Pular para o conteúdo principal

Pré-requisitos

Configuração

mkdir firecrawl-lambda && cd firecrawl-lambda
npm init -y
npm install @mendable/firecrawl-js

Fazer uma busca na web

Crie index.mjs com um handler de busca:
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

export async function handler(event) {
  const body = JSON.parse(event.body || "{}");

  if (body.action === "search") {
    const results = await firecrawl.search(body.query, { limit: 5 });
    return {
      statusCode: 200,
      body: JSON.stringify(results),
    };
  }

  return { statusCode: 400, body: JSON.stringify({ error: "Unknown action" }) };
}

Fazer scraping de uma página

Adicione uma ação scrape ao mesmo handler:
if (body.action === "scrape") {
  const result = await firecrawl.scrape(body.url);
  return {
    statusCode: 200,
    body: JSON.stringify(result),
  };
}

Interaja com uma página

Adicione uma ação interact para controlar uma sessão do navegador em tempo real — clique em botões, preencha formulários e extraia conteúdo dinâmico:
if (body.action === "interact") {
  const result = await firecrawl.scrape("https://www.amazon.com", {
    formats: ["markdown"],
  });
  const scrapeId = result.metadata?.scrapeId;

  await firecrawl.interact(scrapeId, {
    prompt: "Search for iPhone 16 Pro Max",
  });
  const response = await firecrawl.interact(scrapeId, {
    prompt: "Click on the first result and tell me the price",
  });

  await firecrawl.stopInteraction(scrapeId);
  return {
    statusCode: 200,
    body: JSON.stringify({ output: response.output }),
  };
}

Deploy

Empacote e faça o deploy com a AWS CLI:
zip -r function.zip index.mjs node_modules/

aws lambda create-function \
  --function-name firecrawl-scraper \
  --runtime nodejs20.x \
  --handler index.handler \
  --zip-file fileb://function.zip \
  --role arn:aws:iam::YOUR_ACCOUNT:role/lambda-role \
  --environment Variables="{FIRECRAWL_API_KEY=fc-YOUR-API-KEY}" \
  --timeout 60
Defina o tempo limite do Lambda para pelo menos 30 segundos. O scraping de páginas dinâmicas e as sessões de interação podem demorar mais do que o tempo limite padrão de 3 segundos.

Próximos passos

Documentação de busca

Faça uma busca na web e obtenha o conteúdo completo da página

Documentação de scraping

Todas as opções de scraping, incluindo formatos, ações e proxies

Documentação de interação

Clique, preencha formulários e extraia conteúdo dinâmico

Referência do SDK de Node

Referência completa do SDK com rastreamento, map, extração em lote e muito mais