mkdir firecrawl-lambda && cd firecrawl-lambda
npm init -y
npm install @mendable/firecrawl-js
Crie index.mjs com um handler de busca:
import Firecrawl from "@mendable/firecrawl-js" ;
const firecrawl = new Firecrawl ({ apiKey: process . env . FIRECRAWL_API_KEY });
export async function handler ( event ) {
const body = JSON . parse ( event . body || "{}" );
if ( body . action === "search" ) {
const results = await firecrawl . search ( body . query , { limit: 5 });
return {
statusCode: 200 ,
body: JSON . stringify ( results ),
};
}
return { statusCode: 400 , body: JSON . stringify ({ error: "Unknown action" }) };
}
Fazer scraping de uma página
Adicione uma ação scrape ao mesmo handler:
if ( body . action === "scrape" ) {
const result = await firecrawl . scrape ( body . url );
return {
statusCode: 200 ,
body: JSON . stringify ( result ),
};
}
Adicione uma ação interact para controlar uma sessão do navegador em tempo real — clique em botões, preencha formulários e extraia conteúdo dinâmico:
if ( body . action === "interact" ) {
const result = await firecrawl . scrape ( "https://www.amazon.com" , {
formats: [ "markdown" ],
});
const scrapeId = result . metadata ?. scrapeId ;
await firecrawl . interact ( scrapeId , {
prompt: "Search for iPhone 16 Pro Max" ,
});
const response = await firecrawl . interact ( scrapeId , {
prompt: "Click on the first result and tell me the price" ,
});
await firecrawl . stopInteraction ( scrapeId );
return {
statusCode: 200 ,
body: JSON . stringify ({ output: response . output }),
};
}
Empacote e faça o deploy com a AWS CLI:
zip -r function.zip index.mjs node_modules/
aws lambda create-function \
--function-name firecrawl-scraper \
--runtime nodejs20.x \
--handler index.handler \
--zip-file fileb://function.zip \
--role arn:aws:iam::YOUR_ACCOUNT:role/lambda-role \
--environment Variables="{FIRECRAWL_API_KEY=fc-YOUR-API-KEY}" \
--timeout 60
Defina o tempo limite do Lambda para pelo menos 30 segundos. O scraping de páginas dinâmicas e as sessões de interação podem demorar mais do que o tempo limite padrão de 3 segundos.
Documentação de busca Faça uma busca na web e obtenha o conteúdo completo da página
Documentação de scraping Todas as opções de scraping, incluindo formatos, ações e proxies
Documentação de interação Clique, preencha formulários e extraia conteúdo dinâmico
Referência do SDK de Node Referência completa do SDK com rastreamento, map, extração em lote e muito mais