Instalação
Node.js
Uso
- Obtenha uma chave de API em firecrawl.dev
- Defina a chave de API como uma variável de ambiente chamada
FIRECRAWL_API_KEYou passe-a como parâmetro para a classeFirecrawlApp.
Node
Scraping de uma URL
scrape para extrair os dados de uma única URL e receber os dados estruturados da página.
Node
Rastreando um site
crawl. Você pode definir um limite de páginas, restringir o rastreamento a domínios específicos e escolher formatos de resultado. Consulte Paginação para paginação automática e manual.
Node
Rastreamento Somente do Sitemap
sitemap: "only" para rastrear apenas URLs do sitemap (a URL inicial sempre é incluída e a descoberta de links em HTML é ignorada).
Node
Iniciar um rastreamento
startCrawl. O método retorna um ID do job que você pode consultar depois. Use crawl em vez disso quando quiser bloquear até a conclusão. Veja Paginação para comportamento e limites de paginação.
Node
Verificando o status do rastreamento
checkCrawlStatus. Passe o ID do job retornado por startCrawl.
Node
Cancelando um rastreamento
cancelCrawl. Informe o ID do job retornado por startCrawl.
Node.js
Mapeando um site
map. Informe uma URL inicial e receba uma lista das páginas encontradas.
Node.js
Rastreamento de um site com WebSockets
crawlUrlAndWatch. Você recebe cada página conforme ela é rastreada, em vez de aguardar a conclusão de todo o job.
Node
Paginação
next quando há mais dados disponíveis. O SDK de Node faz paginação automática por padrão e agrega todos os documentos; nesse caso, next será null. Você pode desativar a paginação automática ou definir limites.
Rastreamento
crawl para a experiência mais simples, ou inicie um job e faça a paginação manualmente.
Rastreamento simples (paginação automática, padrão)
- Veja o fluxo padrão em Rastrear um site.
Rastreamento manual com controle de paginação (página única)
- Inicie um job e, em seguida, recupere uma página por vez com
autoPaginate: false.
Node
Rastreamento manual com limites (paginação automática + parada antecipada)
- Mantenha a paginação automática ativada, mas interrompa antecipadamente com
maxPages,maxResultsoumaxWaitTime.
Node
Coleta em lote
batchScrape ou inicie uma tarefa e pagine manualmente.
Raspagem em lote simples (paginação automática, padrão)
- Veja o fluxo padrão em Raspagem em lote.
Coleta manual em lote com controle de paginação (página única)
- Inicie um job e, em seguida, recupere uma página por vez com
autoPaginate: false.
Node
Coleta manual em lote com limites (paginação automática + parada antecipada)
- Mantenha a paginação automática ligada, mas interrompa antes com
maxPages,maxResultsoumaxWaitTime.
Node
Browser
Criar sessão
Node
Executar código
Node
Node
Node
Perfis
Node
Conectar via CDP
Node
Listar e Encerrar Sessões
Node
Sessão interativa vinculada ao scraping
interact(jobId, {...})executa código na sessão do navegador vinculada ao scraping.- A primeira chamada de
interactinicializa automaticamente a sessão com base no contexto do scraping. - Chamadas adicionais de
interactno mesmo ID do job reutilizam esse estado ativo do navegador. stopInteraction(jobId)encerra a sessão interativa quando você terminar.
Node
Tratamento de erros
try/catch, como mostrado nos exemplos acima.
Você é um agente de IA que precisa de uma chave de API do Firecrawl? Veja firecrawl.dev/agent-onboarding/SKILL.md para instruções automatizadas de onboarding.

