Instalación
Node
Uso
- Obtén una clave de API en firecrawl.dev
- Define la clave de API como una variable de entorno llamada
FIRECRAWL_API_KEYo pásala como parámetro a la claseFirecrawlApp.
Node
Extracción de una URL
scrape.
Node.js
Rastreo de un sitio web
crawl. Puedes establecer un límite de páginas, restringir el rastreo a dominios específicos y seleccionar formatos de salida. Consulta Pagination para la paginación automática y manual.
Node
Rastreo solo del sitemap
sitemap: "only" para rastrear únicamente las URL del sitemap (la URL inicial siempre se incluye y se omite la detección de enlaces HTML).
Node
Iniciar un rastreo
startCrawl. El método devuelve un ID de trabajo que puedes consultar más tarde. Usa crawl en su lugar cuando quieras bloquear hasta que finalice. Consulta Paginación para el comportamiento y los límites de paginación.
Node
Consultar el estado del rastreo
checkCrawlStatus. Proporciona el ID de trabajo devuelto por startCrawl.
Node.js
Cancelar un rastreo
cancelCrawl. Pasa el ID de trabajo que devuelve startCrawl.
Node
Mapear un sitio web
map. Pasa una URL inicial y obtén una lista de las páginas detectadas.
Node
Rastreo de un sitio web con WebSockets
crawlUrlAndWatch. Recibirás cada página a medida que se rastrea, en lugar de esperar a que termine todo el trabajo.
Node
Paginación
next cuando hay más datos disponibles. El SDK de Node realiza la paginación automáticamente por defecto y agrega todos los documentos; en ese caso, next será null. Puedes desactivar la paginación automática o establecer límites.
Rastreo
crawl para la forma más sencilla, o inicia un job y pagina manualmente.
Rastreo simple (paginación automática, por defecto)
- Consulta el flujo por defecto en Rastrear un sitio web.
Rastreo manual con control de paginación (una sola página)
- Inicia un trabajo y luego recupera una página a la vez con
autoPaginate: false.
Nodo
Rastreo manual con límites (paginación automática + parada anticipada)
- Mantén la paginación automática activada, pero deténla antes con
maxPages,maxResultsomaxWaitTime.
Node
Scrape por lotes
batchScrape, o inicia un job y pagina manualmente.
Raspado por lotes simple (paginación automática, predeterminado)
- Consulta el flujo predeterminado en Raspado por lotes.
Raspado manual por lotes con control de paginación (una sola página)
- Inicia un job y luego recupera una página a la vez con
autoPaginate: false.
Node
Extracción manual por lotes con límites (paginación automática + detención anticipada)
- Mantén la paginación automática activada, pero deténla antes con
maxPages,maxResultsomaxWaitTime.
Node
Browser
Crear una sesión
Node
Ejecutar código
Node
Node
Node
Perfiles
Node
Conectar mediante CDP
Node
Listar y cerrar sesiones
Node
Sesión interactiva vinculada a scrape
interact(jobId, {...})ejecuta código en la sesión del navegador vinculada al scrape.- La primera llamada a
interactinicializa automáticamente la sesión a partir del contexto del scrape. - Las llamadas adicionales a
interactcon el mismo ID de trabajo reutilizan ese estado activo del navegador. stopInteraction(jobId)detiene la sesión interactiva cuando termines.
Node
Manejo de errores
try/catch, como se muestra en los ejemplos anteriores.
¿Eres un agente de IA que necesita una clave de API de Firecrawl? Consulta firecrawl.dev/agent-onboarding/SKILL.md para obtener instrucciones de incorporación automatizada.

