Crawl
Documentation Index
Fetch the complete documentation index at: https://docs.firecrawl.dev/llms.txt
Use this file to discover all available pages before exploring further.
Nota: Una nueva versión v2 de esta API ya está disponible con funciones y rendimiento mejorados.
Autorizaciones
Bearer authentication header of the form Bearer <token>, where <token> is your auth token.
Cuerpo
La URL base desde la que se iniciará el rastreo
⚠️ EN DESUSO: Usa 'crawlEntireDomain' en su lugar. Permite que el rastreador siga enlaces internos a URL hermanas o superiores, no solo a rutas hijas.
Permite que el rastreador siga enlaces a sitios web externos.
Permite que el rastreador siga enlaces a subdominios del dominio principal.
Permite que el rastreador siga enlaces internos a URLs del mismo nivel o superiores, no solo rutas hijas.
false: Solo rastrea URLs más profundas (hijas). → p. ej. /features/feature-1 → /features/feature-1/tips ✅ → No seguirá /pricing ni / ❌
true: Rastrea cualquier enlace interno, incluyendo del mismo nivel y superiores. → p. ej. /features/feature-1 → /pricing, /, etc. ✅
Usa true para lograr una cobertura interna más amplia, más allá de rutas anidadas.
Pausa en segundos entre scrapes. Esto ayuda a respetar los límites de tasa del sitio web.
Patrones de expresiones regulares para el pathname de la URL que excluyen del rastreo las URL que coincidan. Por ejemplo, si configuras "excludePaths": ["blog/.*"] para la URL base firecrawl.dev, se excluirán todos los resultados que coincidan con ese patrón, como https://www.firecrawl.dev/blog/firecrawl-launch-week-1-recap.
No vuelvas a hacer scraping de la misma ruta con distintos parámetros de consulta (o sin parámetros)
Ignorar el sitemap del sitio web durante el rastreo
Patrones regex de rutas de URL que determinan qué URLs se incluyen en el rastreo. Solo las rutas que coincidan con los patrones especificados se incluirán en la respuesta. Por ejemplo, si configuras "includePaths": ["blog/.*"] para la URL base firecrawl.dev, solo se incluirán los resultados que coincidan con ese patrón, como https://www.firecrawl.dev/blog/firecrawl-launch-week-1-recap.
Número máximo de páginas a rastrear. El límite por defecto es 10.000.
Número máximo de scrapes concurrentes. Este parámetro te permite establecer un límite de concurrencia para este rastreo. Si no se especifica, el rastreo se ajusta al límite de concurrencia de tu equipo.
Profundidad absoluta máxima de rastreo desde la base de la URL introducida. Básicamente, es el número máximo de barras diagonales (/) que puede contener el pathname de una URL rastreada.
Profundidad máxima de rastreo basada en el orden de descubrimiento. El sitio raíz y las páginas del mapa del sitio tienen una profundidad de descubrimiento de 0. Por ejemplo, si la configuras en 1 y habilitas ignoreSitemap, solo se rastreará la URL ingresada y todas las URL que estén enlazadas en esa página.
Cuando es true, los patrones regex de includePaths y excludePaths se comparan con la URL completa (incluidos los parámetros de consulta), en lugar de solo con la ruta (pathname) de la URL. Es útil cuando necesitas filtrar URLs en función de las cadenas de consulta (query strings).
Un objeto de especificación de un webhook.
Si se establece en true, no se conservarán datos de este rastreo. Para activar esta función, ponte en contacto con help@firecrawl.dev.

