
Bienvenido a Firecrawl
¿Cómo usarlo?
- API: Documentación
- SDKs: Python, Node
- Frameworks de LLM: LangChain (Python), LangChain (JS), LlamaIndex, Crew.ai, Composio, PraisonAI, Superinterface, Vectorize
- Frameworks low-code: Dify, Langflow, Flowise AI, Cargo, Pipedream
- SDKs de la comunidad: Go, Rust (v1)
- Otros: Zapier, Pabbly Connect
- ¿Quieres un SDK o una integración? Cuéntanos abriendo un issue.
Clave de API
Funcionalidades
- Scrape: extrae una URL y obtiene su contenido en un formato listo para LLM (Markdown, resumen, datos estructurados mediante modo JSON, captura de pantalla, HTML)
- Crawl: extrae todas las URL de una página web y devuelve el contenido en un formato listo para LLM
- Map: ingresa un sitio web y obtén todas las URL del sitio: extremadamente rápido
- Search: busca en la web y obtén el contenido completo de los resultados
- Extract: obtén datos estructurados de una sola página, múltiples páginas o sitios completos con IA.
Capacidades avanzadas
- Formatos listos para LLM: Markdown, resumen, datos estructurados, captura de pantalla, HTML, enlaces, metadatos
- Lo complejo: proxies, mecanismos antibot, contenido dinámico (renderizado con JS), análisis del resultado, orquestación
- Ultrarrápido: Obtén resultados en segundos—diseñado para la velocidad y casos de uso de alto rendimiento.
- Personalización: excluir etiquetas, rastrear detrás de muros de autenticación con encabezados personalizados, profundidad máxima de rastreo, etc.
- Análisis de medios: PDF, DOCX, imágenes.
- Fiabilidad ante todo: diseñado para obtener los datos que necesitas, por difícil que sea.
- Acciones: hacer clic, desplazarse, introducir datos, esperar y más antes de extraer datos
Instalación de Firecrawl
Scraping
scrape
. Recibe la URL como parámetro y devuelve los datos obtenidos como un diccionario.
Respuesta
Rastreo
Uso
start crawl
en los SDK, se devolverá un ID
que podrás usar para verificar el estado del rastreo.
Consultar el estado del rastreo
Respuesta
next
. Debes solicitar esta URL para obtener los siguientes 10 MB de datos. Si el parámetro next
no está presente, indica el final de los datos del rastreo.
modo JSON
JSON
Búsqueda
- Elige formatos de salida específicos (Markdown, HTML, enlaces, capturas de pantalla)
- Elige fuentes específicas (web, noticias, imágenes)
- Busca en la web con parámetros personalizables (ubicación, etc.)
Respuesta
JSON
Extracción sin esquema
prompt
al endpoint. El LLM elige la estructura de los datos.
JSON
Interacción con la página mediante acciones
wait
antes y/o después de ejecutar otras acciones para dar tiempo suficiente a que la página cargue.
Ejemplo
Resultados
Código abierto vs nube
