Descripción general
Funcionalidades
- Raspado web, rastreo y descubrimiento de contenido eficientes en cualquier sitio
- Búsqueda avanzada y extracción inteligente de contenido
- Investigación profunda y scraping por lotes a gran escala
- Despliegue flexible (en la nube o autogestionado)
- Optimizado para entornos web modernos con soporte HTTP por streaming
Requisitos previos
- Obtén una clave de API para Firecrawl en firecrawl.dev
- Instala el Google SDK
Configuración
Herramientas disponibles
| Herramienta | Nombre | Descripción |
|---|---|---|
| Herramienta de scraping | firecrawl_scrape | Extrae contenido de una única URL con opciones avanzadas |
| Herramienta de scraping por lotes | firecrawl_batch_scrape | Extrae múltiples URL de forma eficiente con limitación de tasa integrada y procesamiento en paralelo |
| Consultar estado del lote | firecrawl_check_batch_status | Consulta el estado de una operación por lotes |
| Herramienta de mapeo | firecrawl_map | Genera el mapa de un sitio para descubrir todas las URL indexadas |
| Herramienta de búsqueda | firecrawl_search | Busca en la web y, opcionalmente, extrae contenido de los resultados |
| Herramienta de rastreo | firecrawl_crawl | Inicia un rastreo asíncrono con opciones avanzadas |
| Consultar estado del rastreo | firecrawl_check_crawl_status | Consulta el estado de un trabajo de rastreo |
| Herramienta de extracción | firecrawl_extract | Extrae información estructurada de páginas web usando capacidades de LLM |
Configuración
Configuración requerida
- Obligatorio al usar la API en la nube (por defecto)
- Opcional al usar una instancia autogestionada con FIRECRAWL_API_URL
Configuración opcional
FIRECRAWL_API_URL: Endpoint de API personalizado- Ejemplo:
https://firecrawl.your-domain.com - Si no se especifica, se usará la API en la nube
FIRECRAWL_RETRY_MAX_ATTEMPTS: Número máximo de reintentos (predeterminado: 3)FIRECRAWL_RETRY_INITIAL_DELAY: Espera inicial en milisegundos (predeterminado: 1000)FIRECRAWL_RETRY_MAX_DELAY: Espera máxima en milisegundos (predeterminado: 10000)FIRECRAWL_RETRY_BACKOFF_FACTOR: Multiplicador de backoff exponencial (predeterminado: 2)
FIRECRAWL_CREDIT_WARNING_THRESHOLD: Umbral de advertencia (predeterminado: 1000)FIRECRAWL_CREDIT_CRITICAL_THRESHOLD: Umbral crítico (predeterminado: 100)
Ejemplo: agente de investigación web
Mejores prácticas
-
Usa la herramienta adecuada para la tarea:
firecrawl_searchcuando primero necesites encontrar páginas relevantesfirecrawl_scrapepara páginas individualesfirecrawl_batch_scrapepara varias URL conocidasfirecrawl_crawlpara descubrir y extraer sitios completos
- Supervisa tu uso: Configura umbrales de créditos para evitar consumos inesperados
- Gestiona los errores de forma elegante: Configura la política de reintentos según tu caso de uso
- Optimiza el rendimiento: Usa operaciones por lotes al extraer múltiples URL
Guía completa para crear agentes de IA con Google Agent Development Kit (ADK) y Firecrawl
Aprende a crear potentes sistemas de IA multiagente usando el kit ADK de Google junto con Firecrawl para scraping web.
Documentación del servidor MCP
Obtén más información sobre la integración y las capacidades del servidor Model Context Protocol (MCP) de Firecrawl.
Documentación oficial de Google ADK
Explora la documentación oficial de Google Agent Development Kit para guías completas y referencias de API.

