Vue d’ensemble
Fonctionnalités
- Scraping, exploration et découverte de contenu web efficaces sur n’importe quel site
- Recherche avancée et extraction de contenu intelligente
- Recherche approfondie et scraping par lots à grande échelle
- Déploiement flexible (cloud ou auto‑hébergé)
- Optimisé pour les environnements web modernes avec prise en charge du streaming HTTP
Prérequis
- Obtenez une clé d’API Firecrawl sur firecrawl.dev
- Installez le SDK Google
Configuration
Outils disponibles
| Outil | Nom | Description |
|---|---|---|
| Outil de scraping | firecrawl_scrape | Extraire le contenu d’une seule URL avec des options avancées |
| Outil de scraping par lot | firecrawl_batch_scrape | Extraire plusieurs URL efficacement avec limitation de débit intégrée et traitement parallélisé |
| Vérifier l’état du lot | firecrawl_check_batch_status | Vérifier l’état d’une opération par lot |
| Outil de cartographie | firecrawl_map | Cartographier un site web pour découvrir toutes les URL indexées du site |
| Outil de recherche | firecrawl_search | Rechercher sur le web et, en option, extraire le contenu des résultats de recherche |
| Outil de crawl | firecrawl_crawl | Démarrer un crawl asynchrone avec des options avancées |
| Vérifier l’état du crawl | firecrawl_check_crawl_status | Vérifier l’état d’une tâche de crawl |
| Outil d’extraction | firecrawl_extract | Extraire des informations structurées à partir de pages web à l’aide de modèles LLM |
Configuration
Configuration requise
- Requise lors de l’utilisation de l’API cloud (par défaut)
- Facultative lors de l’utilisation d’une instance auto-hébergée avec FIRECRAWL_API_URL
Configuration optionnelle
FIRECRAWL_API_URL: Point de terminaison de l’API personnalisé- Exemple :
https://firecrawl.your-domain.com - Si non renseigné, l’API cloud sera utilisée
FIRECRAWL_RETRY_MAX_ATTEMPTS: Nombre maximal de tentatives (par défaut : 3)FIRECRAWL_RETRY_INITIAL_DELAY: Délai initial en millisecondes (par défaut : 1000)FIRECRAWL_RETRY_MAX_DELAY: Délai maximal en millisecondes (par défaut : 10000)FIRECRAWL_RETRY_BACKOFF_FACTOR: Facteur de backoff exponentiel (par défaut : 2)
FIRECRAWL_CREDIT_WARNING_THRESHOLD: Seuil d’avertissement (par défaut : 1000)FIRECRAWL_CREDIT_CRITICAL_THRESHOLD: Seuil critique (par défaut : 100)
Exemple : Agent de recherche sur le Web
Bonnes pratiques
-
Utilisez l’outil adapté :
firecrawl_searchlorsque vous devez d’abord trouver des pages pertinentesfirecrawl_scrapepour une page uniquefirecrawl_batch_scrapepour plusieurs URL connuesfirecrawl_crawlpour découvrir et extraire des sites entiers
- Surveillez votre consommation : Configurez des seuils de crédits pour éviter toute utilisation inattendue
- Gérez les erreurs de manière robuste : Configurez les paramètres de nouvelle tentative selon votre cas d’usage
- Optimisez les performances : Utilisez des opérations par lots lors de l’extraction de plusieurs URL
Guide complet pour créer des agents IA avec Google Agent Development Kit (ADK) et Firecrawl
Découvrez comment créer des systèmes d’IA multi-agents performants en utilisant le framework ADK de Google, avec Firecrawl pour le scraping web.
Documentation du serveur MCP
En savoir plus sur l’intégration et les fonctionnalités du serveur Model Context Protocol (MCP) de Firecrawl.
Documentation officielle de Google ADK
Explorez la documentation officielle de Google Agent Development Kit pour des guides complets et des références API.

