Un bac à sable de navigateur sécurisé où les agents peuvent interagir avec le web.
Le bac à sable de navigateur Firecrawl offre à vos agents un environnement de navigateur sécurisé où ils peuvent interagir avec le web. Remplissez des formulaires, cliquez sur des boutons, authentifiez-vous, et plus encore.
Aucune configuration locale, aucune installation de Chromium, aucun problème de compatibilité de driver. agent-browser et Playwright sont préinstallés.Disponible via l’API, la CLI (Bash / agent-browser, Python, Node), le SDK Node, le SDK Python, le Vercel AI SDK et le serveur MCP.Pour ajouter la prise en charge du navigateur à un agent de codage IA (Claude Code, Codex, Open Code, Cursor, etc.), installez la compétence Firecrawl :
Copier
npx -y firecrawl-cli@latest init --all --browser
Chaque session s’exécute dans un bac à sable isolé, jetable ou persistant, qui passe à l’échelle sans avoir à gérer d’infrastructure.
Aucune installation de driver requise — Pas de binaire Chromium, pas de playwright install, pas de problèmes de compatibilité de driver
Python, JavaScript & Bash — Envoyez du code via l’API, la CLI ou le SDK et récupérez les résultats. Les trois langages s’exécutent à distance dans la sandbox
agent-browser — CLI préinstallée avec plus de 40 commandes. Les agents d’IA écrivent de simples commandes bash au lieu de code Playwright
Playwright préinstallé — Playwright est déjà disponible dans la sandbox. Les agents peuvent écrire du code Playwright s’ils le préfèrent.
Accès CDP — Connectez votre propre instance Playwright via WebSocket lorsque vous avez besoin d’un contrôle total
Vue en direct — Suivez les sessions en temps réel via une URL de flux intégrable
Vue en direct interactive — Permettez aux utilisateurs d’interagir directement avec le navigateur via un flux en direct interactif intégrable
Les fichiers téléchargés au cours d’une session peuvent être capturés et renvoyés en base64. Utilisez l’API de téléchargement de Playwright via le point de terminaison execute :
Copier
import base64async with page.expect_download() as download_info: await page.click('a#download-link') # Cliquez sur l'élément qui déclenche le téléchargementdownload = download_info.valuepath = await download.path()# Facultatif : enregistrer le fichier à un emplacement connu# await download.save_as('/tmp/myfile.pdf')# Lire le contenu du fichier et l'afficher en base64with open(path, "rb") as f: content = base64.b64encode(f.read()).decode() print(content)
Le système de fichiers du bac à sable est éphémère : les fichiers téléchargés sont perdus à la fin de la session. Pour les conserver, lisez leur contenu pendant la session et enregistrez-le dans votre propre espace de stockage. Les profils persistants conservent l’état du navigateur (cookies, localStorage), mais pas les fichiers sur le disque.
agent-browser est une CLI de navigateur headless préinstallée dans chaque sandbox. Au lieu d’écrire du code Playwright, les agents envoient de simples commandes Bash. La CLI injecte automatiquement --cdp pour permettre à agent-browser de se connecter à votre session active.
La méthode la plus rapide pour utiliser browser. Le raccourci et execute envoient tous les deux des commandes à agent-browser automatiquement. Le raccourci se contente d’omettre execute et de lancer automatiquement une session si nécessaire :
La forme explicite utilise execute. Les commandes sont envoyées automatiquement à agent-browser : vous n’avez pas besoin de saisir agent-browser ni d’utiliser --bash :
Par défaut, chaque session de navigateur démarre dans un état vierge. Avec profile, vous pouvez enregistrer et réutiliser l’état du navigateur entre les sessions. C’est utile pour rester connecté et conserver les préférences.Pour enregistrer ou sélectionner un profil, utilisez le paramètre profile lors de la création d’une session.
Un nom pour le profil persistant. Les sessions portant le même nom partagent le stockage.
saveChanges
true
Lorsque true, l’état du navigateur est enregistré dans le profil à la clôture. Définissez false pour charger les données existantes sans écrire — utile lorsque vous avez besoin de plusieurs lecteurs simultanés.
Une seule session peut enregistrer dans un profil à la fois. Si une autre session enregistre déjà, vous recevrez une erreur 409. Vous pouvez quand même ouvrir le même profil avec saveChanges: false, ou réessayer plus tard.
L’état de la session du navigateur n’est enregistré qu’une fois la session close. Nous vous recommandons donc de clore la session du navigateur lorsque vous avez terminé afin qu’elle puisse être réutilisée. Une fois une session close, son ID de session n’est plus valide — vous ne pouvez pas le réutiliser. Créez plutôt une nouvelle session avec le même nom de profil et utilisez le nouvel ID de session renvoyé dans la réponse. Pour l’enregistrer et la clore :
Copier
import Firecrawl from '@mendable/firecrawl-js';const firecrawl = new Firecrawl({ apiKey: "fc-YOUR-API-KEY" });await firecrawl.deleteBrowser("YOUR_SESSION_ID");
Chaque session renvoie un liveViewUrl dans la réponse, que vous pouvez intégrer pour observer le navigateur en temps réel. Pratique pour le débogage, les démonstrations ou la création d’interfaces utilisateur pilotées par le navigateur.
La réponse inclut également un interactiveLiveViewUrl. Contrairement à la vue en direct standard, qui est en lecture seule, la vue en direct interactive permet aux utilisateurs de cliquer, de saisir du texte et d’interagir avec la session de navigation directement via le flux intégré. C’est utile pour créer des interfaces de navigateur destinées aux utilisateurs finaux, pour le débogage collaboratif, ou pour tout scénario où la personne qui consulte la session doit contrôler le navigateur.
Chaque session expose une URL WebSocket CDP. L’API execute et l’option --bash couvrent la plupart des cas d’utilisation, mais si vous avez besoin d’un contrôle complet en local, vous pouvez vous connecter directement.
Veille concurrentielle - Parcourir les sites concurrents, naviguer dans les formulaires et filtres de recherche, extraire les tarifs et les fonctionnalités sous forme de données structurées
Ingestion de base de connaissances - Naviguer dans les centres d’aide, la documentation et les portails d’assistance qui nécessitent des clics, de la pagination ou une authentification
Études de marché - Lancer des sessions de navigation parallèles pour constituer des jeux de données à partir de sites d’offres d’emploi, d’annonces immobilières ou de bases de données juridiques