Un sandbox del navegador seguro donde los agentes pueden interactuar con la web.
Firecrawl Browser Sandbox ofrece a tus agentes un entorno de navegador seguro donde pueden interactuar con la web. Completa formularios, haz clic en botones, autentícate y mucho más.
Sin configuración local, sin instalaciones de Chromium, sin problemas de compatibilidad de controladores. Agent Browser y Playwright ya vienen preinstalados.Disponible a través de API, CLI (Bash / agent-browser, Python, Node), Node SDK, Python SDK, Vercel AI SDK y MCP Server.Para añadir compatibilidad con navegador a un agente de programación de IA (Claude Code, Codex, Open Code, Cursor, etc.), instala la skill de Firecrawl:
Copiar
npx -y firecrawl-cli@latest init --all --browser
Cada sesión se ejecuta en un sandbox aislado, desechable o persistente, que escala sin necesidad de gestionar infraestructura.
Los archivos descargados dentro de una sesión se pueden capturar y devolver como base64. Usa la API de descargas de Playwright mediante el endpoint execute:
Copiar
import base64async with page.expect_download() as download_info: await page.click('a#download-link') # Haz clic en el elemento que activa la descargadownload = download_info.valuepath = await download.path()# Opcionalmente, guarda el archivo en una ruta conocida# await download.save_as('/tmp/myfile.pdf')# Lee el contenido del archivo y genera la salida en base64with open(path, "rb") as f: content = base64.b64encode(f.read()).decode() print(content)
El sistema de archivos del sandbox es efímero: los archivos descargados se pierden cuando termina la sesión. Para conservarlos, lee su contenido dentro de la sesión y guárdalo en tu propio almacenamiento. Los perfiles persistentes conservan el estado del navegador (cookies, localStorage), pero no los archivos en disco.
agent-browser es una CLI de navegador headless preinstalada en cada sandbox. En lugar de escribir código de Playwright, los agentes envían comandos de bash sencillos. La CLI inyecta automáticamente --cdp para que agent-browser se conecte a tu sesión activa.
La forma más rápida de usar browser. Tanto el atajo como execute envían comandos a agent-browser automáticamente. El atajo simplemente omite execute y abre una sesión automáticamente si es necesario:
De forma predeterminada, cada sesión de navegador comienza desde cero. Con profile, puedes guardar el estado del navegador entre sesiones. Esto es útil para seguir conectado y mantener tus preferencias.Para guardar o seleccionar un perfil, usa el parámetro profile al crear una sesión.
Un nombre para el perfil persistente. Las sesiones con el mismo nombre comparten el almacenamiento.
saveChanges
true
Cuando es true, el estado del navegador se guarda de nuevo en el perfil al cerrarse. Establécelo en false para cargar datos existentes sin escribir, útil cuando necesitas varios lectores concurrentes.
Solo una sesión puede guardar en un perfil a la vez. Si otra sesión ya está guardando, recibirás un error 409. Aun así puedes abrir el mismo perfil con saveChanges: false o intentarlo de nuevo más tarde.
El estado de la sesión del navegador solo se guarda cuando la sesión se cierra. Por ello, recomendamos cerrar la sesión de navegador cuando termines de usarla para que pueda reutilizarse. Una vez cerrada una sesión, su ID de sesión deja de ser válido; no puedes reutilizarlo. En su lugar, crea una nueva sesión con el mismo nombre de perfil y usa el nuevo ID de sesión devuelto en la respuesta. Para guardarla y cerrarla:
Copiar
import Firecrawl from '@mendable/firecrawl-js';const firecrawl = new Firecrawl({ apiKey: "fc-YOUR-API-KEY" });await firecrawl.deleteBrowser("YOUR_SESSION_ID");
Cada sesión devuelve un liveViewUrl en la respuesta que puedes insertar para ver el navegador en tiempo real. Resulta útil para depuración, demostraciones o para crear interfaces de usuario basadas en el navegador.
La respuesta también incluye un interactiveLiveViewUrl. A diferencia de la vista en vivo estándar, que solo permite observar, la vista interactiva en vivo permite a los usuarios hacer clic, escribir e interactuar con la sesión del navegador directamente a través de la transmisión incrustada. Esto es útil para crear interfaces de navegador orientadas al usuario, depuración colaborativa o cualquier escenario en el que quien la visualiza necesite controlar el navegador.
Cada sesión expone una URL de WebSocket de CDP. La API execute y la bandera --bash cubren la mayoría de los casos de uso, pero si necesitas control local completo puedes conectarte directamente.
Inteligencia competitiva - Explorar sitios de la competencia, navegar por formularios de búsqueda y filtros, y extraer precios y características en datos estructurados
Ingesta de base de conocimientos - Navegar por centros de ayuda, documentación y portales de soporte que requieren clics, paginación o autenticación
Investigación de mercado - Iniciar sesiones de navegador en paralelo para crear conjuntos de datos a partir de bolsas de trabajo, listados inmobiliarios o bases de datos legales