!) que lanza una excepción en lugar de devolver tuplas {:error, ...}.
Instalación
firecrawl a tu lista de dependencias en mix.exs y configura tu clave de API:
Elixir
Elixir
Uso
- Obtén una clave de API en firecrawl.dev
- Configura la clave de API en tu aplicación o pásala como opción a cualquier función.
Elixir
Scraping de una URL
scrape_and_extract_from_url. Devuelve el contenido de la página como datos estructurados, incluidos markdown, metadatos y cualquier otro formato que solicites.
Elixir
Rastrear un sitio web
crawl_urls. Recibe la URL inicial y parámetros opcionales, como el límite de páginas, los dominios permitidos y el formato de salida.
Elixir
Iniciar un rastreo
Elixir
Consultar el estado de un rastreo
get_crawl_status:
Elixir
Cancelar un rastreo
cancel_crawl:
Elixir
Mapea un sitio web
map_urls para generar una lista de URL de un sitio web:
Elixir
Buscar
Elixir
Extracción por lotes
Elixir
Agent
Elixir
Browser
Crear una sesión
Elixir
Ejecutar código
Elixir
Perfiles
Elixir
Listar & cerrar sesiones
Elixir
Instancias autogestionadas
base_url:
Elixir
Manejo de errores
{:ok, response} o {:error, exception}. Las variantes con bang lanzan una excepción en caso de error. NimbleOptions valida todos los parámetros antes de enviar la solicitud, detectando de inmediato errores tipográficos, campos obligatorios ausentes y errores de tipo.
Elixir
Todas las funciones disponibles
| Función | Descripción |
|---|---|
scrape_and_extract_from_url | Hace scraping de una sola URL |
scrape_and_extract_from_urls | Realiza una extracción por lotes de varias URL |
crawl_urls | Rastrea un sitio web |
get_crawl_status | Comprueba el estado del trabajo de rastreo |
get_crawl_errors | Obtiene los errores del trabajo de rastreo |
get_active_crawls | Lista los rastreos activos |
cancel_crawl | Cancela un trabajo de rastreo |
map_urls | Mapea las URL de un sitio web |
search_and_scrape | Busca y hace scraping de los resultados |
start_agent | Inicia una tarea de extracción con agente |
get_agent_status | Comprueba el estado del trabajo del agente |
cancel_agent | Cancela un trabajo del agente |
create_browser_session | Crea una sesión del navegador |
execute_browser_code | Ejecuta código en una sesión del navegador |
list_browser_sessions | Lista las sesiones del navegador |
delete_browser_session | Elimina una sesión del navegador |
get_batch_scrape_status | Comprueba el estado de la extracción por lotes |
get_batch_scrape_errors | Obtiene los errores de la extracción por lotes |
cancel_batch_scrape | Cancela una extracción por lotes |
get_credit_usage | Obtiene los créditos restantes |
!) (por ejemplo, scrape_and_extract_from_url!) que lanza una excepción en lugar de devolver tuplas de error.
Para consultar la documentación completa de la API, consulta hexdocs.pm/firecrawl.
