!) que gera uma exceção em caso de erro, em vez de retornar tuplas {:error, ...}.
Instalação
firecrawl à sua lista de dependências no mix.exs e configure sua chave de API:
Elixir
Elixir
Uso
- Obtenha uma chave de API em firecrawl.dev
- Defina a chave de API na configuração do seu aplicativo ou passe-a como opção para qualquer função.
Elixir
Fazendo scraping de uma URL
scrape_and_extract_from_url. Ela retorna o conteúdo da página como dados estruturados, incluindo markdown, metadados e quaisquer outros formatos que você solicitar.
Elixir
Rastrear um site
crawl_urls. Ele aceita a URL inicial e parâmetros opcionais, como limite de páginas, domínios permitidos e formato de resultado.
Elixir
Iniciar um rastreamento
Elixir
Verificando o status do rastreamento
get_crawl_status:
Elixir
Cancelar um rastreamento
cancel_crawl:
Elixir
Mapeie um site
map_urls para gerar uma lista de URLs a partir de um site:
Elixir
Busca
Elixir
Extração em lote
Elixir
agente
Elixir
Navegador
Criar uma sessão
Elixir
Executar código
Elixir
Perfis
Elixir
Listar & encerrar sessões
Elixir
Instâncias auto-hospedadas
base_url:
Elixir
Tratamento de erros
{:ok, response} ou {:error, exception}. As variantes com bang levantam uma exceção em caso de erro. O NimbleOptions valida todos os parâmetros antes de a requisição ser enviada, detectando imediatamente erros de digitação, campos obrigatórios ausentes e erros de tipo.
Elixir
Todas as funções disponíveis
| Função | Descrição |
|---|---|
scrape_and_extract_from_url | Faz scraping de uma única URL |
scrape_and_extract_from_urls | Faz extração em lote de várias URLs |
crawl_urls | Faz o rastreamento de um site |
get_crawl_status | Verifica o status do job de rastreamento |
get_crawl_errors | Obtém os erros do job de rastreamento |
get_active_crawls | Lista os rastreamentos ativos |
cancel_crawl | Cancela um job de rastreamento |
map_urls | Mapeia URLs em um site |
search_and_scrape | Busca e faz scraping dos resultados |
start_agent | Inicia uma tarefa de extração com agente |
get_agent_status | Verifica o status do job do agente |
cancel_agent | Cancela um job do agente |
create_browser_session | Cria uma sessão de navegador |
execute_browser_code | Executa código em uma sessão de navegador |
list_browser_sessions | Lista as sessões de navegador |
delete_browser_session | Exclui uma sessão de navegador |
get_batch_scrape_status | Verifica o status da extração em lote |
get_batch_scrape_errors | Obtém os erros da extração em lote |
cancel_batch_scrape | Cancela uma extração em lote |
get_credit_usage | Obtém os créditos restantes |
!) (por exemplo, scrape_and_extract_from_url!) que gera uma exceção em vez de retornar tuplas de erro.
Para ver a documentação completa da API, consulte hexdocs.pm/firecrawl.
