
Bem-vindo ao Firecrawl
Como usar?
- API: Documentação
- SDKs: Python, Node
- Frameworks de LLM: LangChain (Python), LangChain (JS), LlamaIndex, Crew.ai, Composio, PraisonAI, Superinterface, Vectorize
- Frameworks low-code: Dify, Langflow, Flowise AI, Cargo, Pipedream
- SDKs da comunidade: Go, Rust (v1)
- Outros: Zapier, Pabbly Connect
- Quer um SDK ou integração? Avise-nos abrindo uma issue.
Chave de API
Recursos
- Scrape: extrai o conteúdo de uma URL em formato pronto para LLM (markdown, resumo, dados estruturados via modo JSON, captura de tela, HTML)
- Crawl: extrai todas as URLs de uma página da web e retorna o conteúdo em formato pronto para LLM
- Map: informe um site e obtenha todas as suas URLs — extremamente rápido
- Search: pesquise na web e obtenha o conteúdo completo dos resultados
- Extract: obtenha dados estruturados de uma única página, de várias páginas ou de sites inteiros com IA.
Capacidades poderosas
- Formatos prontos para LLM: markdown, resumo, dados estruturados, captura de tela, HTML, links, metadados
- O que é difícil: proxies, mecanismos antibot, conteúdo dinâmico (renderizado em JS), parsing de saída, orquestração
- Velocidade relâmpago: obtenha resultados em segundos — feito para velocidade e casos de uso de alto throughput.
- Personalização: excluir tags, navegar atrás de autenticação com headers personalizados, profundidade máxima de rastreamento, etc.
- Parsing de mídia: PDFs, DOCX, imagens.
- Confiabilidade em primeiro lugar: projetado para obter os dados de que você precisa — não importa quão difícil seja.
- Ações: clicar, rolar, inserir, aguardar e mais, antes de extrair dados
Instalação do Firecrawl
Scraping
scrape
. Ele recebe a URL como parâmetro e retorna os dados extraídos como um dicionário.
Resposta
Rastreamento
Uso
start crawl
nos SDKs, será retornado um ID
que você pode usar para verificar o status do crawl.
Verificar status do crawl
Resposta
next
. Você deve requisitar essa URL para obter os próximos 10 MB de dados. Se o parâmetro next
não estiver presente, isso indica o fim dos dados do crawl.
modo JSON
JSON
Busca
- Escolha formatos de saída específicos (Markdown, HTML, links, capturas de tela)
- Escolha fontes específicas (web, notícias, imagens)
- Pesquise na web com parâmetros personalizáveis (localização, etc.)
Resposta
JSON
Extraindo sem schema
prompt
para o endpoint. O LLM escolhe a estrutura dos dados.
JSON
Interagindo com a página usando ações
wait
antes/depois de outras ações para dar tempo suficiente para a página carregar.
Exemplo
Resultado
Open Source vs Cloud
