
Bem-vindo ao Firecrawl
Como usar?
- API: Documentação
- SDKs: Python, Node
- Frameworks de LLM: LangChain (Python), LangChain (JS), LlamaIndex, Crew.ai, Composio, PraisonAI, Superinterface, Vectorize
- Frameworks low-code: Dify, Langflow, Flowise AI, Cargo, Pipedream
- SDKs da comunidade: Go, Rust (v1)
- Outros: Zapier, Pabbly Connect
- Auto-hospedagem: Para auto-hospedar, consulte o guia aqui.
Chave de API
Recursos
- Scrape: extrai o conteúdo de uma URL em formato pronto para LLM (markdown, resumo, dados estruturados via modo JSON, captura de tela, HTML)
- Crawl: extrai todas as URLs de uma página da web e retorna o conteúdo em formato pronto para LLM
- Map: informe um site e obtenha todas as suas URLs — extremamente rápido
- Search: pesquise na web e obtenha o conteúdo completo dos resultados
- Extract: obtenha dados estruturados de uma única página, de várias páginas ou de sites inteiros com IA.
Recursos poderosos
- Formatos prontos para LLM: markdown, resumo, dados estruturados, captura de tela, HTML, links, metadados, imagens
- O que é difícil: proxies, mecanismos anti-bot, conteúdo dinâmico (renderizado em JS), processamento de saída, orquestração
- Velocidade relâmpago: obtenha resultados em segundos — feito para desempenho e casos de uso de alto throughput.
- Personalização: exclua tags, faça crawling atrás de autenticação com headers personalizados, defina a profundidade máxima de crawling, etc.
- Processamento de mídia: PDFs, DOCX, imagens.
- Confiabilidade em primeiro lugar: projetado para obter os dados de que você precisa — não importa o quão difícil seja.
- Ações: clicar, rolar, digitar, esperar e mais, antes de extrair dados
Instalação do Firecrawl
Scraping
scrape. Ele recebe a URL como parâmetro e retorna os dados extraídos como um dicionário.
Resposta
Os SDKs retornarão o objeto de dados diretamente. O cURL retornará o payload exatamente como mostrado abaixo.Rastreamento
Uso
start crawl nos SDKs, será retornado um ID que você pode usar para verificar o status do crawl.
Verificar status do crawl
Resposta
next. Você deve requisitar essa URL para obter os próximos 10 MB de dados. Se o parâmetro next não estiver presente, isso indica o fim dos dados do crawl.
modo JSON
JSON
Busca
- Escolha formatos de saída específicos (Markdown, HTML, links, capturas de tela)
- Escolha fontes específicas (web, notícias, imagens)
- Pesquise na web com parâmetros personalizáveis (localização, etc.)
Resposta
Os SDKs retornarão o objeto de dados diretamente. O cURL retornará o payload completo.JSON
Extraindo sem schema
prompt para o endpoint. O LLM escolhe a estrutura dos dados.
JSON
Interagindo com a página usando ações
wait antes/depois de outras ações para dar tempo suficiente para a página carregar.
Exemplo
Resultado
Open Source vs Cloud

