"summary" - Obtenha um resumo conciso do conteúdo da página{ type: "json", prompt, schema }{ type: "screenshot", fullPage, quality, viewport }"images" - Extraia todas as URLs de imagens da página"branding" - Extraia a identidade da marca, incluindo cores, fontes, tipografia, espaçamento e componentes de UImaxAge padrão de 2 diasblockAds, skipTlsVerification e removeBase64Images vêm habilitados por padrãoBearer authentication header of the form Bearer <token>, where <token> is your auth token.
URL a ser raspada
Formatos de saída que devem ser incluídos na resposta. Você pode especificar um ou mais formatos, como strings (por exemplo, 'markdown') ou como objetos com opções adicionais (por exemplo, { type: 'json', schema: {...} }). Alguns formatos exigem que opções específicas sejam configuradas. Exemplo: ['markdown', { type: 'json', schema: {...} }].
Retorne somente o conteúdo principal da página, excluindo cabeçalhos, elementos de navegação, rodapés etc.
Tags a serem incluídas no resultado.
Tags a serem excluídas da saída.
Retorna uma versão em cache da página se ela for mais recente do que essa idade em milissegundos. Se a versão em cache da página for mais antiga do que esse valor, a página será novamente coletada. Se você não precisa de dados extremamente atualizados, ativar isso pode acelerar suas coletas em até 500%. O padrão é 2 dias.
Cabeçalhos a serem enviados na requisição. Podem ser usados para enviar cookies, user-agent etc.
Defina um atraso, em milissegundos, antes de buscar o conteúdo, permitindo que a página tenha tempo suficiente para carregar. Esse tempo de espera é somado ao recurso de espera inteligente do Firecrawl.
Defina como true se quiser emular a extração a partir de um dispositivo móvel. Útil para testar páginas responsivas e capturar screenshots da versão mobile.
Ignorar a verificação de certificado TLS ao realizar requisições.
Tempo limite da requisição, em milissegundos.
Controla como os arquivos são processados durante o scraping. Quando "pdf" é incluído (padrão), o conteúdo do PDF é extraído e convertido em markdown, com cobrança baseada no número de páginas (1 crédito por página). Quando um array vazio é fornecido, o arquivo PDF é retornado em codificação base64 com uma taxa fixa de 1 crédito para todo o PDF.
Ações a serem executadas na página antes de extrair o conteúdo
Configurações de localização da requisição. Quando definidas, será usado um proxy apropriado, se disponível, e serão emuladas as configurações correspondentes de idioma e fuso horário. O padrão é "US" se não for especificado.
Remove todas as imagens em base64 da saída, que podem ser extremamente longas. O texto alternativo da imagem é mantido na saída, mas a URL é substituída por um valor de placeholder.
Habilita o bloqueio de anúncios e de pop-ups de cookies.
Especifica o tipo de proxy a ser usado.
basic, stealth, auto Se definido como true, a página será armazenada no índice e no cache do Firecrawl. Definir isso como false é útil se sua atividade de scraping puder levantar preocupações relacionadas à proteção de dados. O uso de alguns parâmetros associados a scraping sensível (por exemplo, ações, headers) fará com que esse parâmetro seja definido automaticamente como false.
Se definido como true, isso ativará a retenção zero de dados para este scrape. Para habilitar esse recurso, entre em contato com [email protected]