queries e uma goal, e o Firecrawl executa as queries em cada verificação e alerta sobre resultados novos que o judge considera relevantes para esse objetivo. É descoberta, não diffing.
Cada verificação segue o mesmo ciclo: pega a meta e suas queries, aplica uma janela de recência, executa a busca, remove duplicatas dos resultados pela URL canônica, deixa o judge de IA opcional decidir quais novos resultados são significativos para a meta e envia alertas pelos mesmos canais de webhook e email usados pelos monitores de scraping e de rastreamento. Agendamento, metas, julgamento e notificações funcionam exatamente como descrito na visão geral de monitoramento.
Monitores de página e de rastreamento fazem diff do conteúdo nas URLs que você define; monitores em escala da web descobrem novos resultados em toda a web. O agendamento, o judge e as notificações são os mesmos por trás.
Alvo de busca
type: "search" e substitui urls pelas consultas a serem executadas e por como pontuar os resultados:
Search target
| Campo | Tipo | Descrição |
|---|---|---|
type | "search" | Seleciona o alvo de busca. |
queries | string[] | Consultas de busca executadas em cada verificação. De 1 a 12 consultas, cada uma com até 256 caracteres. Obrigatório. |
searchWindow | "5m" | "15m" | "1h" | "6h" | "24h" | "7d" | Filtro de recência. Considera apenas resultados publicados dentro desta janela. O padrão é 24h. |
maxResults | number | Total de resultados a avaliar por verificação, de 1 a 50. O padrão é 10. Esse é um limite combinado para todas as queries (os resultados são primeiro mesclados e deduplicados), não um limite por consulta. Uma consulta individual pode contribuir com menos resultados, ou nenhum, se outras consultas atingirem o limite primeiro. |
includeDomains | string[] | Opcional. Restringe os resultados a estes domínios (até 50). É mutuamente exclusivo com excludeDomains. |
excludeDomains | string[] | Opcional. Exclui resultados destes domínios (até 50). É mutuamente exclusivo com includeDomains. |
Um alvo de busca exige uma
meta não vazia no nível do monitor, a menos que você defina judgeEnabled: false. queries são obrigatórias; é em relação à meta que o judge avalia cada novo resultado. Ele não gera as consultas. Veja Metas e julgamento.Os créditos escalam com as consultas. Cada consulta busca até
maxResults resultados, e os créditos das chamadas de busca são cobrados com base nos resultados brutos de todas as consultas antes da mesclagem e deduplicação. Adicionar consultas aumenta o custo real da busca, não apenas a estimativa inicial. Após a mesclagem/deduplicação, o Firecrawl avalia no máximo maxResults candidatos selecionados, então os créditos do judge continuam limitados pelos resultados selecionados/avaliados.Crie um monitor em escala da web
type: "search" com queries, searchWindow, maxResults e filtros de domínio opcionais) e o fato de não haver URLs:
monitor.page o reporta com status new e, quando o julgamento é executado, com um judgment descrevendo por que ele é importante:
monitor.page
Como escrever boas metas e queries
queriescontrolam o recall: o que cada busca traz. Se forem específicas demais, eventos reais nunca aparecem; se forem amplas demais, o judge gasta credits filtrando ruído.metacontrola a precisão: quais resultados recuperados realmente geram alert. O judge avalia cada novo resultado em relação à meta, então é a meta que separa uma correspondência real de algo relacionado ao tema, mas irrelevante na prática.
- Use palavras-chave, não texto corrido:
OpenAI new model release, nãotell me when OpenAI releases a new model. - Coloque entre aspas entidades com várias palavras (
"Llama 4") e agrupe sinônimos comOR(launch OR release OR announcement). - Mantenha cada query enxuta (cerca de 2 a 6 termos). Uma query ampla geralmente supera várias queries restritas, porque queries extras dividem o orçamento de
maxResultssem aumentar a cobertura. - Use uma query por assunto distinto. Um único assunto com várias facetas (“launches, benchmarks, docs”) continua sendo uma query; só divida quando a meta realmente citar entidades separadas (por exemplo, “OpenAI, Anthropic, and Google”).
- Não use operadores
site:/-site:nas queries. UseincludeDomains/excludeDomainsno lugar.
- Nomeie o assunto e o que conta como correspondência: “Alert when OpenAI announces a brand-new model.”
- Esclareça termos ambíguos: “Firecrawl (the web scraping API)” evita que o judge confunda com equipamentos de combate a incêndio.
- Adicione
Ignore ...apenas para não correspondências específicas da intenção: “Ignore opinion pieces, tutorials, and unrelated AI news.” Não repita ruído genérico. O judge já lida com formatação, parâmetros de rastreamento e mudanças de reindexação. - Se a intenção for ampla, mantenha-a ampla. Metas específicas demais suprimem correspondências reais.
new: 0, e os alertas só disparam quando algo realmente novo e alinhado à meta aparece. Leia o resumo da verificação e o searchStatus de cada resultado (veja Statuses and dedup) para saber se ele está bem ajustado:
- Um fluxo constante de resultados
ignoredsignifica que as queries trazem ruído, que a meta depois rejeita. Restrinja as queries (ou reduzasearchWindow) para parar de pagar para o judge avaliar resultados que nunca vão gerar alert. watchingfrequente significa que a meta está ambígua. Deixe os critérios de correspondência mais claros para que o judge possa decidir.- Longos períodos sem resultados em um tema ativo significam que as queries são restritas demais ou que
searchWindowestá estreita demais. Amplie os termos ou aumente a janela. - Alertas que o usuário dispensa significam que a meta está ampla demais. Adicione um
Ignore ...específico para a intenção.
Julgamento
judgeEnabled do monitor, a mesma flag descrita em Metas e julgamento. Com o julgamento ativado, o Firecrawl faz scraping de cada resultado correspondente e avalia seu conteúdo em relação à meta, cobrando 1 crédito por resultado avaliado além da chamada de busca. Com judgeEnabled: false, um monitor em escala da web retorna os resultados de busca deduplicados sem julgamento por IA, apenas os novos resultados na SERP, e consome apenas os créditos das chamadas de busca (2 créditos por 10 resultados).
Status e deduplicação
status por página que os monitores de scraping e rastreamento, então os consumidores existentes de webhooks e resultados de verificação continuam funcionando sem alterações. Um resultado de busca é mapeado para:
new: um resultado que correspondeu à meta pela primeira vez. É isso que gera alertas.same: um resultado já visto em uma verificação anterior (sem novo alerta).error: um resultado que não pôde ser avaliado (por exemplo, o scraping para julgamento foi pulado).
metadata.searchStatus de cada página, com um destes valores:
searchStatus | status da página | Significado |
|---|---|---|
alert | new | Novo resultado que o judge considera relevante; dispara uma notificação. |
already_seen | same | O fingerprint correspondeu a um resultado de uma verificação anterior. |
watching | same | Novo resultado sobre o qual o judge ainda não tem confiança; é acompanhado, mas não gera alerta. |
ignored | same | Novo resultado que o judge classificou como não relevante para a meta. |
skipped | error | O resultado não pôde ser avaliado nesta verificação (por exemplo, falha no scraping ou julgamento em modo degradado). |
new. A deduplicação é baseada apenas na URL canônica (título e snippet deliberadamente não fazem parte do fingerprint, então uma mudança de título/snippet não dispara de novo). Como a chave é a URL, um evento do mundo real reportado em várias URLs de artigos gera um alerta por URL, não um por evento.
Editar a meta ou as queries do monitor incrementa seu goalVersion, o que invalida vereditos anteriores do judge. A reavaliação é feita sob demanda, e não em massa: os resultados existentes não são todos reavaliados de uma vez. Em vez disso, cada resultado é reavaliado na próxima vez em que reaparece em uma verificação, adotando então o novo goalVersion. Resultados que não reaparecem mantêm seu veredito antigo e o goalVersion anterior até reaparecerem.
- Agendamentos: cron ou frequência em linguagem natural, no mínimo 5 minutos.
- Metas e julgamento: obrigatório para alvos de busca, a menos que
judgeEnabled: false. - Notificações: envio via webhook e email.
- Resultados das verificações: inspecione cada verificação e seus resultados.
- Preços: 2 créditos a cada 10 resultados por verificação, mais 1 crédito por resultado avaliado.

