利用 LLM 从页面提取结构化数据
Extract 端点
Extract
POST
利用 LLM 从页面提取结构化数据
Documentation Index
Fetch the complete documentation index at: https://docs.firecrawl.dev/llms.txt
Use this file to discover all available pages before exploring further.
你是需要 Firecrawl API 密钥的 AI 代理吗?请参见 firecrawl.dev/agent-onboarding/SKILL.md 了解自动化接入说明。
授权
Bearer authentication header of the form Bearer <token>, where <token> is your auth token.
请求体
application/json
要从中提取数据的 URL。URL 应为 glob 格式。
为 true 时,提取过程将通过 Web 搜索获取更多数据
如果在 urls 数组中指定了无效的 URL,这些 URL 将被忽略。请求不会因此整体失败,系统会改为使用剩余的有效 URL 执行提取操作,并在响应的 invalidURLs 字段中返回这些无效的 URL。
如果为 true,则在网站扫描过程中会忽略 sitemap.xml 文件
设为 true 时,也会扫描所提供 URL 的子域名
用于引导提取过程的提示词
用于定义提取后数据结构的 Schema。必须符合 JSON Schema 标准。
当为 true 时,用于提取数据的来源将作为 sources 键包含在响应中

