利用 LLM 从网页中提取结构化数据
提取端点
Extract
POST
利用 LLM 从网页中提取结构化数据
Documentation Index
Fetch the complete documentation index at: https://docs.firecrawl.dev/llms.txt
Use this file to discover all available pages before exploring further.
注意:此 API 的新 v2 版本 现已推出,具备改进的功能和性能。
授权
Bearer authentication header of the form Bearer <token>, where <token> is your auth token.
请求体
application/json
用于提取数据的 URL。URL 应采用 glob 格式。
当设为 true 时,提取过程会通过网页搜索获取更多数据
如果在 urls 数组中指定了无效 URL,这些 URL 会被忽略。请求不会因此整体失败,而是会使用剩余的有效 URL 执行提取操作,并在响应的 invalidURLs 字段中返回这些无效 URL。
为 true 时,网站扫描过程中会忽略 sitemap.xml 文件
设为 true 时,还会扫描所提供 URL 的子域名
用于引导抽取过程的提示词
用于定义提取后数据结构的模式。必须符合 JSON Schema 规范。
如果为 true,用于提取数据的来源将会包含在响应的 sources 字段中

