使用 Firecrawl 抓取并提取结构化数据
-
设置 Schema(可选):
定义一个 JSON Schema(采用 OpenAI 的格式)来明确所需数据;如果不需要严格的 Schema,也可仅提供一个
prompt
,并附上网页 URL。 - 发起请求: 使用 JSON 模式将你的 URL 和 Schema 发送到我们的 /scrape 端点。查看方法: Scrape Endpoint Documentation
- 获取数据: 返回与你的 Schema 匹配的干净、结构化数据,可直接使用。
提取结构化数据
通过 /scrape 的 JSON 模式
JSON
无需 schema 的结构化数据
prompt
,在没有 schema 的情况下进行提取。LLM 会自行确定数据结构。
JSON
JSON 格式选项
formats
中包含一个对象,例如:
formats: [{ type: 'json', schema: { ... }, prompt: '...' }]
参数:
schema
:用于描述期望结构化输出的 JSON Schema。prompt
:可选提示,用于引导提取(在无 schema 的提取中同样使用)。