支持的操作
- Crawl - 在页面被爬取过程中以及爬取完成时收到通知
- Batch scrape - 针对批量中每个被抓取的 URL 收到更新
- Extract - 在提取任务开始、完成或失败时收到更新
快速开始
webhook
对象以配置 webhook:
JSON
配置选项
字段 | 类型 | 必填 | 描述 |
---|---|---|---|
url | string | ✅ | 你的 webhook 端点 URL |
headers | object | ❌ | 在 webhook 请求中附带的自定义请求头 |
metadata | object | ❌ | 附加在所有 webhook 负载中的自定义数据 |
events | array | ❌ | 要接收的事件类型(默认:全部事件) |
基本用法示例
通过 Webhook 爬取
cURL
通过 Webhook 进行批量抓取
cURL
处理 Webhook
最佳实践
- 快速响应 – 始终在 30 秒内返回
2xx
状态码 - 异步处理 – 对于耗时任务,将其加入队列并立即返回响应
- 验证真实性 – 始终验证 webhook 签名(参见 Security)