此 SDK 目前使用 Firecrawl API 的 v1 版本,非最新(已提供 v2)。部分功能和改进可能仅在 v2 中可用。
安装
Cargo.toml
中添加以下内容:
Rust
使用
FirecrawlApp
。此后即可调用 FirecrawlApp::scrape_url
等函数来使用我们的 API。
下面是在 Rust 中使用该 SDK 的示例:
Rust
抓取单个 URL
scrape_url
方法。该方法以 URL 为参数,返回抓取结果,类型为 Document
。
Rust
使用 Extract 进行提取
serde_json::json!
宏,以 JSON Schema 格式指定你的 schema。
Rust
爬取网站
crawl_url
方法。该方法会等待爬取过程完成;具体耗时取决于起始 URL 和所选参数,可能会较长。
Rust
异步爬取
crawl_url_async
方法。它接受相同的参数,但会返回一个 CrawlAsyncRespone
结构体,其中包含本次爬取的 ID。你可以使用该 ID 调用 check_crawl_status
方法随时查询状态。请注意,已完成的爬取将在 24 小时后被删除。
Rust
映射 URL
Rust
错误处理
FirecrawlError
枚举,并实现了 Error
、Debug
和 Display
接口。我们的所有方法都返回 Result<T, FirecrawlError>
。