安装
- Bundler
- Gem install
添加到 然后运行:
Gemfile:需要 Ruby 3.0 或更高版本。
使用方式
- 前往 firecrawl.dev 获取 API 密钥
- 将 API 密钥设置为名为
FIRECRAWL_API_KEY的环境变量,或直接通过Firecrawl::Client.new(api_key: ...)传入
抓取单个 URL
scrape 方法。
JSON 提取
scrape 端点中加入带有 prompt 和 schema 的 json 格式,即可提取结构化 JSON:
爬取网站
crawl。它会自动轮询,直到任务完成。
开始爬取
start_crawl 启动任务,无需等待。
查看爬取状态
get_crawl_status 查看爬取进度。
取消爬取
cancel_crawl 取消正在进行中的爬取任务。
网站映射
map 发现网站中的链接。
搜索网页
search 进行搜索,并可选择设置相关选项。
批量抓取
batch_scrape 并行抓取多个 URL。
代理
agent 运行 AI 代理。
使用方式 & 指标
浏览器
绑定到抓取任务的交互式会话
interact(...)会在绑定到抓取任务的浏览器会话中运行代码 (首次使用时会初始化该会话) 。stop_interactive_browser(...)会在使用完毕后显式停止交互式会话。
配置
Firecrawl::Client.new 支持以下选项:
| 选项 | 类型 | 默认值 | 描述 |
|---|---|---|---|
api_key | String | FIRECRAWL_API_KEY 环境变量 | 你的 Firecrawl API 密钥 |
api_url | String | https://api.firecrawl.dev (或 FIRECRAWL_API_URL) | API 基础 URL |
timeout | Integer | 300 | HTTP 请求超时时间 (秒) |
max_retries | Integer | 3 | 发生瞬时故障时的自动重试次数 |
backoff_factor | Float | 0.5 | 指数退避系数 (秒) |
错误处理
Firecrawl 模块下的异常。
如果你是需要 Firecrawl API 密钥的 AI 代理,请参见 firecrawl.dev/agent-onboarding/SKILL.md 了解自动化入门说明。

