跳转到主要内容

前提条件

安装 SDK

pip install firecrawl-py

进行网页搜索

from firecrawl import Firecrawl

app = Firecrawl(api_key="fc-YOUR-API-KEY")
results = app.search("firecrawl web scraping", limit=5)

for result in results.web:
    print(result.title, result.url)

抓取页面

result = app.scrape("https://example.com")
print(result.markdown)
{
  "markdown": "# Example Domain\n\nThis domain is for use in illustrative examples...",
  "metadata": {
    "title": "Example Domain",
    "sourceURL": "https://example.com"
  }
}

与页面交互

使用交互功能来控制实时浏览器会话——点击按钮、填写表单并提取动态内容。
result = app.scrape("https://www.amazon.com", formats=["markdown"])
scrape_id = result.metadata.scrape_id

app.interact(scrape_id, prompt="Search for iPhone 16 Pro Max")
response = app.interact(scrape_id, prompt="Click on the first result and tell me the price")
print(response.output)

app.stop_interaction(scrape_id)

环境变量

不要直接传入 api_key,请改为设置 FIRECRAWL_API_KEY 环境变量:
export FIRECRAWL_API_KEY=fc-YOUR-API-KEY
app = Firecrawl()

后续步骤

抓取文档

包含 formats、actions 和代理在内的所有 scrape 选项

搜索文档

进行网页搜索并获取完整页面内容

交互文档

点击、填写表单并提取动态内容

Python SDK 参考

包含爬取、map、async 等内容的完整 SDK 参考