Django 快速入门

前提条件

Django 4+ 项目
Firecrawl API 密钥 — 免费获取

安装 SDK

pip install firecrawl-py

将 API 密钥添加到 Django 设置或环境变量中：

export FIRECRAWL_API_KEY=fc-YOUR-API-KEY

创建视图

在你的 Django 应用中添加 search、抓取和交互视图。在 views.py 中：

import json
import os
from django.http import JsonResponse
from django.views.decorators.csrf import csrf_exempt
from django.views.decorators.http import require_POST
from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key=os.environ["FIRECRAWL_API_KEY"])


@csrf_exempt
@require_POST
def search_view(request):
    body = json.loads(request.body)
    results = firecrawl.search(body["query"], limit=body.get("limit", 5))
    return JsonResponse(
        [{"title": r.title, "url": r.url} for r in results.web],
        safe=False,
    )


@csrf_exempt
@require_POST
def scrape_view(request):
    body = json.loads(request.body)
    result = firecrawl.scrape(body["url"])
    return JsonResponse({
        "markdown": result.markdown,
        "metadata": result.metadata,
    })


@csrf_exempt
@require_POST
def interact_start_view(request):
    body = json.loads(request.body)
    result = firecrawl.scrape(body["url"], formats=["markdown"])
    return JsonResponse({"scrape_id": result.metadata.scrape_id})


@csrf_exempt
@require_POST
def interact_view(request):
    body = json.loads(request.body)
    response = firecrawl.interact(body["scrape_id"], prompt=body["prompt"])
    return JsonResponse({"output": response.output})


@csrf_exempt
@require_POST
def interact_stop_view(request):
    body = json.loads(request.body)
    firecrawl.stop_interaction(body["scrape_id"])
    return JsonResponse({"status": "stopped"})

配置 URL 路由

在 urls.py 中：

from django.urls import path
from . import views

urlpatterns = [
    path("api/search/", views.search_view),
    path("api/scrape/", views.scrape_view),
    path("api/interact/start/", views.interact_start_view),
    path("api/interact/", views.interact_view),
    path("api/interact/stop/", views.interact_stop_view),
]

试一下

python manage.py runserver

# 进行网页搜索
curl -X POST http://localhost:8000/api/search/ \
  -H "Content-Type: application/json" \
  -d '{"query": "firecrawl web scraping", "limit": 5}'

# 抓取页面
curl -X POST http://localhost:8000/api/scrape/ \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

# 启动交互式会话
curl -X POST http://localhost:8000/api/interact/start/ \
  -H "Content-Type: application/json" \
  -d '{"url": "https://www.amazon.com"}'

管理命令

在 Django 管理命令中使用 Firecrawl 运行脚本和数据管道。创建 management/commands/scrape.py：

import os
from django.core.management.base import BaseCommand
from firecrawl import Firecrawl


class Command(BaseCommand):
    help = "抓取一个 URL 并打印 markdown"

    def add_arguments(self, parser):
        parser.add_argument("url", type=str)

    def handle(self, *args, **options):
        firecrawl = Firecrawl(api_key=os.environ["FIRECRAWL_API_KEY"])
        result = firecrawl.scrape(options["url"])
        self.stdout.write(result.markdown)

python manage.py scrape https://example.com

下一步

抓取文档

所有抓取选项，包括 formats、actions 和代理

搜索文档

进行网页搜索并获取完整页面内容

交互文档

点击、填写表单并提取动态内容

Python SDK 参考

完整的 SDK 参考，涵盖爬取、map、async 等功能

快速上手

核心端点

更多

快速入门

开发者指南

Webhooks

使用场景

其他

参与贡献

Django

前提条件

安装 SDK

创建视图

配置 URL 路由

试一下

管理命令

下一步

抓取文档

搜索文档

交互文档

Python SDK 参考

​前提条件

​安装 SDK

​创建视图

​配置 URL 路由

​试一下

​管理命令

​下一步

抓取文档

搜索文档

交互文档

Python SDK 参考

前提条件

安装 SDK

创建视图

配置 URL 路由

试一下

管理命令

下一步