跳转到主要内容
Dify 官方插件: marketplace.dify.ai/plugins/langgenius/firecrawlDify 团队出品官方插件 • 超过 44,000 次安装 • 适用于 Chatflow 与 Agent 应用 • 免费使用

Dify 集成概览

Dify 是一个开源的 LLM 应用开发平台。官方 Firecrawl 插件可让你在 AI 工作流中直接进行网页爬取与抓取。

Chatflow & Workflow Apps

使用 Firecrawl 节点构建用于数据提取的可视化管道

Agent Applications

让 AI Agent 按需抓取实时网页数据

在 Dify 中使用 Firecrawl 工具

将任意 URL 转换为干净、结构化的数据。把原始 HTML 转化为可用的洞察。使用场景: 提取产品数据、抓取文章内容、通过 JSON 模式获取结构化数据。
对网站及其子域执行递归爬取以收集海量内容。使用场景: 全站内容提取、文档抓取、多页面数据收集。
生成站点内所有 URL 的完整映射。使用场景: 站点结构分析、SEO 审核、用于批量抓取的 URL 发现。
根据 Job ID 获取抓取结果,或取消正在进行的任务。使用场景: 监控长时运行的爬取、管理异步抓取流程、按需取消操作。

快速上手

1

安装 Firecrawl 插件

前往 Dify 插件市场 并安装 Firecrawl 工具
2

获取 Firecrawl API Key

访问 Firecrawl API Keys 并创建新的 API Key
3

在 Dify 中授权

进入 Plugins > Firecrawl > To Authorize,输入你的 API Key
4

添加到工作流

将 Firecrawl 工具拖入你的 Chatflow、Workflow 或 Agent 应用
5

配置与测试

配置参数并测试你的工作流

使用模式

  • Chatflow Apps
  • Workflow Apps
  • Agent Apps
可视化流水线集成
  1. 将 Firecrawl 节点添加到你的流水线
  2. 选择操作(Map、Crawl、Scrape)
  3. 定义输入变量
  4. 按顺序执行流水线
示例流程:
用户输入 → Firecrawl(Scrape)→ LLM 处理 → 返回结果

常见用例

AI Chatbot with Live Data

构建基于 RAG 的聊天机器人,抓取并引用网站的实时内容

Content Analysis Agent

通过抓取并分析多源信息进行主题调研的智能体

Competitor Monitoring

自动化流程,用于跟踪竞品网站并在变更时发出告警

Data Enrichment Pipeline

从网站提取并丰富数据,写入结构化数据库

Firecrawl actions

工具描述最适合
Scrape单页数据抽取快速捕获内容
Crawl多页递归爬取全站抽取
Map发现 URL 并生成站点地图SEO 分析、URL 清单
Crawl Job异步任务管理长时运行的操作

最佳实践

Agent Apps

  • 让智能体自行决定何时抓取
  • 使用自然语言指令
  • 在 LLM 设置中启用工具调用
  • 大规模抓取时监控 token 使用量

Workflow Apps

  • 针对大型站点先用 Map 再用 Crawl
  • 设置合理的抓取上限
  • 添加错误处理节点
  • 先用小规模数据集进行测试

Dify 与其他平台对比

功能DifyMakeZapiern8n
类型LLM 应用平台工作流自动化工作流自动化工作流自动化
最适合AI Agent 与聊天机器人可视化工作流快速自动化开发者掌控
定价开源 + 云端按操作计费按任务计费固定月费
AI 原生部分部分部分
自托管
专业提示: Dify 擅长构建需要动态网页访问的 AI 原生应用,特别适用于需要实时数据的聊天机器人、研究助手和 AI 工具。