AWS Lambda 快速入门

前提条件

拥有 Lambda 访问权限的 AWS 账户
一个 Firecrawl API 密钥——免费获取

配置

mkdir firecrawl-lambda && cd firecrawl-lambda
npm init -y
npm install firecrawl

进行网页搜索

创建包含搜索处理程序的 index.mjs：

import { Firecrawl } from "firecrawl";

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

export async function handler(event) {
  const body = JSON.parse(event.body || "{}");

  if (body.action === "search") {
    const results = await firecrawl.search(body.query, { limit: 5 });
    return {
      statusCode: 200,
      body: JSON.stringify(results),
    };
  }

  return { statusCode: 400, body: JSON.stringify({ error: "Unknown action" }) };
}

抓取页面

向同一个处理程序中添加一个 scrape action：

if (body.action === "scrape") {
  const result = await firecrawl.scrape(body.url);
  return {
    statusCode: 200,
    body: JSON.stringify(result),
  };
}

与页面交互

添加一个 interact 操作，以控制实时浏览器会话——点击按钮、填写表单并提取动态内容：

if (body.action === "interact") {
  const result = await firecrawl.scrape("https://www.amazon.com", {
    formats: ["markdown"],
  });
  const scrapeId = result.metadata?.scrapeId;

  await firecrawl.interact(scrapeId, {
    prompt: "Search for iPhone 16 Pro Max",
  });
  const response = await firecrawl.interact(scrapeId, {
    prompt: "Click on the first result and tell me the price",
  });

  await firecrawl.stopInteraction(scrapeId);
  return {
    statusCode: 200,
    body: JSON.stringify({ output: response.output }),
  };
}

部署

使用 AWS CLI 进行打包和部署：

zip -r function.zip index.mjs node_modules/

aws lambda create-function \
  --function-name firecrawl-scraper \
  --runtime nodejs20.x \
  --handler index.handler \
  --zip-file fileb://function.zip \
  --role arn:aws:iam::YOUR_ACCOUNT:role/lambda-role \
  --environment Variables="{FIRECRAWL_API_KEY=fc-YOUR-API-KEY}" \
  --timeout 60

将 Lambda 的超时时间设置为至少 30 秒。抓取动态页面和交互会话所需的时间可能会超过默认的 3 秒超时时间。

后续步骤

搜索文档

进行网页搜索并获取完整页面内容

抓取文档

所有抓取选项，包括 formats、actions 和代理

交互文档

点击、填写表单并提取动态内容

Node SDK 参考

完整的 SDK 参考，涵盖爬取、map、批量抓取等

快速上手

核心端点

更多

快速入门

开发者指南

Webhooks

使用场景

其他

参与贡献

AWS Lambda

前提条件

配置

进行网页搜索

抓取页面

与页面交互

部署

后续步骤

搜索文档

抓取文档

交互文档

Node SDK 参考

​前提条件

​配置

​进行网页搜索

​抓取页面

​与页面交互

​部署

​后续步骤

搜索文档

抓取文档

交互文档

Node SDK 参考

前提条件

配置

进行网页搜索

抓取页面

与页面交互

部署

后续步骤