メインコンテンツへスキップ

事前準備

SDKをインストール

npm install @mendable/firecrawl-js
.env に API key を追加します:
FIRECRAWL_API_KEY=fc-YOUR-API-KEY

Webを検索

フォーム送信を処理するため、action 内で Firecrawl を使用します。app/routes/search.tsx を作成します。
import { json, type ActionFunctionArgs } from "@remix-run/node";
import { Form, useActionData } from "@remix-run/react";
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

export async function action({ request }: ActionFunctionArgs) {
  const formData = await request.formData();
  const query = formData.get("query") as string;
  const results = await firecrawl.search(query, { limit: 5 });
  return json({ results: (results.web || []).map((r) => ({ title: r.title, url: r.url })) });
}

export default function SearchPage() {
  const data = useActionData<typeof action>();

  return (
    <div>
      <Form method="post">
        <input name="query" placeholder="Search the web..." />
        <button type="submit">Search</button>
      </Form>
      {data?.results?.map((r, i) => (
        <div key={i}>
          <a href={r.url}>{r.title}</a>
        </div>
      ))}
    </div>
  );
}

ページをスクレイピングする

loader で Firecrawl を使って、リクエスト時にデータを取得します。app/routes/scrape.tsx を作成します:
import { json, type LoaderFunctionArgs } from "@remix-run/node";
import { useLoaderData } from "@remix-run/react";
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

export async function loader({ request }: LoaderFunctionArgs) {
  const url = new URL(request.url);
  const target = url.searchParams.get("url");
  if (!target) return json({ markdown: null });

  const result = await firecrawl.scrape(target);
  return json({ markdown: result.markdown });
}

export default function ScrapePage() {
  const { markdown } = useLoaderData<typeof loader>();

  return (
    <div>
      <h1>スクレイピングされたコンテンツ</h1>
      {markdown ? <pre>{markdown}</pre> : <p>ページをスクレイピングするには ?url= を指定してください</p>}
    </div>
  );
}

Interact でページを操作する

interact を使うと、ライブのブラウザセッションを操作して、ボタンのクリックやフォームの入力、動的コンテンツの抽出を行えます。app/routes/interact.tsx を作成します:
import { json, type ActionFunctionArgs } from "@remix-run/node";
import { Form, useActionData } from "@remix-run/react";
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

export async function action({ request }: ActionFunctionArgs) {
  const formData = await request.formData();
  const url = formData.get("url") as string;

  const result = await firecrawl.scrape(url, { formats: ['markdown'] });
  const scrapeId = result.metadata?.scrapeId;

  await firecrawl.interact(scrapeId, { prompt: 'Search for iPhone 16 Pro Max' });
  const response = await firecrawl.interact(scrapeId, { prompt: 'Click on the first result and tell me the price' });

  await firecrawl.stopInteraction(scrapeId);

  return json({ output: response.output });
}

export default function InteractPage() {
  const data = useActionData<typeof action>();

  return (
    <div>
      <Form method="post">
        <input name="url" placeholder="操作するURL..." />
        <button type="submit">Interact</button>
      </Form>
      {data?.output && <pre>{data.output}</pre>}
    </div>
  );
}

次のステップ

スクレイピング ドキュメント

フォーマット、アクション、プロキシなど、スクレイピングのオプションを網羅

Search ドキュメント

Web を検索してページ全体のコンテンツを取得

Interact ドキュメント

クリックやフォーム入力で動的コンテンツを抽出

Node SDK リファレンス

クロール、map、バッチスクレイピングなどを含む SDK の完全なリファレンス