Saltar al contenido principal

Requisitos previos

Instala el SDK

npm install @mendable/firecrawl-js
Añade tu clave de API a .env:
FIRECRAWL_API_KEY=fc-YOUR-API-KEY

Buscar en la web

Usa Firecrawl en una action para gestionar el envío de formularios. Crea app/routes/search.tsx:
import { json, type ActionFunctionArgs } from "@remix-run/node";
import { Form, useActionData } from "@remix-run/react";
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

export async function action({ request }: ActionFunctionArgs) {
  const formData = await request.formData();
  const query = formData.get("query") as string;
  const results = await firecrawl.search(query, { limit: 5 });
  return json({ results: (results.web || []).map((r) => ({ title: r.title, url: r.url })) });
}

export default function SearchPage() {
  const data = useActionData<typeof action>();

  return (
    <div>
      <Form method="post">
        <input name="query" placeholder="Buscar en la web..." />
        <button type="submit">Buscar</button>
      </Form>
      {data?.results?.map((r, i) => (
        <div key={i}>
          <a href={r.url}>{r.title}</a>
        </div>
      ))}
    </div>
  );
}

Hacer scraping de una página

Usa Firecrawl en un loader para obtener datos cuando se realiza la solicitud. Crea app/routes/scrape.tsx:
import { json, type LoaderFunctionArgs } from "@remix-run/node";
import { useLoaderData } from "@remix-run/react";
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

export async function loader({ request }: LoaderFunctionArgs) {
  const url = new URL(request.url);
  const target = url.searchParams.get("url");
  if (!target) return json({ markdown: null });

  const result = await firecrawl.scrape(target);
  return json({ markdown: result.markdown });
}

export default function ScrapePage() {
  const { markdown } = useLoaderData<typeof loader>();

  return (
    <div>
      <h1>Scraped Content</h1>
      {markdown ? <pre>{markdown}</pre> : <p>Pass ?url= to scrape a page</p>}
    </div>
  );
}

Interactúa con una página

Usa interact para controlar una sesión activa del navegador: haz clic en botones, rellena formularios y extrae contenido dinámico. Crea app/routes/interact.tsx:
import { json, type ActionFunctionArgs } from "@remix-run/node";
import { Form, useActionData } from "@remix-run/react";
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

export async function action({ request }: ActionFunctionArgs) {
  const formData = await request.formData();
  const url = formData.get("url") as string;

  const result = await firecrawl.scrape(url, { formats: ['markdown'] });
  const scrapeId = result.metadata?.scrapeId;

  await firecrawl.interact(scrapeId, { prompt: 'Search for iPhone 16 Pro Max' });
  const response = await firecrawl.interact(scrapeId, { prompt: 'Click on the first result and tell me the price' });

  await firecrawl.stopInteraction(scrapeId);

  return json({ output: response.output });
}

export default function InteractPage() {
  const data = useActionData<typeof action>();

  return (
    <div>
      <Form method="post">
        <input name="url" placeholder="URL con la que interactuar..." />
        <button type="submit">Interactuar</button>
      </Form>
      {data?.output && <pre>{data.output}</pre>}
    </div>
  );
}

Siguientes pasos

Documentación de scraping

Todas las opciones de scraping, incluidos los formatos, las acciones y los proxies

Documentación de búsqueda

Buscar en la web y obtener el contenido completo de la página

Documentación de Interact

Haz clic, completa formularios y extrae contenido dinámico

Referencia del SDK de Node

Referencia completa del SDK con crawl, mapeo, extracción por lotes y más