Saltar al contenido principal

Requisitos previos

  • Un proyecto de Astro con SSR habilitado (output: "server" o "hybrid")
  • Una clave de la API de Firecrawl — obtén una gratis

Instalar el SDK

npm install @mendable/firecrawl-js
Añade tu clave de API a .env:
FIRECRAWL_API_KEY=fc-YOUR-API-KEY

Buscar en la web

Crea src/pages/api/search.ts:
import type { APIRoute } from "astro";
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({
  apiKey: import.meta.env.FIRECRAWL_API_KEY,
});

export const POST: APIRoute = async ({ request }) => {
  const { query } = await request.json();
  const results = await firecrawl.search(query, { limit: 5 });
  return new Response(JSON.stringify(results), {
    headers: { "Content-Type": "application/json" },
  });
};
O realiza la búsqueda en tiempo de solicitud en una página renderizada en el servidor (src/pages/search.astro):
---
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({
  apiKey: import.meta.env.FIRECRAWL_API_KEY,
});

const query = Astro.url.searchParams.get("q");
let results = [];

if (query) {
  const searchData = await firecrawl.search(query, { limit: 5 });
  results = searchData.web || [];
}
---

<html>
  <body>
    <h1>Search Results</h1>
    {results.length > 0 ? (
      <ul>
        {results.map((r) => (
          <li><a href={r.url}>{r.title}</a></li>
        ))}
      </ul>
    ) : (
      <p>Pass ?q= to search the web</p>
    )}
  </body>
</html>

Realiza scraping de una página

Crea src/pages/api/scrape.ts:
import type { APIRoute } from "astro";
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({
  apiKey: import.meta.env.FIRECRAWL_API_KEY,
});

export const POST: APIRoute = async ({ request }) => {
  const { url } = await request.json();
  const result = await firecrawl.scrape(url);
  return new Response(JSON.stringify(result), {
    headers: { "Content-Type": "application/json" },
  });
};
O hacer scraping al procesar la solicitud en una página renderizada en el servidor (src/pages/scrape.astro):
---
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({
  apiKey: import.meta.env.FIRECRAWL_API_KEY,
});

const target = Astro.url.searchParams.get("url");
let markdown = null;

if (target) {
  const result = await firecrawl.scrape(target);
  markdown = result.markdown;
}
---

<html>
  <body>
    <h1>Contenido extraído</h1>
    {markdown ? <pre>{markdown}</pre> : <p>Pasa ?url= para hacer scraping de una página</p>}
  </body>
</html>

Interactuar con una página

Crea src/pages/api/interact.ts:
import type { APIRoute } from "astro";
import Firecrawl from "@mendable/firecrawl-js";

const firecrawl = new Firecrawl({
  apiKey: import.meta.env.FIRECRAWL_API_KEY,
});

export const POST: APIRoute = async () => {
  const result = await firecrawl.scrape("https://www.amazon.com", {
    formats: ["markdown"],
  });

  const scrapeId = result.metadata?.scrapeId;

  await firecrawl.interact(scrapeId, {
    prompt: "Search for iPhone 16 Pro Max",
  });

  const response = await firecrawl.interact(scrapeId, {
    prompt: "Click on the first result and tell me the price",
  });

  await firecrawl.stopInteraction(scrapeId);

  return new Response(JSON.stringify({ output: response.output }), {
    headers: { "Content-Type": "application/json" },
  });
};

Siguientes pasos

Documentación de scraping

Todas las opciones de scraping, incluidos los formatos, las acciones y los proxies

Documentación de búsqueda

Busca en la web y obtén el contenido completo de la página

Documentación de interacción

Haz clic, completa formularios y extrae contenido dinámico

Referencia del SDK de Node

Referencia completa del SDK con crawl, map, extracción por lotes y más