Saltar al contenido principal

Presentamos /map

La forma más fácil de pasar de una sola URL a un mapa de todo el sitio web. Esto es especialmente útil para:
  • Cuando necesitas pedir al usuario final que elija qué enlaces extraer
  • Necesitas conocer rápidamente los enlaces de un sitio web
  • Necesitas extraer páginas de un sitio web relacionadas con un tema específico (usa el parámetro search)
  • Solo necesitas extraer páginas específicas de un sitio web

Pruébalo en el Playground

Prueba el mapeo en el playground interactivo — sin necesidad de escribir código.

Mapeo

punto de conexión /map

Se usa para mapear una URL y obtener las URL del sitio web. Devuelve la mayoría de los enlaces presentes en el sitio. Las URL se descubren principalmente desde el sitemap del sitio web, complementadas con resultados de motores de búsqueda (SERP) y páginas rastreadas previamente para mejorar la cobertura. Puedes controlar el comportamiento del sitemap con el parámetro sitemap.

Instalación

# pip install firecrawl-py

from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key="fc-TU-API-KEY")

Uso

from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key="fc-TU-API-KEY")
res = firecrawl.map(url="https://firecrawl.dev", limit=50, sitemap="include")
print(res)
Cada solicitud de mapeo consume 1 crédito por llamada, sin importar la cantidad de URL devueltas. Por ejemplo, establecer limit en 100.000 sigue usando 1 crédito.

Respuesta

Los SDK devolverán el objeto de datos directamente. cURL devolverá el payload exactamente como se muestra a continuación.
{
  "success": true,
  "links": [
    {
      "url": "https://docs.firecrawl.dev/features/scrape",
      "title": "Scrape | Firecrawl",
      "description": "Convierte cualquier URL en datos limpios"
    },
    {
      "url": "https://www.firecrawl.dev/blog/5_easy_ways_to_access_glm_4_5",
      "title": "5 maneras sencillas de acceder a GLM-4.5",
      "description": "Descubre cómo acceder a los modelos GLM-4.5 localmente, mediante aplicaciones de chat, a través de la API oficial y usando la API de los marketplaces de LLM para una integración sin fricciones..."
    },
    {
      "url": "https://www.firecrawl.dev/playground",
      "title": "Playground - Firecrawl",
      "description": "Previsualiza la respuesta de la API y obtén fragmentos de código para la API"
    },
    {
      "url": "https://www.firecrawl.dev/?testId=2a7e0542-077b-4eff-bec7-0130395570d6",
      "title": "Firecrawl - La API de datos web para IA",
      "description": "La API de rastreo, scraping y búsqueda web para IA. Diseñada para escalar. Firecrawl pone todo internet al alcance de agentes y desarrolladores de IA. Limpio, estructurado y ..."
    },
    {
      "url": "https://www.firecrawl.dev/?testId=af391f07-ca0e-40d3-8ff2-b1ecf2e3fcde",
      "title": "Firecrawl - La API de datos web para IA",
      "description": "La API de rastreo, scraping y búsqueda web para IA. Diseñada para escalar. Firecrawl pone todo internet al alcance de agentes y desarrolladores de IA. Limpio, estructurado y ..."
    },
    ...
  ]
}
El título y la descripción no siempre están presentes, ya que dependen del sitio web.
Map con el parámetro search te permite buscar URLs específicas dentro de un sitio web.
cURL
curl -X POST https://api.firecrawl.dev/v2/map \
  -H 'Content-Type: application/json' \
  -H 'Authorization: Bearer TU_API_KEY' \
  -d '{
    "url": "https://firecrawl.dev",
    "search": "docs"
  }'
La respuesta será una lista ordenada, de la más relevante a la menos relevante.
{
  "status": "success",
  "links": [
    {
      "url": "https://docs.firecrawl.dev",
      "title": "Firecrawl Docs",
      "description": "Documentación de Firecrawl",
    },
    {
      "url": "https://docs.firecrawl.dev/sdks/python",
      "title": "SDK de Firecrawl para Python",
      "description": "Documentación del SDK de Firecrawl para Python"
    },
    ...
  ]
}

Ubicación e idioma

Especifica el país y los idiomas preferidos para obtener contenido relevante según tu ubicación y preferencias de idioma, de forma similar al punto de conexión /scrape.

Cómo funciona

Cuando especificas la configuración de ubicación, Firecrawl usará, si está disponible, un proxy adecuado y emulará la configuración de idioma y zona horaria correspondientes. De forma predeterminada, la ubicación se establece en “US” si no se especifica.

Uso

Para usar la configuración de ubicación e idioma, incluye el objeto location en el cuerpo de la solicitud con las siguientes propiedades:
  • country: código de país ISO 3166-1 alfa-2 (p. ej., ‘US’, ‘AU’, ‘DE’, ‘JP’). Valor predeterminado: ‘US’.
  • languages: un arreglo de idiomas y configuraciones regionales preferidos para la solicitud, en orden de prioridad. Por defecto, el idioma de la ubicación especificada.
from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key="fc-TU-API-KEY")

res = firecrawl.map('https://example.com',
    location={
        'country': 'US',
        'languages': ['en']
    }
)

print(res)
Para más detalles sobre las ubicaciones compatibles, consulta la documentación de proxies.

Consideraciones

Este punto de conexión prioriza la velocidad, por lo que es posible que no capture todos los enlaces del sitio. Principalmente se basa en el sitemap del sitio, complementado con datos de rastreos en caché y resultados de motores de búsqueda. Para obtener una lista de URLs más completa y actualizada, considera usar el endpoint /crawl en su lugar.