Presentamos /map

La forma más fácil de pasar de una sola URL a un mapa de todo el sitio web. Esto es especialmente útil para:
  • Cuando necesitas pedir al usuario final que elija qué enlaces extraer
  • Necesitas conocer rápidamente los enlaces de un sitio web
  • Necesitas extraer páginas de un sitio web relacionadas con un tema específico (usa el parámetro search)
  • Solo necesitas extraer páginas específicas de un sitio web

Mapeo

punto de conexión /map

Se usa para mapear una URL y obtener las URL del sitio web. Devuelve la mayoría de los enlaces presentes en el sitio.

Instalación

# pip install firecrawl-py

from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key="fc-TU-API-KEY")

Uso

from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key="fc-YOUR-API-KEY")
res = firecrawl.map(url="https://firecrawl.dev", limit=50, sitemap="include")
print(res)

Respuesta

Los SDK devolverán el objeto de datos directamente. cURL devolverá el payload exactamente como se muestra a continuación.
{
  "success": true,
  "links": [
    {
      "url": "https://docs.firecrawl.dev/features/scrape",
      "title": "Scrape | Firecrawl",
      "description": "Turn any url into clean data"
    },
    {
      "url": "https://www.firecrawl.dev/blog/5_easy_ways_to_access_glm_4_5",
      "title": "5 Easy Ways to Access GLM-4.5",
      "description": "Discover how to access GLM-4.5 models locally, through chat applications, via the official API, and using the LLM marketplaces API for seamless integration i..."
    },
    {
      "url": "https://www.firecrawl.dev/playground",
      "title": "Playground - Firecrawl",
      "description": "Preview the API response and get the code snippets for the API"
    },
    {
      "url": "https://www.firecrawl.dev/?testId=2a7e0542-077b-4eff-bec7-0130395570d6",
      "title": "Firecrawl - The Web Data API for AI",
      "description": "The web crawling, scraping, and search API for AI. Built for scale. Firecrawl delivers the entire internet to AI agents and builders. Clean, structured, and ..."
    },
    {
      "url": "https://www.firecrawl.dev/?testId=af391f07-ca0e-40d3-8ff2-b1ecf2e3fcde",
      "title": "Firecrawl - The Web Data API for AI",
      "description": "The web crawling, scraping, and search API for AI. Built for scale. Firecrawl delivers the entire internet to AI agents and builders. Clean, structured, and ..."
    },
    ...
  ]
}
El título y la descripción no siempre están presentes, ya que dependen del sitio web.
Map con el parámetro search te permite buscar URLs específicas dentro de un sitio web.
cURL
curl -X POST https://api.firecrawl.dev/v2/map \
  -H 'Content-Type: application/json' \
  -H 'Authorization: Bearer TU_API_KEY' \
  -d '{
    "url": "https://firecrawl.dev",
    "search": "docs"
  }'
La respuesta será una lista ordenada, de la más relevante a la menos relevante.
{
  "status": "success",
  "links": [
    {
      "url": "https://docs.firecrawl.dev",
      "title": "Firecrawl Docs",
      "description": "Documentación de Firecrawl",
    },
    {
      "url": "https://docs.firecrawl.dev/sdks/python",
      "title": "SDK de Firecrawl para Python",
      "description": "Documentación del SDK de Firecrawl para Python"
    },
    ...
  ]
}

Ubicación e idioma

Especifica el país y los idiomas preferidos para obtener contenido relevante según tu ubicación y preferencias de idioma, de forma similar al punto de conexión /scrape.

Cómo funciona

Cuando especificas la configuración de ubicación, Firecrawl usará, si está disponible, un proxy adecuado y emulará la configuración de idioma y zona horaria correspondientes. De forma predeterminada, la ubicación se establece en “US” si no se especifica.

Uso

Para usar la configuración de ubicación e idioma, incluye el objeto location en el cuerpo de la solicitud con las siguientes propiedades:
  • country: código de país ISO 3166-1 alfa-2 (p. ej., ‘US’, ‘AU’, ‘DE’, ‘JP’). Valor predeterminado: ‘US’.
  • languages: un arreglo de idiomas y configuraciones regionales preferidos para la solicitud, en orden de prioridad. Por defecto, el idioma de la ubicación especificada.
from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key="fc-YOUR-API-KEY")

res = firecrawl.map('https://example.com',
    location={
        'country': 'US',
        'languages': ['en']
    }
)

print(res)
Para más detalles sobre las ubicaciones compatibles, consulta la documentación de proxies.

Consideraciones

Este punto de conexión prioriza la velocidad, por lo que es posible que no capture todos los enlaces del sitio. Estamos trabajando en mejoras. Agradecemos mucho tus comentarios y sugerencias.