La forma más fácil de pasar de una sola URL a un mapa de todo el sitio web. Esto es especialmente útil para:
- Cuando necesitas pedir al usuario final que elija qué enlaces extraer
- Necesitas conocer rápidamente los enlaces de un sitio web
- Necesitas extraer páginas de un sitio web relacionadas con un tema específico (usa el parámetro
search
)
- Solo necesitas extraer páginas específicas de un sitio web
Se usa para mapear una URL y obtener las URL del sitio web. Devuelve la mayoría de los enlaces presentes en el sitio.
# pip install firecrawl-py
from firecrawl import Firecrawl
firecrawl = Firecrawl(api_key="fc-TU-API-KEY")
from firecrawl import Firecrawl
firecrawl = Firecrawl(api_key="fc-YOUR-API-KEY")
res = firecrawl.map(url="https://firecrawl.dev", limit=50, sitemap="include")
print(res)
Los SDK devolverán el objeto de datos directamente. cURL devolverá el payload exactamente como se muestra a continuación.
{
"success": true,
"links": [
{
"url": "https://docs.firecrawl.dev/features/scrape",
"title": "Scrape | Firecrawl",
"description": "Turn any url into clean data"
},
{
"url": "https://www.firecrawl.dev/blog/5_easy_ways_to_access_glm_4_5",
"title": "5 Easy Ways to Access GLM-4.5",
"description": "Discover how to access GLM-4.5 models locally, through chat applications, via the official API, and using the LLM marketplaces API for seamless integration i..."
},
{
"url": "https://www.firecrawl.dev/playground",
"title": "Playground - Firecrawl",
"description": "Preview the API response and get the code snippets for the API"
},
{
"url": "https://www.firecrawl.dev/?testId=2a7e0542-077b-4eff-bec7-0130395570d6",
"title": "Firecrawl - The Web Data API for AI",
"description": "The web crawling, scraping, and search API for AI. Built for scale. Firecrawl delivers the entire internet to AI agents and builders. Clean, structured, and ..."
},
{
"url": "https://www.firecrawl.dev/?testId=af391f07-ca0e-40d3-8ff2-b1ecf2e3fcde",
"title": "Firecrawl - The Web Data API for AI",
"description": "The web crawling, scraping, and search API for AI. Built for scale. Firecrawl delivers the entire internet to AI agents and builders. Clean, structured, and ..."
},
...
]
}
El título y la descripción no siempre están presentes, ya que dependen del sitio web.
Map con el parámetro search
te permite buscar URLs específicas dentro de un sitio web.
curl -X POST https://api.firecrawl.dev/v2/map \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer TU_API_KEY' \
-d '{
"url": "https://firecrawl.dev",
"search": "docs"
}'
La respuesta será una lista ordenada, de la más relevante a la menos relevante.
{
"status": "success",
"links": [
{
"url": "https://docs.firecrawl.dev",
"title": "Firecrawl Docs",
"description": "Documentación de Firecrawl",
},
{
"url": "https://docs.firecrawl.dev/sdks/python",
"title": "SDK de Firecrawl para Python",
"description": "Documentación del SDK de Firecrawl para Python"
},
...
]
}
Especifica el país y los idiomas preferidos para obtener contenido relevante según tu ubicación y preferencias de idioma, de forma similar al punto de conexión /scrape.
Cuando especificas la configuración de ubicación, Firecrawl usará, si está disponible, un proxy adecuado y emulará la configuración de idioma y zona horaria correspondientes. De forma predeterminada, la ubicación se establece en “US” si no se especifica.
Para usar la configuración de ubicación e idioma, incluye el objeto location
en el cuerpo de la solicitud con las siguientes propiedades:
country
: código de país ISO 3166-1 alfa-2 (p. ej., ‘US’, ‘AU’, ‘DE’, ‘JP’). Valor predeterminado: ‘US’.
languages
: un arreglo de idiomas y configuraciones regionales preferidos para la solicitud, en orden de prioridad. Por defecto, el idioma de la ubicación especificada.
from firecrawl import Firecrawl
firecrawl = Firecrawl(api_key="fc-YOUR-API-KEY")
res = firecrawl.map('https://example.com',
location={
'country': 'US',
'languages': ['en']
}
)
print(res)
Para más detalles sobre las ubicaciones compatibles, consulta la documentación de proxies.
Este punto de conexión prioriza la velocidad, por lo que es posible que no capture todos los enlaces del sitio. Estamos trabajando en mejoras. Agradecemos mucho tus comentarios y sugerencias.