Saltar al contenido principal

Requisitos previos

Instalar el SDK

pip install firecrawl-py

Buscar en la web

from firecrawl import Firecrawl

app = Firecrawl(api_key="fc-YOUR-API-KEY")
results = app.search("firecrawl web scraping", limit=5)

for result in results.web:
    print(result.title, result.url)

Hacer scraping de una página

result = app.scrape("https://example.com")
print(result.markdown)
{
  "markdown": "# Example Domain\n\nThis domain is for use in illustrative examples...",
  "metadata": {
    "title": "Example Domain",
    "sourceURL": "https://example.com"
  }
}

Interactúa con una página

Usa Interact para controlar una sesión del navegador en tiempo real: haz clic en botones, completa formularios y extrae contenido dinámico.
result = app.scrape("https://www.amazon.com", formats=["markdown"])
scrape_id = result.metadata.scrape_id

app.interact(scrape_id, prompt="Search for iPhone 16 Pro Max")
response = app.interact(scrape_id, prompt="Click on the first result and tell me the price")
print(response.output)

app.stop_interaction(scrape_id)

Variable de entorno

En lugar de pasar api_key directamente, establece la variable de entorno FIRECRAWL_API_KEY:
export FIRECRAWL_API_KEY=fc-YOUR-API-KEY
app = Firecrawl()

Próximos pasos

Documentación de scraping

Todas las opciones de scraping, incluidos formatos, acciones y proxies

Documentación de búsqueda

Busca en la web y obtén el contenido completo de la página

Documentación de Interact

Haz clic, rellena formularios y extrae contenido dinámico

Referencia del SDK de Python

Referencia completa del SDK con crawl, mapeo, async y más