Saltar al contenido principal

Requisitos previos

Configuración

pip install flask firecrawl-py
Añade tu clave de API a .env:
FIRECRAWL_API_KEY=fc-YOUR-API-KEY

Crea la aplicación

Crea app.py:
import os
from flask import Flask, request, jsonify
from firecrawl import Firecrawl

app = Flask(__name__)
firecrawl = Firecrawl(api_key=os.environ["FIRECRAWL_API_KEY"])


@app.post("/search")
def search():
    data = request.get_json()
    results = firecrawl.search(data["query"], limit=data.get("limit", 5))
    return jsonify([{"title": r.title, "url": r.url} for r in results.web])


@app.post("/scrape")
def scrape():
    data = request.get_json()
    result = firecrawl.scrape(data["url"])
    return jsonify(markdown=result.markdown, metadata=result.metadata)


@app.post("/interact/start")
def interact_start():
    data = request.get_json()
    result = firecrawl.scrape(data["url"], formats=["markdown"])
    return jsonify(scrape_id=result.metadata.scrape_id)


@app.post("/interact")
def interact():
    data = request.get_json()
    response = firecrawl.interact(data["scrape_id"], prompt=data["prompt"])
    return jsonify(output=response.output)


@app.post("/interact/stop")
def interact_stop():
    data = request.get_json()
    firecrawl.stop_interaction(data["scrape_id"])
    return jsonify(status="stopped")


if __name__ == "__main__":
    app.run(debug=True)

Ejecútalo

flask run

Pruébalo

# Buscar en la web
curl -X POST http://localhost:5000/search \
  -H "Content-Type: application/json" \
  -d '{"query": "firecrawl web scraping", "limit": 5}'

# Hacer scraping de una página
curl -X POST http://localhost:5000/scrape \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

# Iniciar una sesión interactiva
curl -X POST http://localhost:5000/interact/start \
  -H "Content-Type: application/json" \
  -d '{"url": "https://www.amazon.com"}'

Siguientes pasos

Documentación de scraping

Todas las opciones de scraping, incluidos los formatos, las acciones y los proxies

Documentación de búsqueda

Busca en la web y obtén el contenido completo de la página

Documentación de Interact

Haz clic, completa formularios y extrae contenido dinámico

Referencia del SDK de Python

Referencia completa del SDK con crawl, map, async y más