Saltar al contenido principal
Firecrawl /agent es una API mágica que busca, navega y recopila datos incluso de los sitios web más complejos, encontrando datos en lugares de difícil acceso y descubriendo información en cualquier parte de internet. Consigue en pocos minutos lo que a una persona le llevaría muchas horas y deja obsoleto el scraping web tradicional. Solo describe qué datos quieres y /agent se encarga del resto.
Vista previa de investigación: Agent está en acceso anticipado. Es de esperar que tenga algunos detalles por pulir. Mejorará significativamente con el tiempo. Comparte tus comentarios →
Agent se basa en todo lo bueno de /extract y lo lleva más allá:
  • No se requieren URL: Describe lo que necesitas mediante el parámetro prompt. Las URL son opcionales.
  • Búsqueda profunda en la web: Busca y navega de forma autónoma, explorando en profundidad los sitios para encontrar tus datos
  • Fiable y preciso: Funciona con una amplia variedad de consultas y casos de uso
  • Más rápido: Procesa múltiples fuentes en paralelo para obtener resultados más rápidos
  • Más económico: Agent es más rentable que /extract para casos de uso complejos

Uso de /agent

El único parámetro obligatorio es prompt. Describe simplemente qué datos quieres extraer. Para obtener salida estructurada, proporciona un esquema JSON. Los SDK son compatibles con Pydantic (Python) y Zod (Node) para definiciones de esquemas con tipado seguro:
from firecrawl import FirecrawlApp
from pydantic import BaseModel, Field
from typing import List, Optional

app = FirecrawlApp(api_key="fc-YOUR_API_KEY")

class Founder(BaseModel):
    name: str = Field(description="Full name of the founder")
    role: Optional[str] = Field(None, description="Role or position")
    background: Optional[str] = Field(None, description="Professional background")

class FoundersSchema(BaseModel):
    founders: List[Founder] = Field(description="List of founders")

result = app.agent(
    prompt="Find the founders of Firecrawl",
    schema=FoundersSchema
)

print(result.data)

Respuesta

JSON
{
  "success": true,
  "status": "completed",
  "data": {
    "founders": [
      {
        "name": "Eric Ciarla",
        "role": "Co-founder",
        "background": "Previously at Mendable"
      },
      {
        "name": "Nicolas Camara",
        "role": "Co-founder",
        "background": "Previously at Mendable"
      },
      {
        "name": "Caleb Peffer",
        "role": "Co-founder",
        "background": "Previously at Mendable"
      }
    ]
  },
  "expiresAt": "2024-12-15T00:00:00.000Z",
  "creditsUsed": 15
}

Proporcionar URLs (opcional)

Puedes proporcionar URLs opcionalmente para centrar al agente en páginas específicas:
from firecrawl import FirecrawlApp

app = FirecrawlApp(api_key="fc-YOUR_API_KEY")

result = app.agent(
    urls=["https://docs.firecrawl.dev", "https://firecrawl.dev/pricing"],
    prompt="Compare the features and pricing information from these pages"
)

print(result.data)

Estado y finalización de trabajos

Los trabajos de agente se ejecutan de forma asíncrona. Cuando envíes un trabajo, recibirás un ID de trabajo que podrás usar para comprobar su estado:
  • Método predeterminado: agent() espera y devuelve los resultados finales
  • Iniciar y luego consultar: Usa start_agent (Python) o startAgent (Node) para obtener un ID de trabajo de inmediato y luego consulta su estado con get_agent_status / getAgentStatus
Los resultados de los trabajos estarán disponibles durante 24 horas después de su finalización.
from firecrawl import FirecrawlApp

app = FirecrawlApp(api_key="fc-YOUR_API_KEY")

# Iniciar una tarea del agente
agent_job = app.start_agent(
    prompt="Find the founders of Firecrawl"
)

# Consultar el estado
status = app.get_agent_status(agent_job.id)

print(status)
# Ejemplo de salida:
# status='completed'
# success=True
# data={ ... }
# expires_at=datetime.datetime(...)
# credits_used=15

Posibles estados

EstadoDescripción
processingEl agente todavía está trabajando en tu solicitud
completedLa extracción finalizó correctamente
failedSe produjo un error durante la extracción

Ejemplo en estado pendiente

JSON
{
  "success": true,
  "status": "processing",
  "expiresAt": "2024-12-15T00:00:00.000Z"
}

Ejemplo completado

JSON
{
  "success": true,
  "status": "completed",
  "data": {
    "founders": [
      {
        "name": "Eric Ciarla",
        "role": "Co-founder"
      },
      {
        "name": "Nicolas Camara",
        "role": "Co-founder"
      },
      {
        "name": "Caleb Peffer",
        "role": "Co-founder"
      }
    ]
  },
  "expiresAt": "2024-12-15T00:00:00.000Z",
  "creditsUsed": 15
}

Parámetros

ParámetroTipoObligatorioDescripción
promptstringDescripción en lenguaje natural de los datos que deseas extraer (máx. 10.000 caracteres)
urlsarrayNoLista opcional de URLs en las que centrar la extracción
schemaobjectNoEsquema JSON opcional para una salida estructurada

Agent vs Extract: Qué ha mejorado

CaracterísticaAgent (nuevo)Extract
URLs necesariasNo
VelocidadMás rápidaEstándar
CostoMás bajoEstándar
FiabilidadMás altaEstándar
Flexibilidad de las consultasAltaModerada

Ejemplos de casos de uso

  • Investigación: “Encuentra las 5 principales startups de IA y sus montos de financiación”
  • Análisis de la competencia: “Compara los planes de precios entre Slack y Microsoft Teams”
  • Recopilación de datos: “Extrae información de contacto de sitios web de empresas”
  • Resumen de contenido: “Resume las últimas entradas de blog sobre web scraping”

Referencia de la API

Consulta la Agent API Reference para más detalles. ¿Tienes comentarios o necesitas ayuda? Escríbenos a [email protected].

Precios

Firecrawl Agent usa facturación dinámica que se ajusta a la complejidad de tu solicitud de extracción de datos. Pagas según el trabajo real que realiza Agent, lo que garantiza un precio justo tanto si estás extrayendo datos simples como información estructurada compleja de múltiples fuentes.

Cómo funcionan los precios de Agent

Los precios de Agent son dinámicos y basados en créditos durante la Research Preview:
  • Extracciones simples (como obtener información de contacto de una sola página) suelen usar menos créditos y cuestan menos
  • Tareas de investigación complejas (como análisis de la competencia en múltiples dominios) usan más créditos, pero reflejan el esfuerzo total involucrado
  • Uso transparente te muestra exactamente cuántos créditos consumió cada solicitud
  • Conversión de créditos convierte automáticamente el uso de créditos del agente en créditos para una facturación sencilla
El uso de créditos varía según la complejidad de tu prompt, la cantidad de datos procesados y la estructura de la salida solicitada.

Primeros pasos

Todos los usuarios reciben 5 ejecuciones gratuitas al día para explorar las capacidades de Agent sin costo. El uso adicional se cobra en función del consumo de créditos y se convierte en créditos.

Gestión de costos

Controla el gasto de tu Agent:
  • Empieza con ejecuciones gratuitas: Usa tus 5 solicitudes gratuitas diarias para entender los precios
  • Configura el parámetro maxCredits: Limita tu gasto estableciendo un número máximo de créditos que estás dispuesto a usar
  • Optimiza los prompts: Los prompts más específicos suelen consumir menos créditos
  • Supervisa tu uso: Haz seguimiento de tu consumo desde el panel
  • Define expectativas: Las investigaciones complejas en múltiples dominios consumirán más créditos que las extracciones sencillas de una sola página
Prueba Agent ahora en firecrawl.dev/app/agent para ver cómo escala el consumo de créditos según tus casos de uso específicos.
Los precios están sujetos a cambios a medida que pasamos de la Research Preview a la disponibilidad general. Los usuarios actuales recibirán aviso previo de cualquier actualización de precios.