import FirecrawlApp from '@mendable/firecrawl-js';
import OpenAI from 'openai';
import { z } from 'zod';
const firecrawl = new FirecrawlApp({ apiKey: process.env.FIRECRAWL_API_KEY });
const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY });
const ScrapeArgsSchema = z.object({
url: z.string().describe('La URL del sitio web a scrapear')
});
const tools = [{
type: 'function' as const,
function: {
name: 'scrape_website',
description: 'Scrapear contenido de cualquier URL de sitio web',
parameters: z.toJSONSchema(ScrapeArgsSchema)
}
}];
const response = await openai.chat.completions.create({
model: 'gpt-5-nano',
messages: [{
role: 'user',
content: '¿Qué es Firecrawl? Visita firecrawl.dev y cuéntame sobre él.'
}],
tools
});
const message = response.choices[0]?.message;
if (message?.tool_calls && message.tool_calls.length > 0) {
for (const toolCall of message.tool_calls) {
if (toolCall.type === 'function') {
console.log('Herramienta llamada:', toolCall.function.name);
const args = ScrapeArgsSchema.parse(JSON.parse(toolCall.function.arguments));
const result = await firecrawl.scrape(args.url, {
formats: ['markdown'] // Otros formatos: html, links, etc.
});
console.log('Contenido scrapeado:', result.markdown?.substring(0, 200) + '...');
// Enviar el contenido scrapeado de vuelta al modelo para la respuesta final
const finalResponse = await openai.chat.completions.create({
model: 'gpt-5-nano',
messages: [
{
role: 'user',
content: '¿Qué es Firecrawl? Visita firecrawl.dev y cuéntame sobre él.'
},
message,
{
role: 'tool',
tool_call_id: toolCall.id,
content: result.markdown || 'No se scrapeó contenido'
}
],
tools
});
console.log('Respuesta final:', finalResponse.choices[0]?.message?.content);
}
}
} else {
console.log('Respuesta directa:', message?.content);
}