Amazon es uno de los sitios de comercio electrónico más analizados mediante scraping. Esta guía te muestra cómo extraer de forma eficaz datos de productos, precios, reseñas y resultados de búsqueda usando las potentes funciones de Firecrawl.
npm install @mendable/firecrawl-js zod
Al hacer scraping en Amazon, normalmente querrás:
- Extraer información del producto (título, precio, disponibilidad)
- Obtener reseñas y valoraciones de clientes
- Supervisar cambios de precio
- Buscar productos de forma programática
- Hacer seguimiento de listados de competidores
Extrae datos de productos estructurados usando esquemas de Zod.
import FirecrawlApp from '@mendable/firecrawl-js';
import { z } from 'zod';
// Definir esquema de Zod
const ProductSchema = z.object({
title: z.string(),
price: z.string(),
rating: z.number(),
availability: z.string(),
features: z.array(z.string())
});
const firecrawl = new FirecrawlApp({ apiKey: process.env.FIRECRAWL_API_KEY });
const result = await firecrawl.scrape('https://www.amazon.com/dp/B0DZZWMB2L', {
formats: [{
type: 'json',
schema: z.toJSONSchema(ProductSchema)
}],
});
// Parsear y validar con Zod
const jsonData = typeof result.json === 'string' ? JSON.parse(result.json) : result.json;
const validated = ProductSchema.parse(jsonData);
console.log('✅ Datos del producto validados:');
console.log(validated);
Busca productos en Amazon.
import FirecrawlApp from '@mendable/firecrawl-js';
const firecrawl = new FirecrawlApp({ apiKey: process.env.FIRECRAWL_API_KEY });
const searchResult = await firecrawl.search('gaming laptop site:amazon.com', {
limit: 10,
sources: [{ type: 'web' }], // { type: 'news' }, { type: 'images' }
scrapeOptions: {
formats: ['markdown']
}
});
console.log(searchResult);
Rastrea una única página de producto de Amazon.
import FirecrawlApp from '@mendable/firecrawl-js';
const firecrawl = new FirecrawlApp({ apiKey: process.env.FIRECRAWL_API_KEY });
const result = await firecrawl.scrape('https://www.amazon.com/ASUS-ROG-Strix-Gaming-Laptop/dp/B0DZZWMB2L', {
formats: ['markdown'], // p. ej. html, links, etc.
onlyMainContent: true
});
console.log(result);
Descubre todas las URL disponibles en páginas de productos o categorías de Amazon. Nota: Map devuelve solo URL, sin contenido.
import FirecrawlApp from '@mendable/firecrawl-js';
const firecrawl = new FirecrawlApp({ apiKey: process.env.FIRECRAWL_API_KEY });
const mapResult = await firecrawl.map('https://www.amazon.com/Best-Sellers-Electronics/zgbs/electronics');
console.log(mapResult.links);
// Devuelve un array de URLs sin contenido
Rastrea varias páginas de una categoría de Amazon o de resultados de búsqueda.
import FirecrawlApp from '@mendable/firecrawl-js';
const firecrawl = new FirecrawlApp({ apiKey: process.env.FIRECRAWL_API_KEY });
const crawlResult = await firecrawl.crawl('https://www.amazon.com/s?k=mechanical+keyboards', {
limit: 10,
scrapeOptions: {
formats: ['markdown']
}
});
console.log(crawlResult.data);
Extrae varias URL de productos de Amazon simultáneamente.
import FirecrawlApp from '@mendable/firecrawl-js';
const firecrawl = new FirecrawlApp({ apiKey: process.env.FIRECRAWL_API_KEY });
// Esperar a que se complete
const job = await firecrawl.batchScrape([
'https://www.amazon.com/ASUS-ROG-Strix-Gaming-Laptop/dp/B0DZZWMB2L',
'https://www.amazon.com/Razer-Blade-Gaming-Laptop-Lightweight/dp/B0FP47DNFQ',
'https://www.amazon.com/HP-2025-Omen-Gaming-Laptop/dp/B0FL4RMGSH'],
{
options: {
formatos: ['markdown']
},
pollInterval: 2,
timeout: 120
}
);
console.log(job.status, job.completed, job.total);
console.log(job);