メインコンテンツへスキップ
Amazonは最もスクレイピング対象となるECサイトの一つです。このガイドでは、Firecrawlの強力な機能を使って、商品データ、価格、レビュー、検索結果を効果的に抽出する方法を解説します。

セットアップ

npm install firecrawl zod

概要

Amazonをスクレイピングする際は、一般的に次のようなことを行います。
  • 商品情報 (タイトル、価格、在庫状況) を抽出する
  • カスタマーレビューと評価を取得する
  • 価格の変動を監視する
  • 商品をプログラムから検索する
  • 競合商品の出品を追跡する

JSONモードでスクレイピング

Zodスキーマを使って構造化された商品データを抽出します。
import { Firecrawl } from 'firecrawl';
import { z } from 'zod';

// Zodスキーマを定義
const ProductSchema = z.object({
    title: z.string(),
    price: z.string(),
    rating: z.number(),
    availability: z.string(),
    features: z.array(z.string())
});

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

const result = await firecrawl.scrape('https://www.amazon.com/dp/B0DZZWMB2L', {
    formats: [{
        type: 'json',
        schema: z.toJSONSchema(ProductSchema)
    }],
});

// Zodでパースして検証
const jsonData = typeof result.json === 'string' ? JSON.parse(result.json) : result.json;
const validated = ProductSchema.parse(jsonData);

console.log('✅ 検証済み商品データ:');
console.log(validated);
Amazonで商品を検索する。
import { Firecrawl } from 'firecrawl';

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

const searchResult = await firecrawl.search('gaming laptop site:amazon.com', {
    limit: 10,
    sources: [{ type: 'web' }], // { type: 'news' }, { type: 'images' }
    scrapeOptions: {
        formats: ['markdown']
    }
});

console.log(searchResult);

スクレイピング

1つの Amazon 商品ページをスクレイピングします。
import { Firecrawl } from 'firecrawl';

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

const result = await firecrawl.scrape('https://www.amazon.com/ASUS-ROG-Strix-Gaming-Laptop/dp/B0DZZWMB2L', {
    formats: ['markdown'], // 例: html、links など
    onlyMainContent: true
});

console.log(result);

Map

Amazon の商品ページやカテゴリページで利用可能なすべての URL を取得します。注: Map はコンテンツではなく URL のみを返します。
import { Firecrawl } from 'firecrawl';

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

const mapResult = await firecrawl.map('https://www.amazon.com/Best-Sellers-Electronics/zgbs/electronics');

console.log(mapResult.links);
// コンテンツなしでURLの配列を返す

クロール

Amazon のカテゴリや検索結果ページから複数のページをクロールします。
import { Firecrawl } from 'firecrawl';

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

const crawlResult = await firecrawl.crawl('https://www.amazon.com/s?k=mechanical+keyboards', {
    limit: 10,
    scrapeOptions: {
        formats: ['markdown']
    }
});

console.log(crawlResult.data);

バッチスクレイプ

複数の Amazon 商品 URL を同時にスクレイピングします。
import { Firecrawl } from 'firecrawl';

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });

// 完了を待つ
const job = await firecrawl.batchScrape([
    'https://www.amazon.com/ASUS-ROG-Strix-Gaming-Laptop/dp/B0DZZWMB2L',
    'https://www.amazon.com/Razer-Blade-Gaming-Laptop-Lightweight/dp/B0FP47DNFQ',
    'https://www.amazon.com/HP-2025-Omen-Gaming-Laptop/dp/B0FL4RMGSH'],
    {
        options: {
            formats: ['markdown']
        },
        pollInterval: 2,
        timeout: 120
    }
);


console.log(job.status, job.completed, job.total);

console.log(job);