概要
機能
- あらゆるウェブサイトに対する効率的なスクレイピング、クロール、コンテンツ発見
- 高度な検索機能と賢いコンテンツ抽出
- 深掘り調査と大規模バッチスクレイピング
- 柔軟なデプロイ(クラウドまたはセルフホスト)
- ストリーミング対応HTTPを活用するモダンなウェブ環境向けに最適化
前提条件
- firecrawl.dev で Firecrawl の API キーを取得する
- Google ADK をインストールする
セットアップ
利用可能なツール
| ツール | 名称 | 説明 |
|---|---|---|
| スクレイプツール | firecrawl_scrape | 高度なオプションで単一のURLからコンテンツをスクレイピングします |
| バッチスクレイプツール | firecrawl_batch_scrape | レート制限と並列処理を備え、複数のURLを効率的にスクレイピングします |
| バッチステータスの確認 | firecrawl_check_batch_status | バッチ処理のステータスを確認します |
| マップツール | firecrawl_map | サイト内のインデックス済みURLを網羅的に把握するためにサイト構造をマッピングします |
| サーチツール | firecrawl_search | ウェブを検索し、必要に応じて検索結果からコンテンツを抽出します |
| クローラーツール | firecrawl_crawl | 高度なオプションで非同期クローリングを開始します |
| クローラーステータスの確認 | firecrawl_check_crawl_status | クローリングジョブのステータスを確認します |
| 抽出ツール | firecrawl_extract | LLMを用いてウェブページから構造化された情報を抽出します |
構成
必須設定
- クラウド API を使用する場合は必須(デフォルト)
- FIRECRAWL_API_URL を指定したセルフホスト環境を使用する場合は任意
任意の設定
FIRECRAWL_API_URL: カスタム API エンドポイント- 例:
https://firecrawl.your-domain.com - 指定がない場合はクラウド API を使用します
FIRECRAWL_RETRY_MAX_ATTEMPTS: 最大リトライ回数(既定値: 3)FIRECRAWL_RETRY_INITIAL_DELAY: 初期待機時間(ミリ秒)(既定値: 1000)FIRECRAWL_RETRY_MAX_DELAY: 最大待機時間(ミリ秒)(既定値: 10000)FIRECRAWL_RETRY_BACKOFF_FACTOR: 指数バックオフ係数(既定値: 2)
FIRECRAWL_CREDIT_WARNING_THRESHOLD: 警告閾値(既定値: 1000)FIRECRAWL_CREDIT_CRITICAL_THRESHOLD: 重大閾値(既定値: 100)
例:Web Research Agent
ベストプラクティス
-
用途に合ったツールを使う:
- まず関連ページを探すなら
firecrawl_search - 単一ページなら
firecrawl_scrape - 既知の複数URLなら
firecrawl_batch_scrape - サイト全体の発見と取得には
firecrawl_crawl
- まず関連ページを探すなら
- 使用状況を監視する: 想定外の消費を避けるためにクレジットのしきい値を設定する
- エラーを適切に処理する: ユースケースに応じてリトライ設定を行う
- パフォーマンスを最適化する: 複数のURLを取得する場合はバッチ処理を使用する
Google Agent Development Kit(ADK)と Firecrawl を用いた AI エージェント構築の完全ガイド
Google の ADK フレームワークと Firecrawl を組み合わせ、Web スクレイピング機能を備えた強力なマルチエージェント AI システムの構築方法を学べます。
MCP サーバー ドキュメント
Firecrawl の Model Context Protocol(MCP)サーバーとの統合および機能について詳しく学べます。
Google ADK 公式ドキュメント
包括的なガイドと API リファレンスは、Google Agent Development Kit の公式ドキュメントをご覧ください。

