url に対してクロールを実行し、見つかったすべてのページをスクレイピングしたうえで、その結果を直近で保持されたスナップショットと照合します。これにより、あらかじめ指定したページへの編集だけでなく、追加・変更・削除されたページも検知できます。ドキュメントサイト、ブログ、更新履歴、ヘルプセンター、競合他社のサイトには最適な選択肢です。
このページでは crawl ターゲットを扱います。スケジューリング、ゴールと判定、変更追跡、通知、料金は、すべてのモニタータイプで共通です。モニターの概要 を参照してください。
Web サイトモニターを作成する
crawl ターゲットを持つモニターを作成します。
クロールターゲット
crawl ターゲットでは、type と 1 つの url が必要です。クロールの挙動は crawlOptions、検出された各ページをどのようにスクレイピングするかは scrapeOptions で指定します。
Crawl target
crawlOptions フィールド:
limit: 1 回のチェックでクロールするページの最大数。maxDiscoveryDepth: 開始urlから何リンク先までページを検出するか。maxDepth: クロールの最大深度。includePaths: これらのパスパターンに一致する URL のみをモニターします (例:/docs) 。excludePaths: これらのパスパターンに一致する URL はスキップします。
maxAge のデフォルト値が 0 になるため、scrapeOptions で別の maxAge を設定しない限り、各チェックで検出されたページは毎回新たにスクレイピングされます。
各チェックで報告される内容
same: ページが再度検出され、変更はありませんでした。changed: ページが再度検出され、変更がありました。new: ページが初めて検出されました。removed: 前回のチェックで検出されたページが、今回は検出されませんでした。error: ページをチェックできませんでした。
scrapeOptions に changeTracking フォーマットを追加してください。変更追跡 を参照してください。

