2024 年 12 月 3 日(火)
Google 検索の検索結果にウェブページが表示される前に、Google 検索で少し作業が行われていることはおそらくご存じのことでしょう。その一つがクロールと呼ばれる処理です。Google 検索のクロールは、Google のサーバー上で稼働する Googlebot というプログラムによって実行されます。クロールはウェブを探索しながら、URL を取得し、ネットワーク エラーやリダイレクトなどの問題を検出した場合は処理していきます。そのほか、あまり語られていない詳細がいくつかあります。今月は毎週、それらの詳細を取り上げ、特にサイトがクロールされる方法に大きく影響する可能性がある情報について掘り下げていきます。
そもそも、クロールとは何か
クロールとは、新しいウェブページを発見したり、更新されたウェブページに再アクセスしたりして、それらをダウンロードするプロセスのことです。つまり、Googlebot は URL を取得し、ホストしているサーバーに HTTP リクエストを送信してサーバーからの応答を処理します。リダイレクトがあればそれに従い、エラーを処理し、ページのコンテンツを Google のインデックス登録システムに渡します。
しかし、最新のウェブページは純粋な HTML だけではありません。では、ページを構成するほかのリソースはどうなるのでしょうか?そして、それらのリソースをクロールすることは、「クロール バジェット」にどのように影響するのでしょうか?また、リソースは Google 側でキャッシュに保存できるのでしょうか?さらに、今までクロールされたことのない URL と、すでにインデックスに登録済みの URL には違いがあるのでしょうか?この投稿では、これらの質問に答え、さらに詳細を説明します。
Googlebot とページリソースのクロール
最新のウェブサイトは、HTML だけでなく JavaScript や CSS などのさまざまな技術を組み合わせて使用し、便利な機能や心踊るウェブサイト エクスペリエンスをユーザーに提供しています。ブラウザからそのようなページにアクセスすると、ブラウザはまず親 URL をダウンロードします。この URL には、そのページを構築してユーザーに表示するために必要なデータ、つまり HTML がホストされています。この初期データには、JavaScript や CSS などのリソースへの参照のほか、画像や動画などが含まれている場合があり、ブラウザはそれを再度ダウンロードして最終的なページを構築し、ユーザーに表示しています。
Google もまったく同じことを行いますが、方法は少し異なります。
- Googlebot は親 URL から初期データ、つまりページの HTML をダウンロードします。
- Googlebot は取得したデータをウェブ レンダリング サービス(WRS)に渡します。
- WRS は、Googlebot を使用して、オリジナル データで参照されているリソースをダウンロードします。
- WRS は、ユーザーのブラウザが行うように、ダウンロードしたすべてのリソースを使用してページを構築します。
ブラウザの場合に比べて、ステップからステップへの移行には時間がかかることがあります。ページのレンダリングに必要なリソースをホストしているサーバーの負荷の上昇が確認された場合など、スケジューリングが制約されることがあるためです。そして、これに絡めて話したいのがクロール バジェットというものです。
ページのレンダリングに必要なリソースをクロールすると、そのリソースをホストしているホスト名のクロール バジェットが減少します。バジェットを少しでも残しておくために、WRS は、表示するページで参照されているすべてのリソース(JavaScript や CSS)をキャッシュに保存しようとします。WRS キャッシュの有効期間(TTL)は、HTTP キャッシュ ディレクティブの影響を受けません。WRS はすべてを最大 30 日間キャッシュに保存し、クロール バジェットを他のクロールタスクに回せるようにします。
これをサイト所有者の観点から見ると、サイトのどのリソースをどのようにクロールしてほしいかを管理することで、クロール バジェットの減り方に影響を与えることができるのです。そこで Google は次のことを推奨しています。
- リソースを可能な限り最小限に抑える。ページのレンダリングに必要なリソースが少ないほど、レンダリング時のクロール バジェットも少なくて済み、ユーザーに優れたウェブサイト エクスペリエンスを提供できます。
- キャッシュ無効化パラメータは慎重に使用する。リソースの URL が変更されると、たとえコンテンツが変わっていなくても Google が再度そのリソースをクロールする必要が生じる可能性があります。これは当然、クロール バジェットを消費することになります。
- メインサイトとは異なるホスト名でリソースをホストする。たとえば、CDN を利用したり、リソースを別のサブドメインでホストしたりする方法があります。そうすることで、クロール バジェットの消費の負担はリソースをホストするホスト側に移動します。
これらのポイントはメディア リソースにも当てはまります。Googlebot(具体的には Googlebot-Image
と Googlebot-Video
)がメディア リソースを取得すると、サイトのクロール バジェットを消費します。
robots.txt を設定すればよいのではないかと思われるかもしれませんが、レンダリングの観点から見ると、リソースのクロールを禁止してしまうことは問題の火種となりかねないのです。それは、レンダリングに必要なリソースを WRS が取得できなければ、Google 検索はページのコンテンツを抽出できず、検索結果にページを表示できなくなる可能性があるためです。
Googlebot のクローリングとは
Google がクロールしているリソースを分析するのに最適な情報源は、サイトの未加工のアクセスログです。このログには、ブラウザやクローラーからリクエストされたすべての URL のエントリが記録されています。Google クローラーをアクセスログで識別するには、デベロッパー向けドキュメントに公開されている IP 範囲を参照してください。
次に優れた情報源は、もちろん、Search Console のクロール統計情報レポートです。このレポートでは、クロールされた各種リソースが分類されています。

最後に、クロールやレンダリングに興味があり、他のユーザーと会話したい場合は、検索セントラル コミュニティが最適です。また、Google の LinkedIn アカウントもあります。
更新
- 2024 年 12 月 6 日更新: 別のホストからリソースを提供する場合のパフォーマンスへの影響を記載しました。
クロールについて詳しくは、12 月のクロール情報シリーズ全体をご覧ください。
Vidio が Google 検索を活用し、地域関連性の高い動画の配信をインドネシアで拡大した方法
インドネシアの OTT メディア サービスである Vidio が、VideoObject マークアップを実装することで、Google 検索での動画のインプレッション数とクリック数を増やした方法について説明します。
Wix における SEO の事例紹介
ユーザーが Google 検索でのパフォーマンスを分析しやすくするために、Wix がどのようにしてプラットフォームに Google の API を統合したのかをご紹介します。サイトマップの送信、URL の検査、アクセス解析レポートといった新機能は、ユーザーがサイトを改善するのに役立ちます。
地域横断動画 SEO の事例紹介
グローバル コンテンツ パブリッシャー 3 社が、動画の SEO ベスト プラクティスの実施と、Search Console のレポートの使用により、オーディエンスへのリーチの効果を高め、サイトへのトラフィックを増やした事例をご覧ください。
Vimeo の動画 SEO の事例紹介
Vimeo が大量の構造化データを追加し、動画 SEO のベスト プラクティスを動画プレーヤーに適用した方法をご紹介します。これにより、Vimeo の顧客は追加の作業なしで重要なシーンなどの機能を活用できるようになりました。
Google 検索での大きな画像の事例紹介
Google の Discover に大きな画像を表示することで、どのようにクリック率が改善され、パブリッシャー サイトへのアクセスが増えるかをご紹介します。
動画の最適化の事例紹介
構造化データを追加して動画のインデックス登録を最適化することで、どのように MX Player が Google のオーガニック トラフィックを増やしたかをご紹介します。
SEO への投資の事例紹介
SEO に投資して適切な構造化データを実装することで、Google 検索におけるユーザー エクスペリエンスをいかに改善し、オーガニック トラフィックを増やしたかをご確認ください。
HowTo 構造化データの事例紹介
StyleCraze が構造化データをハウツーページに追加して、サイトのクリック率を増加させた事例をご覧ください。
Monster India の JobPosting マークアップに関する事例紹介
Monster India が求人情報ページに構造化データを追加し、求人詳細ページのオーガニック トラフィックを増やした事例をご紹介します。
Jobrapido の JobPosting マークアップに関する事例紹介
Jobrapido が求人情報ページに構造化データを追加し、オーガニック トラフィックを増加させた事例をご覧ください。
Eventbrite のイベント マークアップに関する事例紹介
Eventbrite がページにイベント構造化データを追加し、オーガニック トラフィックを増加させた事例をご覧ください。
レシピページの構造化データの事例紹介
レシピページに構造化データを追加することで、どのように楽天のユーザー エクスペリエンスが改善され、平均セッション継続時間が増加したかをご紹介します。
ZipRecruiter の JobPosting マークアップに関する事例紹介
ZipRecruiter が求人情報ページに構造化データを追加してコンバージョン率を上昇させた事例をご覧ください。