2024 年 12 月 17 日(火)
ブログ投稿として公開していた記事を、ファセット ナビゲーションのベスト プラクティスに関する新しいドキュメントとして公開しました。新しいドキュメントの重要な部分をいくつか要約したものを、ここでご紹介します。
ファセット ナビゲーションは、ユーザーがサイト上で必要なものを見つけるのに役立つ優れた方法ですが、慎重に実装しないと SEO 対策に悪影響を及ぼす可能性があります。なぜなら、無限に近い数の URL が生成される場合があり、以下のような問題につながる可能性があるからです。
- 過剰クロール: ユーザーにとって価値のない無数の URL のクロールに検索エンジンの時間が無駄に費やされます。
- 発見の遅れ: この過剰クロールにより、重要な新しいコンテンツの検出が遅くなります。
実際、サイト所有者から報告される過剰クロールの原因としてもっとも多いのは、ファセット ナビゲーションです。そして、ほとんどのケースでは、いくつかのベスト プラクティスを実施することで、この問題を回避できました。では、最初から説明していきます。
URL の問題
通常、ファセット ナビゲーションにおける各フィルタの組み合わせにより、固有の URL が作成されます。次に例を示します。
https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny
任意のパラメータ(product
、color
、または size
)を変更することで、新しい URL が生成され、URL が爆発的に増加する可能性があります。これにより、ほぼ無数の新しい URL が検出されるのを待つ状態になるという問題が生じます。この問題を改善するには次のような方法があります。
2 つのアプローチ
-
ファセット ナビゲーション URL をブロックする:
-
ファセット ナビゲーション URL をインデックスに登録する必要がない場合は、
robots.txt
を使用してクロールを禁止します。 -
または、フィルタに URL フラグメント(
#
)を使用します。通常、検索エンジンは URL フラグメントを無視します。
-
ファセット ナビゲーション URL をインデックスに登録する必要がない場合は、
-
ファセット ナビゲーション URL を最適化する(たとえコストがかかってもクロールが必要な場合):
-
URL パラメータには標準の区切り文字
&
を使用します。💩 は、パラメータの区切り文字としては適切ではありません。 - URL パス内のフィルタの順序は、一貫性を保ってください。
- 結果がないフィルタの組み合わせには、ステータス コード
404
を返します。 - 他に選択肢がない場合(たとえば、単一ページのアプリを使用している場合)を除き、空の結果を一般的な「見つかりません」ページにリダイレクトすることは避けてください。
-
URL パラメータには標準の区切り文字
重要な考慮事項
-
また、
rel="canonical"
を使用して、メインページにバリエーションを指すことで、シグナルを統合することも可能です。これは反映されるまでに時間がかかります。 -
フィルタのリンクに
rel="nofollow"
を使用することでクロールを抑制できますが、整合性を保つ必要があります。つまり、これらのページを指すすべてのリンク(内部および外部)に、rel="nofollow"
属性を指定する必要があります。 - ファセット ナビゲーション URL をクロールすると、常にサーバーのリソースが消費され、新しいコンテンツの検出に影響が出る可能性があります。
もし、ファセット ナビゲーションのベスト プラクティスに関する新しいドキュメントについてご提案やご不明な点がありましたら、そのドキュメントのフィードバック ツールをご利用ください。ファセット ナビゲーションに興味があり、他のユーザーと会話したい場合は、検索セントラル コミュニティが最適です。また、Google の LinkedIn アカウントもあります。
クロールについて詳しくは、12 月のクロール情報シリーズ全体をご覧ください。
12 月のクロール情報: CDN とクロール
2024 年 12 月 24 日(火) コンテンツ配信ネットワーク(CDN)は、ウェブサイトの遅延を短縮し、通常はウェブトラフィック関連のトラブル回避に特に役立つサービスです。CDN の主な目的は、サイトで大規模なトラフィック負荷が発生している場合でも、その影響を受けずにコンテンツをすばやく配信することにあります。CDN の「 "D" 」とは、世界中にコンテンツを届ける(Deliver)または分散する(Distribute)ことを指しており、1
12 月のクロール情報: HTTP キャッシュ保存
2024 年 12 月 9 日(月曜日) Google がキャッシュ保存をできるようにしてください。ぜひともお願いします。 インターネットの成長に伴い、Google によるクロールも増加しています。Google のクロール インフラストラクチャは、ヒューリスティックなキャッシュ保存のメカニズムをサポートしています。これは以前からそうです。ただ、ローカル キャッシュから返されるリクエストの数は 10 年前と比較して減少しています。10 年前はフェッチ全体の約 0.026%
12 月のクロール情報: Googlebot がクロールする理由とその方法
2024 年 12 月 3 日(火) Google 検索の検索結果にウェブページが表示される前に、Google 検索で少し作業が行われていることはおそらくご存じのことでしょう。その一つがクロールと呼ばれる処理です。Google 検索のクロールは、Google のサーバー上で稼働する Googlebot というプログラムによって実行されます。クロールはウェブを探索しながら、URL を取得し、ネットワーク