12 月のクロール情報: ファセット ナビゲーション

2024 年 12 月 17 日(火)

ブログ投稿として公開していた記事を、ファセット ナビゲーションのベスト プラクティスに関する新しいドキュメントとして公開しました。新しいドキュメントの重要な部分をいくつか要約したものを、ここでご紹介します。

ファセット ナビゲーションは、ユーザーがサイト上で必要なものを見つけるのに役立つ優れた方法ですが、慎重に実装しないと SEO 対策に悪影響を及ぼす可能性があります。なぜなら、無限に近い数の URL が生成される場合があり、以下のような問題につながる可能性があるからです。

  • 過剰クロール: ユーザーにとって価値のない無数の URL のクロールに検索エンジンの時間が無駄に費やされます。
  • 発見の遅れ: この過剰クロールにより、重要な新しいコンテンツの検出が遅くなります。

実際、サイト所有者から報告される過剰クロールの原因としてもっとも多いのは、ファセット ナビゲーションです。そして、ほとんどのケースでは、いくつかのベスト プラクティスを実施することで、この問題を回避できました。では、最初から説明していきます。

URL の問題

通常、ファセット ナビゲーションにおける各フィルタの組み合わせにより、固有の URL が作成されます。次に例を示します。

https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny

任意のパラメータ(productcolor、または size)を変更することで、新しい URL が生成され、URL が爆発的に増加する可能性があります。これにより、ほぼ無数の新しい URL が検出されるのを待つ状態になるという問題が生じます。この問題を改善するには次のような方法があります。

2 つのアプローチ

  1. ファセット ナビゲーション URL をブロックする:
    • ファセット ナビゲーション URL をインデックスに登録する必要がない場合は、robots.txt を使用してクロールを禁止します。
    • または、フィルタに URL フラグメント(#)を使用します。通常、検索エンジンは URL フラグメントを無視します。
  2. ファセット ナビゲーション URL を最適化する(たとえコストがかかってもクロールが必要な場合):
    • URL パラメータには標準の区切り文字 & を使用します。💩 は、パラメータの区切り文字としては適切ではありません。
    • URL パス内のフィルタの順序は、一貫性を保ってください。
    • 結果がないフィルタの組み合わせには、ステータス コード 404 を返します。
    • 他に選択肢がない場合(たとえば、単一ページのアプリを使用している場合)を除き、空の結果を一般的な「見つかりません」ページにリダイレクトすることは避けてください。

重要な考慮事項

  • また、rel="canonical" を使用して、メインページにバリエーションを指すことで、シグナルを統合することも可能です。これは反映されるまでに時間がかかります。
  • フィルタのリンクに rel="nofollow" を使用することでクロールを抑制できますが、整合性を保つ必要があります。つまり、これらのページを指すすべてのリンク(内部および外部)に、rel="nofollow" 属性を指定する必要があります。
  • ファセット ナビゲーション URL をクロールすると、常にサーバーのリソースが消費され、新しいコンテンツの検出に影響が出る可能性があります。

もし、ファセット ナビゲーションのベスト プラクティスに関する新しいドキュメントについてご提案やご不明な点がありましたら、そのドキュメントのフィードバック ツールをご利用ください。ファセット ナビゲーションに興味があり、他のユーザーと会話したい場合は、検索セントラル コミュニティが最適です。また、Google の LinkedIn アカウントもあります。


クロールについて詳しくは、12 月のクロール情報シリーズ全体をご覧ください。