隠しテキストは Google のウェブマスター向けガイドライン違反です

2009年12月15日火曜日

約 1 年前に、「 Google の検索は隠しテキストが嫌い 」という記事を Google 公式ブログ 日本版 に掲載しましたが、その記事でもお伝えしましたように、隠しテキストは、Google の ウェブマスター向けガイドライン に違反します。その理由の詳細は、 ウェブマスター向けヘルプ センターの記事 にも載せておりますが、本日はその背景と、日本で多く見られる隠しテキストの具体的な一例を改めてご紹介します。

Google の検索は、隠しテキストに限らず、ユーザーが閲覧するウェブページと Googlebot が取得するウェブページの情報が大きく異なる状態を好みません。なぜなら、Google の検索では、Googlebot が取得したウェブページの情報をもとに検索結果をユーザーの方々に返しているため、取得したウェブページの情報と、実際にユーザーが見るページの内容に大きな差があると、適切な検索結果を返すことができなくなってしまうからです。

隠しテキストとなってしまう具体例。皆さまのサイトは大丈夫ですか?

例えば、次のような構造の、季節のギフトを販売するオンラインショップがあるとします。

HOME
┣┳ Products (商品一覧)
┃┣ ...........
┃┣ ...........
┃┣ ...........

┣━ Shipping (送料)
┣━ Payment (お支払方法)
┣━ Inquiry (お問い合わせ)
┗━ About (会社概要)

このサイトでは、膨大な量のウェブページのデザインを一括で管理し、季節ごとにデザインを変えるなどの作業を容易にするため、HTML ファイルと CSS ファイルを分けて構築しています。例えば、このサイトのナビゲーションは、次のような HTML ファイル、CSS ファイルが組み合わさって構築されています。


HTML ファイル:

<div id="navi">
<ul>
<li id="home"><a href="./index.html">ホリデー ギフト 通販 ホーム</a></li>
<li id="products"><a href="./products.html">ホリデー ギフト 通販 商品一覧</a></li>
<li id="shipping"><a href="./shipping.html">ホリデー ギフト 通販 送料</a></li>
<li id="payment"><a href="./payment.html">ホリデー ギフト 通販 お支払い方法</li>
<li id="inquiry"><a href="./inquiry.html">ホリデー ギフト 通販 お問い合わせ</li>
</ul>
</div>


CSS ファイル:

#navi li {
text-indent: -9999px;
}

#navi li#home {
background: url(./img/navi/home.gif) no-repeat;
}
#navi li#products {
background: url(./img/navi/products.gif) no-repeat;
}


CSS ファイル内には、text-indent プロパティを -9999 px と指定している箇所 ( 赤字 ) が見られます。これは、通常のブラウザでの閲覧時に、ナビゲーションに並ぶサイト内へのリンクを、テキストリンクの代わりに画像を使って表示させたい時に用いられることのある方法です。これにより、テキストリンクはページ外に移動する形で隠され、代わりに background プロパティで指定された画像が表示されます。
このナビゲーション部分を通常のウェブブラウザで閲覧すると、次のように見えます。




ナビゲーションが画像で綺麗に表示され、一見、何の問題もありません。

次に、このナビゲーション部分をテキストブラウザで見てみます。
多くのテキストブラウザでは、CSS による装飾が外され、テキストのみの形式でページを閲覧できます。
そして、テキストブラウザでの閲覧情報は、Googlebot がこのページを解釈するときに取得する情報とほぼ同等のものとなっています。




おや? 「ホリデー」「ギフト」「通販」など、先ほど通常のブラウザで閲覧した時には見えなかった単語が表示されていますね。じつは、このサイトでは CSS で隠されるテキストが通常のブラウザでは表示されないことを利用して、 関連するキーワードでの検索にマッチさせるためのキーワードを隠していたのでした。( 上記 HTML ファイルをチェックしてみてください。 )

通常のウェブブラウザで閲覧できる内容はユーザーに提示されている内容、テキストブラウザで閲覧できる内容は Googlebot に対して提示されている内容であるということから、このサイトについて考えてみましょう。
ウェブブラウザとテキストブラウザとでの閲覧時の内容を比較した場合、ナビゲーション部分に注目すると、Googlebot には ユーザーより不自然なほどに多くの文字情報が返されていることがわかります。このようなテキストは、「 隠しテキストと隠しリンク 」 と見なされ、このサイトの情報は、Google が適切な検索結果を提供するうえで信用できないと認識され、サイトが Google の検索結果から一時的に削除されることがあります。

ポイントは、そのテキストがユーザー向けであることです

ただ、画像の内容と CSS や alt 属性による代替テキストが完全に一致していなければならないわけではありません。 前回の記事 に も書きましたように、代替テキストが、ユーザーに読ませることを想定し、ユーザーにとって有益なものであると考えられるものであれば ( 例えばテキストブラウザや、テキスト読み上げソフトをご利用のユーザーのために書かれたものである場合 ) 、問題はありません。しかし、ユーザーのためではなく、検索エンジンのためにそのテキストを書いてしまっている場合は、サイトが検索結果から削除されてしまうことがあります。心配な場合は、上記のように、 Lynx w3m な どのテキストブラウザを使ってサイトを閲覧し、通常のブラウザでの閲覧時と比較し、ユーザーのためとは言えない隠しテキストや隠しリンクがないか確認してみてください。判断に迷った際は、「たとえ検索エンジンが存在しなくてもそのテキストを書いたかどうか」と考えてみてください。もし検索エンジンが存在しなくても、そのテキストがユーザーの利便性のために必要なものであると思われる場合、おそらくそれはガイドライン違反ではありません。

ご参考になりましたでしょうか。 ご自身のサイトに隠しテキストがあることが原因で、サイトが Google のインデックスから除外されている場合は、サイトを修正し、 再審査リクエスト を送信してください。

ご意見、ご質問は、 ウェブマスターヘルプフォーラム までお寄せください。