URL の削除について、パート III: 所有していないコンテンツの削除
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
2010 年 4 月 20 日(火曜日)
URL 削除シリーズの第 3 回投稿をお届けします。第 1 回と第 2 回の投稿では、自身の管理下にあるコンテンツを速やかに削除する方法と、キャッシュの速やかな削除をリクエストする方法について説明しました。今回は、Google の公開 URL 削除ツールを使用して、自身の管理下にないウェブサイトにコンテンツが掲載されているときに、Google の検索結果からコンテンツを削除するようリクエストする方法について説明します。
Google は、コンテンツの速やかな削除をリクエストできるように、次の 2 つのツールを提供しています。
-
確認済み URL 削除ツール: ウェブマスター ツールで自身が確認済み所有者になっているサイト(自分のブログや自社のサイトなど)でコンテンツが公開されているときに、Google の検索結果からそのコンテンツを削除するようリクエストするためのツール。
-
公開 URL 削除ツール: 自身の所有権を確認できないサイト(友だちのブログなど)でコンテンツが公開されているときに、Google の検索結果からそのコンテンツを削除するようリクエストするためのツール。
自身が所有していないサイトまたは管理できないサイトに掲載されている情報を削除したい場合があります。個々のサイトとサイトのコンテンツはそれぞれのウェブマスターが管理しているので、Google の検索結果を更新または削除する最良の方法は、コンテンツが公開されているサイトの所有者が URL のクロールをブロックするか、コンテンツ ソースを変更するか、ページを完全に削除することです。コンテンツが変更されなければ、次にクロールされたときに再び検索結果に表示されます。したがって、自身が所有していないサイトでホストされているコンテンツを削除する最初のステップは、ウェブサイトの所有者に連絡して、該当のコンテンツの削除またはブロックを依頼することです。
削除またはブロックされたコンテンツ
ウェブサイトの所有者がページを削除した場合は、削除されたページへのリクエストに対して 404 Not Found
レスポンスまたは 410 Gone
レスポンスが返されます。ウェブサイトの所有者が検索エンジンからページをブロックすることを選択した場合は、そのページをサイトの robots.txt ファイルで不許可にするか、そのページに noindex
meta
タグを含める必要があります。これらの要件のいずれかが満たされたら、[ウェブマスターがすでにページをブロックしています] オプションを使用して、削除リクエストを送信できます。
ウェブサイトの所有者がページをブロックまたは削除したと主張していても、技術的にそうしていない場合があります。ページをすでにブロックしたと主張している場合は、サイトの robots.txt ファイルを入念にチェックして、該当ページが禁止済みのリストに含まれているかどうかを確認できます。
User-agent: *
Disallow: /blocked-page/
ページがブロックされているかどうかは、ページの HTML ソースコード自体でも確認できます。そうするには、ブラウザでページにアクセスして、[ページのソースを表示] を選択します。HTML の head
セクションに noindex メタタグがあることを確認します。
<html>
<head>
<title>blocked page</title>
<meta name="robots" content="noindex">
</head>
...
ウェブサイトの所有者からページを削除したという通知が届いたら、HTTP レスポンス テストツール(Firefox ブラウザの Live HTTP Headers アドオンなど)を使用して確認できます。Firefox でこのアドオンを有効にすると、任意の URL をリクエストして、HTTP レスポンスが実際に 404 Not Found
または 410 Gone
になるかどうかをテストできます。
ページから削除されたコンテンツ
削除しようとしているコンテンツがページからなくなったことを確認したら、[コンテンツはすでにページから削除されました] オプションを使用して、キャッシュの削除をリクエストできます。このタイプの削除(通常は「キャッシュ」削除と呼ばれます)を行うと、古いページのキャッシュに保存されたコピーまたはバージョン、あるいはページのテキストの古いバージョンのスニペットが Google の検索結果に含まれなくなります。現在の更新済みページ(削除されたコンテンツを含まない)のみが Google の検索結果からアクセスできるようになります。ただし、現在の更新済みページは、外部サイトからのリンクがまだ存在しているために、引き続き古いコンテンツに関連する検索キーワードに対してランク付けされる可能性があります。キャッシュ削除リクエストでは、「ページから削除された語句」の入力を求められます。ページが変更されたことを Google の自動プロセスが確認できるように、現在のライブページにない単語を入力してください。そうしないと、リクエストは拒否されます。キャッシュ削除については、「URL の削除について」シリーズのパート II で詳しく説明しています。
セーフサーチでフィルタされた結果に表示される不適切なウェブページまたは画像の削除
Google は、不快感を与えるおそれがあるコンテンツを除外した検索結果の提供を目的として、セーフサーチ フィルタを導入しました。セーフサーチで除外されるべきと思われるコンテンツを見つけた場合は、セーフサーチでフィルタされた検索結果からそのコンテンツを今後除外するようリクエストできます。[セーフサーチでフィルタリングした検索結果に不適切なコンテンツが表示される] オプションを使用して、削除リクエストを送信してください。
公開 URL 削除ツールで問題が発生した場合や、このページで取り扱っていない疑問がある場合は、ウェブマスター ヘルプ フォーラムに投稿するか、ヘルプセンターで詳細な削除手順を参照してください。フォーラムに投稿する場合は、削除したいコンテンツへのリンクを表記する際に URL 短縮サービスを使用してください。
このシリーズの他の投稿
オンラインで利用可能な情報の管理もお読みになることをおすすめします。
Written by
Jonathan Simon, Webmaster Trends Analyst
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
[null,null,[],[[["\u003cp\u003eThis post focuses on Google's public URL removal tool, which helps remove content from search results when it's on a site you don't control.\u003c/p\u003e\n"],["\u003cp\u003eBefore using the tool, contact the website owner and request they remove or block the content, ensuring they return a 404/410 response or use robots.txt/noindex meta tag.\u003c/p\u003e\n"],["\u003cp\u003eIf content is removed from the page but still appears in search results, request a cache removal using the tool to update Google's index.\u003c/p\u003e\n"],["\u003cp\u003eYou can use the tool to request removal of inappropriate content appearing in SafeSearch filtered results.\u003c/p\u003e\n"],["\u003cp\u003eFor issues or questions, refer to the Webmaster Help Forum or detailed removal instructions in Google's Help Center.\u003c/p\u003e\n"]]],[],null,["# URL removal explained, Part III: Removing content that you don't own\n\nTuesday, April 20, 2010\n\n\nWelcome to the third episode of our URL removals series! In episodes one and two, we talked about\n[expediting the removal of content that's under your control](/search/blog/2010/03/url-removal-explained-part-i-urls)\nand\n[requesting expedited cache removals](/search/blog/2010/04/url-removals-explained-part-ii-removing).\nToday, we're covering how to use Google's\n[public URL removal tool](https://www.google.com/webmasters/tools/removals)\nto request removal of content from Google's search results when the content originates on a\nwebsite not under your control.\n\nGoogle offers two tools that provide a way to request expedited removal of content:\n\n1. Verified URL removal tool: for requesting to remove content from Google's search results when it's published on a site of which you're a verified owner in Webmaster Tools (like your blog or your company's site)\n2. Public URL removal tool: for requesting to remove content from Google's search results when it's published on a site which you can't verify ownership (like your friend's blog)\n\n\nSometimes a situation arises where the information you want to remove originates from a site that\nyou don't own or can't control. Since each individual webmaster controls their site and their\nsite's content, the best way to update or remove results from Google is for the site owner (where\nthe content is published) to either block crawling of the URL, modify the content source, or\nremove the page altogether. If the content isn't changed, it would just reappear in our search\nresults the next time we crawled it. So the first step to remove content that's hosted on a site\nyou don't own is to\n[contact the owner of the website](https://www.google.com/support/webmasters/bin/answer.py?answer=9109)\nand request that they remove or block the content in question.\n\nRemoved or blocked content\n--------------------------\n\n\nIf the website owner removes a page, requests for the removed\npage should return a\n[`404 Not Found` response or a `410 Gone` response](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes).\nIf they choose to block the page from search engines, then the page should either be disallowed\nin the site's\n[robots.txt](/search/docs/crawling-indexing/robots/intro)\nfile or contain a\n[`noindex` `meta` tag](/search/docs/crawling-indexing/block-indexing).\nOnce one of these requirements is met, you can submit a removal request using the \"Webmaster has\nalready blocked the page\" option.\n\n\nSometimes a website owner will claim that they've blocked or removed a page but they haven't\ntechnically done so. If they claim a page has been blocked you can double check by looking at the\nsite's robots.txt file to see if the page is listed there as disallowed. \n\n```\nUser-agent: *\nDisallow: /blocked-page/\n```\n\n\nAnother place to check if a page has been blocked is within the page's HTML source code itself.\nYou can visit the page and choose \"View Page Source\" from your browser. Is there a meta noindex\ntag in the HTML `head` section? \n\n```\n\u003chtml\u003e\n\u003chead\u003e\n\u003ctitle\u003eblocked page\u003c/title\u003e\n\u003cmeta name=\"robots\" content=\"noindex\"\u003e\n\u003c/head\u003e\n...\n```\n\n\nIf they inform you that the page has been removed, you can confirm this by using an HTTP response\ntesting tool like the\n[Live HTTP Headers](https://addons.mozilla.org/en-US/firefox/addon/3829)\nadd-on for the Firefox browser. With this add-on enabled, you can request any URL in Firefox to\ntest that the HTTP response is actually `404 Not Found` or `410 Gone`.\n\nContent removed from the page\n-----------------------------\n\n\nOnce you've confirmed that the content you're seeking to remove is no longer present on the page,\nyou can request a\n[cache removal](https://www.google.com/support/webmasters/bin/answer.py?answer=59819)\nusing the 'Content has been removed from the page' option. This type of\nremoval---usually called a \"cache\" removal---ensures that Google's search results will not\ninclude the cached copy or version of the old page, or any\n[snippets](/search/docs/appearance/snippet)\nof text from the old version of the page. Only the current updated page (without the content\nthat's been removed) will be accessible from Google's search results. However, the current updated\npage can potentially still rank for terms related to the old content as a result of inbound links\nthat still exist from external sites. For cache removal requests you'll be asked to enter a \"term\nthat has been removed from the page.\" Be sure to enter a word that is not found on the current\nlive page, so that our automated process can confirm the page has changed---otherwise the\nrequest will be denied. Cache removals are covered in more detail in\n[part two of the \"URL removal explained\" series](/search/blog/2010/04/url-removals-explained-part-ii-removing).\n\nRemoving inappropriate webpages or images that appear in our SafeSearch filtered results\n----------------------------------------------------------------------------------------\n\n\nGoogle introduced the\n[SafeSearch](https://www.google.com/support/websearch/bin/answer.py?answer=510)\nfilter with the goal of providing search results that exclude potentially offensive content. For\nsituations where you find content that you feel should have been filtered out by SafeSearch, you\ncan request that this content be excluded from SafeSearch filtered results in the future. Submit\na removal request using the 'Inappropriate content appears in our SafeSearch filtered results'\noption.\n\n\nIf you encounter any issues with the public URL removal tool or have questions not addressed here,\nplease post them to the\n[Webmaster Help Forum](https://support.google.com/webmasters/community/label?lid=5489e59697a233d7)\nor consult the more\n[detailed removal instructions](https://www.google.com/support/webmasters/bin/answer.py?answer=164734)\nin our Help Center. If you do post to the forum, remember to use a\n[URL shortening service](https://www.google.com/search?q=url+shorteners)\nto share any links to content you want removed.\n\nOther posts of this series\n--------------------------\n\n- [Part I: Removing URLs and directories](/search/blog/2010/03/url-removal-explained-part-i-urls)\n- [Part II: Removing and updating cached content](/search/blog/2010/04/url-removals-explained-part-ii-removing)\n- [Part III: Removing content you don't own](/search/blog/2010/04/url-removal-explained-part-iii-removing)\n- [Part IV: Tracking requests, what not to remove](/search/blog/2010/05/url-removal-explained-part-iv-tracking)\n\n\nFinally, you might be also interested to read about\n[managing what information is available about you online](/search/blog/2009/10/managing-your-reputation-through-search).\n\n\nWritten by\n[Jonathan Simon](/search/blog/authors/jonathan-simon), Webmaster Trends Analyst"]]