コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
削除した情報が Google 検索に表示されないようにする
ドキュメントや画像をウェブに公開する際、人間の目には見えにくい情報を意図せず公開してしまう場合があります。たとえば、通常は表示されない情報や削除したはずの情報が一部のドキュメント形式に含まれていて、それが検索エンジンで表示されてしまうといったケースです。
検索エンジンは、画像も含めウェブ上の公開コンテンツをインデックスに登録するため、完全に削除していないコンテンツは検索エンジンで見つかる可能性があります。スクリーン リーダーなどの支援技術を使えば、この「隠れた」コンテンツにも簡単にアクセスできます。また、光学式文字認識(OCR)などの一般的な画像認識技術を使用して、このようなコンテンツを検索可能にすることもできます。
テキストのフォントサイズを小さくする、テキストのフォント色を背景色と同じにする、テキストを画像で覆うといった方法を使えば、人間の目からはある程度隠せるかもしれません。しかし、このような方法では、実際にはテキストが削除されていないため、検索エンジンによるインデックス登録や検索結果への表示を防ぐことはできません。
他にも、ドキュメントの種類によっては、情報が目に見えにくい形で含まれているものもあります。たとえば、ドキュメントの変更履歴が含まれていて、削除や変更を行ったテキストを表示できるものもあります。また、画像を切り抜いたり削除したりしても、そのすべてのバージョンが保持されるドキュメントもあります。ファイルにメタデータ(通常は表示されない)が含まれていて、そこにファイルのアクセス者や編集者の名前がリストされている場合もあります。
このような情報はすべて、ドキュメントがエクスポートされたり別の形式に変換されたりしても保持されうるものです。ファイルに削除すべき情報が含まれている場合は、そのファイルを公開する前に、対象の情報を完全に削除することが重要です。
ここでは、Google 検索によるインデックス登録や検索結果への表示がなされないよう、ドキュメントから情報を適切に削除するためのおすすめの方法を紹介します。
画像を埋め込み前に編集してエクスポートする
Google 検索には、ウェブで見つかった画像が表示されますが、その中にはウェブページ上の画像と、さまざまな形式のドキュメントに埋め込まれた画像の両方が含まれています。埋め込み画像については、それを含むドキュメントの編集ツールのみを使って、情報の削除が行われることがあります。その場合、画像がドキュメントから切り離されてインデックスに登録されると、削除が取り消されてしまう可能性があります。そのため、画像の編集はドキュメントへの埋め込み前に行うことをおすすめします。特に、次のことを推奨します。
- ドキュメントへの埋め込み前に、画像から不要な部分を切り取ります。ドキュメント編集ツール(ワード プロセッサやスライド作成ツールなど)によっては、切り取り前の画像が保持され、それがドキュメントの公開バージョンに使用されることがあります。ツールの説明ドキュメントを詳細にご確認ください。
-
画像に含まれるテキストやその他の非公開部分は、完全に削除するか不明瞭化します。画像にテキストが含まれていると、OCR システムによって検索可能なテキストに変換される可能性があるためです。
-
不要なメタデータはすべて削除します。
このドキュメントの推奨される手順を実施した後、更新済みの画像をベクター以外の単層の画像ファイル形式(PNG や WEBP など)でエクスポートまたは保存します。これにより、画像中の上記のような情報が誤って公開ドキュメントに含まれることがなくなります。
公開ファイル形式に移行する前に不要なテキストを編集または削除する
公開ドキュメントを生成する前に、表示したくないテキストを最終バージョンのファイルからすべて削除します。その後、公開ファイル形式に移行すれば、それまでの変更履歴が含まれることはありません。以下に、おすすめの方法を具体的に示します。
- ファイルの情報を削除する必要がある場合は、適切なドキュメント編集ツールを使用します。たとえば、削除の方法として、テキストを黒い四角で覆うことは避けてください。これでは、テキストが公開ドキュメントに含まれたままになります。
-
公開ファイルのドキュメント メタデータを再確認します。
-
使用するファイル形式(PDF、画像など)向けのドキュメントの情報削除に関するおすすめの方法を適用します。
-
URL またはファイル名自体に含まれる情報に注意します。ウェブサイトの一部を robots.txt でブロックしても、URL は検索のインデックスに登録されます(コンテンツは登録されません)。URL パラメータには、メールアドレスや名前の代わりにハッシュを使用してください。
-
認証を使用して、削除したコンテンツへのアクセスを制限することを検討します。結果のログインページに
noindex
robots meta
タグを指定して、インデックス登録をブロックします。
-
公開するときは、ウェブサイトが Google Search Console で確認済みであることを確かめます。これにより、必要な場合に迅速な削除作業が可能になります。
削除が未実施または不適切なドキュメントが検索のインデックスに登録された場合の対応
-
公開しているウェブサイトまたは場所からライブ ドキュメントを削除します。
-
確認済みのサイトに対して削除ツールを使用して、検索結果から問題のドキュメントを削除します。多数のドキュメントを削除する必要がある場合は、URL プレフィックスを使用します。確認済みサイトの場合、URL の削除には通常 1 日もかかりません。これで、削除したコンテンツを検索しても、問題のドキュメントは表示されなくなります。
-
適切に情報を削除したドキュメントを別の URL でホストします。こうすることで、インデックスに登録されているのがドキュメントの古いバージョンではなく、新しいバージョンであることを確認できます(URL の再クロールと検索インデックスの更新には時間がかかるため)。その後、対象ドキュメントへのリンクをすべて更新します。
-
情報の削除が不適切なドキュメントをホストしている他のすべてのサイトに連絡して、対象ドキュメントを削除するよう依頼します。Search Console アカウントで削除ツールを使用するよう依頼するか、古いコンテンツの削除ツールを使用して、Google に検索結果の更新をリクエストします。
-
URL の削除リクエストが期限切れ(Google の検索インデックスで URL が更新されたか、約 6 か月後)になるのを待ちます。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-08-04 UTC。
[null,null,["最終更新日 2025-08-04 UTC。"],[[["\u003cp\u003eAvoid unintentionally publishing sensitive information hidden within documents or images, as search engines can index this data.\u003c/p\u003e\n"],["\u003cp\u003eEmploy proper redaction techniques like cropping, obscuring, or removing sensitive content before publishing files, rather than relying on visual concealment methods.\u003c/p\u003e\n"],["\u003cp\u003eEdit images and remove unwanted text before embedding them into documents to prevent unintended exposure of redacted content.\u003c/p\u003e\n"],["\u003cp\u003eUse the Google Search Console's removal tools if improperly redacted documents are indexed to quickly remove them from search results.\u003c/p\u003e\n"]]],["To keep information out of Google Search, properly redact documents before publishing. Edit images before embedding them, cropping unwanted parts, removing text, and deleting metadata. Remove unwanted text from documents, using redaction tools instead of merely covering text. Export images in non-vector formats. For indexed, improperly redacted content, remove the live document, use Google Search Console's Removals tool, host a properly redacted version under a new URL, and contact other hosts to remove the documents.\n"],null,["# Keep Redacted Information out of Google | Google Search Central\n\nKeep redacted information out of Google Search\n==============================================\n\n\nWhen publishing documents and images on the web, you may unintentionally publish information\nbeyond what is immediately visible to the human eye. In particular, information that you might\nnot see, or that was intended to be redacted, might be included in some document formats and\nvisible to search engines.\n\nBecause search engines index public material on the web, including images, content that is\nnot completely redacted can potentially be findable in search engines. Assistive technologies\nlike screen readers can make this seemingly \"hidden\" content more easily accessible, and\ncommon image understanding techniques like optical character recognition (OCR) similarly make\nit possible to search for this content.\n\nEven though putting text in a tiny font, using a font color that's the same as the background\nthe text is on, or covering text with an image may make something invisible to the human eye,\nthese methods don't actually redact material in a way that prevents search engines from\nindexing it and making it findable.\n\n\nSimilarly, some document types include information in various ways that aren't immediately\nvisible. They might include the document's change history, allowing users to see text that has\nbeen redacted or altered. They might retain the full versions of images that contain cropped\nor redacted information. There might also be metadata that's included in a file, which is not\nimmediately visible, that may list the names of people who accessed or edited the file.\n\n\nAll of this information can remain even when a document is exported or converted from one\nformat to another. If you need to remove information from a file, it's critical that the\ninformation is removed completely from the file before that file is made public.\n\n\nHere are some best practices for how to appropriately redact information from documents that\nyou don't want to be indexed and made discoverable via Google Search.\n\nEdit and export images before embedding them\n--------------------------------------------\n\n\nGoogle Search lists images that it finds across the web, both those that are on web pages or\nthose that are embedded into various document formats. Embedded images are sometimes edited\nusing only the containing document's editing tools. This can cause this redaction to fail when\nan image is indexed apart from the document. That is why it's best to edit images before\nembedding them into a document, not after. In particular:\n\n- Crop out unwanted information from images before embedding them into documents. Some document editing tools (such as word processors or slide creation tools) will maintain any uncropped images that you use in the public version of the document, so be sure to review the tool's documentation thoroughly.\n- Completely remove or obscure any text or other non-public parts of the image, as OCR systems may turn any image text seen into searchable text.\n- Remove any undesired metadata.\n\n\nAfter following the suggestions in this document, export or save the updated images as non-vector or\nflattened image file formats such as PNG or WEBP. This prevents those parts of the images from\nbeing inadvertently included in a public document.\n\nEdit or remove unwanted text before moving to a public file format\n------------------------------------------------------------------\n\n\nBefore you generate the public document, remove any text that you don't want displayed in the\nfinal version of the file. Move to a public format that does not keep your previous change\nhistory. Here are more specific tips:\n\n- Use proper document redacting tools if a file needs to have information redacted. For example, avoid placing black rectangles over text as a redaction method, as this can result in the text still being included in the public document.\n- Double-check the document metadata in the public file.\n- Follow the [document redaction best practices](https://www.google.com/search?q=document+redaction+best+practices) for the format that you are using (PDF, image, etc).\n- Consider information in the URL or file name itself. Even if a part of a website is [blocked by robots.txt](/search/docs/crawling-indexing/robots/intro), the URLs may be indexed in search (without their content). Use hashes in URL parameters instead of email addresses or names.\n- Consider using authentication to limit access to the redacted content. Serve the resulting login page with a [`noindex` robots `meta` tag](/search/docs/crawling-indexing/block-indexing) to block indexing.\n- When publishing, make sure that the website is [verified in Google Search Console](https://support.google.com/webmasters/answer/9008080). This allows quick removal action, if needed.\n\nWhat to do if unredacted or improperly redacted documents are indexed in Search\n-------------------------------------------------------------------------------\n\n1. Remove the live document from the website or location where you published it.\n2. Use the [Removals tool](https://support.google.com/webmasters/answer/9689846) for the verified site to remove the documents in question from Search. Use a URL prefix if you need to remove many documents. For verified sites, a URL removal generally takes less than a day. This prevents the document in question from appearing for any searches for redacted content.\n3. Host the properly redacted document under a different URL. This makes sure that any newly indexed version is of the new document, and not an older version of the document (since recrawling of URLs and updating them in a search index can take a bit of time). Update any links to those documents.\n4. Contact any other site that may also be hosting the improperly redacted documents and ask them to take them down as well. Ask them to use the Removals tool in their Search Console account, or you can use the [Outdated Content tool](https://support.google.com/webmasters/answer/7041154) to ask Google's systems to update the search results.\n5. Allow the URL removal requests to expire (this happens after the URLs were either updated in the Google Search index, or after about 6 months)."]]