詳解移除網址 - 第 2 集:移除網頁中的機密文字

2010 年 8 月 6 日,星期五

我們在上一篇關於移除網址的文章中提到,有時候您可以完全封鎖網站上的網頁,或是將網頁從網站上完全移除。有時您或許只是變更網頁的部分內容,或是移除特定文字。由於網頁的檢索頻率不同,所以這些變更需要一段時間才會反映在搜尋結果中。在這篇網誌文章中,我們將會說明一些步驟,如果過舊、遭到移除的內容仍然以「摘要」的形式顯示在搜尋結果中,或是出現在可透過搜尋結果連結到的快取網頁中,您就可以採取這些步驟來解決問題。如果舊的內容含有需要快速移除的機密資訊,這樣做就有其必要,而如果您只是正常更新網站,就沒有必要這麼做。

我們以下面這個虛構的搜尋結果為例:

Walter E. Coyote < 標題

Chief Development Officer at Acme Corp 1948-2003: worked on the top
secret velocitus incalculii capturing device which has shown potential...

< 摘要
www.example.com/about/waltercoyote - Cached < 網址 + 快取網頁的連結

如要變更摘要 (或連結快取網頁) 中顯示的內容,必須先變更實際網頁上的內容。除非網頁公開顯示的內容有所變更,否則 Google 的自動程序會繼續在搜尋結果中顯示部分的原始內容。

變更網頁內容後,您可以透過幾種方式在搜尋結果中顯示這些變更:

  1. 等待 Googlebot 重新檢索網頁並重新建立索引:Google 會使用這種自然的方式更新大部分的內容。這有時可能需要相當長的時間,取決於 Googlebot 目前檢索相關網頁的頻率。重新檢索網頁並重新建立索引後,系統通常會以目前內容取代舊的內容,因此不會顯示舊的內容。假設 Googlebot 並未因遭到封鎖而無法檢索相關網頁 (無論是遭到 robots.txt 檔案封鎖或無法正常存取伺服器),您就不必採取任何特別的措施。通常我們無法加快檢索和建立索引的速度,因為這些程序都是全自動化,且取決於許多外部因素。

  2. 使用 Google 的公開網址移除工具要求移除已經從他人網頁上刪除的內容。使用這項工具時,請務必輸入已經過修改的網頁確切網址,然後選取「內容已從網頁中移除」選項,再指定一或多個已經從該網頁上完全移除的字詞。

    Google 快取移除工具

    請注意,您輸入的「所有」字詞都不得顯示在網頁上;即使字詞已從網頁的某個部分移除,如果該字詞仍出現在網頁的其他部分,您的要求就會遭到拒絕。請確保您所選的字詞 (或多個字詞) 不再出現在網頁上的「任何位置」。在上述範例中,如果您移除了「top secret velocitus incalculii capturing device」,則應該提交這些字詞,而不是像「我的專案」這樣的字詞。不過,如果網頁上任何位置還有「top」或「device」等字詞,系統就會拒絕要求。若要成功排除一切可能,通常最簡單的做法是只輸入一個您確定不會出現在網頁任何位置的字詞。

    一旦系統處理了您的要求,而且發現送出的字詞已不再出現於網頁上,則搜尋結果就不會再顯示摘要內容,也不會提供快取網頁。儘管摘要中不再顯示這些字詞,但仍會顯示該網頁的標題和網址;且對於已刪除內容的相關搜尋 (例如 velocitus incalculii 的搜尋查詢),您可能仍會在搜尋結果中發現該項目。不過,等到網頁經過重新檢索並重新編入索引,我們的搜尋結果便會顯示新的摘要內容和快取網頁。

    請記住,我們必須檢視網頁才能驗證是否移除該字詞。如果網頁已經不存在,且伺服器傳回適當的 404410 HTTP 結果碼,導致我們無法檢視網頁,則建議您要求移除網頁

  3. 使用 Google 網站管理員工具網址移除工具,要求將資訊從您網站上的某個網頁中移除。如果您有權存取相關網站,且已經在 Google 網站管理員工具中驗證網站的擁有權,就可以使用網址移除工具 (位於「網站設定」>「檢索器存取權」下) 來要求移除摘要和快取網頁,直到系統重新檢索網頁為止。如果要使用這項工具,您只需提交網頁的確切網址 (不必指定任何已移除的字詞)。系統處理您的要求後,就會從搜尋結果中移除摘要和快取網頁,但仍然會顯示網頁的標題和網址,當搜尋與已移除的內容有關的內容時,該網頁仍可能繼續出現在搜尋結果中。重新檢索網頁並重新建立索引後,系統就會根據新內容,在搜尋結果中顯示更新的摘要和快取網頁。

Google 會同時根據網頁內容和其他外部因素 (例如網址的連入連結),為網頁建立索引並進行排名。因此,即使網頁已重新檢索並重新建立索引,搜尋結果中可能還是會繼續出現已經移除的網頁的內容網址。雖然網址移除工具能夠從搜尋結果中移除摘要和快取網頁,但是當有人搜尋任何目前或先前的內容時,這項工具並不會變更或移除搜尋結果的標題、變更顯示的網址,或是禁止顯示網頁。如果這對您來說相當重要,請確認網址符合從搜尋結果中完全移除的規定。

移除非 HTML 內容

如果變更的內容不是 (X)HTML (例如,如果圖片、Flash 檔案或 PDF 檔案已經變更),則您將無法使用快取移除工具。因此,如果您必須確保舊內容不會再出現在搜尋結果中,最快的方法就是變更檔案網址,讓舊網址傳回 404 HTTP 結果碼,並使用網址移除工具移除舊網址。否則,如果您選擇讓 Google 自然重新整理資訊,則系統必須在重新檢索後更新資訊,這樣預覽非 HTML 內容 (例如 PDF 檔案的快速檢視連結) 所需的時間,會比一般 HTML 網頁還要長。

主動防止顯示網頁摘要或快取版本

身為網站管理員,您可以選擇使用漫遊器 meta 標記來主動防止顯示網頁摘要或快取版本,而不必使用我們的移除工具。儘管我們並不建議使用這種預設方法 (摘要可以協助使用者更快找到相關搜尋結果,而快取網頁則能在發生無法存取伺服器的非預期事件情況下,讓使用者查看您的內容),但您還是可以使用「nosnippet」漫遊器 meta 標記來禁止顯示摘要,或是使用「noarchive」robots meta 標記來停用快取頁面。請注意,如果現有和已知網頁有所變更,Googlebot 就必須重新檢索這些網頁並重新建立索引,才能在搜尋結果中顯示變更。

希望這篇網誌文章能夠讓您更清楚瞭解更新的網頁網址移除工具背後的作業程序。在下一篇網誌文章中,我們將介紹如何要求移除不屬於自己的內容;敬請持續鎖定最新消息!

我們一如以往歡迎您前往網站管理員說明論壇提供意見和提問。

最後,我們也建議您參閱這篇文章,瞭解如何管理網路上與您有關的資訊。