防範網站的部分內容遭到垃圾內容濫用

2021 年 5 月 26 日星期三

身為網站擁有者,您可能會提供數種管道供使用者進行互動,例如論壇、留言板、社群媒體平台、檔案上傳工具、代管服務或內部搜尋服務等。這類服務能讓使用者建立帳戶,以便在網站上張貼內容、上傳檔案或進行搜尋。遺憾的是,垃圾內容發布者經常利用這些服務,產生數百個無法為網路帶來任何附加價值或價值極為低落的垃圾網頁。在這種情況下,依據 Google 網站管理員指南中載明的原則,Google 可能會對受影響的網頁採取專人介入處理。以下舉幾個例子說明:

遭濫用的論壇/留言板 遭濫用的檔案上傳工具以及垃圾 PDF 檔案 遭濫用的代管服務 遭濫用的內部搜尋結果

這類垃圾內容可能會在多種層面上對您的網站和使用者造成損害:

  • 因為網站某部分出現劣質內容,而影響整個網站的排名。
  • 垃圾內容可能將使用者引導至無用內容或有害內容 (例如含有惡意軟體或網路詐騙行為的網站),進而降低網站的信譽。
  • 不相關內容帶來的未預期流量會使網站的速度變慢,並增加代管費用。
  • 如果網頁中充斥第三方產生的垃圾內容,為了維護搜尋結果的品質,Google 可能會移除該網頁的搜尋結果或降低其排名。

我們將在這篇網誌文章中提供一些提示,協助防範垃圾內容發布者濫用您的網站。

封鎖自動建立帳戶的機制

如果您的網站能讓使用者建立帳戶,建議在建立機制中採用 Google 的 CAPTCHA 服務或類似的驗證工具,例如 SecurimageJcaptcha。這麼做可限制只有真人使用者能夠進行註冊,防止自動化指令碼在網站的公開平台上產生帳戶和內容。

您可要求新使用者在註冊新帳戶時必須驗證真實的電子郵件地址,藉此防止許多發布垃圾內容的漫遊器自動建立帳戶。此外,您也可以設定篩選器來封鎖可疑的電子郵件地址,或封鎖來自不信任電子郵件服務的地址。

開啟管理功能

建議針對建立評論和建立個人資料啟用管理功能,規定使用者必須擁有一定信譽才能張貼連結。請盡可能變更您的設定,禁止使用者張貼匿名文章,並指定新使用者發布的文章必須通過審核才能公開顯示。

監控網站的垃圾內容,並清理發生的任何問題

請在 Search Console 中註冊並驗證網站的擁有權。您可以查看安全性問題報告專人介入處理報告,瞭解 Google 是否偵測到任何問題,也可以透過「訊息」面板進一步瞭解詳情。

Search Console 訊息通知網站出現濫發第三方垃圾內容問題

除此之外,建議您偶爾檢查網站中是否含有非預期或垃圾內容,方法是在 Google 搜尋中運用 site: 運算子,並搭配與網站主題無關的商業或成人內容關鍵字。舉例來說,您可以透過「site:your-domain-name viagra」或「site:your-domain-name watch online」等查詢偵測網站上是否有無關內容,尤其是下列情況:

  • 與上下文無關的文字或偏離主題的連結,唯一目的是宣傳第三方網站/服務。例如:「免費下載電影/免費電影線上看」
  • 並非由實際使用者所撰寫的自動化文字或胡言亂語
  • 內部搜尋結果中明顯離題的使用者查詢字詞,旨在宣傳第三方網站/服務

請監控網路伺服器記錄檔,留意突然出現的流量高峰,尤其是新建立的網頁。 舉例來說,您可以檢查網站中的網址,尋找是否有任何網址模式包含了與網站完全無關的關鍵字。如要找出含有潛在問題的高流量網址,請參閱 Google Analytics (分析) 中的網頁報表

透過垃圾字詞黑名單 (例如與串流、下載、成人、賭博或藥品相關的字詞),禁止使用者在平台上發布明顯不適當的內容。系統內建功能或外掛程式都可為你刪除這些內容,或將其標示為垃圾內容。

另一項實用工具是 Google 快訊,您可以建立「site:your-domain-name spammy-keywords」快訊來偵測網站上是否有異常關鍵字,例如商業用字或成人關鍵字。此外,Google 快訊也是偵測遭入侵網頁的絕佳工具。

找出垃圾帳戶並加以終止

監控網路伺服器記錄檔中的使用者註冊記錄,找出常見的垃圾內容模式,例如:

  • 短時間內完成的大量註冊表單。
  • 從相同 IP 位址範圍傳送的要求量。
  • 註冊過程中使用的非預期使用者代理程式。
  • 莫名其妙的使用者名稱,或註冊過程中提交的其他無意義的值。例如,「免費電影下載」這類像是商業用的使用者名稱,看起來不像真人姓名,還連結到不相關網站。

禁止 Google 搜尋顯示或追蹤不信任的內容

如果您的網站允許使用者建立網頁 (例如個人資料頁面、論壇會話串或網站),可以禁止 Google 搜尋顯示或追蹤網站上的新內容或不受信任的內容,藉此遏止垃圾內容濫發行為。

例如,您可以使用 noindex 中繼標記標準,禁止 Google 存取不受信任的網頁,如下所示:

<html>
  <head>
    <meta name="googlebot" content="noindex">
  </head>
</html>

您也可以使用 robots.txt 標準暫時封鎖網頁,例如:

Disallow: /guestbook/

建議您使用 rel="ugc"rel="nofollow" 標示出使用者自製內容 (UGC),例如評論和論壇文章。 這麼做有助於向 Google 說明您的網站與連結網頁之間的關係,並要求 Google 不要追蹤該連結。

將開放平台的內容整合為單一檔案路徑或目錄

垃圾內容發布者利用自動化指令碼或軟體,短時間內就能在您的網站上產生大量垃圾網頁,其中部分內容可能會散落在各處檔案路徑或目錄中,讓網站擁有者無法有效偵測和清理垃圾內容。以下列舉幾個例子:

example.com/best-online-pharma-buy-red-viagra-online
example.com/free-watch-online-2021-full-movie

我們也建議您將使用者自製內容整合到單一檔案路徑或目錄,以利維護和偵測垃圾內容。舉例來說,建議您使用下列檔案路徑:

example.com/user-generated-content-dir-name/example01.html
example.com/user-generated-content-dir-name/example02.html

隨時保持網站軟體為最新狀態,並使用自動化系統保護您的網站

建議您一律在網站上使用最新軟體,並留意重要的安全性更新。垃圾內容發布者可能會利用舊版網誌、公布欄和其他內容管理系統的安全性漏洞來達成目的。

除此之外,Akismet 這類較全面的垃圾內容防護系統還提供外掛程式,可用於許多網誌和論壇系統,不僅安裝簡便,且能為您執行大部分杜絕垃圾內容的措施。 此外,某些平台也能使用值得信賴且廣為人知的安全性外掛程式來協助保護網站,也許能夠及早偵測到濫發垃圾內容的行為。

請依網站情況參閱以下說明文件,進一步瞭解詳細資訊:

如果需要任何協助,您也可以造訪我們的搜尋中心產品討論社群