為搜尋者提供有價值的代管服務

2012 年 3 月 6 日,星期二

免付費的網站代管服務是很棒的資源!很多這類服務已幫助網站管理員降低了成本和技術障礙,現在也不斷有新手網站管理員是經由這些服務開始經營網路事業。遺憾的是,這些服務在為低技術群體減少障礙的同時,也可能因為成本低廉、操作簡單的特性而吸引到一些投機分子,比如垃圾內容發布者之流就會試圖利用這類服務架設成百上千個對網路幾乎毫無價值的網站。對於自動產生的網站,我們一貫的方針是根據網站是否有足夠的附加價值來決定處理方式。一般來說,我們會將沒有價值的網站視為垃圾網站,並採取適當措施來避免使用者在隨機搜尋結果中接觸到這類網站。

垃圾內容示例
我們會將如上圖這種自動產生的網站當成垃圾網站。

當免付費的代管服務開始出現垃圾內容的跡象時,我們會盡量不傷及無辜地逐一處理垃圾網頁或網站。不過,若是垃圾內容發布者已幾乎支配網站代管服務,或是掌控大部分服務,我們就不得不採取更堅決的措施來保護使用者,將整個網站代管服務從我們的搜尋結果中移除。為了避免這種情況,我們建議網站代管服務的擁有者可以透過一些方式節省頻寬、處理能力等寶貴資源,同時避免代管服務遭到垃圾內容發布者濫用。相關做法如下:

  • 發布明確的濫用政策並傳達給使用者,比如在註冊過程中顯示這類政策。這項措施可以讓使用者清楚得知您會將哪些行為視為濫用活動。
  • 考慮在註冊表單中採用人機驗證 (Captcha)類似的驗證工具,藉此限制只有真人使用者能夠註冊,並防止自動化指令碼透過您的代管服務產生大量網站。儘管不能保證萬無一失,但是這些措施已能避免許多不肖人士濫用服務。
  • 嘗試監控代管服務是否出現其他垃圾內容信號,例如:重新導向、大量廣告單元、特定垃圾關鍵字、大段落逸出的 JavaScript 程式碼等。如果您想尋找簡單又符合成本效益的解決方案,也許可以使用 site: 運算子查詢或 Google 快訊
  • 保留註冊記錄,嘗試分辨典型的濫用行為模式,比如表單填寫時間、從相同 IP 位址範圍傳送的要求數量、註冊期間用到的使用者代理程式、註冊時提供的使用者名稱或選擇提交的其他表單資料值等等。再次提醒,這些資料不一定可做為判斷依據。
  • 留意網站伺服器的記錄檔中是否突然出現流量高峰 (尤其是新建立的網站是否出現這種情況),嘗試找出造成頻寬和處理能力消耗變多的原因。
  • 嘗試監控網站代管服務上是否有網路釣魚網頁和感染了惡意軟體的網頁。舉例來說,您可以使用 Google Safe Browsing API 定期檢測您的服務中的網址,或是申請接收 AS (自治系統編號) 快訊
  • 制定幾項健全性檢查。舉例來說,如果您經營的是波蘭當地的網站代管服務,您的服務中有可能在一夜之間突然冒出數千個合規的全新日文網站嗎?如果您想偵測新建網站的語言,目前有很多工具都能助您一臂之力,比如語言偵測程式庫Google Translate API v2 等。

最後的重點是,我們建議網站代管服務的經營者務必要監控活動突然增加的情況,因為這可能代表您的服務正在遭受垃圾內容攻擊。

如需經營優質代管服務的更多提示,請參閱我們先前的文章。最後,請務必在 Google 網站管理員工具中註冊並驗證您的網站,以便我們在需要與您聯繫或發現問題時通知您。