進一步瞭解 Google 如何產生網頁搜尋結果的標題

2021 年 9 月 17 日,星期五

我們在上個月宣布要透過全新系統產生網頁搜尋結果的標題。在此感謝大家提供寶貴意見,讓我們得以進一步修正標題系統。下文將詳細說明我們採取的措施,以及創作者可參考的額外指南。

標題元素的使用率最高

如同上一篇文章所述,對絕大多數的網頁搜尋結果而言,新系統會採用 HTML 標題元素 (有時稱為標題標記) 做為在搜尋結果中顯示的標題。我們已根據各位的意見回饋調整系統,具體來說,現在約有 87% (之前約為 80%) 的情況會使用標題元素。

不一律採用標題元素的原因在於每個網頁的情況可能不同,有些網頁會使用空白標題,部分網站則在所有網頁上都顯示相同的標題 (無論網頁的實際內容為何),某些網頁甚至根本沒有標題元素。自 2012 年起,如果系統判定標題元素可能無法準確描述網頁,就會使用該元素以外的文字。

使用標題元素以外內容的例子

我們的新系統經過精心設計,可因應更多或許需要用到標題元素以外內容的情況。以下將根據我們在數兆個所列網頁上觀察到的實際問題,列舉一些系統偵測到及調整過的內容。

半空標題

如果大型網站使用範本建立網頁標題,但當中有部分內容遺失,通常就會出現半空標題。範本可能會在標題中依序列出網頁摘要和網站名稱,但在半空標題常會缺少摘要內容,如下所示:

| <網站名稱>

我們的系統會檢查標頭元素中的資訊和網頁上其他醒目的大型文字,藉此偵測半空標題並做出調整,進而產生與網站本身預期相符的標題,如下所示:

<產品名稱> | <網站名稱>

過時標題

如果年復一年在相同網頁上顯示週期性資訊,但標題元素未更新為反映最新日期,通常就會產生過時的標題。接著來看看以下標題元素:

2020 年錄取標準 - 第一大學

這裡是以某大學錄取標準網頁的搜尋結果標題為例。該網頁上有顯目的斗大標題寫著「2021 年錄取標準」,但基於某種原因,標題元素並未更新為目前的日期。我們的系統偵測到這種不一致的狀況,因此根據標題中的正確日期顯示以下內容:

2021 年錄取標準 - 第一大學

錯誤標題

標題有時可能無法準確反映網頁內容。舉例來說,網頁可能會包含動態內容,卻帶有類似下方的標題元素:

大型絨毛動物玩偶、泰迪熊、北極熊 - <網站名稱>

使用者會預期能在網頁上找到標題列出的產品,這點相當合理。不過,顯示上述靜態標題的網頁含有會動態變更的內容,也就是說,該標題中的產品有時可能不會出現在網頁上。

我們的系統會嘗試判斷標題是否無法準確反映網頁內容。如果是的話,系統可能會修改標題,讓使用者更清楚瞭解可能會看到的內容,如下所示:

絨毛動物玩偶 - 網站名稱

輕度公式化標題

公式化標題相當容易偵測,這是指網站上的所有 (或幾乎所有) 網頁都顯示相同的標題。輕度公式化標題則是指網站有部分網頁顯示公式化的標題元素。我們的系統會偵測這類情況並提供協助,整體情況與處理公式化標題元素相同。

以電視節目的線上論壇為例,論壇中可能有各節目專屬的討論區,而每個節目都有各季別的討論串專區。輕度公式化標題元素會出現在季別網頁上,但由於標題省略了季別編號,因此無法清楚看出網頁的確切季別。這種情況會產生類似下方的重複標題:

我所謂的精彩電視節目

我所謂的精彩電視節目

我所謂的精彩電視節目

我們的系統會偵測醒目的大型標題文字中所用的季別編號,並將該編號插入標題中,讓標題更加實用:

第 1 季 - 我所謂的精彩電視節目

第 2 季 - 我所謂的精彩電視節目

第 3 季 - 我所謂的精彩電視節目

網站擁有者指南

我們針對標題提供給網站擁有者的主要建議並未改變,依然與說明網頁上關於此主題的建議大致相同,那就是必須重視建立優質的 HTML 標題元素。到目前為止,我們最常使用的還是這個元素。

此外,也請參考本文提供的例子,瞭解是否可能有類似的模式,或許會造成系統檢查標題元素以外的內容。我們會做出這些更動,主要是想協助可能未意識到標題有問題的創作者,進而彌補這個疏忽。進行更動或許能確保系統重新使用您的標題元素,而這確實也是我們偏好的方式。

我們會持續改善標題品質

產生標題的系統難免會有不盡完美之處。正如上文所述,一律使用標題元素會造成問題,但我們也瞭解自家的標題系統並非無懈可擊,目前已根據各位的寶貴意見大幅改善系統。歡迎您繼續在論壇中 (包括這個主題現有的英文日文討論串) 提供更多意見。