2024 年 12 月 9 日,星期一
請允許我們快取,麻煩您了。
多年來,隨著網際網路蓬勃發展,Google 檢索量也隨之增加。雖然 Google 的檢索基礎架構一直都支援啟發式快取機制,但可從本機快取傳回的要求數量逐漸減少:10 年前,總擷取次數中約有 0.026% 的內容可快取,雖然這數字並不高,但如今已降至 0.017%。
為什麼快取很重要?
網際網路就像一幅大型拼圖,而快取是其中非常重要的部分。快取功能可讓網頁在重新載入時快速載入,節省運算資源和自然資源,並為用戶端和伺服器省下大量昂貴的頻寬。
特別是如果你的網站規模龐大,且個別網址的內容很少變動,允許本機快取可能有助於提升檢索網站的效率。Google 的檢索基礎架構支援 HTTP 快取標準定義的啟發式 HTTP 快取功能。具體來說,就是透過 ETag
回應和 If-None-Match
要求標頭,以及 Last-Modified
回應和 If-Modified-Since
要求標頭。
我們強烈建議您使用 ETag
,因為這個值不像 Last-Modified
值容易出錯。如果您有這個選項,請同時設定這兩個值,網際網路使用者會感謝您。或許吧。
如果您認為有重大變更,可以自行決定是否要由用戶端重新整理快取內容。內容有重大變更時,建議您要求重新整理快取。假如您只更新了網頁底部的版權日期,可能就不屬於重大變更。
ETag
和 If-None-Match
Google 檢索器支援 ETag
的條件要求,完全符合 HTTP 快取標準定義。也就是說,如要向 Google 的檢索器傳送快取偏好設定信號,請將 Etag
值設為任何任意的 ASCII 字串 (通常是內容或版本號碼的雜湊,但也可以是 π 的一部分,由您決定),該字串必須與存取網址所代管內容的表示法相符。舉例來說,如果您在同一個網址下代管相同內容的不同版本 (例如行動版和電腦版),每個版本可能有其專屬的 ETag
值。
支援快取的 Google 檢索器會傳送 ETag
值,該值是先前在 If-None-Match header
中檢索該網址時傳回的值。如果檢索器傳送的 ETag
值與伺服器產生的目前值相符,伺服器應傳回 HTTP 304
(未修改) 狀態碼,且沒有 HTTP 主體。沒有 HTTP 主體這一點很重要,原因如下:
- 伺服器不需要耗費運算資源來實際產生內容,這樣可以省錢。
- 伺服器不需要傳輸 HTTP 主體,這樣可以省錢。
在用戶端 (例如使用者的瀏覽器或 Googlebot),系統會從用戶端的內部快取中擷取該網址底下的內容。這項作業不需要傳輸資料,因此速度極快,除了能讓使用者滿意,還能節省資源。
Last-Modified
和 If-Modified-Since
與 ETag
類似,Google 檢索器也支援 Last-Modified based
條件要求,完全符合 HTTP 快取標準的定義。從語意角度來看,這與 ETag
的運作方式相同,兩者都是透過 ID 決定資源是否可快取。從用戶端角度來看,這項功能提供與 ETag
相同的優勢。
如果您使用 Last-Modified
做為快取指令,請參考以下幾項建議:
-
Last-Modified
標頭中的日期格式必須符合 HTTP 標準。為避免剖析問題,建議使用以下日期格式:「星期幾, DD Mon YYYY HH:MM:SS 時區」。例如: 「Fri, 4 Sep 1998 19:15:56 GMT」。 -
雖然
Cache-Control
標頭的max-age
不是必填欄位,但建議您一併設定,協助檢索器判斷何時要重新檢索特定網址。將max-age
欄位的值設為內容預期不變的秒數。例如:Cache-Control: max-age=94043
。
範例
如果您和我一樣,不太瞭解啟發式快取的運作方式,建議您參考要求和回應鏈結的範例,或許有助於掌握相關概念。以下兩個鏈結 (一個用於 ETag
/If-None-Match
,另一個用於 Last-Modified
/If-Modified-Since
),以視覺化方式呈現運作方式:
ETag /If-None-Match |
Last-Modified /If-Modified-Since |
|
---|---|---|
伺服器對檢索的回應:這是檢索器用來儲存先決條件標頭欄位 ETag 和 Last-Modified 的回應。 |
HTTP/1.1 200 OK Content-Type: text/plain Date: Fri, 4 Sep 1998 19:15:50 GMT ETag: "34aa387-d-1568eb00" ... |
HTTP/1.1 200 OK Content-Type: text/plain Date: Fri, 4 Sep 1998 19:15:50 GMT Last-Modified: Fri, 4 Sep 1998 19:15:56 GMT Cache-Control: max-age=94043 ... |
後續檢索器條件要求:條件要求會以先前要求儲存的先決條件標頭值為根據。這些值會傳回至伺服器,在 If-None-Match 和 If-Modified-Since 要求標頭中進行驗證。 |
GET /hello.world HTTP/1.1 Host: www.example.com Accept-Language: en, hu User-Agent: Googlebot/2.1 (+http://www.google.com/bot.html) If-None-Match: "34aa387-d-1568eb00" ... |
GET /hello.world HTTP/1.1 Host: www.example.com Accept-Language: en, hu User-Agent: Googlebot/2.1 (+http://www.google.com/bot.html) If-Modified-Since: Fri, 4 Sep 1998 19:15:56 GMT ... |
伺服器對條件要求的回應:檢索器傳送的先決條件標頭值會在伺服器端進行驗證,因此伺服器會傳回 304 HTTP 狀態碼給檢索器 (不含 HTTP 主體)。這會發生在每項後續要求中,直到先決條件驗證失敗 (伺服器端的 ETag 或 Last-Modified 日期有變更) 為止。 |
HTTP/1.1 304 Not Modified Date: Fri, 4 Sep 1998 19:15:50 GMT Expires: Fri, 4 Sep 1998 19:15:52 GMT Vary: Accept-Encoding If-None-Match: "34aa387-d-1568eb00" ... |
HTTP/1.1 304 Not Modified Date: Fri, 4 Sep 1998 19:15:50 GMT Expires: Fri, 4 Sep 1998 19:15:51 GMT Vary: Accept-Encoding If-Modified-Since: Fri, 4 Sep 1998 19:15:56 GMT ... |
如果您想讓使用者滿意,並想節省主機代管費用,請與您的代管服務或內容管理系統供應商或開發人員討論,瞭解如何為網站啟用 HTTP 快取。至少使用者會更滿意您提供的瀏覽體驗。
如要討論快取功能,請前往最接近的搜尋中心產品討論社群。如對我們的快取方式有任何意見,歡迎在這篇網誌文章中一起發布的快取功能說明文件中提供意見回饋。
想進一步瞭解檢索嗎?請觀看完整的「檢索 12 月」系列影片:
檢索 12 月:2024 年度回顧
2024 年 12 月 31 日,星期二 讀完這篇網誌文章時,您可能會想知道這是誰撰寫的:大型語言模型 (LLM) 或 Gary。有這樣的疑惑很合理,您可以仔細尋找本文使用的複雜語言是否存在 LLM 的蛛絲馬跡,畢竟在歲末年終的忙碌下,我們可以幾乎未經審查就發布網誌文章,也不會被發現 (Gary 之後會處理可能出現的問題,或者該說後果)。如同每年最後一篇文章的慣例,我們會根據大型語言模型 (或 Gary) 的說法,回顧 2024 年 Google 搜尋中心發生的一切,並透露 2025
檢索 12 月:CDN 和檢索
2024 年 12 月 24 日,星期二 內容傳遞網路 (CDN) 特別適合用來降低網站的延遲時間,一般來說可避免網站流量相關的麻煩。畢竟,這就是他們的主要用途:即使網站流量很高,也能快速傳送內容。CDN 中的「 "D" 」是指全球內容傳遞或發布,因此將資料傳輸給使用者的時間,會比單純在某個資料中心代管內容的情況要短。在本文中,我們將探討如何使用 CDN 改善網站的檢索和使用者體驗,並進一步說明檢索 CDN 支援網站時的幾項細微差異。 CDN 基本上是原始伺服器 (網站所在位置)
檢索 12 月:多面向導覽
2024 年 12 月 17 日,星期二 我們剛發布 關於多面向導覽最佳做法的全新文件 ,這份文件 最初是以網誌文章形式發布 。以下是新說明文件頁面中一些重要部分的摘要。 多面向導覽是協助使用者在網站上找到所需內容的絕佳方式,但如果導入不當,可能會導致 SEO 災難。原因在於這種網站導覽方式可以產生近乎無限的網址數量,造成以下問題: 事實上,網站擁有者目前最常回報的過度檢索問題,多半是多面向導覽造成的。在多數情況下,只要遵守一些最佳做法,就能避免這個情形。不過,讓我們先回顧一下。
2024 年吉隆坡和臺北 Search Central Live:回顧
2024 年 12 月 13 日,星期五 在吉隆坡和臺北舉行的 Search Central Live 活動非常精彩,特別感謝超過 600 位與會者的熱情參與!即使在臺北場活動的前一天,我們共同面對了 康芮颱風 - 臺灣歷史上第一個在 10 月中旬後登陸的超級颱風,我們還是很高興看到與會者展現的熱情與參與度。以下將深入探討這些活動的特殊之處與後續的發展。
檢索 12 月:Googlebot 檢索的運作方式和原因
2024 年 12 月 3 日,星期二 您可能知道 Google 搜尋需要一些前製作業,才能讓網頁顯示在 Google 搜尋結果中。其中一個步驟就是「檢索」。Googlebot 負責處理 Google 搜尋的檢索作業,這個程式在 Google 伺服器上運作,會擷取網址、處理網路錯誤、重新導向和其他可能在檢索過程中遇到的網路問題。其中還有許多細節,但通常都不會提到。在這個月,我們每週都會探討其中一些細節,因為這些細節可能會對網站檢索方式產生重大影響。 檢索
2024 年雅加達和曼谷 Search Central Live:圓滿落幕
2020 年 10 月 15 日,星期二 今年在亞洲舉辦的前兩場 Search Central Live 活動已圓滿落幕,我們也回顧了這兩場活動,瞭解我們學到了什麼,以及可以做得更好的地方。 2024 年 7 月 25 日,我們很榮幸在雅加達舉辦活動,共有 335 位與會者聆聽 Google 員工的演講,並首次在印尼舉辦社群速成講堂!Google 講座較著重於搜尋服務的基礎,涵蓋的主題包括搜尋服務的運作方式 (較長版本)、品質與更新相關討論、AI 與搜尋、搜尋功能、使用 Search
Search Central Live 重返台北:2024 Search Central Live 將於台北與吉隆坡舉辦!
Search Central Live Taipei 2024 將於 2024 年 11 月 1 日星期五舉行。繼去年愉快的活動後,我們很高興又能在台北與您見面!
2024 年 Search Central Live 即將回到 APAC 地區舉辦
2024 年 5 月 29 日,星期三 Search Central Live 即將重回亞太地區舉行,除了提供 Google 搜尋的深入分析、有趣的交流機會之外,還有更多活動等著您!今年,我們希望能造訪 印尼、馬來西亞、臺灣和泰國 ,但請持續關注完整活動詳情。 亞太地區的第一場系列活動將於 7 月 25 日 在雅加達舉行。名額有限,請在 7 月 7 日前報名,把握有限的活動名額。 想瞭解活動內容嗎?請觀看 2023 年雅加達 Search Central Live 的影片:
搜尋引擎最佳化 (SEO) 入門指南改版
2024 年 2 月 2 日,星期五 我們更新了 搜尋引擎最佳化 (SEO) 入門指南 ,使其更名副其實,也就是更貼近新手讀者的需求。 這份指南於 2008 年推出 ,原為 22 頁的 PDF,目的是集中說明當時最常見的 SEO (搜尋引擎最佳化的縮寫) 主題。這份 PDF 支援 40 種語言 ,隨後 更新為 HTML 版 。 多年來,我們加入了更多主題 (但很少移除任何內容),每次新增的項目,都反映了各別時期 (looking at you、mobilegeddon) 的整體建議。
劃下句點
2023 年 12 月 31 日,星期日 想必各位一定都很想知道為何今天要吸引大家的目光。沒錯,這是年末的網誌文章,我們將回顧 2023 年 Google 搜尋中心發生的一切,並帶給各位一些樂趣! 2023 年,除了新加坡和東京等常見舉辦地點之外,我們的旗艦活動系列 Google Search Central Live 也在新的地點展開。我們的足跡遍及雅加達、墨西哥市、聖保羅、臺北和眾多其他地區,我們所到的每個地方都獲得了非常熱切的迴響;詳情如下:
Search Console 中的檢索頻率限制工具即將淘汰
2023 年 11 月 24 日,星期五 Search Console 中的檢索頻率限制工具將於 2024 年 1 月 8 日淘汰。這項工具 已推出超過十年 ,但隨著檢索邏輯和發布商可使用的其他工具與日俱進,檢索限制工具的實用性已日益消散。 Googlebot 是根據網站的處理方式,或更具體地說,根據伺服器處理網站的方式,回應 Googlebot 的 HTTP 要求。舉例來說,如果伺服器持續傳回一系列網址的 HTTP 500 狀態碼,Googlebot
Search Central Live 來台北了
我們非常高興的宣布,Search Central Live 將在12 月 6 日首次落腳台北!這是 Search Central Live 系列活動的一環,也是首度在台灣舉行的現場活動,活動內容緊湊豐富,我們也準備好要回答您 (大多數) 的問題。
2023 年新加坡 Search Central Live 活動
2023 年 10 月 18 日,星期三 我們很高興在此宣布, Search Central Live Singapore 將於今年 11 月 22 日再次舉辦。如往常一樣,本次活動將由 Google 搜尋團隊主持,我們期待與社群成員一同學習、交流及建立人脈。 我們將在 Search Central Live Singapore,探討與搜尋行銷相關的 各種主題 ,並提供資源協助網站擁有者在 Google 搜尋中取得亮眼表現,包括: 所有演講皆以英文進行。
錯誤的喜劇
2023 年 8 月 24 日,星期四 我們不時會收到使用者的疑問,指出 Search Console 顯示的網站資料有誤,也不時會遇到使用者不瞭解發生錯誤的原因。這很容易理解,畢竟存取網站時可能會發生許多問題。不過,所有問題都可歸結至提供存取權的特定系統,無一例外。在以下簡短的參考故事中,我們會試著說明錯誤的類型,或許你就不會覺得這些錯誤很嚇人。馬上開始吧!
Search Central Live 即將在印度舉行
2023 年 8 月 17 日,星期四 今年我們已經舉辦了三場 Search Central Live 活動,現在我們正式宣布即將舉行詢問度最高的「Search Central Live India」活動! 這項活動即將在以下兩個地點舉行: 有興趣參加嗎?請在 2023 年 9 月 8 日前 報名參加 Search Central Live India 2023
東京和雅加達 Search Central Live:圓滿落幕
2023 年 7 月 27 日,星期四 自從東京 Search Central Live 活動結束至今已經將近一個月的時間,而雅加達的 SCL 也已經是大約 2 週前的事了!回顧這些活動真是讓人開心的事!很高興能回這裡親自認識大家!讓我們想一下我們在這些活動中學到了什麼。 今年的第一場活動,是在 2023 年 6 月 16 日於東京舉行。我們邀請了將近 150 位來賓蒞臨位在澀谷區的辦公室,這是我們當初測試全新活動空間的地方,稱之為 Froyo
Sitemap 連線偵測 (ping) 端點即將淘汰
2023 年 6 月 26 日,星期一 我們在 2005 年推出了 Sitemap 通訊協定 ,協助搜尋引擎發現新網址,並針對已找到的網址安排新檢索作業。它是廣受歡迎的通訊協定,已超過 15 年未變更。雖然這個做法依然有用,但有些層面在現今的網際網路環境中已變得較不實用。 為此,我們宣布將全面淘汰 Sitemap 的「連線偵測」端點機制,並針對 lastmod 元素提供其他建議用法。 Sitemap 通訊協定定義了 未經驗證的 REST 方法 ,用來將 Sitemap
Search Central Live:首站落腳東京,下半年巡迴亞太地區
2023 年 5 月 16 日,星期二 在 2023 年, Search Central Live 即將回歸,地點就在亞太地區,我們等不及要與大家見面了!在 2022 年 11 月,我們重啟這系列的活動, SCL Singapore 率先登場,成果無比豐碩,我們大受激勵,如今已準備好在亞太地區巡迴, 台灣就是其中一站! 活動內容預計和以前一樣,有許多由 Google 員工和其他講者主持的講座,您可與網站擁有者和搜尋引擎最佳化專員專家盡情交流,或許還會參與精彩有趣的活動。 2023 年
x-default 如何提供協助
2013 年 5 月 8 日 星期一 最近有許多問題使我們發現,有些網站已使用 hreflang 協助搜尋使用者找到正確的網頁版本,但這些網站可能未充分利用 hreflang x-default 值。提醒您,這是一款十分強大的工具,能做到的事情可能超乎您想像。 當網站不支援使用者語言和區域時,可使用 hreflang x-default 值,針對部分內容指定不限語言和區域的網址。這個值可與其他 hreflang 值搭配使用,如果是以特定語言和區域為目標的內容,可透過後者指定網址版本。
請勿使用 403 或 404 限制檢索頻率
2023 年 2 月 17 日,星期五 過去幾個月來,我們發現網站擁有者和部分內容傳遞聯播網 (CDN) 嘗試使用 404 和其他 4xx 用戶端錯誤 (但並非 429 ) 試圖降低 Googlebot 檢索頻率的情況有所增加。 這篇網誌文章的簡短版就是:請不要這麼做。歡迎參閱我們的 如何降低 Googlebot 檢索頻率 說明文件。請閱讀該說明文件並瞭解如何有效管理 Googlebot 的檢索頻率。 伺服器傳回至用戶端的 4xx
感謝 2022 年!
2022 年 12 月 30 日,星期五 到了年度回顧的時間了。2022 年只剩幾天就結束了,辦公室中一片安靜,我們認為現在很適合從搜尋中心的觀點回顧一年來的成果。 Search Console 推出了新功能與相關指南 、新奇有趣的文件更新、 影片 、活動,以及線上和線下活動,真的是非常豐富的一年!我們也同樣對 2023 年的發展充滿期待。 一開始,我們認為產品中加入更多報表和功能後,Search Console 進展的速度就會放慢,結果又加入了更多報表和功能。7 月推出的 影片索引報表
Google 搜尋狀態資訊主頁簡介
2022 年 12 月 14 日,星期三 我們希望在 2023 年推出另一項工具,協助大眾瞭解影響 Google 搜尋的系統最新狀態,包含檢索、建立索引以及提供內容。雖然系統中斷問題極為少見,但我們希望能公開透明呈現中斷發生的情形。過去我們曾與 網站可靠性工程師 (SRE) 合作,在 Google 搜尋中心 Twitter 帳戶對外說明這些中斷情形。今天,我們要推出 Google 搜尋狀態資訊主頁 ,藉此提供您日後的 Google 搜尋狀態資訊。 過去幾年來,我們一直與 SRE
Google 搜尋的視覺元素
2022 年 12 月 13 日,星期二 走進圖書館,索取一本書,卻沒指明哪一本。館員露出困惑的表情,然後可能會問您一大堆問題,試著搞懂是哪本書:書實在太多了 (具體數字是 超過 129,864,880 本)。上述對話其實很像我們在 Twitter 上觀察到的現象,有人試著要討論搜尋結果網頁的某項搜尋功能或 UI 元素,但:要怎麼稱呼那些星號?又該怎麼讓這些東西隨著我的網站一起顯示? Google 搜尋結果網頁不是由超過 129,864,880
網站擁有者指南更新
2022 年 10 月 13 日,星期四 我們在 2002 年為網站擁有者推出了一個指南網頁 ,提供關於建構網站的最佳做法簡介。這個網頁就是一直使用至今的《網站管理員指南》。從那時開始,我們在指南中加入了豐富的資訊,目的都是協助網站擁有者打造優質網站,為透過 Google 搜尋來訪的使用者提供服務。 2002 年至今,很多事都有所改變,因此,現在我們要推出更簡單明瞭的新版《網站管理員指南》,同時也會使用新的名稱。 我們先前將「網站管理員」這個詞從網站名稱 (「搜尋中心」,先前稱為「Google
恢復運作:Search Central Live 活動
2022 年 10 月 13 日,星期四 2019 年,我們特別為超過 15 個國家/地區 (特別是在那些不太受搜尋會議青睞的地區) 的網站擁有者和搜尋引擎最佳化專員舉辦活動。雖然之後我們 必須停止一段時間 ,但我們承諾會盡快恢復相關活動。 現在,這一切都可能實現,我們使用 Search Central Live 這個全新的名稱恢復正常運作了。 首場 Search Central Live 活動將於 2022 年 11 月 24 日於新加坡現場舉辦。 2022 年新加坡 Search
Googlebot 和 15 MB 的內容
2022 年 6 月 28 日,星期二 最近幾天,我們收到了大量關於 Googlebot 說明文件 近期更新內容的問題。也就是說,我們記錄到,Googlebot 在擷取 特定檔案類型 時,只「看見」前 15 MB 的內容。這並非新的門檻,這個門檻已經存在好幾年了。我們之所以將這一點加入說明文件中,是因為對某些人來說,這個門檻在偵錯時可能很實用,而且也很少發生變化。 這項限制僅適用於 Googlebot 首次發出要求時收到的 位元組 (內容),並不適用於網頁中參照的資源。 舉例來說,當您開啟
春季大掃除:部分 Sitemap 擴充元素標記即將停用
2022 年 5 月 6 日,星期五 這些年來,我們推出了數種 Google Sitemap 擴充元素的標記和標記屬性,特別是 圖片 和 影片 擴充功能。大多數標記的作用都是為了讓網站擁有者能更輕鬆將資料傳送至 Google 搜尋。 在評估 Google Sitemap 擴充元素標記的值之後,我們決定正式淘汰部分標記和屬性,並從說明文件中移除這些標記和屬性。2022 年 8 月 6 日之後,已淘汰的標記對於索引和搜尋功能就不再發生作用。 如果您是 Sitemap 外掛程式開發人員或自行管理
春季大掃除:網址參數工具
2022 年 3 月 28 日,星期一 簡單來說: 我們將於 1 個月後淘汰 Search Console 中的網址參數工具。目前使用這項工具的使用者無需採取任何行動。 2009 年,Search Console 的前身「網站管理員工具」中推出網址參數工具時,網際網路環境比現在更不受規範。 SessionID 參數很常見,CMS 難以整理參數,而瀏覽器則經常使連結損壞。網站擁有者可運用網址參數工具,指定特定參數影響自家網站內容的方式,更精細地控管 Google 檢索網站的方式。
全新漫遊器標記:indexifembed
2022 年 1 月 21 日,星期五 今天,我們推出了全新的漫遊器標記「 indexifembedded 」,讓您可以進一步控管系統將內容編入索引的情況。你可以透過 indexifembedded 標記讓 Google 知道,某項內容雖然透過 iframes 和類似的 HTML 標記嵌入到其他網頁,甚至該內容網頁設有 noindex 標記,您還是希望系統將該內容編入索引。 indexifembedded
網誌文章作者們的 2021 年回顧
2021 年 12 月 31 日,星期五 每年到了這個時候,我們都會發布網誌文章回顧過去一年的概況,並展望未來。撰寫這樣的文章並不容易,因此我們邀請了曾在 2021 年發布過搜尋中心網誌的幾位 Google 員工,請他們再次與我們一起回顧過去這年最難忘的時刻,並稍微透露 2022 年有哪些令人期待的內容。說起來,這篇網誌文章應該算他們寫的。 2021 年確實充滿挑戰,我們回應問題的方式也反映了這一點。 John Mueller 和其他幾位都說,他們最有印象的是 2021 年發布的 幾則