2022 年我们如何抵御 Google 搜索中的网络垃圾
2023 年 4 月 11 日,星期二
每天,我们都会发现数十亿个网页,将其编入索引并提供给用户,在此过程中会发现其中很大一部分是网络垃圾。2022 年,我们对系统进行了多项更新,目的是阻止这些攻击,确保所有 Google 搜索用户都能获得无网络垃圾体验。
改进了 SpamBrain
SpamBrain 是我们处理垃圾网站的核心举措,我们在 2022 年做出了许多改进,以提高覆盖率。SpamBrain 发现垃圾网站的数量是 2021 年的 5 倍,且是首次发布时的 200 倍。借助 SpamBrain,我们得以确保超过 99% 来自 Google 搜索的访问不含网络垃圾。
处理滥用链接和被黑网络垃圾
我们还改进了 SpamBrain,使其成为一个强大而灵活的平台,推出多种解决方案来扩大不同滥用行为类型的覆盖率。例如,垃圾链接。正如我们在 12 月份分享的那样,我们训练了 SpamBrain 来检测构建垃圾链接的网站,以及为了将垃圾链接传递到其他网站而创建的网站。得益于 SpamBrain 的学习能力,我们检测到的垃圾链接网站数量是以前的垃圾链接更新的 50 倍。同样,为了让 SpamBrain 更充分地了解被黑垃圾内容,我们采取的举措也让被黑网站检测技术提升到 10 倍。
网络垃圾处理速度更快
SpamBrain 也是在抓取时更好地检测网络垃圾的一个重要因素。这意味着,我们可以在首次访问网页时更好地识别网络垃圾,而根本不将其编入索引,从而更好地利用我们的资源将有用的网页编入索引。
提高了用户安全性
除了网络垃圾之外,我们还推出了新的反欺诈解决方案,以提高用户在 Google 搜索中的安全性。这些新解决方案扩大了覆盖率,并首次将欺诈防护扩展到所有语言。与 2021 年相比,我们将欺诈网站的点击次数减少了 50%。
更新了网站所有者指南
除了抵御网络垃圾之外,我们还在搜索要素指南中更新了网络垃圾政策。这些网络垃圾政策涵盖最常见的网络垃圾和滥用行为,并可能导致网站在搜索结果中的排名下降或根本不显示在搜索结果中。我们更新了网络垃圾政策,使用更相关、更精确的语言,并添加了新的示例来协助网站所有者避免创建有害内容。
我们还发现,人们对由 AI 生成的内容和由 AI 辅助的内容非常感兴趣,并发布了有关 AI 生成内容的指南。我们希望该指南有助于解释 AI 和自动化如何成为创作实用内容的有用工具,但如果 AI 主要用于操纵搜索排名,则会违反我们关于防范自动生成的垃圾内容的长期政策。
我们一直在努力检测网络垃圾并将其作废,以便用户能够通过 Google 搜索找到最有用的内容。我们无法独自完成这项工作;感谢您为用户创建实用内容和有用的网站,并向我们提供关于网络垃圾和滥用行为的反馈和见解深刻的报告。如果您遇到了垃圾内容或操纵行为,请向我们举报或访问搜索中心帮助社区。
发布者:搜索质量分析师 Duy Nguyen
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
[null,null,[],[[["Google significantly improved its spam detection capabilities in 2022, resulting in a spam-free search experience for over 99% of users."],["SpamBrain, Google's AI-based spam-fighting system, saw major enhancements, leading to a substantial increase in the detection of spam sites, link spam, and hacked content."],["Google implemented new anti-scam solutions, extending protection to all languages and reducing clicks on scam sites by 50% compared to the previous year."],["Google refreshed its spam policies and provided guidance on AI-generated content, encouraging site owners to create helpful content and avoid manipulative tactics."],["Google continues to actively combat spam and encourages users to report any encountered spam or abusive behaviors to ensure a safe and useful search experience."]]],["In 2022, SpamBrain significantly improved spam detection, identifying five times more spam sites than in 2021. It detected 50 times more link spam and ten times more hacked sites. The systems improved the detection of spam at crawling time, preventing them from being indexed. Anti-scam solutions were expanded across all languages, reducing clicks on scam sites by 50%. Updated spam policies, with guidelines on AI-generated content, were released for site owners.\n"]]