2022 年我们如何抵御 Google 搜索中的网络垃圾
2023 年 4 月 11 日,星期二
每天,我们都会发现数十亿个网页,将其编入索引并提供给用户,在此过程中会发现其中很大一部分是网络垃圾。2022 年,我们对系统进行了多项更新,目的是阻止这些攻击,确保所有 Google 搜索用户都能获得无网络垃圾体验。
改进了 SpamBrain
SpamBrain 是我们处理垃圾网站的核心举措,我们在 2022 年做出了许多改进,以提高覆盖率。SpamBrain 发现垃圾网站的数量是 2021 年的 5 倍,且是首次发布时的 200 倍。借助 SpamBrain,我们得以确保超过 99% 来自 Google 搜索的访问不含网络垃圾。
我们还改进了 SpamBrain,使其成为一个强大而灵活的平台,推出多种解决方案来扩大不同滥用行为类型的覆盖率。例如,垃圾链接。正如我们在 12 月份分享的那样,我们训练了 SpamBrain 来检测构建垃圾链接的网站,以及为了将垃圾链接传递到其他网站而创建的网站。得益于 SpamBrain 的学习能力,我们检测到的垃圾链接网站数量是以前的垃圾链接更新的 50 倍。同样,为了让 SpamBrain 更充分地了解被黑垃圾内容,我们采取的举措也让被黑网站检测技术提升到 10 倍。
SpamBrain 也是在抓取时更好地检测网络垃圾的一个重要因素。这意味着,我们可以在首次访问网页时更好地识别网络垃圾,而根本不将其编入索引,从而更好地利用我们的资源将有用的网页编入索引。
除了网络垃圾之外,我们还推出了新的反欺诈解决方案,以提高用户在 Google 搜索中的安全性。这些新解决方案扩大了覆盖率,并首次将欺诈防护扩展到所有语言。与 2021 年相比,我们将欺诈网站的点击次数减少了 50%。
我们还发现,人们对由 AI 生成的内容和由 AI 辅助的内容非常感兴趣,并发布了有关 AI 生成内容的指南。我们希望该指南有助于解释 AI 和自动化如何成为创作实用内容的有用工具,但如果 AI 主要用于操纵搜索排名,则会违反我们关于防范自动生成的垃圾内容的长期政策。
我们一直在努力检测网络垃圾并将其作废,以便用户能够通过 Google 搜索找到最有用的内容。我们无法独自完成这项工作;感谢您为用户创建实用内容和有用的网站,并向我们提供关于网络垃圾和滥用行为的反馈和见解深刻的报告。如果您遇到了垃圾内容或操纵行为,请向我们举报或访问搜索中心帮助社区。
发布者:搜索质量分析师 Duy Nguyen
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
