谷歌搜索被大规模垃圾邮件攻击淹没

在过去的几天里,谷歌的搜索结果一直受到垃圾邮件攻击,这种攻击只能用完全失控来形容。许多域名都有数十万个关键字排名,这表明这种攻击的规模可以很容易地达到数百万个关键字短语。

更新:垃圾邮件最初是由Lily Ray发现的:

如果你现在谷歌“craigslist二手汽车零件”,前20个结果中每一个都是垃圾邮件,减去craigslist的前两个结果。

——Lily Ray (@lilyraynyc) 2023年12月20日

垃圾网站似乎利用了至少三个机会窗口,这是谷歌排名网站的一部分。这些机会并不新鲜,垃圾邮件发送者多年来一直在利用它们,但还没有达到最近的程度。也许垃圾网站成功的最重要的原因是垃圾网站排名的搜索查询是低竞争的,这使得排名更容易。有两种类型的低容量搜索查询,垃圾网站正在寻找机会。

本地搜索算法:本地搜索是一种搜索类型,当人们搜索附近的东西时,比如餐馆或电影时间,就会触发本地搜索。这是一种更宽松的算法,允许没有链接的本地餐厅排名。

长尾关键词:长尾关键词是查询量小的短语,一个月或一年一次。因此,这些查询是低竞争,使其更容易排名。

许多垃圾网站都是全新的。域名已在排名前24至48小时内注册。

谷歌给全新的网站一个短暂的时间,在这段时间里,它得到了怀疑的好处,而谷歌的算法在一个短暂的蜜月期里找出这个网站,这个网站可以在搜索查询中排名。

许多域名是在过去24-48小时内才注册的。这可能意味着这些域名也在利用这个小窗口溜进来,在数百万个搜索查询中排名,然后消失。

一位谷歌用户描述了为什么新网站可以排名:

“特别是,对于全新的网站,我们遇到的困难之一是我们可能没有很多信号给这些网站,所以我们必须做出估计。

这取决于我们如何进行估计,有时这意味着在开始的时候我们显示这个网站比最后信号告诉我们的更明显。

最近我注意到Bill Hartzer的一系列帖子(LinkedIn简介),他发布了一个由Majestic反向链接工具生成的链接图,暴露了几个垃圾网站的链接网络。他发布的链接图显示了几十个网站彼此紧密相连,这是垃圾链接网络中相当典型的模式。Google Search Overwhelmed By Massive Spam AttackGoogle Search Overwhelmed By Massive Spam Attack

“Bill和我在Facebook messenger上谈论垃圾网站,我们都同意,尽管垃圾邮件发送者投入了大量工作来创建反向链接网络,但这些链接实际上并不是高排名的原因。

这些链接很可能会帮助谷歌找到全新的垃圾网站,让它们被抓取并最终排名。在我看来,这在一定程度上是谷歌的错,他们似乎更注重内容而不是链接。我百分之百地同意Google把更多的重点放在内容上而不是链接上。但我的想法是,垃圾链接的存在是为了让Googlebot能够发现垃圾页面并将其编入索引,即使只是一两天。

一旦索引垃圾页面我认为谷歌的算法有两个漏洞,这是我接下来要讲的。

许多网站对长尾短语进行排名,这些短语在某种程度上很容易排名,以及带有本地搜索组件的短语,也很容易排名。“长尾”这个概念已经存在了将近20年,后来在2006年出版的《长尾:为什么未来的商业是卖得少还是卖得多》一书中普及开来。

垃圾邮件发送者能够对这些很少被搜索的短语进行排名,因为这些短语几乎没有竞争,这使得排名很容易。因此,如果一个垃圾邮件制造者创建了数百万页的长尾短语,这些页面可以在很短的时间内每天为数十万个关键字排名。像亚马逊这样的公司利用长尾原理,每天销售数十万个单独的产品,这与每天销售数十万次一个产品不同。

这就是垃圾邮件发送者所利用的,长尾短语排名的便利性。垃圾邮件发送者利用的第二件事是本地搜索固有的漏洞。

本地搜索算法与非本地关键字排名算法不同。已经曝光的例子是Craigslist和相关关键字的变体。

的例子是像Craigslist的汽车零件,Craigslist的房间出租,Craigslist的业主出售和成千上万的其他关键字,其中大多数都没有使用Craigslist这个词。垃圾邮件的规模是巨大的,远远超过了包含“Craigslist”这个词的关键字。“垃圾邮件页面看起来像什么”

通过浏览器访问页面来查看垃圾邮件页面是不可能的。

我试着去看那些在谷歌排名靠前的网站的源代码,但是所有的垃圾网站都会自动重定向到其他域名。接下来,我在W3C链接检查器中输入了这个垃圾网址,但是W3C bot也看不到这个网站。所以我把浏览器的用户代理改成了Googlebot,但是垃圾网站还是重定向了我。

这表明该网站没有检查用户代理是否是Googlebot。

垃圾邮件站点正在检查Googlebot的IP地址。如果访问者的IP地址匹配为属于Google,那么垃圾邮件页面将内容显示给Googlebot。

所有其他访问者都被重定向到其他显示粗略内容的域名。为了看到网站的HTML,我必须访问一个谷歌的IP地址。因此,我使用Google的Rich Results测试器访问了这个垃圾网站,并记录了页面的HTML。我向Bill Hartzer展示了如何使用Rich Results测试器提取HTML,他马上就在twitter上发布了这条消息,哈哈。见鬼!

丰富的结果测试仪有一个选项,显示网页的HTML。因此,复制HTML,将其粘贴到文本文件中,然后将其保存为HTML文件。

Google Search Overwhelmed By Massive Spam AttackGoogle Search Overwhelmed By Massive Spam Attack

我接下来编辑HTML文件,删除任何JavaScript,然后再次保存文件。

Screenshot of a spam webpage that ranks in GoogleScreenshot of a spam webpage that ranks in Google

一个域名排名为300,000+关键字

Bill给我发了一个电子表格,里面有一个关键字短语列表,只有一个垃圾网站排名。一个垃圾网站,只是其中的一个,排名超过30万个关键字短语。

Image showing a closeup of a spreadsheet with keyword phrases on itImage showing a closeup of a spreadsheet with keyword phrases on it

Craigslist有很多关键词短语,但也有其他长尾短语,其中许多包含本地搜索元素。正如我提到的,很容易对长尾短语进行排名,很容易对本地搜索短语进行排名,并将这两种短语结合起来,很容易对t进行排名这些关键字短语。为什么这个垃圾邮件技术工作?如前所述,本地搜索使用与非本地算法不同的算法。例如,一个本地站点不需要很多链接来为搜索查询排名。页面只需要正确的关键字来触发本地搜索算法并随后排名。

本地搜索的算法是不同的,更允许,所以本地类型的网站可以排名。本地搜索算法是如此的宽松,以至于一个几乎完全用拉丁语编写的网站可以为“Rhinoplasty Plano Texas”这样的短语排名。Danny Sullivan在推特上承认,谷歌至少从12月19日起就知道这个垃圾邮件问题。是的,我已经把这个给搜索小组了。让我们来看看。人们正在研究这个问题。pic.twitter.com/vJH3EisnXD

-谷歌搜索联络(@searchliaison) 12月19日2023

有很多方法谷歌可以做到这一点,比如更严格,不允许网站在某些域名排名。这将是有趣的,看看谷歌是否最终找到了一种方法来打击这种垃圾邮件。

 

滚动至顶部