成功劫持谷歌官方文档我想分享一个代理商最近的操作尝试

优采云 发布时间: 2021-07-20 23:07

  成功劫持谷歌官方文档我想分享一个代理商最近的操作尝试

  指南:

  [Dan Sharp 分享了一个案例,他的公司可以劫持 Google 官方搜索引擎优化 (SEO) 入门指南的排名。让我们来看看它们是如何运作的。成功劫持谷歌官方文档。我想分享一个代理最近的操作尝试。运营后,谷歌认为我们的网站是谷歌官方的搜索引擎优化入门指南PDF

  Dan Sharp 分享了一个案例,他的公司可以劫持 Google 官方搜索引擎优化 (SEO) 介绍指南的排名。让我们来看看它们是如何运作的。

  

  成功劫持谷歌官方文档

  我想分享一个代理最近的操作尝试。经过操作,谷歌认为我们网站是谷歌官方搜索引擎优化指南PDF的权威版本——并在其“搜索引擎优化”目录中列出了我们以及数千个词组。

  我们进行了内部测试,包括我们的 SEO Spider 软件和用户代理。本次特殊实验仅供娱乐,只是为了验证我们的发现,无意伤害他人,也不以赚钱为目的。目前我们已终止实验并删除相关内容。

  

  谷歌搜索结果截图

  背景

  在搜索引擎结果中发现一些奇怪的现象后,我们提前联系了谷歌。他们的 SEO 介绍指南 PDF 位于“SEO”和“Google SEO Guide”等相关目录中。有些事情不对...

  @JohnMu 您好,John,Google SEO 入门指南不在列表中或无法检索。此 URL 已被另一个 URL 替换。这个突出的问题是302s?图/i5M4VLFe9D

  ----- Dan Sharp(@screamingfrog) 2016 年 11 月 7 日

  在搜索结果中,PDF介绍指南出现在搜索结果列表中,也有其他上传PDF的网址的链接,但没有出现在谷歌自己的网站中。所以,出于某种原因,谷歌没有在列表中收录自己的网页;相反,其他网站 使用了 Google 相关内容。

  以下是网站在英国的部分排名。每个网站都试图挤出其他搜索结果,因为谷歌会根据搜索结果更改可信的权威版本。

  

  SEO 入门指南排名情况

  我们决定调查为什么无法检索 Google 的网页,而其他网页可以。我们注意到谷歌在搜索引擎优化指南中使用了302重定向功能,并且它侧重于单独的域名。

  在302重定向中,可以在Google网页中检索到原创网址,但在静态状态下无法检索到目标网址。

  然而,这两个网址都没有检索到,都试图确认权限并检索原创内容和网址。谷歌之前没有使用“noindex”,也没有通过robots.txt截取任何内容,其他内容都可以检索到,与规范、网页内容、HTTP头没有直接冲突。

  Google 曾表示,无论是 302 临时重定向还是 301 永久重定向,页面排名结果都是相似的。真正重要的是检索到的 URL 类型以及搜索结果中的 URL 类型。所以,理论上应该是要检索原创网址和排名,但这不是重点。

  因为每个重定向都使用类似的方法来传达 PageRank,Gary Illyes 说 301 有助于标准化。

  @AndyNRodgers 重定向投递是一样的,但 301 有助于规范@JohnMu

  ---- GaryIllyes ᕕ(ᐛ )ᕗ (@methode) 2016 年 8 月 5 日

  我们从之前的实验中知道,同样的内容可能会被劫持,但通常会换成更权威的网站。 Google 的 SEO 入门指南有大约 2,100 个指向原创 URL 的链接根域,以及 485 个重定向目标(HTTP/HTTPS 组合协议),因此这是一个功能强大且知名度高的网页。

  入门指南也在,享有很高的声誉。最终目的是占据一个独立的域名。

  显然,Screaming Frog 的权威性不如 Google,但由于上面提到的问题,许多鲜为人知的网站 提前更换了它们。

  实验

  我们计划进行短期实验,只将 Google SEO 介绍指南上传到我们的域名。然后我们通过谷歌搜索控制台提交了收录,然后就不管了。

  一周后,我们发现我们劫持了谷歌自己的排名(由于我们的权限更高,之前所有黑客都没有这样做过),因为谷歌的算法似乎认为我们是他自己内容的一部分。我们的 URL 出现在 info: 和 cache: 命令的查询结果中。

  

  我们劫持了这个文档在谷歌官网的排名

  我们劫持了黑客,我们劫持了 Google。

  

  劫持后的排名情况

  虽然我们是英国网站,但在美国,我们的“搜索引擎优化”已经从第50位上升到了第四位,“SEO”也进入了前十。

  

  英国网址和美国搜索排名也有所提升

  在PDF排名中,“谷歌搜索引擎优化”、“谷歌搜索引擎优化指南”、“www goolgle com”等谷歌关键词都可见。

  

  与SEO入门指南相关的关键词排名也有所提升

  在美国和英国的其他PDF排名中,我们可以看到他们对SEMrush的热爱(以下截图为美国的结果)

  此外,Sistrix 还强调,我们故意制作了这个突然出现的“新”关键词。

  Google 网站站长工具记录了近 80 万次 PDF 展示,尤其是在过去四天内。

  

  Google 网站站长工具记录了此更改

  我们在推特上宣布后,该实验受到了广泛关注。

  所以在接下来的一段时间里,我们会继续关注谷歌,看看他是否会修正索引,改变归一化和排名。 48 小时后,我们注意到 Google 的官方搜索引擎优化指南开始出现在排名中。现在无法检索以前的搜索结果(也出现在站点:命令查询结果中)。

  之后,我们还发现 Google 在 PDF 的原创 URL 中添加了一个 HTTP 规范,以帮助其正确收录。

  但是我们的内容还是出现在info:查询结果中,也有排名。这意味着这两个指南都在搜索结果中,我们的网址排名仍然高于 Google。

  

  我们的排名仍然高于谷歌官方文档的排名

  我们希望这件事能改变---谷歌正式列为权威,我们的网页退出排名。在接下来的五天里,我们的网页仍然出现在谷歌的搜索结果中,并有数千次访问。之后,我们的PDF就消失了,我们赶紧终止了实验。

  反思

  首先,我们不推荐别人的乱七八糟的信息。这不是获得最高排名的可行策略技术,这只是一个独特而有趣的案例研究。我们很难总结这一点,因为我们无法确定是否还有其他未知因素可能会影响操作。

  我们有很多理论和想法,这里总结三点。

  1. 与关 302 重定向没有(完全)相关

  起初我们认为根本原因是 302 重定向。众所周知,Google 坚信使用 302 重定向没有任何问题。我们觉得文件托管方式很难断开。

  经过一段时间后,我们发现了 URL 中其他一些奇怪的现象(根据 Accept-Language 标头提供的有价值的信息),并且在 HTTPS 中没有正确使用规范化。

  2.使用规范

  使用规范来帮助改进收录 是明智之举。只要 Google 更新 PDF 的 HTTP 规范并将其更改为单独的 URL 即可检索。

  使用爬虫爬取你的网站中缺少的规范链接,也可以爬取HTTP头中的规范链接。

  对于 PDF 和文档,您可以使用 .htaccess 轻松设置诸如 HTTP 规范的文件。

  3.虽然发生的概率很小,但是劫持还是有可能的

  在某些情况下,网页的排名可以劫持内容完全相同的域名,例如索引问题,或者更专业的来源。总体来说可能性不大,但谷歌还是需要在原创来源排名问题上做一些改进。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线