搜索引擎优化pdf(成功劫持谷歌官方文档我想分享代理商操作尝试)
优采云 发布时间: 2021-10-27 00:10搜索引擎优化pdf(成功劫持谷歌官方文档我想分享代理商操作尝试)
Dan Sharp 分享了一个案例,他的公司可以劫持 Google 官方搜索引擎优化 (SEO) 入门指南的排名。让我们来看看它们是如何运作的。
成功劫持谷歌官方文档
我想分享一个代理最近的操作尝试。经过操作,谷歌认为我们网站是谷歌官方搜索引擎优化指南PDF的权威版本——并在其“搜索引擎优化”目录中列出了我们以及数千个词组。
我们进行了内部测试,包括我们的 SEO Spider 软件和用户代理。本次特殊实验仅供娱乐,只是为了验证我们的发现,无意伤害他人,也不以赚钱为目的。目前,我们已经终止了实验并删除了相关内容。
Google 搜索结果的屏幕截图
背景
在搜索引擎结果中发现一些奇怪的现象后,我们提前联系了谷歌。他们的 SEO 介绍指南 PDF 位于“SEO”和“Google SEO Guide”等相关目录中。有些事情不对...
@JohnMu 您好,John,Google SEO 入门指南不在列表中或无法检索。此 URL 已被另一个 URL 替换。这个悬而未决的问题是302s?图/i5M4VLFe9D
----- Dan Sharp (@screamingfrog) 2016 年 11 月 7 日
在搜索结果中,搜索结果列表中出现了PDF介绍指南,也有链接到其他上传PDF的网址,但没有出现在谷歌自己的网站中。所以,出于某种原因,谷歌没有在列表中收录自己的网页;相反,其他 网站 使用了 Google 相关内容。
以下是网站在英国的部分排名。每个网站都试图排挤其他搜索结果,因为谷歌会根据搜索结果改变可信的权威版本。
SEO入门指南排名情况
我们决定调查为什么无法检索到 Google 的网页,而其他网页却可以。我们注意到谷歌在搜索引擎优化指南中使用了302重定向功能,并且它侧重于单独的域名。
在302重定向中,可以在Google网页中检索到原创URL,但静态无法检索到目标URL。
但是,这两个URL都没有被检索到,都试图确认权限并检索原创内容和URL。谷歌之前没有使用“noindex”,也没有通过robots.txt截取任何内容,其他内容都可以检索到,与规范、网页内容、HTTP头没有直接冲突。
谷歌已经表明,无论是302临时重定向还是301永久重定向,页面排名结果都是相似的。真正重要的是检索到的 URL 类型以及搜索结果中的 URL 类型。因此,理论上应该检索原创 URL 和排名,但这不是重点。
因为每个重定向都使用类似的方法来传达 PageRank,Gary Illyes 说 301 有助于标准化。
@AndyNRodgers 重定向交付相同,但 301 有助于规范化 @JohnMu
---- GaryIllyes ᕕ(ᐛ )ᕗ (@methode) 2016 年 8 月 5 日
我们从之前的实验中知道,同样的内容可能会被劫持,但通常会换成更权威的网站。Google 的 SEO 入门指南有大约 2,100 个指向原创 URL 的链接根域,以及 485 个重定向目标(HTTP/HTTPS 组合协议),因此这是一个功能强大且可见度高的网页。
入门指南也在,享有很高的声誉。最终目标是占据一个独立的域名。
显然,Screaming Frog 的权威性不如 Google,但由于上面提到的问题,很多名不见经传的网站 已经提前取而代之。
测试
我们计划进行短期实验,只上传我们域名的谷歌搜索引擎优化介绍指南。然后我们通过谷歌搜索控制台提交,是收录,然后就不管了。
一周后,我们发现我们劫持了谷歌自己的排名(由于我们的权限更高,之前所有黑客都没有这样做过),因为谷歌的算法似乎认为我们是他自己内容的一部分。我们的 URL 出现在 info: 和 cache: 命令的查询结果中。
我们劫持了这个文档在谷歌官网的排名
我们劫持了黑客,我们劫持了谷歌。
劫持后的排名情况
虽然我们是英国的网站,但在美国,我们的“搜索引擎优化”已经从第50位跃升至第4位,“SEO”也进入了前十。
英国网址、美国搜索排名也有所提升
在PDF排名中,“谷歌搜索引擎优化”、“谷歌搜索引擎优化指南”、“www goolgle com”等谷歌关键词都可见。
SEO入门指南相关的关键词排名也有所提升
在美国和英国的其他PDF排名中,我们可以看到他们对SEMrush的热爱(以下截图显示了美国的结果)
此外,Sistrix 还强调,我们特意制作了这个突然出现的“新”关键词。
谷歌网站管理员工具记录了近 80 万份 PDF 演示文稿,尤其是在过去四天里。
谷歌网站管理员工具记录了这一变化
我们在推特上公布后,该实验受到了广泛关注。
所以在接下来的一段时间里,我们会继续关注谷歌,看看他是否会修正索引,改变标准化和排名。48 小时后,我们注意到 Google 的官方搜索引擎优化指南开始出现在排名中。现在无法检索以前的搜索结果(也出现在站点:命令查询结果中)。
后来,我们还发现谷歌在 PDF 的原创 URL 中添加了一个 HTTP 规范,以帮助它正确收录。
但是我们的内容还是出现在info:query results中,也有排名。这意味着两个指南都在搜索结果中,我们的 URL 排名仍然高于 Google。
我们的排名还是高于谷歌官方文档的排名
我们希望这件事能改变——谷歌正式列为权威,我们的网页退出排名。在接下来的五天里,我们的网页仍然出现在谷歌的搜索结果中,并有数千次访问。之后,我们的PDF消失了,我们很快就终止了实验。
反射
首先,我们不推荐别人的乱七八糟的信息。这不是获得最高排名的可行策略技术,这只是一个独特而有趣的案例研究。我们很难对此进行总结,因为我们无法确定是否还有其他未知因素可能会影响操作。
我们有很多理论和想法,这里总结三点。
1. 与关 302 重定向没有(完全)相关
起初我们认为根本原因是 302 重定向。众所周知,Google 坚信使用 302 重定向没有任何问题。我们觉得文件托管方式很难断开。
一段时间后,我们在URL中发现了其他一些奇怪的现象(根据Accept-Language标头提供的有价值的信息),HTTPS中没有正确使用规范化。
2.使用规范
使用规范来帮助改进 收录 是明智的。只要谷歌更新PDF的HTTP规范,改成单独的URL,就可以检索到。
你可以使用爬虫爬取你的网站中的规范链接,也可以爬取HTTP头中的规范链接。
对于 PDF 和文档,您可以使用 .htaccess 轻松设置文件,例如 HTTP 规范。
3. 虽然发生的概率不大,但是劫持还是有可能的
在某些情况下,网页的排名可以劫持内容完全相同的域名,例如索引问题,或者更专业的来源。总体来说可能性不大,但是谷歌还是需要在原创来源排名的问题上做一些改进。