网站内容复制(克隆网站的搜索结果和排名代替了原网站吗?)
优采云 发布时间: 2022-01-31 09:15网站内容复制(克隆网站的搜索结果和排名代替了原网站吗?)
我们经常谈论黑帽 SEO 策略和内容抓取的例子。实际上,内容抓取行为是使用自动化脚本从其他网站中复制所有内容,最后克隆并重建。我们的许多客户最近都受到了这种类型的攻击。
今天我们来看看这个攻击的更新版本,其中克隆 网站 的搜索结果和排名取代了原来的 网站。这些克隆的 网站 生成虚假流量并修改克隆 网站 上的内部反向链接,以便对 Google 内容进行排名。最后,克隆的 网站 将不再具有指向原创 网站 的链接。
搜索引擎如何根据内容进行排名
搜索引擎的目的是努力在搜索结果中为用户返回具有内容相关性和客户体验的最佳网页。因此,具有相同和相似内容的页面可能会占搜索引擎返回的内容的一页以上。当然,也有可能不止一个网站在搜索结果中排名靠前。搜索引擎考虑的因素之一是网站的有效流量,它可以帮助搜索引擎确定网站的排名。除此之外,谷歌使用重定向来跟踪搜索者点击了哪些结果,以及用户是否继续点击其他搜索结果(如果没有找到所需的内容,用户应该继续点击)。
根据 2021 年 Chitika 的一项研究:
谷歌列出的第一个搜索结果平均会获得搜索引擎约 92% 的流量。
做 SEO 的人自然希望在搜索引擎中获得尽可能好的结果,以保证他们的行动成功,或者尽可能多地赚取收入。当然,有时他们这样做只是为了损害目标网站的 SEO 性能。
克隆效果 网站
黑客通过从权威的 文章 来源复制您的内容来使用内容抓取策略来迷惑搜索引擎。这种攻击是最糟糕的,当你注意到它的时候已经太晚了,你的搜索排名将会下降,或者你会看到你原来的排名被其他克隆网站所取代。
我创建了一个场景来更好地演示这种攻击,假设受害者的 网站 是“黑客”,而我的 网站 是“攻击者”。我的 网站 在这里被克隆。下面是效果图,攻击前后对比:
在图片中我们可以看到黑客在谷歌搜索排名中将克隆的网站替换为原创的网站。
处理这个问题的一个重要步骤是我们需要发现 网站 内容是如何被抄袭的。
如果你的 网站 的内容发生变化,导致克隆 网站 立即发生变化,这意味着黑客正在使用自动化脚本。
如果你的网站的内容发生了变化,但是克隆的网站没有变化,那么黑客可能已经存储了网站的数据。
下面,我将详细说明为什么这个问题很重要。
网站如何爬取
为了演示这种攻击,让我们看一下我们的开发人员(Lee Howarth)的脚本:
在代码分析方面,克隆网站会捕获原网站的所有内容,可以保证用户可以正常使用。当然,也可以比这更简单,只需要内容和积分,然后就可以做广告了。
代码准备好了,接下来就是用谷歌来最大化克隆网站的点击量。这样做会引起搜索引擎的注意。一旦有效命中率足够高,克隆 网站 将替换原来的 网站。为了获得足够的点击量,黑客会使用黑链或聘请专门赚取点击量的公司。
一旦他们窃取了您的工作,他们就会突然变成任何形式的恶意 网站、网络钓鱼等。
这被认为是被黑客入侵了吗?当然不会,但是您的 网站 会受到影响。
那么如何抵挡
我们可以从以下几个方面来解决问题。
1.在每个页面上添加rel=canonical:这个标签会告诉搜索引擎爬虫内容的域名,详见这里。许多 SEO 插件和相关从业者默认添加此标签。
2.联系受害者的网站:正如我上面提到的,黑客会利用别人的网站来攻击你的网站。您可以使用 whois 和社交信息与受害者网站管理员取得联系,让他们进行修复和保护。当然,这也是一件好事。
3.查出克隆人的whois信息网站:可以查出被克隆人的whois信息网站,找出黑客并想办法联系其网站@ > 服务提供者让他们为这个网站 停止服务。如果站点使用 CDN 或 WAF,请不要犹豫,直接联系 CDN/WAF 提供商,以便他们可以将请求直接转发到源主机,或直接在目标上执行操作。
4.设置 Google 提醒:当您的 网站文章 标题与您在 Google 上的标题完全匹配时,您可以提醒自己。当文章被抄袭时,您会及时收到提醒。此功能是免费的,让您有时间在问题变得太糟糕之前进行修复。
5.阻止来自克隆的请求网站:在获得克隆的 IP网站 后,您可以要求您的托管服务提供商阻止来自该 IP 的请求。当然,还有更好的办法,就是在.htaccess中加几行。假设克隆的网站的IP为192.168.190.190,可以添加如下.htaccess:
命令允许,拒绝
从 192.168.190.190 拒绝
允许所有人
6.向Google报告克隆内容:一旦确认您的网站内容已被克隆,您可以进入Google DMCA页面或直接访问此处并选择“WebSearch”。确认所有表格都填写完毕后,提交给官方谷歌申诉。再过几天,这些克隆网站链接的排名就会被移除,你的流量自然会回来。
如果黑客使用自动化脚本内容直接克隆,封禁被克隆的网站的IP只能防止内容泄露,而无法及时返回你的排名和流量。当然,如果你对这些不是太着急,这仍然是一个很好的解决方案。
如果您的内容被盗,您可以尝试以上方法尽快解决问题。
保护您的 网站SEO 免受盗窃
没有 100% 的方法可以防止内容抓取,大多数黑客总能找到绕过您的保护的方法。您可以使用许多服务(例如 Grammarly 和 Copyscape)来查明您的 网站 内容是否被抄袭。或者你可以直接在你的网站的文章的某一行加上引号去谷歌搜索,应该会有相应的收获。
您不应该感到容易受到 SEO 攻击,但您需要定期检查您的 网站 并提高其安全性。实际上有很多方法可以消除搜索结果页面 (SERP) 中的热链接,例如上面提到的一些要点。
如果您专注于该行业的竞争,则定期内容审查和内部和外部重复检查应该是您的 SEO 策略的一部分。