网站转载内容太多(曾庆平SEO前面讨论的网址规范化问题会产生复制内容吗)

优采云 发布时间: 2021-11-02 04:15

  网站转载内容太多(曾庆平SEO前面讨论的网址规范化问题会产生复制内容吗)

  重复内容也可以称为重复内容。重复内容意味着两个或多个 URL 具有相同或非常相似的内容。复制内容可能发生在同一个网站 或不同的网站 上。

  1、复制内容的原因

  以下原因可能会导致复制内容。之前曾庆平在SEO中讨论的URL标准化问题会产生重复内容。

  代理商和零售商从产品制造商处复制产品信息。这没有任何问题,大多数制造商都同意不存在版权问题。但是,大多数代理商、零售商和批发商直接复制而不做任何更改。每个人都使用完全相同的产品描述,因此这些电子商务网站充斥着大量复制内容。

  印刷版。很多网站不仅提供普通页面供浏览,还提供更适合打印的页面版本。如果没有正确禁止抓取,这些印刷版网页将成为复制内容。

  网站 结构导致的各种页面版本。比如商品列表按价格、评论、发售时间等排序,博客分类存档、时间存档等。

  网页内容由RSS生成。有很多网站,尤其是新闻网站,使用其他网站 RSS feeds 生成网站内容,在原创来源和许多其他类似的网站 上面已经出现过很多次了。

  使用会话 ID。搜索引擎蜘蛛在不同时间访问网页时会被赋予不同的会话 ID。事实上,网页的内容是一样的。因为Session 1D的参数不同,所以被认为是不同的网页。

  页面上的内容太少。每个网页都难免有通用部分,如导航栏、版权声明、广告等,如果网页正文部分太短,一般部分内容量不够,可以考虑抄袭的内容页面。

  转载和抄袭。有时别人抄袭你的网站内容,有时善意转载,有时作者以不同的网站文章发表,这些都会造成内容的抄袭。

  镜像 网站。镜子 网站 曾经非常流行。当网站太忙太慢时,用户可以通过备用镜像查看或下载内容。这也会产生复制内容的风险。

  产品或服务的类型之间的差异相对较小。比如有的网站把自己的服务按地区分类,但实际上每个地区提供的产品或服务都是一样的。这些按地区分类的页面只是改变了地名,其他服务的描述都是一样的。向 URL 添加任何字符仍会返回 200 状态代码。一些网站由于技术原因,用户在URL后添加任意字符或参数,服务器可以正常返回200状态码,返回相同的重复内容页面,没有任何字符。

  检查页面是否有副本相对简单。取出页面正文中的一句话,加双引号,在搜索引擎中搜索。从结果中可以看出是否有多个页面收录这句话。一般来说,一个随机选择的句子不太可能完全出现在另一个不相关的文章中。

  2、复制内容的危害

  很多SEO对抄袭内容​​有误解,认为如果网站上有抄袭内容,搜索引擎会惩罚他们。事实上,搜索引擎不会因为复制少量网站而惩罚或降权。搜索引擎所做的就是尽量从多个页面中选出真正的原创版本,给它一个合适的排名,其他复制的版本不会在搜索结果中返回或排名相对较低。

  但是,由于是留给搜索引擎来判断,可能会出现判断错误,将原本原创的页面视为转载或抄袭复制内容,所以排名不好。这确实是对原创页面的惩罚,但不是因为内容本身的复制,而是因为搜索引擎没有判断原创。

  同一个网站上的复制内容似乎没有那么严重。不管搜索引擎判断的是哪个版本的原创,都是自己的页面网站。问题是搜索引擎考虑的最合适的 URL 可能与 SEO 站长考虑的最合适的 URL 不同。SEO站长在优化和链接时关注页面A,但搜索引擎认为页面B是最好的。(A的内容和B的一样),SEO站长在A页上花了很多功夫。

  同一网站内的重复内容会分散权重。由于页面出现在 网站 上,所以必须有到这些页面的链接。如果一条独特的内容只出现在一个网址上,可以将网站上的链接集中在这个网址上,从而提高其排名能力。链接分散到多个网址,会使得每个网址的排名能力不那么突出。外链也是一样,很可能会分散到不同的网址。

  同样的网站副本也造成了太多无意义的页面。在域名权重较低的情况下,可能会挤压其他独特内容收录的机会。如果网站上存在大量抄袭内容,可能会导致搜索引擎怀疑网站的质量而受到处罚。

  3、消除重复内容

  URL归一化导致的复制内容上面已经讨论过了。最好的办法是保证一篇文章文章只对应一个URL,不要有多个版本,网站的所有内链都统一到这个URL。有时您需要使用 301 重定向。

  不是因为 URL 的标准化导致在同一站点上复制内容。最好的解决方案是选择一个版本允许收录,其他版本禁止搜索引擎抓取或收录。

  您可以使用robots 文件来禁止抓取,或者使用noindex meta robots 标签来禁止索引。连翔不希望收录的链接使用nofollow标签、JavaScript等来防止蜘蛛爬行。

  复制内容的另一种解决方案是使用规范标签。canonical标签可以用于URL规范化导致的复制内容,也可以用于其他情况。

  比如网站上同款的鞋子可能会分不同的型号,型号之间唯一的区别就是颜色。这些模型生成多个URL,产品描述几乎相同,只是颜色不同。

  这时候可以使用canonical标签,用户不会被重定向,也不会看到不同的页面,但是搜索引擎会将权重集中在其中一个模型上,避免复制内容。

  带有Session ID的页面也可以使用canonical标签,比如页面:放代码:

  这样,不管后面生成什么Session ID:

  上述 URL 将被搜索引擎加权为:

  在不同的网站之间复制内容比较麻烦,因为其他网站上的内容是无法控制的。只有两件事可以做。一种是在页面添加版权声明,需要转载的网站保留版权声明和原文链接。

  一些联合网站 会抓取提要并自动生成内容,因此还应在提要中添加版权声明和链接。

  一般来说,原创 版本的外链会比转载的多。即使在中国互联网这个不太重视版权的环境下,仍然会有部分站长在转载时保留原出处链接。对于搜索引擎来说,原创来源的链接是判断原创的最重要信号。

  还有一点就是坚持原创,给定时间,网站的权重肯定会增加,这样网站上的内容被判定为原创的几率就会增加。如果有其他网站的大量抄袭,导致原创的内容无法排名,您也可以考虑联系对方索取版权链接或删除抄袭内容,或向对方主机或域名提供商投诉、搜索引擎投诉等。

  本文来自微信公众号:平哥SEO优化(qingpingseo)

  

  申请创业报告,分享创业好点子。,共同探讨创业新机遇!

  关键词 排名优化

  免责声明:本文章由【艺马酷站】整理自网络!如有侵权,请邮件删除。本站发布的文章及附件仅供学习研究之用;以上内容不得用于商业或非法用途,否则后果由用户负责。

  本站信息来源于网络,版权纠纷与本站无关。您必须在下载后 24 小时内从您的计算机中彻底删除上述内容。如果您喜欢本程序,请支持正版软件,购买并注册,获得更好的正版服务。如有侵权,请邮件联系。

  赞助本站仅用于维护服务器的日常运行,不收取程序和源代码费用,因此不提供任何技术支持,如需商业用途请购买正版!

  如无特殊说明,本站资源解压密码为

  最喜欢的海报分享链接:

  分享给 :

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线