网站内容复制(曾庆平SEO前面讨论的网址规范化问题会产生复制内容吗)
优采云 发布时间: 2021-09-17 15:11网站内容复制(曾庆平SEO前面讨论的网址规范化问题会产生复制内容吗)
重复内容也可以称为重复内容。重复内容是指具有相同或非常相似内容的两个或多个URL。复制的内容可能出现在相同的网站或不同的网站中@
1、复制内容的原因
以下原因可能导致复制内容。曾庆平之前在SEO中讨论的网站标准化将产生重复内容
代理商和零售商重印产品制造商提供的产品信息。这没什么错。大多数制造商都同意不存在版权问题。就像两个豌豆一样,大多数零售商、批发商都是直接复制而不做任何更改,并且他们使用相同的产品描述,因此这些电子商务网站充满了复制内容。p>
印刷版。许多网站除了用于浏览的普通页面外,还提供更适合打印的页面版本。如果不以适当的方式禁止爬行,这些打印页面将成为复制内容
网站structure导致的各种页面版本。例如,产品列表按价格、评论、上架时间等进行排序,以及博客的分类归档和时间归档
Web内容由RSS生成。许多网站,尤其是新闻网站,都会与其他网站RSS源一起生成网站内容。这些内容在原创来源和许多其他类似网站中多次出现@
使用会话ID。当搜索引擎爬行器在不同的时间访问网页时,它会获得不同的会话ID。事实上,网页内容是一样的。由于会话1D参数不同,因此它们被视为不同的网页
网页内容太少。每个网页都不可避免地有公共部分,如导航栏、版权声明、广告等。如果网页的主体部分太短,且内容量不等于一般部分,则可以将其视为内容页的副本
转载和剽窃。有时其他人剽窃您的网站内容,有时真诚地转载,有时作者以不同的网站发布文章内容,这将导致内容重复
镜像网站. 镜像网站曾经非常流行。当网站太忙或太慢时,用户可以通过替换镜像来查看或下载内容,这也会带来复制内容的风险
产品或服务类型之间的差异相对较小。例如,有些网站按地区对其服务进行分类,但事实上,向每个地区提供的产品或服务是相同的。这些按地区分类的页面只会更改地名,其他服务内容的描述都是一样的。向URL添加任何字符或返回200状态码。有些网站由于技术原因,如果用户在URL后添加任何字符或参数,服务器通常可以返回200个状态码,并返回相同的重复内容页,但不收录任何字符
检查页面是否有副本版本相对简单。在页面主体中取出一个句子,添加双引号,在搜索引擎中搜索,您可以从结果中看到多个页面是否收录该句子。一般来说,随机选择的句子完全出现在另一个不相关的文章文本中的概率非常低
2、复制内容的危害
许多SEO对复制的内容有误解。他们认为如果网站上有被复制的内容,搜索引擎会惩罚他们。事实上,搜索引擎不会惩罚或减少他们的权利,因为网站有少量被复制的内容。搜索引擎所做的是从多个页面中挑选出真正的原创版本,并给出它应有的排名。其他复制的版本将不会返回,也不会在搜索结果的后面进行排名
但是,由于这是留给搜索引擎来判断的,有可能会误判,将原来的原创页面视为复制或复制的内容,因此排名不好。这真的很像对原创页面的惩罚,但不是因为内容本身,而是因为搜索引擎无法判断原创页面
似乎在同一个网站上复制的内容并不那么严重。无论搜索引擎判断哪个版本为原创,它都是独立的页面网站. 问题是,搜索引擎考虑的最合适的URL可能与SEO站长自己考虑的最合适的URL不同。当SEO站长优化页面和链接时,他关注的是a页,但搜索引擎认为B页是最好的(a页的内容与B页的内容相同)。SEO站长在页面a上花费的精力是浪费的
相同网站中复制的内容将分散权重。由于页面显示在网站上,因此必须有指向这些页面的链接。如果一个独特的内容只出现在一个网站上,网站链接可以集中在该网站上,以提高其排名能力。分散到多个网站的链接将使每个网站的排名能力不突出。外部链接也是如此,它们可能分散到不同的URL
同一站点上的复制也会导致收录太多无意义的页面,这可能会在域名权重不高时挤出收录其他独特内容的机会。如果网站上有大量复制内容,搜索引擎可能会怀疑网站的质量并受到处罚
3、消除重复内容
前面已经讨论了由网站标准化引起的复制内容。最好的解决方案是确保一篇文章文章只对应一个URL,而不是多个版本,网站所有内部链接都连接到此URL。有时您需要使用301重定向
最好的解决方案是选择一个允许收录和其他禁止搜索引擎爬行的版本或收录
您可以使用robots文件禁用爬行,也可以使用Noindex meta robots标记禁用索引。指向不需要的收录复制内容的链接使用nofollow标记、JavaScript等防止爬行器爬行
复制内容的另一个解决方案是使用规范标记。规范化标记不仅可以应用于由网站标准化引起的复制内容,还可以应用于其他情况
例如,网站同一款式的鞋子可以分为不同的型号。型号之间唯一的区别是颜色。这些模型生成多个网址,产品描述几乎相同,但颜色不同
此时,可以使用规范标记。用户将不会看到不同的页面,但搜索引擎会将权重集中在其中一个模型上,以避免复制内容
会话ID为的页面也可以使用规范标记,例如带有代码的page:/page-a.html:
这样,无论以后生成什么会话ID:
/page-a.html?sessionid=123456
/page-a.html?sessionid=456789
以上URL将由搜索引擎加权为:/page-a.html
在不同的网站之间复制内容很麻烦,因为另一个网站上的内容无法控制。只有两件事可以做。首先,在页面中添加版权声明,要求保留重印的版权声明和指向原创来源的链接网站
一些聚合网站将获取提要并自动生成内容,因此版权声明和链接也应添加到提要中
一般来说,原创version的外部链接比转载的要多。即使在中国互联网的环境下,很少关注版权,一些站长在转载时也会保留原创的源链接。对于搜索引擎来说,原创来源的链接是判断原创的最重要信号@
另一点是坚持原创,随着时间的推移,我们将能够增加网站的重量,并增加网站内容被判定为原创的可能性。如果还有其他的“网站海量抄袭”,导致“原创”内容不能排名,还可以考虑联系对方请求版权链接或删除剽窃内容,或向对方主机、域名提供商、搜索引擎等投诉