网站内容复制(是不是只是复制来发布的呢?不可不知的秘密)

优采云 发布时间: 2022-02-28 08:15

  网站内容复制(是不是只是复制来发布的呢?不可不知的秘密)

  纵观整个互联网,我们其实知道现在很多资料都是复制粘贴的,但是在复制的过程中,我们只是复制发布吗?显然任何做优化的人都知道这肯定是不可行的。

  一、重复内容一般是指不同域名之间存在大量相同或相似的内容。很多时候,这不是故意的,或者至少不是恶意的。例如,一些论坛生成专为移动屏幕显示而设计的页面;商店项目在各种 URL 上显示(有时甚至链接到)等等。实际的例子,比如and,这两个url是不同的,但是它们对应的网页内容是完全重复的。在一些程序的开发过程中经常会出现类似的问题。

  目前,一些网站会大量复制其他网站的内容,以操纵搜索引擎排名,为热门或长尾查询获取更多流量。为此,就是复制内容,而对于一些网站,会有不同的算法,比如谷歌,谷歌网站有一个方便易用的翻译功能,我们的算法会没有英语和*敏*感*词*语版本的相同内容被视为内容的复制品。同样,您不必担心对 文章 中其他 文章 片段的引用被视为重复。对于 Google,用户通常希望在使用搜索引擎时看到各种 原创 内容。想象一下,如果他们发现的只是一堆具有相同内容的搜索结果,那将是多么烦人。还,网站管理员不喜欢看到搜索引擎给出一些复杂的 URL。但是当复制和搜索引擎抓取网页并获得搜索结果时,他们总是试图索引和显示具有不同内容的页面。这个过滤意味着,比如像谷歌,如果你的网站有普通版和打印版的文章,并且你没有在robots.txt中设置noindex标志,谷歌只会选择一个版本向 Google 用户展示。在极少数试图利用复制内容来操纵排名和欺骗谷歌用户的情况下,我们将对相关页面的索引和排名进行适当的调整。当然,我们更愿意专注于过滤而不是排名调整,所以在绝大多数情况下,最坏的可能结果是 原创 读者在我们的索引中看到不需要的版本。@网站管理员不喜欢看到搜索引擎给出一些复杂的 URL。但是当复制和搜索引擎抓取网页并获得搜索结果时,他们总是试图索引和显示具有不同内容的页面。这个过滤意味着,比如像谷歌,如果你的网站有普通版和打印版的文章,并且你没有在robots.txt中设置noindex标志,谷歌只会选择一个版本向 Google 用户展示。在极少数试图利用复制内容来操纵排名和欺骗谷歌用户的情况下,我们将对相关页面的索引和排名进行适当的调整。当然,我们更愿意专注于过滤而不是排名调整,所以在绝大多数情况下,最坏的可能结果是 原创 读者在我们的索引中看到不需要的版本。@网站管理员不喜欢看到搜索引擎给出一些复杂的 URL。但是当复制和搜索引擎抓取网页并获得搜索结果时,他们总是试图索引和显示具有不同内容的页面。这个过滤意味着,比如像谷歌,如果你的网站有普通版和打印版的文章,并且你没有在robots.txt中设置noindex标志,谷歌只会选择一个版本向 Google 用户展示。在极少数试图利用复制内容来操纵排名和欺骗谷歌用户的情况下,我们将对相关页面的索引和排名进行适当的调整。当然,我们更愿意专注于过滤而不是排名调整,所以在绝大多数情况下,最坏的可能结果是 原创 读者在我们的索引中看到不需要的版本。管理员不喜欢看到搜索引擎给出一些复杂的 URL。但是当复制和搜索引擎抓取网页并获得搜索结果时,他们总是试图索引和显示具有不同内容的页面。这个过滤意味着,比如像谷歌,如果你的网站有普通版和打印版的文章,并且你没有在robots.txt中设置noindex标志,谷歌只会选择一个版本向 Google 用户展示。在极少数试图利用复制内容来操纵排名和欺骗谷歌用户的情况下,我们将对相关页面的索引和排名进行适当的调整。当然,我们更愿意专注于过滤而不是排名调整,所以在绝大多数情况下,最坏的可能结果是 原创 读者在我们的索引中看到不需要的版本。管理员不喜欢看到搜索引擎给出一些复杂的 URL。但是当复制和搜索引擎抓取网页并获得搜索结果时,他们总是试图索引和显示具有不同内容的页面。这个过滤意味着,比如像谷歌,如果你的网站有普通版和打印版的文章,并且你没有在robots.txt中设置noindex标志,谷歌只会选择一个版本向 Google 用户展示。在极少数试图利用复制内容来操纵排名和欺骗谷歌用户的情况下,我们将对相关页面的索引和排名进行适当的调整。当然,我们更愿意专注于过滤而不是排名调整,所以在绝大多数情况下,最坏的可能结果是 原创 读者在我们的索引中看到不需要的版本。不喜欢看到搜索引擎给出一些复杂的 URL。但是当复制和搜索引擎抓取网页并获得搜索结果时,他们总是试图索引和显示具有不同内容的页面。这个过滤意味着,比如像谷歌,如果你的网站有普通版和打印版的文章,并且你没有在robots.txt中设置noindex标志,谷歌只会选择一个版本向 Google 用户展示。在极少数试图利用复制内容来操纵排名和欺骗谷歌用户的情况下,我们将对相关页面的索引和排名进行适当的调整。当然,我们更愿意专注于过滤而不是排名调整,所以在绝大多数情况下,最坏的可能结果是 原创 读者在我们的索引中看到不需要的版本。不喜欢看到搜索引擎给出一些复杂的 URL。但是当复制和搜索引擎抓取网页并获得搜索结果时,他们总是试图索引和显示具有不同内容的页面。这个过滤意味着,比如像谷歌,如果你的网站有普通版和打印版的文章,并且你没有在robots.txt中设置noindex标志,谷歌只会选择一个版本向 Google 用户展示。在极少数试图利用复制内容来操纵排名和欺骗谷歌用户的情况下,我们将对相关页面的索引和排名进行适当的调整。当然,我们更愿意专注于过滤而不是排名调整,所以在绝大多数情况下,最坏的可能结果是 原创 读者在我们的索引中看到不需要的版本。

  再次让我们看看 网站 管理员如何主动处理重复内容以防止搜索引擎访问,即您可能希望指示 Google 选择您喜欢的版本,而不是让我们的算法确定文件的“最佳”版本。例如,如果您不希望我们为您的 网站文章 的打印副本编制索引,您可以通过在 robots.txt 中写入目录名称或正则表达式来禁用 Google 对这些打印副本的抓取文件挑选。第二种是使用301重定向,或者保持你的内部链接一致,不要同时有/page/,还要有/page和/page/index.htm内部链接。和上面提到的重构,如果你重构了你的网站,请在你原来的网站中使用301重定向(永久重定向)来重定向你的用户,

  也就是说,总的来说,我们需要对内容复制问题有一个大致的了解,并花几分钟时间对您的 网站 进行有洞察力的预防性维护。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线