seo伪原创在线工具(网站出现多个不规范网址会给搜索引擎收录和排名带来很多麻烦)

优采云 发布时间: 2021-09-12 19:02

  seo伪原创在线工具(网站出现多个不规范网址会给搜索引擎收录和排名带来很多麻烦)

  SEO 文章重写

  EZ 重写器

  文章更换器

  最佳 Spinner 演示

  快速内容向导

  文章改写者

  免费的内容重写工具

  文章微调

  免费文章微调

  URL标准化成为搜索引擎最喜欢的URL

  网址规范化是指搜索引擎选择最合适的网址作为真实(规范)网址的过程。

  为什么会有不规则的网址?例如,以下网址——通常指的是同一个文件:

  域名 .com

  但从技术上讲,这些网址都是不同的网址,搜索引擎确实将它们视为不同的网址。虽然在大多数情况下,这些网址返回的是同一个文件,即网站homepage,但从技术上讲,主机可以用不同的内容来响应这些网址。除了以上有无www和文件名是否为index.htmi导致的URL不规则外,还有可能是以下原因导致的URL标准化问题:

  cms系统原因,使得同一篇文章文章(也可以是产品、帖子等)可以通过几个不同的网址访问。

  URL 静态设置错误。同一篇文章文章有多个静态网址。

  URL静态化后,静态和动态URL并存,都有链接,都可以访问。

  目录后有或没有斜线。 (而且是不同的网址,但它们实际上是一页)。

  加密后的网址和同时存在,都可以访问。

  URL 中有端口号,:80 和?

  跟踪代码,一些联属网络营销计划或广告服务会在 URL 后添加跟踪代码,例如域名。 com/?affid-100?显示主页的内容。

  网站中多个不规则网址的存在会给搜索引擎收录和排名带来很大的麻烦。比如网站homepage应该是固定的,只有一个网址,但是很多站长在链接回首页时使用的网址不是唯一的,链接到-一会。虽然不会给用户带来任何麻烦,但因为这些网址实际上是同一个文件,所以给搜索引擎造成了混乱。哪个网址才是真正的主页?应该返回哪个 URL 作为主页?如果网站上不同版本的网址同时出现,那么两个或多个版本的网址可能会被收录引擎搜索到,会造成内容重复。搜索引擎在计算排名时必须找到所谓的标准化网址,这是搜索引擎考虑的最合适的网址版本。

  URL标准化带来的几个问题:

  cms 系统链接到不同位置的不同网址,分散页面权重,不利于排名。

  外部链接也可能指向不同的 URL,分散权重。

  搜索引擎确定的规范网址不是网站管理员想要的网址。

  如果URL归一化问题太严重,也可能会影响收录。对于权重较低的域,可以收录的页面总数和蜘蛛的总爬行时间是有限的。搜索引擎将资源花在收录 非标准网址上,为独特内容留下的资源更少。

  复制内容过多,搜索引擎可能会认为有作弊嫌疑。

  解决URL标准化问题的方法有很多,比如:

  确保所使用的cms 系统只生成标准化的 URL,无论它们是否是静态的。

  所有内部链接保持统一并指向标准化的 URL。以带www和不带www为例,确定一个版本为标准化的URL,网站内的链接统一使用该版本。这样,搜索引擎也会明白哪个是站长希望的标准化网址。由于用户习惯,通常选择带www的版本作为标准化URL。

  在 Google 管理员工具中设置首选域。

  使用 301 重定向将所有非标准化 URL 重定向到标准化 URL。这将在下一节深入讨论。

  使用规范标签。稍后将对此进行深入讨论。

  提交给搜索引擎的所有 XML网站 地图都使用标准化的 URL。

  但每种方法都有其局限性:

  Google 管理员工具不适用于其他搜索引擎。

  有些网站由于技术原因不能做301转向。

  cms系统经常不受我们控制。

  内部链接可以自己控制,但外部链接不是。

  因此,虽然有替代方案,但 URL 标准化一直是困扰网站站长和搜索引擎的问题。据估计,互联网上10%到30%的URL是内容相同但URL不同的非标准化URL。为了做到万无一失,往往需要多种方法结合起来。

  如何避免软404给网站带来的错误

  亲爱的网站owners or 网站站长:爬你的网站时,我们发现了世界协调时间(UTC,伦敦,都柏林,爱丁堡)在2012-11-27 20:00左右的瞬态数软 404 错误有所增加。您的网站服务可能已经中断,但问题已经解决。以下是一些可能导致软 404 错误的网页示例:

  ———————————————————————————————————————————————

  以上是关于谷歌在MMONICE网站上发送的错误报告。可以看到,“在爬取你的网站时,我们发现在世界协调时间(UTC,伦敦,都柏林,爱丁堡)2012-11-27 20:00左右的瞬时软404错误数量有所增加。 ”提到软404。而且很多时候,当请求的链接出现错误时,会出现两种错误码信息,一种是我们经常调用的404,一种是软404。

  一般情况下,当网页不存在时,会返回404码,表示软404就是这些不存在的网页返回的是200码而不是404错误码。对于经常使用Google网站Administrator Tools的小伙伴们,在排查的爬虫错误中可能会发现一些软的404错误提示。

  软404和普通404的区别主要是软404给用户返回一个错误提示页面(不是404错误提示),HTTP状态码为200;正常的404就像用户返回一个404错误页面,HTTP状态码是404;

  这里,为什么会有软 404?出现软404码大致有四种情况:服务器配置错误; 网站程序或模板错误; 网站 恶意攻击造成的; 网站 管理员错误。在很多情况下,网站administrator 难免会犯一些小错误。错误导致的软404错误有时是由于误操作或程序问题。对于不存在的网页,直接返回首页。

  软404代码会让普通用户感到困惑,看到一个很有趣的链接,但点击后却不是他们想要的;对于搜索引擎的爬虫程序,会花费大量时间爬取网站和不存在且经常重复的索引网址。会导致网站收录的数量比较少(因为蜘蛛程序会花费大量的时间去爬取一些不存在的网页,而一些内容独特的网页可能无法及时发现),或者更严重的页面重复降级,K站行为。

  对于软404,最好的处理方式是返回404代码,让用户根据404错误链接找到相关页面,爬虫程序也会很好的处理404错误。此外,软404可能是根据上述情况引起的。有几种可能,可以检查网页并修复错误。

  但有时现实并不像预期的那样理想。这时候我们可以使用robots.txt文件或者nofollow来防止爬虫。对于普通用户来说,软404难免会导致页面跳出率高。然后,为了获得更好的用户体验,建议始终返回 404(未找到)或 410(已删除)响应代码。您可以将网站 配置为在返回 404 响应代码时显示自定义 404 页面以改善用户体验。

  先生seo的博文,本文固定链接地址:转载请注明。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线