php抓取网页匹配url(先说一下网站结构中的URL优化注意事项伪静态分析)
优采云 发布时间: 2022-02-06 13:21php抓取网页匹配url(先说一下网站结构中的URL优化注意事项伪静态分析)
现场SEO优化是核心部分。有时,一个好的站内结构甚至不需要发送外部链接就可以吸引搜索引擎的青睐。百度之前也有解释过,百度的算法取消了外链传递权重的作用。当然,取消权重的传递并不意味着外链完全没用。关于文章外链,后面会分享给大家。今天就来说说网站结构中的URL优化注意事项。
一个好的网站结构不仅可以引导蜘蛛的爬行,还需要起到合理的重量传递作用。另外,一个好的网站权重也是提升用户体验的必要步骤。
URL注意事项,URL优化主要包括以下三点:1、目录级别,2、伪静态,3、关键词,4、中文路径,< @5、相对路径和绝对路径,6、字母大小写问题,7、目录最后一个斜杠。我们逐项分析。
第一点是目录级别的问题。目录级别不宜过多。大部分新手站长使用cms来搭建网站后台,很多cms后台路径已经配置好了。例如,根目录/列/年/月、日期/文章号等目录级别有5个以上。这样的URL目录结构不利于爬取已经传递的权重。下面我们来学习如何修改cms系统的目录结构,将目录结构改为首页/栏目页/详情页的结构。
第二点是伪静态的。建议对 网站 URL 使用静态或伪静态 URL。所谓的动态目录通常有?比如特殊符号或者带参数的 URL 链接,那为什么推荐使用伪静态 URL?在搜索引擎的初始阶段,它无法识别动态参数,因此可能会导致一些爬取错误或生成无效的网址,从而降低体验。随着搜索引擎的发展,现在已经可以识别动态参数,这意味着简单的带参数的 URL 不需要是伪静态的。在做优化分析的时候,也建议站长不要看到动态链接。伪静态。除非您想将 关键词 添加到伪静态 URL 或想让您的优化看起来更专业。
第三点关键词,最好在URL中收录关键词,如ipad3、web、seo等。在URL中加上这些字或拼音。网页为收录后,百度也会根据URL中的关键词匹配搜索结果。
第四点是中文网址。不建议使用中文网址。搜索引擎可以识别带有中文字符的 URL,但是 URL 通常是通过编码来表示的,所以我这里不推荐使用中文 URL。
第五点是相对路径和绝对路径。根据我的经验,推荐大家使用绝对路径,这样可以让搜索引擎更快的抓取网站内容,让一些懒惰的采集用户自动给我们加链。绝对路径的缺点是开发时不方便测试,而且会增加网页的大小。网站先不说开发测试,通过简化代码可以缩小页面大小,大部分搜索引擎都可以完全爬取页面内容。
第六点是字母的大小写。你不需要说太多。只要记住统一使用小写字母,不要添加特殊符号。
第七点末尾的斜线,建议统一URL规范网站。URL末尾会有/abc和/abc/两种情况。对于搜索引擎来说,这是两个链接,会造成重复页面的问题。所以我们需要对整个站点有一个统一的标准。这里建议大家带上最后的斜线或者加.html来统一网站URL。
现场SEO优化是核心部分。有时,一个好的站内结构甚至不需要发送外部链接就可以吸引搜索引擎的青睐。百度之前也有解释过,百度的算法取消了外链传递权重的作用。当然,取消权重的传递并不意味着外链完全没用。关于文章外链,后面会分享给大家。今天就来说说网站结构中的URL优化注意事项。
一个好的网站结构不仅可以引导蜘蛛的爬行,还需要起到合理的重量传递作用。另外,一个好的网站权重也是提升用户体验的必要步骤。
URL注意事项,URL优化主要包括以下三点:1、目录级别,2、伪静态,3、关键词,4、中文路径,< @5、相对路径和绝对路径,6、字母大小写问题,7、目录最后一个斜杠。我们逐项分析。
第一点是目录级别的问题。目录级别不宜过多。大部分新手站长使用cms来搭建网站后台,很多cms后台路径已经配置好了。例如,根目录/列/年/月、日期/文章号等目录级别有5个以上。这样的URL目录结构不利于爬取已经传递的权重。下面我们来学习如何修改cms系统的目录结构,将目录结构改为首页/栏目页/详情页的结构。
第二点是伪静态的。建议对 网站 URL 使用静态或伪静态 URL。所谓的动态目录通常有?比如特殊符号或者带参数的 URL 链接,那为什么推荐使用伪静态 URL?在搜索引擎的初始阶段,它无法识别动态参数,因此可能会导致一些爬取错误或生成无效的网址,从而降低体验。随着搜索引擎的发展,现在已经可以识别动态参数,这意味着简单的带参数的 URL 不需要是伪静态的。在做优化分析的时候,也建议站长不要看到动态链接。伪静态。除非您想将 关键词 添加到伪静态 URL 或想让您的优化看起来更专业。
第三点关键词,最好在URL中收录关键词,如ipad3、web、seo等。在URL中加上这些字或拼音。网页为收录后,百度也会根据URL中的关键词匹配搜索结果。
第四点是中文网址。不建议使用中文网址。搜索引擎可以识别带有中文字符的 URL,但是 URL 通常是通过编码来表示的,所以我这里不推荐使用中文 URL。
第五点是相对路径和绝对路径。根据我的经验,推荐大家使用绝对路径,这样可以让搜索引擎更快的抓取网站内容,让一些懒惰的采集用户自动给我们加链。绝对路径的缺点是开发时不方便测试,而且会增加网页的大小。网站先不说开发测试,通过简化代码可以缩小页面大小,大部分搜索引擎都可以完全爬取页面内容。
第六点是字母的大小写。你不需要说太多。只要记住统一使用小写字母,不要添加特殊符号。
第七点末尾的斜线,建议统一URL规范网站。URL末尾会有/abc和/abc/两种情况。对于搜索引擎来说,这是两个链接,会造成重复页面的问题。所以我们需要对整个站点有一个统一的标准。这里建议大家带上最后的斜线或者加.html来统一网站URL。