网站内容搜索( 搜索引擎优化百度优化篇网站结构网站应该有清晰的结构和明晰的导航)
优采云 发布时间: 2021-09-07 00:06网站内容搜索(
搜索引擎优化百度优化篇网站结构网站应该有清晰的结构和明晰的导航)
搜索引擎优化
百度优化篇
如何让搜索引擎(百度)更好收录网站content
网站结构
网站 应该有清晰的结构和清晰的导航。这可以帮助用户快速从你的网站中找到他们需要的东西,也可以帮助搜索引擎快速了解网站中每个网页的位置。结构层次。
网站Structure 建议采用树状结构,通常分为以下三个层次:首页——频道——文章页。就像一棵大树,先是树干(首页),然后是树枝(频道),最后是叶子(普通内容页面)。树形结构更具可扩展性。当网站的内容变多时,可以通过细分分支(频道)轻松处理。
理想的网站结构应该是扁平化的,从首页到内容页的层次越少越好,这样搜索引擎会更容易处理。
同时网站也应该是网状结构。 网站上的每个页面都应该有上下级页面和相关内容的链接:首页有频道页链接,频道页有首页链接。公共内容页面的链接,公共内容页面有上级频道和首页的链接,内容相关网页之间有链接。
网站中的每个网页都应该是网站结构的一部分,并且应该能够链接到其他网页。
综上所述,合理的网站结构应该是扁平的树状网络结构。
推荐:
网站应该有简洁明了的导航,让用户快速找到自己需要的东西,也有助于搜索引擎更好地理解网站的结构。
推荐:
选择子域和目录
选择使用子域或目录来合理分发网站内容会对网站在搜索引擎中的表现产生更大的影响。
1. 在一个频道的内容不够丰富以独立站点存在之前,使用目录格式;等到频道下积累了足够的内容,再转换成子域的形式。
一个网页能否排在搜索结果的前面,“开始”很重要,如果来自网站权重较高的网站,则更有可能排在第一位,反之亦然通常情况下,主站点的权重最高,子站点会继承主站点的部分权重。继承的数量取决于子站点的质量。
在内容不够丰富作为独立站点使用之前,将内容放在主站点的下一个目录可以在搜索引擎中获得更好的性能。
2.对于内容差异大、相关性低的内容,采用子站点的形式。
搜索引擎会识别网站的主题。如果站点中的内容相关性不高,可能会导致搜索引擎对其进行错误识别。相关性不高的内容可以放在不同的子域下,帮助搜索引擎更好地理解网站主题。
3. 域名的内容是正确授权的,并且是相互分离的。下的内容。不能通过b访问。
子域之间的内容可以互相访问,有可能被搜索引擎视为重复内容。保留网址可能不在普通域名下。
4. 不要滥用子域。
滥用大量内容不丰富的子域会被搜索引擎视为作弊。
标准、简单的网址
创建一个描述性好、标准化、简单的网址,可以帮助用户更轻松地记住和判断网页的内容,也有助于搜索引擎更有效地捕捉您的网站。 网站设计之初,要有合理的URL规划。
1.网站中同一个网页只对应一个url。如果网站上的多个网址可以访问同一个内容,就会出现如下危险:
如果你的网站上有多个URL表单,建议按照以下方式处理:
2. 允许用户从 URL 中确定网页的内容和网站 的结构,并预测他们会看到什么。
3.URL 应尽可能短。
长网址不仅难看,而且用户也很难从中获取额外的有用信息。另一方面,短网址也有助于缩小页面大小、加快网页打开速度并改善用户体验。
4.普通动态网址对搜索引擎没有影响。
url是动态的还是静态的对搜索引擎没有影响,但建议尽量减少动态url中收录的可变参数。这将有助于减少 url 的长度,降低搜索引擎陷入黑洞的风险。
5.不要添加系统无法自动识别为url一部分的字符。
修改/更改域名
网站revision 和域名变更在互联网的高速发展下是不可避免的,但处理不当会造成重大的流量损失。
改版和换域名需要考虑的第一点就是如何保证老用户不流失。当用户访问旧内容时,可以引导到新网站上的相应内容,防止用户无法访问以前的采集夹。网页的情况。
我们建议在修改或更改域名时,将旧网页301永久重定向到内容对应的新网页,以便百度更容易检测到这种变化,并快速将旧网页累积的权重转移到相应的新网页。 .
合理的返回码
百度爬虫在抓取和处理的时候,会根据http协议规范设置相应的逻辑,所以站长也应该参考http协议中返回码含义的定义来设置。
百度蜘蛛对常用http返回码的处理逻辑如下:
1.404
404 返回码的含义是“NOT FOUND”。百度会认为该网页无效,因此通常会从搜索结果中删除,蜘蛛会在短期内再次找到该网址,不会抓取。
2.503
503 返回码的含义是“服务不可用”。百度会认为网页暂时无法访问,通常网站暂时关闭,带宽受限等都会造成这种情况。对于返回503的网页,百度蜘蛛不会直接删除该网址,短期内还会再次访问。届时,如果网页已经恢复,就可以正常抓取;如果继续返回503,那么短时间内会被多次访问。但是如果网页长时间返回503,那么这个网址还是会被百度认为是失效链接,会从搜索结果中删除。
3.403
403返回码的意思是“禁止访问”,百度会认为该网页当前被禁止访问。在这种情况下,如果是新发现的网址,百度蜘蛛暂时不会抓取,会在短期内再次检查;如果是百度有收录url,目前不会直接删除,短期内会再次访问。那个时候,如果网页被允许访问,就会正常抓取;如果仍然不允许,将在短时间内访问多次。但如果网页长时间返回403,百度也会认为是无效链接,从搜索结果中删除。
4.301
301返回码的意思是“Moved Permanently”,百度会认为网页当前重定向到了新的url。在网站迁移、域名更换或网站改版的情况下,建议使用301返回码,以尽量减少改版带来的流量损失。虽然百度蜘蛛现在对 301 跳转的响应周期更长,但我们仍然建议您这样做。
推荐: