百度搜索引擎优化白皮书(建站之初重视网站结构设置避免不必要损失(图))
优采云 发布时间: 2021-12-20 02:21百度搜索引擎优化白皮书(建站之初重视网站结构设置避免不必要损失(图))
2.3网站 结构
网站结构的合理设置是网站快速爬取获取搜索流量的基础;由于网站结构设置不合理,网站无法快速识别和爬取在百度日常反馈中经常看到的例子,而且网站换域名也会对网站造成一定的损失@>,所以希望站长们从网站开始就注意网站的结构设置,以免造成必要的损失。
2.3.1URL结构设置
URL构建是否有严格要求,请看以下几点注意:
在构建网站结构和制作URL时,尽量避免非主流设计,追求简单美。越简单、越普遍越好。例如,URL 中的异常字符,如异常的“II”,会导致搜索引擎识别错误
不建议在 URL 中收录中文字符。汉字容易出现编码转换问题,导致识别错误
URL长度要求去掉协议头http(s)://后的URL长度不能超过256字节
谨慎使用#parameters,#后面不能放有效的参数;它们可能会被截断并导致网络爬行异常
2.3.2 目录结构设置
网站 目录结构是否合理会影响搜索引擎对网站的抓取。这里需要提到的是,网站 目录结构一般是扁平的或者树形的。可以通过搜索引擎找到,但有以下几点需要注意:
建议将不同的内容放在不同的目录或子域中。域名划分在2.1. 2 网站 域名划分在章节中有详细介绍
不要使用孤岛链接,因为孤岛链接很难被搜索引擎快速找到;如果网站中已经有大量海岛链接,建议使用搜索资源平台的链接提交工具向百度提交数据
不建议将重要内容放在较深的目录中。如果内容没有大量的内链,搜索引擎将很难判断页面的重要性
下面是一张图片的例子:
2.4 服务商/自建服务器
选择服务商或自建服务器是网站建设中非常重要的一环;服务器的安全和稳定性将直接影响百度搜索引擎对网站的整体判断。
2.4.1 域名服务
2.4.1.1 域名服务&域名部署
关于域名服务和域名部署,有以下几点注意事项:
√站长要注意域名部署的方方面面,避免域名部署错误
√网站 不推荐用于泛分析。如果网站在*敏*感*词*泛分析中爆发,影响不好,就会被搜索策略压制
√尽量选择优质的域名服务商
2.4.2台服务器
做网站 的另一个非常重要的部分是服务器的选择。在选择服务器时,无论是虚拟主机、云主机还是独立服务器,都要注意以下四点:
√中文网站不建议选择国外服务器
√服务器的稳定性很重要。需要保持访问顺畅,服务器是否稳定。可以使用百度搜索资源平台(原百度站长平台)进行异常捕获,捕获诊断工具进行检测维护。(服务器经常无法访问或崩溃,这对爬虫来说是致命的)
√服务器的选择除了自身的稳定性之外,其实还需要考虑网站的业务量,比如带宽、内存、CPU是否能承受访问量,是否可以正常访问大流量的事件。
√服务器主机设置,需要注意是否有禁止爬虫的设置或者404错误信息的设置。这些情况都会造成不必要的搜索引擎抓取判断异常,给网站带来不必要的损失。
2.4.2.1 个虚拟主机
一般来说,建议购买虚拟主机时要特别注意:
√托管公司是否限制搜索引擎的访问;
√主办公司资质是否符合要求;
√主机公司的技术沉淀是否足够,建议选择品牌较大的主机公司;
√主机托管的机房物理条件和网络条件是否足够好;
√主机的技术和客服支持是否足够好;
√主办公司是否会出现产能过剩;
√主机是否存在非法访问高危站点的问题,或者同一IP下是否会存在高危站点。
√国内站点,建议购买国内云主机建站;
2.4.2.2个独立主机
独立主机为站点和个性化软件的安装带来更轻松的环境。因此,独立主机需要站长具备一定的技术力量来保证网站的正常运行和安全。
我们对网站管理员购买和托管独立主机的建议是:
√注意虚拟主机是否将爬虫IP拉入黑名单。百度UA请参考3.1.2.1百度蜘蛛章节;
√建议使用独立IP地址的主机;
√建议使用较大机构的主机,在安全配置和稳定性方面相对较好;
√考虑IDC服务商的建设标准,如防火、防盗、UPS保障、室内温控、防火等。
√IDC服务商的服务质量和技术是否符合标准,是否24小时值班,是否可以协助排除部分故障,是否免费重启重装系统等。
√IDC机房资质是否齐全,存储站点是否有高风险站点或服务器。
2.4.3 安全服务