网页音频抓取(1.域名选择网站域名中的建议和建议)
优采云 发布时间: 2022-03-07 00:02网页音频抓取(1.域名选择网站域名中的建议和建议)
1. 域选择
网站域名的选择,不仅可以让用户快速直观的了解网站的定位和域名设置,还会影响网站被搜索的抓取。因此,选择一个简单、易记、安全的域名是网站建设初期最重要的一步。
1.1 域名选择注意事项
网站建立之初,建议网站的域名独立好记;独立移动台的域名选择也遵循这个规则。
移动站的域名需要和PC站的域名分开。不建议移动站与PC站共享域名; Adaptive网站 可能不会考虑到这一点。
网站在域名选择上,主要有两个建议:
√ 建议使用比较常见的域名后缀,如.com\.cn\.net等;
√如果网站追求个性化使用稀有域名后缀,为了保证搜索效果,需要在站长平台进行站点验证。
1.2 使用子域或目录
网站是需要建立子域名还是划分多级目录,可以根据网站自身定位和网站内容量级来确定。一般来说,对于综合类或者内容比较多的网站,可以根据不同的二级域明确划分内容;而如果网站的内容较少,不建议打开太多的网站子域。
比如对于博客风格的网站,有的网站给每个博客作者一个单独的三级域,但是如果作者发表频率较低,整个三级域就处于低更新状态频率,太低的发布频率对搜索引擎不友好。
2 内容发布系统
所有发布系统,除了遵循有序、逻辑清晰的网站建设外,还应注意网站建设的安全问题,避免网站隐患,以更好地提升价值网站。
2.1自建内容发布系统
网站自建内容发布系统,注意事项包括:
√ 主要内容清晰,可以很好的识别和区分;
√ 不要在后台自行设置发布时间,按照发布时间和显示时间进行;
√ 内容发布系统中各个表单的设置合理。比如标签的设置不宜过多,不宜列出关键词;
√ 分类明确,分类主题的文章应在相应分类下公布;
√标题匹配,不卖狗肉,欺骗搜索引擎流量,损害用户体验;
√ 段落清晰合理,字体大小适中,字体颜色不宜使用与背景色相近的颜色;
√ 发布内容目录划分清晰。
2.2 第三方发布系统
使用第三方发布系统搭建网站,站长需要注意以下几点:
√ 不建议频繁更换模板主题;
√ 不建议使用过多的插件,会影响网页的打开速度;
√ URL 伪静态处理,命名约定,层次清晰;
√ 开源建站系统存在诸多安全隐患,使用过程中一定要做好一些安全设置和优化。
2.3 页面生成规范
无论网站自建发布系统还是网站使用第三方建站系统,网站页面生成时应注意以下几点:
√ 网页结构清晰,各分类名称设置醒目;
√ 导航和面包屑导航设置合理,机器可读,位置显着,用户在网站中可以轻松知道所访问页面的位置;
√ 没有遮挡主要内容的广告元素;
√没有三俗的图文元素;
关注网站构建系统安全问题,消除网站安全隐患。
3 网站结构
网站结构的合理设置是网站被快速抢占并获得搜索流量的基础;由于网站结构设置不合理,无法快速识别网站爬取案例在反馈中经常看到,而网站更改域名也会对网站造成一定损失@>,所以希望各位站长从建站之初就注意网站结构设置,以免造成不必要的损失。
3.1 URL结构设置
对URL构建是否有严格要求,请看以下几点:
√ 在构建网站的结构和制作网址时,尽量避免非主流设计,追求简洁美观。 ”,这会导致搜索引擎识别错误;
√ URL长度要求去掉协议头http(s)://后的URL长度不能超过256字节;
√ 慎用#参数,有效参数不能放在#后面;它们可能会被截断并导致异常的网络爬取。
3.2 目录结构设置
网站目录结构是否合理会影响搜索引擎对网站的抓取。这里需要提到的是网站目录结构是扁平的或者树状的。 ,一般搜索引擎都能找到,但有几点需要注意:
√ 建议将不同的内容放在不同的目录或子域中;
√ 不要使用孤岛链接,搜索引擎很难快速找到孤岛链接;如果网站有大量孤岛链接,建议使用搜索资源平台的链接提交工具向站长平台提交数据;
√ 重要内容不建议放在deep目录下。如果内容没有大量的内部链接,搜索引擎很难判断页面的重要性。
4 服务商/自建服务器
选择服务商或自建服务器是网站建设中非常重要和基础的一环;服务器的安全性和稳定性将直接影响百度搜索引擎对网站的整体判断。
4.1个域名服务4.1.1个域名服务&域名部署
关于域名服务和域名部署,以*敏*感*词*意事项:
√站长要注意域名部署的方方面面,不要出现域名部署错误;
√ 不建议网站进行一般分析。如果网站爆发*敏*感*词*泛分析,影响不好,会被搜索策略压制;
√ 尽量选择优质的域名服务商。
4.2 个服务器
做网站还有一个很重要的部分,就是服务器的选择。在服务器的选择上,无论是虚拟主机、云主机还是独立服务器,都需要注意以下四点:
√中文网站不建议选择国外服务器;
√ 服务器的稳定性很重要。需要保持访问顺畅,服务器是否稳定。可以使用百站长平台爬取异常,爬取诊断工具进行检测和维护。 (服务器经常无法访问或崩溃,这对爬虫来说是致命的);
√ 服务器选择除了自身的稳定性外,还要考虑网站的业务量,比如带宽、内存、CPU能否承受流量,在情况下能否正常访问突然大流量;
√ 服务器主机设置,需要注意是否有禁止爬虫爬取的设置,或者404错误信息设置。这些情况都会造成不必要的搜索引擎爬取异常判断,从而给网站带来不必要的爬取损失。
4.2.1 个虚拟主机
一般来说,建议在购买虚拟主机时要特别注意:
√主机公司是否限制搜索引擎的访问;
√ 主办公司资质是否符合要求;
√主机公司技术沉淀是否充足,建议选择品牌较大的主机公司;
√ 主机公司托管的机房物理条件和网络条件是否足够好;
√ 托管公司的技术和客服支持是否足够好;
√ 东道公司是否会出现产能过剩;
√ 宿主公司是否非法访问高风险站点或同一IP下是否存在高风险站点;
√ 国内网站建议购买国内云主机建站。
4.2.2 台专用主机
独立托管给网站带来更宽松的使用环境和个性化的软件安装,所以独立托管需要站长具备一定的技术实力才能保证网站的正常运行和安全。
我们对网站管理员购买和托管专用主机的建议是:
√ 关注虚拟主机是否已将爬虫IP拉入黑名单;
√ 建议使用具有专用IP地址的主机;
√ 建议使用较大机构的主机,在安全配置和稳定性方面相对较好;
√IDC服务商的建设标准需要一定的考虑,比如防火、防盗、是否有UPS保障、室内温控、防火等;
√IDC服务商的服务质量和技术是否达标,是否24小时值班,是否能协助排除部分故障,免费重启重装系统等;
√IDC机房资质是否齐全,存储站点是否有高风险站点或服务器。
4.3 安全服务4.3.1 HTTPS