搜索引擎优化内容(面向机器的抓取优化(一):缺省设置301跳转)

优采云 发布时间: 2021-10-13 01:03

  搜索引擎优化内容(面向机器的抓取优化(一):缺省设置301跳转)

  面向机器的抓取优化

  1.默认域名唯一:301跳转到的默认设置一方面减轻了搜索引擎繁重页面的负担,另一方面可以汇总相同内容的反向链接权重。对于网站默认使用https访问,如果不重定向(比如之前的支付宝),经常会出现浏览器提示安全证书路径不匹配;另外:谷歌站长工具配置中还有一个默认域名;

  2 遗忘流量:想办法采集因域名解析失败和拼写错误造成的流量损失;之前激活过的域名尽量不要删除,保留并设置为最新地址;有没有渠道可以得到这个DNS NS记录?

  3 404页面操作:返回hard 404(返回http header而不是html 404 header),使用referer统计跟踪404日志,解决这些问题;

  4 保存HEAD请求:对于一些蜘蛛(主要是百度蜘蛛),经常使用头部请求来检查旧链接的有效性。建议这些请求可以直接返回304处理,节省服务器处理资源;

  5 永久转向:避开302,转向时尽量使用301到最终地址;

  6 关注站内搜索:利用搜索做内容之间的关联和发现,每篇文章文章都提供了文章等相关功能;而404访问可以解析出搜索源关键词尤其应该通过Site search为用户提供其他可选的内容。

  7 使用google站长工具跟踪收录和错误爬取问题并及时纠正;

  8 存档页面的URL标准化:虽然搜索引擎声称动态页面和静态页面收录和RANK不受影响,但最好将内容页面尽可能标准化为静态地址,并在页面,方便管理。自定义地址减少了繁重搜索引擎抓取相同内容的不同链接后的麻烦,例如各个论坛的内页:

  面向用户的内容优化

  1 主动检查垃圾邮件本身,防止大量镜像内容。对于不利于垃圾邮件处理的网站,搜索引擎往往不得不采用整体降低权限的方法;

  2 为防止用户因使用第三方计数器和小JS功能(如炫目的用户鼠标指针等)而被植入病毒木马,谷歌将向较严重站点的webmaster@Mailbox发送邮件,提醒相关问题,所以这个邮箱一定要定期创建和查看;

  3 结构化数据源:RSS、sitemaps存档入口,最高效的就是利用各种ping接口将最新的内容即时发送到搜索引擎(最近百度也支持相应的接口和协议);

  4 关注搜索结果页面标题和元描述的可读性:元描述不参与排序,但好的标题和元描述往往比纯算法建议的摘要更接近用户目标。在现有的排名位置下,争取吸引更多的用户点击也是一个有效的策略;

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线