网站不收录又与那些因素有关系的原因是什么

优采云 发布时间: 2021-06-03 04:07

  网站不收录又与那些因素有关系的原因是什么

  要学习搜索引擎优化,必须要了解搜索引擎的工作原理。今天我们就来聊聊百度搜索引擎的工作原理。了解了搜索引擎的工作原理后,收录就涉及到了。关于网站不收录的一些问题与这些因素有关吗?

  我们先来了解一下什么是搜索引擎蜘蛛?搜索引擎蜘蛛是抓取信息的程序。各大搜索引擎对应的蜘蛛不一样。

  百度蜘蛛:baiduspider

  Google 蜘蛛:Googlebot

  360蜘蛛:360蜘蛛

  搜狗蜘蛛:sogounewsspider

  ……

  

  一、搜索引擎工作流程

  1、Grab:沿着链接爬行,抓取页面信息。

  蜘蛛沿着链接爬行,然后爬行,在深度和广度上爬行。广泛抓取:对首页、栏目页、栏目页中的标签进行抓取,一一抓取。深度爬取:首页、栏目页、栏目页分页、栏目页)蜘蛛沿着链接爬行。

  2、Filtering:对内容质量不好进行过滤,如:采集内容、内容不正确、内容不丰富等。如果一些质量好的内容延迟收录,那是因为它需要一个周期,过一段时间就会收录。

  3、Storage 索引库:提取和组织质量信息以构建索引库。

  4、Show:将内容存放在临时索引库中。经过一些算法排序后,当用户搜索到某个关键词时,搜索者根据用户输入的查询关键字,在索引库中快速检测出来,给出有价值的内容展示。

  二、网站没有出现收录的原因

  1、是否允许蜘蛛爬行。首先要看是否有蜘蛛来找你网站抓,然后再分析其他原因。 Robots 文件中禁止蜘蛛,蜘蛛不会来爬行。

  2、 需要一个循环。好的内容放在临时索引库中,通过一些算法进行排序。如果一些好的内容延迟收录,那是因为也需要一个周期。

  3、内容质量不好。过滤时直接过滤。

  4、蜘蛛无法识别的东西,然后蜘蛛直接过滤掉。无法识别的蜘蛛有哪些?

  (1)Js蜘蛛无法识别,建议只用一两个地方。

  (2)图片上的内容人眼可以识别,蜘蛛却无法识别,需要加alt属性。

  (3)Flash,例如视频。需要结合视频的上下文来解释这个视频的主要内容。

  (4)iframe 框架。有很多层次。

  (5)嵌套表。

  5、需要登录的信息页。蜘蛛无法进入此类页面。

  三、Notes

  1、已收录内容,不要改变整个文章内容尤其是标题,不要移动或删除,否则会形成死链接。

  2、 显示结果需要一定的时间(2个月内是正常的)。 网站已经上线一周了而不是收录,需要一个周期。

  3、内容的丰富性。文字、图片、视频等

  4、吸引蜘蛛。主动提交到搜索引擎(重复提交),链接。主动出击。

  5、Spider 的跟踪,网站IIS 日志。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线