网站不收录又与那些因素有关系的原因是什么
优采云 发布时间: 2021-06-03 04:07网站不收录又与那些因素有关系的原因是什么
要学习搜索引擎优化,必须要了解搜索引擎的工作原理。今天我们就来聊聊百度搜索引擎的工作原理。了解了搜索引擎的工作原理后,收录就涉及到了。关于网站不收录的一些问题与这些因素有关吗?
我们先来了解一下什么是搜索引擎蜘蛛?搜索引擎蜘蛛是抓取信息的程序。各大搜索引擎对应的蜘蛛不一样。
百度蜘蛛:baiduspider
Google 蜘蛛:Googlebot
360蜘蛛:360蜘蛛
搜狗蜘蛛:sogounewsspider
……
一、搜索引擎工作流程
1、Grab:沿着链接爬行,抓取页面信息。
蜘蛛沿着链接爬行,然后爬行,在深度和广度上爬行。广泛抓取:对首页、栏目页、栏目页中的标签进行抓取,一一抓取。深度爬取:首页、栏目页、栏目页分页、栏目页)蜘蛛沿着链接爬行。
2、Filtering:对内容质量不好进行过滤,如:采集内容、内容不正确、内容不丰富等。如果一些质量好的内容延迟收录,那是因为它需要一个周期,过一段时间就会收录。
3、Storage 索引库:提取和组织质量信息以构建索引库。
4、Show:将内容存放在临时索引库中。经过一些算法排序后,当用户搜索到某个关键词时,搜索者根据用户输入的查询关键字,在索引库中快速检测出来,给出有价值的内容展示。
二、网站没有出现收录的原因
1、是否允许蜘蛛爬行。首先要看是否有蜘蛛来找你网站抓,然后再分析其他原因。 Robots 文件中禁止蜘蛛,蜘蛛不会来爬行。
2、 需要一个循环。好的内容放在临时索引库中,通过一些算法进行排序。如果一些好的内容延迟收录,那是因为也需要一个周期。
3、内容质量不好。过滤时直接过滤。
4、蜘蛛无法识别的东西,然后蜘蛛直接过滤掉。无法识别的蜘蛛有哪些?
(1)Js蜘蛛无法识别,建议只用一两个地方。
(2)图片上的内容人眼可以识别,蜘蛛却无法识别,需要加alt属性。
(3)Flash,例如视频。需要结合视频的上下文来解释这个视频的主要内容。
(4)iframe 框架。有很多层次。
(5)嵌套表。
5、需要登录的信息页。蜘蛛无法进入此类页面。
三、Notes
1、已收录内容,不要改变整个文章内容尤其是标题,不要移动或删除,否则会形成死链接。
2、 显示结果需要一定的时间(2个月内是正常的)。 网站已经上线一周了而不是收录,需要一个周期。
3、内容的丰富性。文字、图片、视频等
4、吸引蜘蛛。主动提交到搜索引擎(重复提交),链接。主动出击。
5、Spider 的跟踪,网站IIS 日志。