搜索引擎优化(seo)的基本工作模块(学习搜索引擎优化,搜索引擎的工作原理是必须要了解的)
优采云 发布时间: 2022-04-12 08:17搜索引擎优化(seo)的基本工作模块(学习搜索引擎优化,搜索引擎的工作原理是必须要了解的)
要学习搜索引擎优化,必须了解搜索引擎的工作原理。今天我们来聊聊百度搜索引擎的工作原理。了解了搜索引擎的工作原理之后,会涉及到收录一些问题,那么网站no收录还有那些因素呢?
我们先来了解一下什么是搜索引擎蜘蛛?搜索引擎蜘蛛是抓取信息的程序。各大搜索引擎对应的蜘蛛都不一样。
百度蜘蛛:baiduspider
谷歌蜘蛛:谷歌机器人
360蜘蛛:360蜘蛛
搜狗蜘蛛:sogounewsspider
……
一、搜索引擎工作流程
1、爬取:沿着链接爬取页面信息。
蜘蛛沿着链接爬行,然后爬行,在深度和广度上爬行。广度爬取:抓取首页、栏目页、栏目页内分页、逐级爬取。深度爬取:首页、栏目页、栏目页分页、栏目页)蜘蛛沿着链接爬行。
2、过滤:如果内容质量不好,进行过滤,例如:采集的内容,错文的内容,不丰富的内容。如果一些优质内容延迟收录,那是因为需要一段时间,过了一段时间就会收录。
3、存储索引库:提取和整理优质信息,构建索引库。
4、显示:将内容存储在临时索引库中。经过一些算法排序后,当用户搜索某个关键词时,快速检测出有价值的内容并显示出来。
二、网站原因不是收录
1、是否允许蜘蛛爬行。首先要看有没有蜘蛛来找你网站抢,然后分析其他原因。 Robots文件中禁止蜘蛛爬行,蜘蛛不会爬行。
2、需要一个周期。好的内容放在临时索引库中,并通过一些算法进行排序。如果一些优质的内容被延迟收录,那是因为这也需要一个周期。
3、内容质量很差。过滤时直接过滤。
4、蜘蛛无法识别的,那么蜘蛛就会直接过滤掉。蜘蛛不能识别的东西有哪些?
(1)js蜘蛛无法识别,建议只用一两个地方。
(2)图片上的内容人眼可以识别,但蜘蛛不能识别,所以需要添加alt属性。
(3)Flash例如是一个视频。在视频的上下文中解释视频的主要内容。
(4)iframe 框架。有很多层次。
(5)嵌套表。
5、需要登录的信息页面。蜘蛛无法进入此类页面。
三、备注
1、已经是收录内容,不要更改整个文章内容,尤其是标题,不要移动,不要删除,否则会形成死链接。
2、显示结果需要一定的时间(2个月是正常的)。 网站已经上线一周了还没有收录,需要一个周期时间。
3、内容丰富。文字、图片、视频等
4、 吸引蜘蛛。主动提交给搜索引擎(可重复提交),链接。采取主动。
5、蜘蛛踪迹,网站IIS 日志。