[]SEO搜索引擎的基本工作原理(一)_光明网
优采云 发布时间: 2021-08-20 00:21[]SEO搜索引擎的基本工作原理(一)_光明网
[] SEO搜索引擎基本工作原理
SEO搜索引擎的基本工作原理:抓取、索引、排序
应该知道SEO搜索引擎的工作过程非常复杂,但是SEO搜索引擎的基本工作原理大致分为三个阶段:抓取、索引和排序。
[] SEO搜索引擎基本工作原理
首先,抓住它
搜索引擎首先发送一个名为“蜘蛛”或“机器人”的软件,它会按照一定的规则扫描互联网上网站的存在,并沿着网页上的链接从一个页面到另一个页面。转到另一个网站 并获取页面的HTML代码并将其保存在数据库中。为确保采集到的最新信息,它也会返回已被抓取的页面。
二、索引
采集索引系统对采集到的网页进行分析,提取相关网页信息,并根据一定的相关性算法进行大量复杂的计算,得到页面文字与超链接中每个关键词的各个页面的相关性,然后利用这些相关信息建立一个Web索引数据库。
三、排序
用户输入关键字进行搜索后,搜索系统程序会从网络索引数据库中查找与该关键字匹配的所有相关网页。由于该关键字的所有相关页面的相关性已经非常好,您只需根据现有的相关性值进行排序即可。相关性越高,排名越高。最终返回给用户。
搜索引擎分三步工作:爬行-索引-排序。
1.Grab:主要是数据采集。
2.Index/Preprocessing:提取文本-中文分词-删除停用词-消除噪音-删除权重-索引。