搜索引繁的工作原理是怎么工作的?懂总比不懂要好一些
优采云 发布时间: 2021-08-27 03:07搜索引繁的工作原理是怎么工作的?懂总比不懂要好一些
做SEO的人应该对搜索引擎的基本原理有一定的了解。从搜索引擎找到网址到页面排名,再到后续的更新过程,搜索引用到底是如何工作的,需要一个简单的了解。无需对专业算法进行深入研究,但您必须对搜索引擎工作中的策略和算法原理有一个简单的了解,这样SEO工作才能更有效地进行,并且必须知道为什么当然,也有一些朋友不明白这个,他们还是做的很好,但是了解搜索引擎的工作原理总比不了解好。
之前的SEO资料中对这一段内容的解释比较简单。希望在这里可以尝试结合SEO的实际工作和现象,进一步分析搜索引擎的工作原理。其实,当你了解了搜索引擎的工作流程、策略和基本算法之后,就可以在一定程度上避免操作不当造成的不必要的惩罚,同时也可以快速分析出很多搜索结果异常的原因。哪里有搜索行为,哪里就有搜索引擎。搜索引擎用于站点搜索、全网搜索和垂直搜索。接下来,作者将讨论基于专业知识的全文搜索引擎的基本结构。百度、谷歌等综合搜索巨头的结构和检索技术当然更加复杂,但宏观层面的基本原理是相似的。
搜索引擎的大致结构如下图所示。可以分为两部分: 虚线左右部分:一部分是主动抓取网页并进行一系列处理建立索引,等待用户搜索;另一部分是分析用户的搜索意图,展示用户需要的搜索结果。
搜索引擎主动抓取网页,对内容进行处理,索引的过程和机制大致如下。
第一步:根据一定的策略发送Spider抓取网页回搜索引擎服务器;
第2步:对检索到的网页进行链接提取和内容处理,消除噪声,提取页面的主题文字内容等;
第三步:对网页文字内容进行中文分词,去除停用词等;
第四步:在对网页内容进行切分后,判断页面内容是否与被索引的网页重复,去除重复的页面,对剩余的网页进行倒排索引,然后等待用户检索.
当用户进行查询时,搜索引擎工作的过程机制一般如下。
第一步:首先对用户查询的关键词进行分词处理,根据用户的地理位置和历史检索特征分析用户需求,以区域搜索结果和个性化搜索结果展示用户最需要的内容;
第2步:查看缓存中是否有关键词的查询结果。如果是这样,为了尽快呈现查询结果,搜索引擎会根据当前用户的各种信息来判断他们的真实需求。结果可以微调或直接呈现给用户;
第三步:如果缓存中不存在用户查询的关键词,则检索索引库中的网页并进行排序,并将关键词和对应的搜索结果添加到缓存;
第四步:根据用户的搜索词和搜索需求,分析索引库中网页的相关性、重要性(链接权重分析)和用户体验,得到页面排名。用户在搜索结果中的点击和重复搜索行为也可以告诉搜索引擎,用户使用搜索结果页面的体验。这个区域是最近作弊最多的部分,所以这部分会伴随着搜索引擎的反作弊算法干预,有时甚至可能会进行人工干预。
根据上述搜索引擎的结构,蜘蛛、内容处理、分词、去重、索引、内容相关性、链接分析、页面用户体验判断、反作弊、人工干预、缓存机制和用户需求分析。
原创文章,作者:大卫,如转载请注明出处:
本文标题:搜索引擎工作原理介绍