不懂搜索引擎原理的seoer就是在裸奔!!
优采云 发布时间: 2021-07-19 19:09不懂搜索引擎原理的seoer就是在裸奔!!
www;集电极;控制器;原创数据库;网页分析模板;索引器;索引数据库;猎犬;用户界面;用户行为日志数据库;日志分析器;词库
图片13204-1:
站长最长的一句口头禅是:不懂搜索引擎原理的seoer裸奔!
作者会一步一步的给大家讲解和讲解。进行一次完整的seo基础知识普及。
1、www:我们的互联网,一个庞大而复杂的系统;
2、便利器:这对我们的站长来说很熟悉。我们俗称爬虫,爬虫,他的工作就是访问页面,抓取页面,下载页面;
3、Controller:蜘蛛下载并发送到控制器,功能是调度,比如公交车组的调度室,控制发车时间,目的地,主要是控制蜘蛛的爬行间隔,以及派最近的蜘蛛去爬,可以想到SEO,空间定位有利于SEO优化;
4、原创数据库:访问网页的数据库为原创数据库。留作下一步使用,并提供百度快照。我们会发现 MD5 值相同的 URL 没有重复。某些 URL 可用,但标题不可用。只能通过 URL 组件来查找,因为这个 索引不是通过索引数据库建立的。原创数据库的主要功能是存储和读取速度,以及访问空间,这些空间将被压缩并为未来提供服务。网页数据库调度器对蜘蛛检索到的网页进行简单的分析,即提取URL,过滤,镜像后存储到数据中,那么他的数据就没有索引了;
5、网页分析模板:这个很重要。 seo优化的垃圾邮件和镜像页面的过滤,以及网页的权重计算都集中在这一项。称其为网页加权算法,有上百种;
6、Indexer:在索引数据库中存储有价值的网页的目的是为了让查询更快。将有价值的网页转化为另一种表达形式,将网页转化为关键词。它被称为正指数。这样做是为了方便。有多少网页,有多少关键词。几百万页或几百万字更方便。倒排索引将关键词转换成网页,并将所有的排名条件存储在此。形成了高效的存储结构。许多排名因素作为一个项目存储在此。一个词出现在多少个网页上(一个网页由多个关键词组成。将网页变成关键词的过程称为正向索引。推荐索引的原因:为了方便和效率。有多少个网页一个词出现,改变词形成一个网页的过程称为倒排索引。搜索结果简单来说就是在倒排数据库中获取数据,并将许多排名因素存储为一个项目);
7、Index 数据库:用于未来排名的数据。 关键词quantity、关键词location、网页大小、关键词feature标签、指向这个网页(内链、外链、锚文本),用户体验数据都存储在这个里面,提供给搜索者。百度之所以这么快,是因为百度直接提供索引数据库中的数据,而不是直接访问WWW。那就是预处理工作;
8、Searcher:对用户查询的词进行切分,然后排序,通过行业接口返回给用户。负责分词、分词、查询,并根据排名因素对数据进行排序;
9、用户界面:将查询记录、IP、时间、点击的URL、URL位置、上次点击和下一次点击的间隔时间存入用户行为日志数据库。它是百度的盒子,一个用户界面;
10、User Behavior Log Database:搜索引擎、SEO工具、排名软件的关注点都来源于此。用户使用搜索引擎的过程和行为;
11、Log Analyzer:通过用户行为日志数据库进行持续分析,并将这些行为记录存储在索引器中。这些行为都会影响排名。这就是我们所说的恶意点击或隔夜排名。 (如果key没有找到,直接搜索域名,这些都会记录在用户行为数据库中);
12、Thesaurus:web分析模块中的日志分析器会发现词库中存储了最新的词汇,通过词库进行分词。网页分析模块基于词库。