搜索引擎的工作原理是什么?如何建立数据库与索引量
优采云 发布时间: 2021-08-26 07:12搜索引擎的工作原理是什么?如何建立数据库与索引量
学习SEO时,搜索引擎的工作原理是必学的课程。了解搜索引擎的工作原理后,可以解决很多优化问题,比如网站Spider是否会访问网站,为什么不收录网站,为什么收录网站而不进行排名
搜索引擎的工作原理很简单,1、crawl2、滤3、include,4、sort(排序)共4步,了解每一步是什么
搜索引擎的工作原理图
1、Getting
搜索引擎想要抓取网页,手动无法完成,于是百度、谷歌和他们的工程师编写了一个程序,他们给这个自动抓取程序起了一个名字,叫做蜘蛛(也称为“机器人”)。通过蜘蛛查找网页并爬取网站
爬取之后,这个内容应该放在哪里?临时数据库
2、filter
由于内容已被抓取并放入临时数据中,因此存在高质量内容、垃圾内容或重复内容,或者之前可能已经存在于搜索引擎中。如果是,你会选择吗?答案是肯定的,因此这些内容将被丢弃。过滤就是过滤掉那些低质量的垃圾邮件。如果您不希望自己的内容被过滤掉,请准备好您的内容
包括3、
如果内容没有被过滤,就会被收录。打开百度搜索链接,可以查看链接是否收录
收录页面
不收录此页面
包括百度搜索引擎,我可以获得排名吗?基本上百度搜索引擎,你可以这样想,但实际上需要在收录索引后进行索引。第一张图也不包括在内。您看到的是直接进入索引的临时数据。一旦内容被编入索引,您就有机会进行排名。所以请注意,由于无法查询单个索引,所以只能从百度的网站站长平台查看整个网站的索引量
网站站长平台索引量
包括:此页面由百度蜘蛛发现并分析
索引:百度蜘蛛认为初步分析是有意义的,因此需要建立数据库
收录与索引的关系
收录与索引的关系:收录关系,索引可以先于收录,收录的个数大于索引的个数。
4、sort
用户输入的关键字,可以查看相关内容。这时候会按照一个结果来显示,谁排第一,谁排第二,我们称之为结果排行。
排名会很复杂。百度会对其进行一系列复杂的分析,并根据分析的结论,根据用户输入的关键词需求,在索引库中找到一系列与其最匹配的网页。对网页的优劣势和优劣势进行评分,最后整理好评分并展示给用户。
您必须非常熟悉搜索引擎的工作原理,因为只有了解了这一点,才能了解问题的原因。