搜索引擎优化原理(搜素引擎的工作原理是什么?蜘蛛spider的分类及分类)
优采云 发布时间: 2022-01-19 23:15搜索引擎优化原理(搜素引擎的工作原理是什么?蜘蛛spider的分类及分类)
今天商企云小编就为大家深入分析一下搜索引擎的工作原理,这对于更深入的了解seo非常重要。一些SEO从业者总是喜欢有很高的眼界,认为这些基础理论不值得研究。这是不切实际的,也不符合SEO的本质。
蜘蛛不是动物
搜索引擎蜘蛛蜘蛛,一个很形象的名字。如果把互联网比作蜘蛛网,那么蜘蛛就是在网上四处爬行的蜘蛛。搜索引擎蜘蛛通过网页的链接地址搜索网页,从网站的某个页面(通常是首页)开始,读取网页的内容,寻找网页中的其他链接地址,然后通过这些链接地址搜索下一页,以此类推,直到这个网站的所有页面都被爬取完毕。如果把整个互联网看成一个网站,那么搜索引擎蜘蛛就是用这种方法爬取互联网上的所有网页。
蜘蛛的分类
根据抓取内容的不同,搜索引擎蜘蛛可以分为以下几类。
全文索引
搜索引擎分类部分提到了全文搜索引擎从网站中提取信息以建立网页数据库的概念。搜索引擎的自动信息采集功能有两种。一种是常规搜索,即每隔一段时间(比如谷歌一般是28天),搜索引擎主动发出“蜘蛛”程序。在特定 IP 地址范围内搜索 Internet 网站。一旦找到新的网站,它会自动提取网站的信息和URL,并将其添加到自己的数据库中。
另一种是提交对网站的搜索,即网站的拥有者主动向搜索引擎提交一个URL。它会在一定的时间内(从2天到几个月)向你的网站发送一个“蜘蛛”程序,扫描你的网站并将相关信息存入数据库供用户查询。随着搜索引擎索引规则的巨大变化,主动提交网址并不能保证您的网站会进入搜索引擎数据库。最好的方法是获取更多的外部链接,以便搜索引擎有更多的机会找到它们。你和你的网站收录。
当用户使用 关键词 搜索信息时,搜索引擎会搜索数据库。如果找到匹配用户请求的网站,则使用特殊算法——通常根据网页中关键词的匹配程度、位置、频率和链接质量——来计算每个网页的价值。相关性和排名级别,然后将这些链接按照相关性程度依次返回给用户。这个引擎的特殊性是搜索率比较高。
目录索引
目录索引,又称“分类搜索”,是互联网上第一个提供www资源查询的服务。它主要采集和整理互联网资源,根据搜索到的网页内容,将其URL分配给相关分类主题目录的不同层次,形成图书馆目录一样的分类树形结构索引。目录索引无需输入任何文字,只要点击网站提供的学科分类目录,即可找到所需的网络信息资源。
虽然有搜索功能,但不能称得上是真正意义上的搜索引擎,它只是一个按目录排序的网站链接列表。用户可以完全按照分类找到自己需要的信息,无需依赖关键词进行查询。
与全文搜索引擎相比,目录索引有很多不同之处。
首先,搜索引擎是自动的网站检索,而目录索引完全是手动的。用户提交网站后,目录编辑会亲自浏览你的网站,然后根据一套自定义的标准甚至是用户的主观印象决定是否接受你的网站编辑。其次,当搜索引擎收录网站时,只要网站本身不违反相关规则,一般都可以登录成功;虽然目录索引对 网站 的要求要高得多,但有时多次登录并不一定能成功。尤其是雅虎这样的超级索引,登录更是难上加难。
另外,登录搜索引擎的时候,一般不用考虑网站垃圾分类的问题,登录目录搜索引擎的时候,一定要放网站在最合适的目录中。
最后,搜索引擎中网站的相关信息是自动从用户的网页中提取出来的,所以从用户的角度来看,我们有更多的自主权;而目录索引需要网站信息,并且有各种限制。还有,如果工作人员认为你提交的目录和网站信息不合适,她可以随时调整,当然不会提前和你商量。
注意:搜索引擎和目录索引有相互协调的趋势。一些纯全文搜索引擎也提供目录搜索。例如,谷歌借用开放目录提供分类查询,而雅虎等老式目录索引则通过与谷歌等搜索引擎合作扩大搜索范围。在默认搜索模式下,有些目录搜索是引擎首先在自己的目录中返回匹配的网站,比如中国的搜狐、新浪、网易等;而其他的默认是网页搜索,比如雅虎,这个引擎的特点是搜索的准确性比较高。
元搜索
元搜索引擎接受用户的查询请求后,同时在多个搜索引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎包括infospace、dogpile、vivisimo等。在中文元搜索引擎中,具有代表性的是搜索引擎。在搜索结果的排列方面,有的直接按来源排列搜索结果,如dogpile;重新排列结果的规则,例如 vivisimo。