搜索引擎优化实训(搜索引擎发展背景、分类及特点,搜索引擎介绍2.1介绍)

优采云 发布时间: 2021-10-01 11:04

  搜索引擎优化实训(搜索引擎发展背景、分类及特点,搜索引擎介绍2.1介绍)

  本章介绍了搜索引擎的发展背景、分类和特点,然后详细解释了搜索引擎的工作原理和工作流程,最后结合实例介绍了几种常见的搜索引擎。搜索引擎简介2.1 搜索引擎简介 搜索引擎出现的背景在互联网发展初期比较小,比较容易找新闻。但是,随着新闻技术的飞速发展,尤其是互联网应用的迅速普及,网站越来越多,全球互联网页面每天以千万级的速度在增加。在庞大的新闻网络中找到您需要的材料无异于大海捞针。这时,搜索< @网站 应运而生,满足大家的新闻检索需求。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合搜索引擎、门户搜索引擎和免费链接列表等。一个搜索引擎由四部分组成:搜索器、索引器、搜索器和用户界面。2.2 搜索引擎分类 搜索引擎按其工作方式可分为三种类型,即全文搜索引擎、搜索索引/目录和元搜索引擎(Meta Search Engine)。全文搜索引擎 全文搜索引擎是名副其实的搜索引擎,是目前广泛使用的主流搜索引擎。国外具有代表性的全文搜索引擎有谷歌和雅虎!国内比较知名的全文搜索引擎有百度等。

  他们都是通过从互联网上提取各种信息来建立一个数据库,从这个数据库中检索出符合用户查询条件的相关记录,最后按照一定的顺序返回给用户。目录搜索引擎虽然有搜索功能,但严格意义上并不是真正的搜索引擎,只是一个按目录分类的网站链接列表。用户无需搜索关键词(Keywords),仅依靠分类目录就可以找到自己需要的信息。元搜索引擎元搜索引擎在接受用户的查询请求时,会同时在多个其他搜索引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎包括 Dogpile、Vivisimo 等。搜索引擎免费链接列表的非主流形式 三大搜索引擎2.3 搜索引擎的工作原理 搜索引擎由搜索器、索引器、检索器和用户界面组成。一个搜索引擎的主要工作流程包括:“页面抓取”、“页面分析”、“页面排序”和“关键词查询”2.3.1 页面抓取 搜索引擎抓取搜索结果进入数据库,读取页面内容,找到页面然后利用这些链接地址寻找下一个网页,一直循环下去,直到这个网站的所有网页都被抓取完毕。1、页面抓取process “蜘蛛程序”通过这些 URL 列表爬到页面。

  2、page收录的原理是从指定页面开始,跟随页面中的链接,按照特定的策略遍历网站中的页面。不断将访问过的 URL 从 URL 列表中移除,存储原创页面,同时提取原创页面中的 URL 信息: URL 分为域名和内部 URL 两大类,同时时间,判断该URL是否被访问过。未访问的 URL 添加到 URL 列表中。递归扫描 URL 列表,直到耗尽所有 URL 资源。3、page收录方法“用户提交”2.3.2页面分析搜索引擎首先索引存储的原创页面,并对原创页面的标签信息进行过滤,提取出网页中的文字信息,然后将网页中的文字信息切词为文字信息,建立关键词索引,得到页面与关键词的对应关系,最后全部重新组织关键词,建立关键词与页面的对应关系。为了提高页面检索的效率,搜索引擎需要对抓取到的原创网页进行索引。由于url是页面的入口地址,索引原页面实际上就是索引微页面的url,这样就可以根据url快速进行索引。找到相应的页面。2、网页分析 网页分析是整个页面处理中最重要的部分,包括以下链接:(4)

  决定页面顺序的因素有很多,包括页面相关性、页面相关性、链接权重、用户行为权重和用户行为。1、 页面相关性 页面相关性是指页面内容与用户查询的关键词之间的接近程度,主要由以下因素决定: 链接主要分为内链和外链,分别是网页 制作者或组织者在规划或编辑页面内容时添加到页面中。添加的原因可能是链接指向的页面非常重要或者是大多数用户需要的。2.3.4 关键字查询搜索引擎查询功能的实现非常复杂,用户返回结果所需的时间也非常高。在如此短的时间内完成如此复杂的计算是不现实的。因此,搜索引擎需要通过一套高效的机制来处理来自用户的查询。(1)先将用户提供的查询条件中的词剪掉,将查询条件中无意义的词或词删除,如、得等停用词;(2)然后用切词结果为关键字反向索引列表中的条件匹配;(3)如果有匹配结果,则将所有匹配该关键字的页面的URL组合成一个列表;(4)@ >最后,匹配页面按照权重值从高到低排序返回给用户,用户在搜索引擎中的行为主要包括搜索和点击,搜索是用户获取信息的过程,点击是用户获取到所需信息后的表现。为了在极短的时间内响应用户的查询请求,搜索引擎不仅在用户提交查询信息之前生成对应页面排名的key,还需要为页面排名建立缓存机制对应最常查询的关键字。经过统计。

  2.4 常用搜索引擎介绍谷歌公司成立于1998年9月4日,由拉里·佩奇和谢尔盖·布林共同创立,被公认为全球最大的搜索引擎。谷歌搜索引擎的主要搜索服务有:网页、图片、音乐、视频、地图、新闻、问答。2.4.1个谷歌搜索引擎2.4.2个百度搜索引擎百度于1999年底在美国硅谷成立,目前是全球最优秀的华人信息检索和传递技术供应商。百度为中国80%以上提供搜索引擎的门户网站网站提供搜索引擎技术支持。现有客户包括新浪、中国人、腾讯、263、21cn等2.4. 3 雅虎搜索引擎 雅虎是世界上最早的分类目录和最大的门户网站网站。它的搜索结果最初来自谷歌,后来采用了Inktomi(被雅虎收购)提供的结果。雅虎现在已经开发了自己的搜索技术,称为雅虎搜索技术(YST)。搜索结果的数量与谷歌相当。2.5 章节小结 本章介绍了搜索引擎的历史、分类和原理。总结了搜索引擎发展的演进过程,介绍了当前行业主要的搜索引擎类别:全文搜索和分类目录。简要介绍搜索引擎的工作过程和原理。专注于搜索引擎技术在星空黄页网站中的应用,并描述了搜索引擎的架构和功能特性。搜索引擎的出现在很大程度上改变了人们使用信息的习惯,提高了信息的使用效率。它起源于互联网,但现在已经渗透到各个行业。了解搜索引擎,研究搜索引擎,应用搜索引擎。广阔的发展空间。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线