那些年,我们了解的搜索引擎
优采云 发布时间: 2022-06-23 08:56那些年,我们了解的搜索引擎
搜索引擎
Search
Engines
创造人类的记忆的,始终是人本身;
而记录人美好记忆的载体,可能是搜索引擎。
搜索引擎的概念
【所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出指定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。】
【类型分类:
一、全文搜索引擎,它们从互联网提取各个网站的信息(以网页的文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。国内著名的有百度(Baidu)国外则是Google。
二、目录索引型,用户完全不需要依靠关键词(Keywords)查询,只是按照分类目录找到所需要的信息。目录索引中,国内具代表性就是新浪、搜狐、网易分类目录和Yahoo网站雅虎。
三、元数据索引型,接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户,著名的元搜索引擎有360搜索、infoSpace、Dogpile、VIsisimo等。
四、垂直索引型,垂直搜索引擎适用于有明确搜索意图情况下进行检索。
五、互动式索引型,在用户输入一个查询词时,尝试理解用户可能的查询意图,智能展开多组相关的主题,引导用户更快速准确定位自己所关注的内容。】
搜索引擎的发展阶段
【第一代:
分类目录时代
网站是一个导航网站,也可以说分类目录网站,用户可以从这个分类目录里找到自己想要的东西,这就是搜索引擎第一代。
第二代:
文本检索时代
到了这一代,搜索引擎查询信息的方法则是通过用户所输入的查询信息提交给服务器,服务器通过查阅,返回给用户一些相关程度高的信息。
第三代:
整合分析时代
这一代的搜索引擎所使用的方法大概是和我们今天的网站的外部链接形式基本相同,在当时,外部链接代表的是一种推荐的含义,通过每个网站的推荐链接的数量来判断一个网站的流行性和重要性。
第四代:
用户中心时代
主要是以用户为中心。当客户输入查询的请求时候,同一个查询的请求关键词在用户的背后可能是不同查询要求
第五代:
生活生态圈
第五代搜索引擎应该是基于物联网的搜索,物联网搜索拥有更广阔的搜索空间,能预测到物联网一个最典型的应用就是:找东西!比如远程看管小孩、老人,或搜索走失小孩,包括精确到厘米的GPS定位,比如你去一个陌生的地方,找厕所,找窗口,甚至找警察。】
核心问题
【网页时效性:
互联网上的用户众多,数据信息来源极广,互联网上的网页是呈实时动态变化的,网页的更新、删除等变动极为频繁,有时候会出现新更新的网页在爬虫程序还来不及抓取的时候却已经被删除的情况,这将大大影响搜索结果的准确性。
大数据存储问题:
爬虫抓取的数据在经过预处理后数据量依然相当庞大,这给大数据存储技术带来相当大的挑战。
检索结果可靠性:
目前由于数据挖掘技术以及计算机硬件的限制使得数据处理准确度未能达到理想程度,而且由于一些个人或公司利用搜索引擎现有的漏洞通过作弊手段来干扰检索结果导致检索结果的可靠性可能会有损失。】
搜索引擎的营收
【竞价排名:
这是搜索引擎早期的主要盈利途径。所谓竞价排名,就是关键词搜索结果的位置拍卖。
技术授权:
搜索引擎需要的技术要求很高,很多网站都不愿花费大量的人力和财力去研发自身的搜索技术,而是通过付费给某些搜索企业来使用他们的技术。
AdWords广告:
这是Google于2003年最先开创的盈利模式,这种广告是针对企业客户而设计的。简单的说,AdWords就是通过用户搜索的关键词来提供相关的广告。】
20传播学班
宋庆森 聂航
文字 |宋庆森 聂航
排版 |宋庆森