搜索引擎的定义和分类目录时代的发展趋势和发展
优采云 发布时间: 2021-06-06 06:15搜索引擎的定义和分类目录时代的发展趋势和发展
1.搜索引擎定义
搜索引擎是指利用特定的计算机程序,按照既定的策略,从互联网上采集信息,然后对信息进行组织和处理,为用户提供搜索服务,最后将用户检索到的相关信息显示为用户网站系统。简而言之,搜索引擎通过对互联网上许多网页中的关键字进行采集和排序并对其进行索引来构建索引数据库。当用户搜索某个关键字时,页面内容中收录该关键字的所有页面都会显示为搜索结果。例如在百度搜索框中输入关键词“布艺沙发”,然后进入搜索结果页面。
一般来说,在海量搜索结果中,搜索结果中显示的位置越高,用户浏览的可能性就越大,营销推广效果也越好。
搜索引擎发展的历史。在互联网出现之前,人们通常使用FTP来共享信息,大量的文件分散在FTP主机上,给用户查询信息带来了很大的麻烦。为了解决这个问题,1990年,麦吉尔大学计算机学院的Alan Emtage开发了搜索服务工具Archie。 Archie可以定期采集和分析FTP服务器上的文件名信息,为用户提供查找分散在各个FTP主机上的文件的服务。
随着互联网的出现,实际为方便在互联网上查询网页信息的搜索引擎也出现了,并随着互联网的发展而不断发展进步。一般搜索引擎分为4代,介绍如下:
第一代搜索引擎:目录时代。
分类目录时代的搜索引擎会采集互联网上各种网站站点名称、网址、内容摘要等信息,并将其分为几类
将它们分别放在一个网站中,用户可以在分类目录中浏览和查找相关的网站。搜狐目录、ha0123等代表典型分类目录时代
第二代搜索引擎:文本检索时代。
在文本检索时代,搜索引擎可以对用户输入的查询信息进行各种操作,然后判断与目标网页内容的相关性,返回与用户高度相关的网页。一些早期的搜索引擎,如AtaⅥsta、Excite等,都是这个时代的代表。
第三代搜索引擎:综合分析时代。
综合分析时代,搜索引擎会根据外部链接的数量判断网站的流行度和重要性,然后结合网站内容的重要性和相似度来提高反馈信息的质量,最后返回反馈。海量信息以门户的形式智能集成到界面中,而不是像文本检索时代那样返回未分类的链接列表。第一个使用这种综合分析的是Goge,它不仅使Google取得了巨大的成功,而且在当时引起了学术界和其他商业搜索引擎的极大关注。
第四代搜索引擎:以用户为中心的时代
以用户为中心是指用户在进行查询时,必须充分挖掘用户的深层次需求,才能实现精准的用户定位和销售。比如搜索关键词“手机”时,针对的是不同职业、不同年龄的用户。 ,他们的需求是不同的。由于时间和场合的不同,即使是同一个用户也会有不同的需求。为了通过用户输入的简短关键词判断用户的实际需求,搜索引擎需要能够真正了解用户。搜索引擎在用户搜索时可以用到很*敏*感*词*,比如上网时间、操作习惯、搜索内容等,为了逐步总结用户的一般特征,比如性别、年龄、爱好等,这些数据是搜索引擎“商业数据挖掘”的巨大财富。