基于搜索引擎的网络信息检索模式研究——以百度为例高莹莹
优采云 发布时间: 2021-07-14 07:12基于搜索引擎的网络信息检索模式研究——以百度为例高莹莹
>人才/159文化高地基于搜索引擎的网络信息检索模式研究——以百度为例 高莹莹 前言:网络检索成为必然趋势,当前基于搜索引擎的网络信息检索发展有其自身的优势,但也存在一定的局限性。本文从信息检索入手,同时分析搜索引擎的发展过程,然后将两者结合起来研究其未来的发展趋势。关键词:搜索引擎;网络信息检索模式 Internet作为一个开放的庞大信息资源库,一方面极大地扩展了信息检索的空间;另一方面,它是无序的、无限的、良莠不齐的,缺乏统一的组织和控制,对传统的信息组织、检索、获取方式形成了很大的冲击。到目前为止,网络信息检索已经成为主流,网络信息检索的探索必将对未来信息检索的发展产生新的影响。 1.网络信息检索模型作为信息检索的重要组成部分,网络信息检索模型有其自身的发展特点。在研究网络信息检索模型的同时,有必要对信息检索的发展有一个整体的认识。 1.1 信息检索分析信息检索可分为广义和狭义。广义的信息检索是指以一定的方式组织和存储信息,并根据用户的需要找出相关信息的过程。狭义的信息检索是指从信息集合中找出用户需要的相关信息的过程。
根据存储和检索对象,信息检索可分为:文档检索、数据检索、事实检索;按存储载体和技术手段实现检索为标准:人工检索、机械检索、计算机检索;按检索方式划分:直接检索和间接检索从检索思想的本质,分析上述检索方法,我们可以看出它们基本上都是基于字符串匹配的方法,即都属于关键词 检索。 关键词 搜索的缺点是显而易见的。最常见的例子是,我们可以想象一个极端的情况:一个以“Potato”为主题的文档(或网页)没有出现在“Potato”这个词的全文中,根据关键词Based 字面量匹配方法,当用户输入搜索词“Potato”时,文档无法被查出,虽然大家都知道“Potato”和“Potato”是同一个意思。可见,在传统的网络信息组织方式下,基于字面串匹配的关键词检索的检索质量在完整性和准确率两个指标上无法实现质的飞跃。 1.2 网络信息检索分析 互联网技术给信息的传播方式带来了巨大的变化,也极大地促进了信息检索技术的发展和应用。在一定程度上,网络信息检索代表了当代信息检索的发展方向。目前,大多数人在网络环境下的信息资源检索都是通过搜索引擎来实现的。搜索引擎根据一定的策略采集和发现互联网上的信息,并对信息进行理解、提取和处理,为用户提供检索服务,从而提供信息导航的目的。
然而,网络环境下人们对信息的需求千差万别,有时往往面临着非常复杂的资源类型和内容结构,难以提前理解。由于查询方式的限制,无法与信息组织形式相匹配。无法获得满意的结果。当前环境下的搜索引擎,无论何种类型,由于对网络信息资源的管理不完善,加上关键词匹配检索技术的局限性,都存在诸多问题,主要表现在两个方面:一是检索工具自身的局限在于信息资源组织的问题。 2. 搜索引擎的发展 2.1 搜索引擎简介 简而言之,搜索引擎是为用户提供搜索服务,并显示与用户检索相关的相关信息的系统。百度和谷歌是搜索引擎的代表。目前,搜索引擎的分类还没有统一的标准。根据搜索语言,搜索引擎可分为关键词搜索和分类搜索;按搜索功能可分为目录搜索引擎和全文搜索引擎;根据搜索范围,可分为综合性搜索引擎和专业性搜索引擎;按组合方式可分为独立搜索引擎和元搜索引擎。 2.2 百度搜索引擎简介百度由李彦宏和徐勇于1999年底在美国硅谷创立。2000年,百度回到中国发展。专门为中国人提供中文搜索服务,搜索结果同时显示