搜索引擎进行信息检索的优化策略方法(因特网信息检索的方法要想在因特网上获得所需信息,)
优采云 发布时间: 2021-10-02 00:21搜索引擎进行信息检索的优化策略方法(因特网信息检索的方法要想在因特网上获得所需信息,)
互联网信息检索方法
如果要在互联网上获取所需的信息,就必须知道信息存储在哪里,即知道互联网上提供信息的服务器的地址,然后通过该地址访问服务器,获取所需的信息信息。在互联网上,信息资源的一般查询方式有基于超文本的信息查询、基于目录的信息查询和基于搜索引擎的信息查询。
基于超文本的信息查询也称为浏览。使用浏览方式搜索时,用户只需要以一个节点为入口,根据节点的文字内容,嵌入链接指向的话题,然后选择自己感兴趣的节点进行进一步搜索。在搜索过程中,用户会发现很多相关节点的内容根本不是他们所期望的,而是在浏览过程中不断弹出,提醒用户注意。基于目录的信息查询基于在线目录,一般使用主题 主主题包括几个小主题。用户只需逐层查找,即可得到具体的信息标题。目录存放在www服务器,各种主题用超文本组织在一起,并且用户通过目录获取到所需信息的URL后,就可以在对应的地方搜索该信息。这种通过目录获取所需信息,然后搜索信息的方法称为基于目录的信息查询。雅虎是一个非常有名的基于目录的查询'S URL。
搜索引擎是基于搜索引擎的信息查询,是互联网上的服务站点,是www上的一种信息检索软件。其工作原理是根据信息采集和用户需求的匹配和选择。只需输入搜索词和搜索词根据输入的信息在索引数据库中搜索搜索软件之间的逻辑关系,得到互联网上的一系列节点地址并输出给用户。基于此,用户可以进行下一次搜索。常用的搜索引擎如下:
元搜索引擎。这种类型的搜索引擎将用户的查询请求同时提交给多个搜索引擎,将所有的查询结果以统一的格式呈现给用户。它的优点是可以在最短的时间内提供比较全面的信息。,准确的信息。这类搜索引擎的代表是WebCrawler(略)。
智能搜索引擎。一般搜索引擎缺乏知识处理和理解能力,只能通过机械的关键词匹配来实现要检索的信息。智能搜索引擎可以将关键词水平提升到基于知识(或概念)层面,提高检索效率。目前,中国最先进的智能搜索引擎是百度()。
专用搜索引擎。如果要查找电话号码、姓名、电子邮件、地址等信息,则必须使用专用搜索引擎。这些搜索引擎专门采集某种类型的信息资源,内容丰富,数据量大,可以帮助用户快速找到一些特殊的信息,如域名搜索引擎、地图搜索引擎、明星搜索引擎等。
专业的搜索引擎。专业搜索引擎是特定学科的信息查询工具。几乎每个学科都有相关的专门搜索引擎。比如对于游客,有中国旅游网(省略ta.省略/);法律方面包括中国法律信息网(略/)、中法网(略);在专利方面,有中国专利信息网(略/)、德温特专利网站(略)和国家专利网站等;对于化学化工程学科,有CAS(American Chemical Abstracts Service,略)、Chemistry Online(略/)等,专业人士可以从专业网站搜索自己需要的信息,避免非专业搜索引擎信息大量冗余和无用信息混杂的现象。当用户对专业网站不太了解时,可以先用一般的搜索引擎,比如搜索、谷歌、百度等,找一些专业的网站,记住备用.
使用 Google 等搜索引擎
搜索引擎提供 Internet 上的大部分搜索服务。常用的英文搜索引擎有谷歌(略)和雅虎(略);中文搜索引擎有百度(略)、易网(略)、天网(略)、雅虎中国(略/)、搜狐(略)等,其中以谷歌最为著名。除了提供普通的网络搜索外,它还提供包括人物、图片、多媒体、产品搜索、翻译和在线股票在内的各种服务。由谷歌提供的主要服务有:
图片搜索。它可以搜索数亿张图片。它的用户界面简单友好。缺点是“安全搜索”只支持英文搜索。
新闻组搜索。谷歌已链接全球所有著名新闻网站,只要输入搜索词,谷歌就会在这些网站中快速搜索;另外,新闻组还提供了各种话题讨论区,不足的地方在于它的大部分内容都是英文的。
在线英语词典。只需输入您要查找的单词,浏览器就会显示有关该单词的信息。
页面翻译功能。如果搜索中出现非英文结果,Google 会提供翻译或英文翻译的链接,标题后会出现“翻译此页面”字样。
网页快照。当谷歌搜索网页时,它会对该网页进行索引快照并存储在服务器中。当用户不想访问检索到的网页,而只想浏览其内容或检索到的网页无法访问或已被删除时,“网页快照”可以更好地满足用户需求。
购物。该服务允许用户按类别或产品名称进行搜索,并免费为用户提供准确的产品信息。与特价购物网站不同,它只提供用户和企业联系的渠道,不提供产品本身。
在线问答。谷歌聘请专业人士回答用户提出的问题,例如健康咨询(该服务是收费的)。
旅游信息查询。用户想了解某个地区的天气情况、航班、优采云火车等信息,只需输入相关关键词,即可获取所需信息。此外,谷歌还提供地图搜索和电话本服务等。
互联网信息检索策略
检索策略是为达到检索目的而制定的执行计划或计划。它在整个检索过程中起到操作和引导作用。一般来说,检索策略包括检索主题分析、检索工具、检索方法和检索手段!表达、优化检索程序、确定检索步骤等。目的是广泛、快速、准确、准确、省时、省力、省钱地获取所需信息。
主题分析是检索策略的重点。完成这一步后,其余的将容易得多。主题分析的关键是明确目的和要求,突出检索重点,分析检索范围,!属性语言类别等
!选择合适的搜索系统或网站 是关键。正确的!选择搜索系统或网站 是搜索成功的关键。首先,你必须熟悉不同的搜索系统或网站的收录范围、内容、信息可靠性、检索方法、用户界面、检索效率等,然后结合其特点检索主题,尽可能!选材与信息需求、学科和专业对口紧密结合,信息覆盖面广、数量大、及时报道、准确揭示信息内容、具有一定深度和完整检索功能的检索系统或网站@ >.
搜索识别(词、词组、分类号、作者等)!确定性是核心。确定搜索标识有两个原则:一是提高其相关性,二是提高其匹配度。提高相关性可以直接针对主题名称中的主要概念作为搜索标记,也可以从专业、技术、学科的角度仔细分析研究内容,找出确切的主题概念作为搜索标记. 同义词、同义词和相关词可用于改进匹配。
目标是构建适当的搜索查询公式。合适的搜索公式构建基于对主题的良好分析以及对搜索软件的理解和应用,决定了搜索系统或工具、使用的逻辑、位置符号等。。构建检索问题时-文体上,要确定检索标记之间的概念关系和位置关系,准确表达主题需要的内容,灵活运用各种符号;充分利用检索系统或搜索引擎的功能,必要时借助其“帮助”。
互联网信息检索技巧
检索技巧主要是研究如何充分利用检索系统和检索工具提供的各种功能,以及检索者掌握的知识和技能,最大限度地提高检索效率。这里我想讨论的是如何提高查准率和检索率的问题。如何提高准确率?
(1)尽量使用相应的专业搜索引擎、传统信息信息网站、图书馆门户网站等进行搜索。
(2)提高搜索公式的特异性。增加或使用低位词和特异性更高的搜索词,并使用逻辑乘法和逻辑非符号连接不同的主题和概念。
(3) 尽量使用所有准确的复合信息(短语、短语甚至句子)进行搜索。
(4)添加概念限制。逻辑乘法符号可以用来连接原创概念和添加的相关概念,也可以使用逻辑非符号来限制一些不相关的概念以缩小搜索范围。
(5)使用短语或短语。通常组成短语或短语的多个单词用双引号括起来进行搜索。
(6)尽量使用专业词汇。使用更专业或更具体的下位搜索词,尤其是使用复合词进行搜索,可以提高搜索的准确率。
(7)按字段搜索。搜索范围可以缩小到相关字段,如标题、网址、图片等。
(8)使用搜索引擎提供的二级搜索功能或高级搜索功能,如果使用一级搜索命中多条记录,可以使用二级搜索功能或高级搜索功能,使搜索结果更相关.
(9)使用分层检索。所谓分层检索是指先搜索网络元素(在线检索单元、相关网页、在线新闻组、在线数据库等),找出相关网站,然后执行相关网站 网站上的传统信息检索。这里的分层检索不同于互联网查询或传统信息检索中的分级检索。分级检索是第一检索集中相同性质的第二次检索,而层次检索是从互联网上收缩为单一的URL检索,层次检索其实就是查询信息应该在哪里,如何提高召回率?
(1) 使用多个搜索系统或搜索引擎。研究证明搜索引擎数据库的重叠并不大。因此,要提高召回率,需要找到多个搜索引擎进行检索。
(2)使用截断字符(后截断、预截断、中间屏蔽)可以提高召回率。
(3)使用逻辑“或”运算符连接同义词、同义词、相关词等,以提高回忆。
(4)使用搜索词的上位词或广义词扩大搜索范围。
(5)尽量利用搜索系统提供的各种搜索方式,如标题、分类、作者、关键词等有意义的搜索单元等,从不同搜索方法 相关信息。
(6) 不同层次的检索。即先将检索需求分析成不同层次和同一层次的不同方面,然后分别从这些层次和方面进行检索,再分析各个层次检测到的信息。综合并查找相关信息。
(7) 充分利用检索系统或搜索引擎的链接功能,获取更多相关信息。
(8)除了显式主题外,还需要搜索隐藏主题,即在分析信息需求时,要注意显式主题概念的表达和对隐式主题的提取。 , 尤其是在显式主题特异性太高、召回率不理想的情况下,使用隐式主题检索往往能取得更好的效果。
(作者单位:濮阳市图书馆)
编辑:杨彩霞