内部信息源与外部信息源搜索引擎优化方法的异同(名词解释参考数据库指存放学科领域原始文献的来源和属性)

优采云 发布时间: 2022-01-10 09:03

  内部信息源与外部信息源搜索引擎优化方法的异同(名词解释参考数据库指存放学科领域原始文献的来源和属性)

  一、词汇表

  1.信息检索(广义)

  信息检索是指以一定的方式组织和存储信息,并根据用户的需要找到所需信息的过程。因此,信息检索包括信息存储和检索两个不可分割的部分。

  2. 说明

  描述是记录文献信息的各种内部和外部特征的过程,其结果是一个书目信息。书目信息记录后,有助于识别、交流和传播;通过描述的书目信息可以很容易地指向原创信息。

  3. 二次文学

  二手文献是通过对散乱、杂乱无章的一手文献进行筛选、分析、整理、提炼和浓缩,根据其内容特征和外在特征,对文献进行控制,便于人们查找而编制的具有检索功能的文献。

  4.参考数据库

  参考数据库是指存储某一学科领域原创文献的来源和属性的一类数据库;它为用户提供线索以获取原创信息。数据库中的记录通过原创文献的来源和属性(如编目、索引、摘要等)进行处理和过滤,记录内容包括标题、作者、主题词、摘要、来源等。的文件。

  5.元搜索引擎

  元搜索引擎是搜索搜索引擎的搜索引擎,是多个独立搜索引擎的集成、调用、控制和优化,也被称为“搜索引擎之母”。

  6. 搜索语言

  检索语言是信息检索系统存储和检索中使用的通用语言,即:在存储文档时,按照检索语言描述文档的内容和外部特征;检索文档时的问题也按照检索语言表达。

  7. 搜索引擎

  搜索引擎是按照一定的策略采集互联网上的信息,并使用特定的计算机程序,对信息进行组织和处理,并将处理后的信息展示给用户的系统。它是一个为用户提供检索服务的系统。

  8. 源数据库

  源数据库是一种可以直接向用户提供原创数据或特定数据的数据库。源数据库可以提供的数据信息包括数值、事实和原文,可以直接满足用户的信息需求,无需参考其他信息源。

  9. 回顾

  追溯法是以已有文献背后的参考文献作为检索条目,根据文献之间的引文和被引关系进行检索的方法。

  10. RSS

  RSS:Really Simple Syndication,真正简单的聚合,是一种在站点之间共享内容的简单方式,通常对时间敏感的内容使用RSS订阅可以更快地获取信息,例如Blog、新闻。

  二、填空

  1.标准按使用范围可分为国际标准、地区标准、国家标准、行业标准和企业标准。

  2.两个最重要的国际标准化组织是 ISO 和 IEC。

  3.我国将标准分为四级:国家标准、行业标准、地方标准、企业标准。

  4.参考数据库包括:书目数据库、摘要数据库和索引数据库。

  5.源数据库包括:数字数据库、(事实数据库)和(全文数据库)。

  6.文献信息来源按发表形式分为常规文献和特殊文献。特殊文件包括学位论文、会议论文、专利、标准、科技报告、产品资料、技术文件等。

  7.信息检索是基于信息的存储和检索的对应关系。

  8.根据检索学科的发展特点,抓住学科快速发展时期和大量发表文献逐年检索的方法称为抽查法。这种方法可以在更短的时间内获得更多的文档。信息。

  9.三大国际著名索引:SCI、EI、ISTP。

  10.CSSCI由南京大学开发,是教育部人文社会科学重大研究项目。CSSCI的中文全称是(中国社会科学引文索引)。

  11.IPC是国际专利分类号,它的作用是(提供一种从分类中查找专利的方法)。

  12.中国将专利分为3类:(发明)专利、(实用新型)专利和(设计)专利

  13.中国各类专利说明书均可在中国国家知识产权局网站免费检索和下载

  本书全文。

  14.在很多数据库中,都有一个“在结果中搜索”的功能,“在结果中搜索”的意思是:在之前的搜索的基础上再次搜索。

  15.一个典型的搜索引擎的系统架构基本上由三个模块组成:信息采集、信息组织和信息查询服务。

  16.根据检索内容的不同,信息检索的类型分为:文献信息检索、数据信息检索、事实信息检索,其中数据信息检索和事实信息检索属于确定性检索。

  17.ISBN对应中文(国际标准书号);ISSN对应中文(国际标准序列号);CN对应中文(国内统一序列号)。

  18.以下英文单词对应的中文分别是,Abstract:(Abstract),References:(References),Advanced Search:(高级搜索),Expert Search:(专业搜索),Browse:(浏览)。

  19.文档是记录知识的载体,它的四个要素是:文档信息、符号系统、文档载体、记录方法。

  20.专利号“ZL 2004214062.7”表示该专利为()专利。

  21.VIP中文科技期刊全文数据库在内容处理深度上属于(二级)文献。

  三、简答题

  1. 简述信息检索的三个层次。

  信息检索分为三个层次,如下:

  第一级:知道在哪里可以找到信息,即了解不同的信息来源;

  第二层次:能够从信息源中检索到合适的信息,即掌握一定的主题分析和检索技术;第三层次:能够对检索结果进行评价和分析,即对信息资源进行评价、选择和综合利用的能力。

  2. 简述一级、二级、三级文件的关系

  从原创文件到二级文件,再到三级文件,是一个从零散的原创文件到系统化、密集化的过程。

  原创文献:它是所有文献的基础;它是检索和利用的主要对象。

  二级文献:是检索一级文献的工具,又称检索工具。

  三文档:是文档内容的高度浓缩,也是我们使用的重要信息来源。

  3.简述recall、precision以及它们之间的关系。

  (1)召回率是衡量信息检索系统检测相关文档能力的指标。

  

  (2)精度是信息检索系统在检测文档中的准确性的度量。

  

  (3)召回率和准确率之间存在相互关系。

  4. 简述搜索引擎排名算法的发展历程。

  搜索引擎排名算法经历了 3 代:

  第一代搜索引擎——基于词位加权的排名算法;

  第二代搜索引擎——基于链接分析的排名算法;

  第三代搜索引擎——基于智能排序的排序算法。

  5. 简述链接分析排序算法的原理。

  (1)链接分析和排名的思想起源于文献引文索引机制。

  (2)文献引文索引机制:一篇论文被引用或被更权威的论文引用的次数越多,论文的价值就越高。

  (3)链接分析与排名的思路:一个网页被其他网页或更权威的网页引用的次数越多,它的价值就越大。被其他网页引用的次数越多,越受欢迎;被更权威的网页引用,表明该网页的质量更高。

  6. 简要描述 Science Direct 提供的个性化服务。

  Science Direct 提供两种非常独特的个性化服务:另存为搜索警报和搜索提要。

  另存为搜索提醒:供用户设置搜索提醒,并定期通过电子邮件向用户发送最新的搜索结果。

  搜索提要:一种订阅服务,通知用户与搜索相关的最新出版物。7.简述文献资料老化规律的定义及应用。(本题6分)

  文献信息的老化规律是指随着时间的推移,信息的价值会逐渐衰减甚至失效。文献资料显示衰老规律。

  学术信息的半衰期一般为 3 到 5 年。

  在查阅文献资料时,尽量选择较新的文献,同时考虑较早的文献。一般研究,可选择近五年的文献;背景信息要长得多;发达国家的文献使用年限可在中国文学年限的基础上再增加3~10年。

  8. 简要描述布尔逻辑运算符及其含义。

  四、 作文题

  1.在使用搜索引擎的过程中讨论你的应用程序的使用和技巧。

  注意:每个点都需要解释清楚。

  2.检索题目:近两年国内期刊论文《电子商务环境下的第三方物流》。

  要求:请详细描述该主题的搜索过程。

  第 1 步:分析主题

  主题概念/搜索词:电子商务第三方物流

  文献类型:2009-2010年国内期刊论文

  第 2 步:制定搜索策略

  选用检索系统:CNKI/VIP期刊全文数据库

  搜索策略:time=2009-2010 and 关键词= * and 关键词=* and title=*

  第三步:评估检索效果

  如果搜索结果过多:修改搜索策略,缩短搜索。

  如果搜索结果太少:修改搜索策略,扩大搜索范围。

  如果搜索结果不相关:重新制定搜索策略。

  第四步:索取原文

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线