内部信息源与外部信息源搜索引擎优化方法的异同(企业信息检索等同于使用搜索引擎的误区及解决办法(上))

优采云 发布时间: 2021-10-31 14:11

  内部信息源与外部信息源搜索引擎优化方法的异同(企业信息检索等同于使用搜索引擎的误区及解决办法(上))

  互联网的发展明显促进了信息检索技术的发展和应用。大量的搜索引擎产品诞生,为网民提供了快速信息获取和网络信息导航的良好工具。但是,如果将信息检索等同于使用搜索引擎,那么它就会陷入困境。误解。全文信息检索技术也常用于搜索引擎技术,但互联网信息搜索和企业信息搜索是不同的。

  一是数据量。传统的信息检索系统一般都有GB级别的索引库规模,但互联网网页搜索需要处理数千万个网页。搜索引擎的基本策略是使用搜索服务器集群,这对于大多数企业应用来说是不合适和不必要的。,不适用于企业应用。

  二是内容相关性。如果信息太多,检查和排序尤为重要。谷歌等搜索引擎开发了网页链接分析技术,该技术以网页在互联网上被连接的次数作为判断重要性的依据。但是,企业网站的内部网页链接是由网站的内容获取、编辑和发布系统决定的。链接数量存在偶然因素,不能作为判断重要性的依据。实际企业应用的搜索需求是基于内容的相关性排序,即与搜索需求最相关的信息排在搜索结果的前面,

  三是实时。搜索引擎索引生成和检索服务是分开的。定期更新和同步数据。大型搜索引擎的更新周期需要每周甚至每月进行衡量;而企业信息检索需要实时反映内外部信息的变化,搜索引擎系统机制无法适应企业动态数据增长和修改的需求。

  四是安全。互联网搜索引擎都是基于文件系统的,但企业应用的内容一般都安全地集中存储在数据仓库中,以保证数据安全和管理需求。

  五是个性化和智能化。由于搜索引擎数据和客户规模的限制,相关反馈、知识检索、知识挖掘等计算密集型智能技术难以应用,而专门针对企业的信息检索应用可以在智能和个性上走得更远。

  (InformationRetrieval),通常是指文本信息检索,包括信息存储、组织、性能、查询、访问等方面。它的核心是文本信息的索引和检索。从历史上看,信息检索经历了人工检索、计算机检索、当今网络化、智能化检索等多个发展阶段。

  目前,信息检索已经发展到网络化、智能化阶段。信息检索的对象已经从独立数据库管理的相对封闭、稳定、一致的信息内容扩展到开放、动态、更新快、分布广、管理松散的网络内容;信息检索的用户也从原来的情报专业人员扩展到了普通大众,包括业务人员、管理人员、师生以及各类专业人士,对信息检索从结果到方法都提出了更高、更多样化的要求。适应网络化、智能化、个性化的需求是信息检索技术发展的新趋势。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线