智能采集(关键词:档案信息智能采集改进方式应用研究)

优采云 发布时间: 2021-12-06 20:08

  智能采集(关键词:档案信息智能采集改进方式应用研究)

  顾伟

  摘要:档案信息情报采集技术是大数据环境下获取数字档案信息资源的重要技术手段。本文在分析现有档案信息智能采集技术研究成果的基础上,根据档案信息智能采集的不同方法,提出一种创新的方式来提高档案信息智能应用采集 @采集 技术。以达到提高档案信息智能采集技术的实用性和有效性的目的。

  关键词:档案信息情报采集改进方法应用研究一、简介

  在大数据环境下,智能化信息采集技术是实现电子档案全馆藏的重要手段,特别是对于网站网页、社交媒体等“新领域”电子档案馆藏. 这些“新领域”的档案信息不仅来源广泛、数量庞大,而且更新速度快、存在时间短。如果不能及时发现,主动采集,就会被新的信息覆盖。因此,利用档案信息智能化采集技术实现档案信息自动化采集变得越来越紧迫和重要。

  目前,学者们从不同角度对档案信息情报问题进行了研究。张倩认为,利用自动采集是获取档案信息资源的一种新途径[1]。王维娜提出了互联网条件下的档案信息。@采集的原理[2],傅昌辉从个性化服务的角度指出了有效采集文件数据的难点,以及如何制定合理的采集策略,选择合适的采集Tools[3],程智构建了档案数据智能采集模型[4],冉朝霞研究了基于舆情数据的档案信息跨维度采集与分类[5]。然而,这些研究较少关注档案信息智能采集技术的实际应用。因此,本文从实践创新的角度研究档案信息智能采集技术。二、文件信息智能采集技术

  档案信息情报采集技术是将档案实践工作与计算机信息采集技术相结合,为在电子环境下完整、完整、及时、准确地采集数字档案信息资源而产生的一种应用技术。档案信息采集是档案数据存储、清理、分析和应用的首要环节,对丰富数字档案信息资源、开展档案数据治理具有重要作用。从档案信息采集技术的发展阶段来看,档案信息采集技术经历了手工采集、计算机自动化采集、网络信息采集和智能化信息采集@ >四个阶段。

<p>本文研究的档案信息智能采集是档案信息采集技术的第四阶段。它利用信息爬取技术,主动按照互联网上预设的采集规则到不同的来源采集,对采集收到的归档信息进行数据类型分析和异构数据分类存储,并根据对档案信息的有效性和相关性的分析进行智能过滤,提取与采集主题高度相关的档案信息及其元数据,从而达到精准、自动化的

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线