自动采集发布系统(沈航知识工程中心2010年8月互联网情报信息跟踪采集发布系统)

优采云 发布时间: 2021-09-07 20:21

  自动采集发布系统(沈航知识工程中心2010年8月互联网情报信息跟踪采集发布系统)

  {互联网情报信息tracking采集release system}在航空企业应用 沉航知识工程中心2010年8月 航空企业互联网情报信息tracking采集系统应用 第1页共9格 微互联网信息采集工具以知识管理思想及相关技术架构为基础,以知识挖掘技术为核心支撑,结合航空企业研究院信息化管理和应用需求的现状和特点,基于公众号采集在*敏*感*词*同行业互联网网站实现信息辅助跟踪、采集和管理功能。整合企业情报渠道,提高信息采集效率,提高处理重要信息采集的及时性和有效性,实现采集,互联网上各种格式信息源的分类存储,建立共享良好、统一管理信息辅助处理工具。根据智能采集的目标和形式的不同,可以分为“话题追踪”和“定点追踪”两种形式。具体申请表格如下:1、topic tracking采集tools 使用话题追踪采集tools自定义搜索引擎,通过设置相关话题内容和智能搜索条件,提供相关范围内的@网站 采集 自动搜索和下载与跟踪主题相关的内容。该工具协助情报人员完成一站式搜索和管理,对搜索结果进行汇总整理,并协助情报人员对搜索结果进行快速筛选和处理。 Table-List of Function Modules No. Module Functions Items Main Functions and Features 以树状结构管理主题分类,包括:新建主题、1个主题目录管理、命名、删除。

  主题管理 管理特定的采集主题内容,包括:设置2个主题设置管理、设置跟踪条件、开始跟踪、重命名、删除等。 根据不同搜索引擎的搜索形式和条件,搜索栏3 搜索条件管理文件配置管理。搜索引擎根据设置的搜索条件,自动跟踪@网站,生成预搜索结果的摘要和标题信息,形成搜索结果4搜索结果管理列表。可以对搜索结果列表进行下载、删除等操作,进行搜索管理。结果列表信息包括项目的权重、状态、标题、文件类型、更新时间、网页类型等。您可以预览搜索结果列表中内容的原创网页或文档信息。方便用户判断网页内容是否满足下载5个文件预览的需要。可以下载和预览网页、word、pdf、ppt等多种格式的文档,根据搜索主题创建最终结果集合。搜索结果的文件可以保存在每个最低目录中。 6 采集夹管理 采集夹管理可以维护采集夹,包括:打开、创建、清空、导出结果、重命名、删除功能。 7 历史记录 您可以按主题查看导出的历史结果。互联网情报信息追踪采集航空企业系统应用 第2页,共9页 可设置工具下载线程数、超时时间、下载文件 8 设置文件下载临时目录、网页自动跟踪检查、网页预览、网页内容去噪、清空临时文件等功能信息配置管理。

  部分@网站需要使用代理才能正常访问。系统提供对常用代理站点的维护和管理功能,包括免工具设置 9 代理设置代理、使用指定代理、使用轮询机制访问代理。包括文档结果采集路径设置、搜索跟踪最多10个其他设置、结果数量设置、搜索结果状态显示和搜索结果自动过滤设置等。 主题管理:以树状结构管理主题分类,管理特定的采集主题内容,包括设置跟踪条件、开始跟踪、重命名、删除等。 图-搜索主题设置 搜索管理:根据不同搜索引擎的搜索形式和条件对搜索条件进行配置和管理。根据设置的搜索条件,搜索引擎自动跟踪@网站,生成预搜索结果的摘要和标题信息,形成搜索结果列表。可以下载和删除搜索结果列表进行管理。结果列表信息包括项目的权重、状态、标题、文件类型、更新时间、网页类型等。您可以预览搜索结果列表中内容的原创网页或文档信息。方便用户判断网页内容是否满足下载需要。可以下载和预览网页、word、pdf、ppt等多种格式的文档。 互联网情报信息跟踪采集系统在航空企业中的应用 Page 3 of 9 Pages 图-搜索引擎条件设置图-搜索结果列表管理互联网智能信息跟踪采集系统在航空企业的应用9页图片搜索结果预览采集管理第4页:根据搜索主题创建最终结果的采集目录。

  搜索结果的文件可以保存在每个子节点目录中。采集夹可以维护,包括:打开、创建、清空、导出结果、重命名和删除功能。图-话题采集夹管理互联网情报信息跟踪采集系统在航空企业的应用第5页共9页图-结果下载合集2、定点跟踪采集工具定点跟踪采集工具可指定@的网页网站和专栏内容自动采集并定期整理,适用于跟踪采集定期更新变化的新闻或技术论坛。工具提供采集站点管理、采集result管理、采集result优化设置等,具体如下表所示: 序列号模块功能项的主要功能和特点以树状分类管理新闻站点的结构,包括:新站 1 站点订阅设置点、重命名、删除等 管理特定的采集站点,并根据站点页面链接的特点设置自动下载规则,包括: 2 采集Rules 设置站点管理通用设置、采集页面规则、翻页规则和系统登录设置等。对于特定的采集站点内容更新规则,您可以设置3个跟踪周期设置来设置自动跟踪的周期和下载网页内容,如每日、每周、每月等。 互联网情报信息跟踪采集 航空企业系统应用 Page 6 of 9 系统提供交互式站点结果管理列表,方便管理和维护采集 内容和导出应用程序。结果列表的内容包括:内容标题、下载状态、存储4采集result管理结果管理文件名、采集time等

  采集 结果分为:当前采集资源、未导出资源、导出资源、删除资源。 5 结果内容预览 您可以选择采集 内容进行在线预览。工具提供交互操作方式,对相似网页的下载内容进行选择和分析,过滤掉与结果页内容和结果内容无关的广告、其他链接等信息页。可以通过模板设置好需要的规则,然后工具自动实现对相似网页的去噪功能。站点管理:以树状结构管理新闻站点分类,包括:新建站点、重命名、删除等。管理特定的采集站点,根据站点页面链接的特点设置自动下载规则,包括常规设置、采集页面规则、翻页规则、系统登录设置。对于特定的采集网站内容更新规则,您可以设置自动跟踪和下载网页内容的周期,例如每天、每周、每月等。下载的结果可以定期导出并提供给相关部门的用户企业。图-采集站点管理 互联网智能信息跟踪采集系统在航空企业的应用 Page 7 of 9 Pages 图-采集规则设置 图-自动跟踪规则设置 互联网智能信息跟踪采集系统在航空企业中的应用企业第8 页,共9 页采集 结果优化:工具提供交互操作方式,对相似网页的下载内容进行选择和分析,过滤掉页面上与文本内容无关的广告等链接。信息。可以通过模板设置,然后工具自动实现类似网页的去噪功能。互联网情报信息追踪采集系统在航空企业中的应用 共9页

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线