Web信息智能采集与自动分类标引系统的应用方向分析

优采云 发布时间: 2021-08-10 22:37

  Web信息智能采集与自动分类标引系统的应用方向分析

  Web Information Intelligence采集和自动分类索引系统是我们汇海科技-武汉大学移动业务联合实验室的首个联合研发项目。系统集成已完成,系统进入系统测试阶段。下面我来介绍一下。

  概述:

  网络信息智能采集和自动分类索引系统是一个智能系统,自动采集并根据用户定制需求处理来自互联网的信息。 采集信息类型包括新闻页面、论坛社区、SNS、BBS、博客、微博等

  功能列表:

  1.Web信息分布式多渠道实时定向采集

  2. 提取采集Web 页面的正文

  3.去除相似信息

  4.自动主题分类(自动将文章文章归入预设类别)

  5.自动主题索引(提取 5~6 关键词

  6.作者、时间、出版单位自动提取

  7.信息检索,包括全文检索、按时间段检索、限定类别检索

  8.搜索结果自动分类

  应用方向:

  1.垂直搜索引擎

  2.公众情绪监测

  3.发表评价信息监控

  4.Enterprise 竞争情报和市场情报监控

  5.机构负面信息监控

  6.区域形象评价

  7.用户偏好分析

  8.在线社交网络分析与挖掘

  9.其他信息增值服务

  其他概述:

  Web information采集系统是各种基于Web信息的应用服务的基础。对于采集收到的网页信息,企业可以开发各种具体的内外部增值服务。是出版社涉足信息服务业。基础的、平台化的工具对传统出版集团在出版选题、网络营销、竞争情报、产品评估、企业形象管理等方面都有非常大的支持作用。

  我们欢迎出版行业的朋友与我们合作进行系统研发、业务咨询和理论探讨,特别是有兴趣开发移动出版服务和增值在线信息服务的朋友。

  武汉大学-汇海科技移动业务联合实验室副主任王晓光

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线