Web信息智能采集与自动分类标引系统的应用方向分析
优采云 发布时间: 2021-08-10 22:37Web信息智能采集与自动分类标引系统的应用方向分析
Web Information Intelligence采集和自动分类索引系统是我们汇海科技-武汉大学移动业务联合实验室的首个联合研发项目。系统集成已完成,系统进入系统测试阶段。下面我来介绍一下。
概述:
网络信息智能采集和自动分类索引系统是一个智能系统,自动采集并根据用户定制需求处理来自互联网的信息。 采集信息类型包括新闻页面、论坛社区、SNS、BBS、博客、微博等
功能列表:
1.Web信息分布式多渠道实时定向采集
2. 提取采集Web 页面的正文
3.去除相似信息
4.自动主题分类(自动将文章文章归入预设类别)
5.自动主题索引(提取 5~6 关键词)
6.作者、时间、出版单位自动提取
7.信息检索,包括全文检索、按时间段检索、限定类别检索
8.搜索结果自动分类
应用方向:
1.垂直搜索引擎
2.公众情绪监测
3.发表评价信息监控
4.Enterprise 竞争情报和市场情报监控
5.机构负面信息监控
6.区域形象评价
7.用户偏好分析
8.在线社交网络分析与挖掘
9.其他信息增值服务
其他概述:
Web information采集系统是各种基于Web信息的应用服务的基础。对于采集收到的网页信息,企业可以开发各种具体的内外部增值服务。是出版社涉足信息服务业。基础的、平台化的工具对传统出版集团在出版选题、网络营销、竞争情报、产品评估、企业形象管理等方面都有非常大的支持作用。
我们欢迎出版行业的朋友与我们合作进行系统研发、业务咨询和理论探讨,特别是有兴趣开发移动出版服务和增值在线信息服务的朋友。
武汉大学-汇海科技移动业务联合实验室副主任王晓光