自动采集子系统(乐思网络舆情监测系统的网络拓扑*敏*感*词*所示与分析)
优采云 发布时间: 2022-03-07 13:06自动采集子系统(乐思网络舆情监测系统的网络拓扑*敏*感*词*所示与分析)
系统组成
乐思互联网舆情监测系统由两个子系统组成:自动采集子系统(采集层)和分析浏览子系统(分析层和表现层)。
乐思互联网舆情监测系统的网络拓扑如下图所示,也可以根据需要在隔离的外网和内网中分别实现。
自动采集子系统功能描述
Auto采集 子系统可以自动采集 任何目标网站。
例如:新华网、强国论坛、天涯社区、西辞社区、网易社区、新浪论坛、搜狐社区、凤凰网、*敏*感*词*等用户指定的动态网站。您可以提取所有新闻文章或主题帖子或最新主题帖子的内容,也可以提取对主题帖子的所有回复或最新回复帖子的内容。您可以指定一个目标网站 进行监控,也可以不指定一个目标网站 进行全局范围的监控网站,或者将两者结合使用。它可以监控国内网站和国外网站如Facebook、Twitter、BBC、CNN。
自动化的采集 子系统还可以监控基于应用程序的*敏*感*词*。
后端数据库支持任何主流关系型数据库,如Oracle、IBM DB2、MS SQL Server、MySQL、Sybase和文件数据库Access等。
自动采集子系统的综合监控功能如下图所示:
自动采集 子系统具有以下显着特点:
1. 世界领先的自动化采集 能力
Luxsoft 的网络信息采集 技术是世界领先的,支持任何网页中任何数据的准确采集。乐思软件每天为*敏*感*词*各种网站用户提供采集服务,离不开高效稳定的采集平台。
2. 支持各种监控对象
实时监控微博、新闻、论坛、博客、公共*敏*感*词*、搜索引擎、留言板、应用程序、报纸网站电子版等。
3. 无需配置即可监控上千条新闻网站
系统内置网站全球监控配置,输入关键词,采集自动文章标题和文字。
4. 强大的多语言统一处理功能 26 禁止 9 挪用 0
可以自动处理和保存中文、英文、法文、德文、日文、韩文、维吾尔文、阿拉伯文等多种语言。
5. 智能文章 提取
对于文章类型的网页,可以直接自动提取文章文字和标题,以及作者发布日期等,无需配置,自动去除广告、栏目等无关垃圾内容, 版权等
6. 完美支持各种网页情况
支持当前流行网页2.0 AJAX动态网站
支持用户名密码自动登录
支持表单查询