自动采集子系统(乐思网络舆情监测系统的网络拓扑*敏*感*词*所示与分析)

优采云 发布时间: 2022-03-07 13:06

  自动采集子系统(乐思网络舆情监测系统的网络拓扑*敏*感*词*所示与分析)

  系统组成

  乐思互联网舆情监测系统由两个子系统组成:自动采集子系统(采集层)和分析浏览子系统(分析层和表现层)。

  乐思互联网舆情监测系统的网络拓扑如下图所示,也可以根据需要在隔离的外网和内网中分别实现。

  自动采集子系统功能描述

  Auto采集 子系统可以自动采集 任何目标网站。

  例如:新华网、强国论坛、天涯社区、西辞社区、网易社区、新浪论坛、搜狐社区、凤凰网、*敏*感*词*等用户指定的动态网站。您可以提取所有新闻文章或主题帖子或最新主题帖子的内容,也可以提取对主题帖子的所有回复或最新回复帖子的内容。您可以指定一个目标网站 进行监控,也可以不指定一个目标网站 进行全局范围的监控网站,或者将两者结合使用。它可以监控国内网站和国外网站如Facebook、Twitter、BBC、CNN。

  自动化的采集 子系统还可以监控基于应用程序的*敏*感*词*。

  后端数据库支持任何主流关系型数据库,如Oracle、IBM DB2、MS SQL Server、MySQL、Sybase和文件数据库Access等。

  自动采集子系统的综合监控功能如下图所示:

  自动采集 子系统具有以下显着特点:

  1. 世界领先的自动化采集 能力

  Luxsoft 的网络信息采集 技术是世界领先的,支持任何网页中任何数据的准确采集。乐思软件每天为*敏*感*词*各种网站用户提供采集服务,离不开高效稳定的采集平台。

  2. 支持各种监控对象

  实时监控微博、新闻、论坛、博客、公共*敏*感*词*、搜索引擎、留言板、应用程序、报纸网站电子版等。

  3. 无需配置即可监控上千条新闻网站

  系统内置网站全球监控配置,输入关键词,采集自动文章标题和文字。

  4. 强大的多语言统一处理功能 26 禁止 9 挪用 0

  可以自动处理和保存中文、英文、法文、德文、日文、韩文、维吾尔文、阿拉伯文等多种语言。

  5. 智能文章 提取

  对于文章类型的网页,可以直接自动提取文章文字和标题,以及作者发布日期等,无需配置,自动去除广告、栏目等无关垃圾内容, 版权等

  6. 完美支持各种网页情况

  支持当前流行网页2.0 AJAX动态网站

  支持用户名密码自动登录

  支持表单查询

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线