网站内容采集系统(功能设计舆情招标基本要求-上海怡健医学())

优采云 发布时间: 2022-04-07 12:35

  网站内容采集系统(功能设计舆情招标基本要求-上海怡健医学())

  投标基本要求:

  产品实用性强,功能设计要非常适合舆论工作的需要,系统要能有效利用网络资源和硬件资源,要求厂商有持续的研发能力,以及良好的执行和售后服务能力;

  1、产品形式要求为软硬件一体化产品。为了完成舆情监测的需要,需要提供: 1 舆情监测系统采集部分

  该产品可以利用搜索引擎技术、文本处理技术、知识管理方法,对海量互联网信息进行自动获取、提取、分类、聚类、监控和聚焦,满足用户对在线舆情监控和热点话题跟踪的需求。事件。形成舆情简报、专题分析等分析结果,为客户提供网络智能和辅助决策系统,为客户全面掌握舆情动态、实施舆情引导提供分析依据。

  2、支持国内主流微博和海外指定网站

  舆论采集系统实现定时监控采集,可配置管理采集时间密度、采集内容、采集方法;维护管理员可以轻松指定采集的目标站点或页面。

  3、运行稳定,系统可全面实现7*24小时无人值守信息采集,系统具有自恢复和启动功能。真正满足舆情监测应用需求。

  配置简单:采集系统支持可视化向导的配置。同时支持有针对性的采集和全网监控。

  需要内置JavaScript/Jscript/VbScript等脚本引擎,可以解析提取复杂的脚本页面,应对复杂的采集环境。支持增量采集 和完整更新采集。

  4、强大的贴吧,论坛采集功能。不仅可以采集论坛主帖和所有后续帖子,还可以实时更新。可以采集点击数和回复数(包括点击数和回复数不在最终详情页)。(提供截图)采集结果自动重排,结果重排支持URL的重排方式,利用内容的相似性进行重排。内置全网采集功能,用户只需指定需要的关键词即可轻松监控全网。支持HTTP压缩编码传输gzip/deflate,支持代理转换。减少了对目标 网站 的 采集 压力。减少被拒绝的机会采集 按目标 网站。自动识别网页编码,支持采集多语言网页,支持UTF-8、BIG5、GBK等;分页内容重组,对于目标数据源的一篇文章文章分页显示在目标网站上,系统可以自动重组。内置了常用的采集网站,无需过多配置即可轻松实现对常用网站的采集监控。系统会自动重组。内置了常用的采集网站,无需过多配置即可轻松实现对常用网站的采集监控。系统会自动重组。内置了常用的采集网站,无需过多配置即可轻松实现对常用网站的采集监控。

  5、网页智能提取,采集软件可以通过统计算法从复杂的网页内容中自动提取标题、文字、日期、出处、作者等元数据属性。智能提取兼顾准确性和完整性。(提供截图)采集深度和广度随意控制

  6、多行层,多任务,支持异步处理,合理利用系统资源

  支持海量数据采集,可根据项目规模进行并行扩展分析部分

  舆情分析模型。舆情分析支持语义分析和舆情知识库。舆论规则支持 AND 或非任意组合。自动生成热点,计算舆情热度。热量计算系数通过采集系统实时更新。

  7、论坛帖子实时分析,确保舆情应用中看到的帖子数据与原网站同步。(提供截图)

  要求系统能够对舆情信息进行正反判断,从而自动发现负面信息,实现对敏感信息的有效监控。

  相关链接 舆情监测行业 政务网络舆情监测 舆情信息系统 舆情监测系统 招投标 舆情监测企业

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线