资讯内容采集系统(金石舆情监测系统(监测软件)(图))

优采云 发布时间: 2022-02-25 20:31

  资讯内容采集系统(金石舆情监测系统(监测软件)(图))

  金石舆情监测系统(舆情监测软件)是一款面向全网的负面舆情检测系统。可检测各大论坛、门户、新闻、贴吧、网站中的舆情信息,支持所有网络搜索、定向检测、自动发现、自动预警、统计分析、自动报告生成等强大的功能让您可以捕捉全网舆情信息。您还可以自定义 网站采集 监控。系统会根据您预设的特征词自动对舆情进行分类,您也可以手动调整分类。该系统具有类似的信息分析和信息来源跟踪功能。

  金石舆情监测系统(舆情监测软件)*敏*感*词*采用ACCESS作为数据库,携带方便,灵活小巧,避免了繁琐的数据库安装和维护。

  经常问的问题

  1. 为什么我在百度上能找到很多资料,而软件却很少采集?

  A:软件不是采集所有信息,而是采集在您指定的天数内发布的有效信息。这个指定的天数是在系统设置的 采集 选项中设置的。并且百度搜索结果显示所有信息。另外,关键词的匹配方式,模糊匹配或精确匹配,全文匹配或标题匹配都会影响采集的结果。

  2.我刚刚在新浪微博发的帖子里有我对关键词的定义,为什么软件采集还没到呢?

  A:微博信息量很大,采集的速度变化很大。一些名人和热门微博主发布的帖子可能会在几分钟内到达采集,而一些不太受欢迎的博主发布的帖子可能需要几个小时甚至七八个小时(根据实际测量)到采集@ > 到达。不过不用担心,采集 无论如何都可以到达,时间可快可慢。

  3. 如何更改关键词 的类别?

  A:在主界面左侧的关键词树形列表中,按住CTRL+鼠标左键,拖放关键词可以改变分类栏目。您也可以点击【管理关键词】进入关键词和分类栏的管理界面,批量修改关键词的分类栏。

  4. 为什么添加关键词时系统报错说关键词已经存在,但是在关键词列表中却找不到?

  答:您可能已停用 关键词。关键词停用后,将不再显示在主界面的导航列表中,但可以在【管理关键词】界面进行管理。只需在 [Manage关键词] 中重新启用 关键词。

  5. 如果一个关键词 有多个条目,系统会使用什么条件采集?

  A:如果系统设置匹配方式中设置了【精确匹配】,系统会收录多个条目作为采集条件。如果是模糊匹配,系统可能采集只收录部分关键词信息。

  6.关键词 和特征词有什么区别?

  A:关键词用于区分网络信息是否满足采集的监测条件,特征词用于对采集接收到的舆情信息进行分类。比如有一个特征词分类:负面舆论,里面收录了特征词:质量问题。那么采集收到的收录“质量问题”二字的舆情会被归入“负面舆情”的范畴。此外,它的分类可以手动调整。

  7. 在系统设置中,采集 的范围只有“新闻”。为什么自定义信息源网站还是从论坛获取信息?

  A:采集范围设置只针对普通采集,如果在自定义信息源网站中将网站归为论坛,还是采集@ > 关于本论坛的信息。

  8.系统设置中信息老化有什么用?

  A:信息老化的设置有两个作用。一是采集时只有设定天数内的有效信息是采集,二是系统会定期删除已经采集超过天数的信息信息老化。@>信息。

  9.类比信息分析中,两种分析方案有什么区别?

  A:在相似度信息的分析中,提供了两种分析方案供选择,一种是相似度指标,一种是最大相同字符数。两种方案各有优缺点。相似度指标侧重于两者的整体比较,分析得出相似度,但容易受到一些非关键词的干扰,影响分析结果。最大相同字符数索引用于分析两者之间最大相同字符数。当达到该指标时,判断为相似信息,不会受到太多其他词的干扰。

  10.为什么我采集 有与指定的关键词 无关的信息?

  A:如果在系统设置中将关键词匹配设置为模糊匹配和全文匹配,可能采集会得到一些与指定关键词无关的信息,主要是比较复杂网页的部分网页源代码中收录某些文字,但可能在网页上看不到。在系统设置中将关键词匹配设置为精确匹配、标题匹配等,可以提高采集信息的准确性。您可以继续探索最适合您的 采集 方式。

  11.在哪里可以自定义网站采集?

  A:点击工具栏中的【管理信息源】按钮或菜单【工具】中的【管理信息源】按钮,对自定义网站进行管理,在系统中称为自定义信息源网站。

  12.为什么我在消息中添加了自定义提要网站而不是采集?

  A:系统采集可以达到绝大多数网站,但不排除部分网站采取了极端措施来阻止采集,比如某些政治上敏感的 网站。可以点击菜单【工具】中的【监控自定义Feed网站采集】查看哪些网站采集没有卡住。当然,有些网站 堵塞只是由于暂时的网络不畅造成的。如果 网站 一直无法被拾取,可以尝试更改 URL 链接到子页面地址。如果还是不行,只能放弃删除网站。

  1 3.自定义信息源网站中的两个采集方法有什么区别?

  A:进入管理信息源界面,每个网站可以选择两种采集方法中的一种,这对采集的速度和准确性影响很大。它们的区别如下:

  一、快速采集:只有在采集的指定URL中的页面才会得到每个文章的文本内容,并从中判断出准确的发布时间。执行所有 网站采集 用户。

  二、深度采集:将采集指定URL和其中收录的子链接页面,并获取每个文章的文本内容,从中确定准确的推出日期 。由于 采集 页面范围广泛,采集 速度较慢。适合需要对整个网站进行深入采集的用户。

  14.自定义信息源采集的信息和普通采集收到的信息有什么区别?

  A:在舆情观察页面,自定义信息源采集接收到的信息,其网站名称标为蓝色,以区别于其他采集的黑色网站 @> 来源名称。

  15.为什么有些自定义信息源采集到达的时间不对?

  答:有两种可能:一是对方网站中的信息发布日期不规范。系统可以识别最常见的日期书写方式,但由于时间的人类书写方式,可能有数十种或数百种。有些书写软件无法识别。如果无法识别,软件会匆忙将当前日期作为信息时间。第二种可能是文章正文中有多个日期时间表达式,系统只会采用第一个日期。但是,此日期不一定是 文章 发布的时间。当然大部分网站都会在最上面写发布时间,比如标题后面。

  16.想使用自己安装的默认第三方浏览器,但是不喜欢使用系统定义的浏览器,如何设置?

  A:在系统设置中,舆情观察选项中,可以为常用的网站打开方式和内部网页打开方式指定“默认浏览器”。您还可以指定任何浏览器来打开网页。

  17.为什么我设置了关键词在百度上找的信息很多,而舆情监测的却很少?

  A:我们的舆情监测只采集规定天数内发布的最新信息,并非全部信息采集。您可以在系统设置中调整有效天数设置。通过增加值,可以增加采集的信息。

  18.如何找到我查看过的信息?

  A:系统右上角可能会显示“显示搜搜”复选框,勾选,会出现搜索选项。您可以搜索任何已采集 的信息。

  变更日志

  金石舆情监测系统(免费舆情监测系统)v10.9更新内容:

  更新了最新的已失效 采集。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线