阿里云 大数据教你玩转娱乐圈

优采云 发布时间: 2020-08-22 20:05

  阿里云 大数据教你玩转娱乐圈

  ” 不仅这般,公众趋势剖析原先还是阿里小ai的一只“眼睛”,帮助小ai成功预测了《我是歌手》决赛的粉丝投票排名。今天名厨带你一起用他闯一闯娱乐圈。

  必备产品:

  单价:UI大众版 69元/年 8月2日 10:00准时发售!

  阿里云公众趋势剖析的应用场景则包括政府机关、传媒机构、金融行业、地产行业、教育行业、医疗行业、旅游行业、企业品牌等。

  

  一、注册与订购

  此前它以每个月1元(UI体验版)的体验价钱(现在升级为UI大众版69元/元)向公众开放,大厨就以这个价钱任性地尝试了一把——首先打开阿里云·数加的官方链接,然后点击该网页右侧的“立即订购”,就能进行注册、缴费与使用了。

  

  二、使用流程——以近日吴亦凡风波为例

  注册并开通“公众趋势剖析”服务以后,便能进行配置测量专题、关键词和参数并剖析采集内容变化趋势了。

  (一) 设置监控的专题和关键词

  首次步入“公众趋势剖析”管理控制台,需要为剖析对象配置监控专题和关键词, 可以用监控专题的一个或多个关键词组合进行描述。

  数加官网“快速开始”称:

  “系统后台将采集收录那些关键词组合的文章内容,进行汇总剖析。后续一些统计功能将主要针对监控专题进行操作,所以尽量为每位剖析对象创建一个单独的监控专题。”

  八卦的主厨为此次热热闹闹的吴亦凡风波专门开辟了一个专题并设置了关键词组合—首先点击后台管理的关键字,继而点击添加专题,然后进行关键词配置。

  大厨一口气添加了吴亦凡、小G娜、卓伟、加拿大炮王等一系列热点词汇,选择了包括新闻、论坛、微博、微信在内的所有给定源站,生成的专题如下:

  据官方说明,关键词配置的要点如下:

  “配置关键词时主要考虑以下两方面诱因。(注意:系统后台每10分钟就会更新全局的关键词采集策略,因此新的关键词递交配置以后,需要10分钟左右生效。)

  ○ 采集范围:需要在什么类型的站点上采集内容。源站类型可以包括:新闻、论坛、贴吧、微博、微信、政府网站和视频类网站。

  ○ 组合方法:关键词怎样组合,是否添加同义、近义、通假或网上用语的变体,这可能须要花一些时间逐渐调整。另外,请不要设置过分笼统的关键词组合,例如“网络”、“安全”等单个词,这会采集过多不相关的文章,导致您的采集数量配额快速用尽。如下图所示,一次可批量添加多个关键词组合,每一行表示一个关键词组合。根据您购买的版本不同,关键词组合的数目(即行数)有不同的上限。一个关键词组合可以由单个或则多个词组成,词与词之间用空格分隔,表示“与”的关系:必须同时 收录一行中所有词的信息就会被采集。”

  (二) 查看采集内容

  这下才能开始关注舆情动态了,点击两侧导航栏的“新舆情”或者“全部舆情就”可以查看关键词采集到的文章列表。列表中标题字体加粗的表示未读文章,点击某一条文章将在右边显示文章的详尽信息。

  大厨随机点开其中一篇文本,如下图,情感早已被手动设定为“负面”,而标签、情感(正面、中性、负面)、风险等级、备注等信息都可以进行自定义,同时,大厨将这篇信息设置为有效。

  值得注意的是,标记训练是机器学习的过程,据官方说明:

  标记训练“可自动勾选文章标题,批量标记为‘有效’、‘无效’或‘已读’。‘有效’表示这种文章是值得重点关注的,‘无效’表示这种文章属于干扰信息。手动标记的过程,实际上是在训练后台的智能分类模型,一般经过100篇左右的标记训练然后,系统的分类模型将越来越确切,结合‘过滤规则’可以实现智能过滤, 后续采集到不相关的内容(如广告、干扰信息、垃圾信息),即可手动划入‘回收站’。”

  同时,该应用还提供了文章的搜索功能,点击文章上面的搜索按键,便可以从多维度筛选文章。

  (三) 查看结果剖析报表

  最后点击两侧导航栏的“首页”,便可以查看相关剖析报表,可以查看“今天”、“7天”、“30天”的剖析结果。

  三、结果展示

  大厨检查了从6月21日到6月24日关于此风波的结果。

  源站类型和热词云分析如下图所示,结果显示:微博成为这次风波的主要舆论场,符合你们的潜在认知。

  然而,关于采集到的舆情数目,大厨心有疑问。在微博搜索“吴亦凡”的发文数目远远超过“公众趋势剖析”在微博四天内共搜集到的2万多条。这说明该应用的数据筛选有着自己的一套标准,且该标准获取的样本量显著偏小,“大数据”的搜集能力还需后续观察。

  结果显示:

  对于此次吴亦凡负面风波的公众情感剖析,6.21-6.24日的均值为1,公众的正面情绪稍为抢占上风,说明大量粉丝甚至是脑残粉持续进行舆论攻势。

  6.23日公众的正面情绪有较高的上升,这与吴亦凡名誉侵权案结案具有一致性。

  以6.24日为例,全天的对此风波的想法相对中性,但在清晨四点到10点达到情感高峰,说明双方的立场僵持以支持者抢占上风(反对者可能都在睡梦中)。

  一言以蔽之,大厨对该应用之于发文的手动情感判定相当服气,虽然有一些文章存在疏漏之处,但大部分都能确切定性。

  分析结果显示6.21-6.24日?——热门风波TOP10为:

  通过上述图表可知,吴亦凡此番风波的后续发酵和迈向与一些热点风波和炒作有关——吴亦凡名誉侵权案高踞热门风波前二,6.22日早晨的结案推动舆情数目迈向高峰。这说明了吴亦凡方的公关做法在实质的迈向中起到了影响和率领粉丝进行舆情反攻的作用。

  四、 功能点评

  优点:

  1.情感剖析较为出众,能够较为确切地表现舆情迈向。

  2.自动化操作和检查,界面简约,使用简单。

  缺点:

  1.目前应用平台不太成熟,存在一些bug。

  a) 删除设定的专题后,专题内的关键词并不会在舆情的界面消失,还是会继续在云端加载数据,且无法删除。

  b) 首页的剖析结果并非依照某一单一专题得出,而是所有关键词的汇总剖析结果,且难以设定,这一点十分不合理。例如你有两个不同须要检查的专题“京东618”和“吴亦凡”,首页的情感剖析、词云统计太有可能是所有测量文本的集合结果,目前难以实现对不同专题的差异化结果显示。因此,该平台目前对具有单一的测量主题的受众较为适用。

  2.抓取的数据量不够完整,且舆情数目很容易达到上限。(大厨仅仅检查了4天吴亦凡风波,控制台的上便捷有如下提示。)

  3.若干更为实用的工具还未向公众开放。如下图,开放插口下的传播路径剖析等功能还未开放,因此数据的使用和剖析具有局限性。

  PS:大厨发觉,前几日的1元体验版现在已渐次下架,取而代之的是69元/年的大众版,据负责人透漏:1元钱的体验版为上个月的活动价,对数据量进行了控制,每天仅能抓取1万条信息,功能较弱;而今的69元/年的大众版,每天可以抓取30万条信息,大大提高了该平台的剖析容量,算是真正商业化了。这确也部份解答了主厨的体验困扰。当然,大厨只是体验了初级版,各位boys或则girls,值得拥有大众版!

  公众趋势剖析地址:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线