自媒体(WeMedia)时代已经到来,你准备好了吗?

优采云 发布时间: 2021-08-15 23:04

  自媒体(WeMedia)时代已经到来,你准备好了吗?

  1 简介

  随着互联网技术的飞速发展,论坛、博客、微博、微信等Web2.0应用逐渐成为信息表达的主要渠道。该信息有别于传统的专业媒体信息发布。群众主导的信息传播方式是信息从“点对面”向“点对点”传播方式的转变。 自媒体用户在接收信息的同时也在传播信息,方便快捷,互动性好。信息可以以最快的速度推送给观众,观众也可以给出最快的反馈。 自媒体(自媒体)时代已经到来。在大学校园里,无论是教室、食堂还是宿舍,大学生都在使用自媒体进行交流,自媒体为大学生搭建了广泛的社交平台。通过这个平台,大学生可以充分展示自己的才能和个性。同时自媒体也为大学生提供了一个关注社会热点、讨论时事政策的平台。

  2 舆论与高校网络舆论的内涵

  公众情绪是公众对社会的态度和意见的集合。从政治角度看,它是一种政治倾向和态度[1]。传统的舆论来自公众反馈或舆论研究。随着网络技术的进步,网络论坛、贴吧、微博等逐渐成为人们交流的重要渠道,产生了网络舆论。有学者认为,网络舆情是指在网络上传播的各类网民对社会问题的情绪、态度和意见的集合[2]。网络舆情具有真实舆情的所有特征,不同之处在于媒体不同。网络舆情由以下要素组成:(1)main,指网络舆情的参与者,包括接收者和传播者,具体可分为普通网民、意见领袖、网络推动者、五十美分(网络海军)等;(2)客体,即舆论讨论对象,即话题,一般是社会热点。(3)内容,代表态度、倾向、舆情参与者对舆情话题的情绪,内容的有效识别,为危机公关决策提供支持(4)空间,即提供舆情讨论和演变的场所,包括信息论坛、微博、微信等载体(5)力量,网络舆情强度检测来自于舆论主体的情绪倾向、措辞等。(6)热度,是关注度)网友们,从他们的cl icks、回复、转发等 [3]。大学生有强烈的求知欲和责任感,是一个思想非常活跃的群体,对热点社会事件关注度高。有较高的敏感度,尤其是那些涉及国家荣辱、社会不公的事情会引起他们的强烈关注。目前高校的舆论内容主要包括:(1)*敏*感*词*热点,如钓鱼岛问题;(2))学校突发事件,如灾害等;(3))与学生自身利益相关,如学校服务质量等[3]。经历、世界观、人生观、价值观还在形成中,容易跟风,容易相信别人。大学生接受新事物的能力很强,当代大学生习惯使用自媒体交流信息。一旦发生事件,他们可以通过论坛、微博、微信等渠道的信息快速传播和讨论,使高校网络舆论具有突发性、及时性、盲从、情绪化的特点。国家和群体特征[4]。

  3 网络舆情系统功能

  负面舆论将影响高校的稳定发展。如何对高校舆情进行监测,快速准确地分析舆情,及时干预和引导舆情走向,是舆情分析系统需要完成的任务。一个典型的舆情分析系统主要有以下几个功能:(1)可以根据话题点击、回复、转发等数量识别指定时间段内的热点话题;(2)分析趋势和趋势)话题信息,识别其发展演变趋势;(3)基于舆情分析系统生成舆情报告,提供决策支持。根据网络舆情系统功能和舆情生命周期流程,高校网络舆情系统结构如图1所示。 网络舆情分析系统流程可分为4个阶段,即:在线舆情信息采集与存储、舆情信息预处理、舆情信息分析与处理。其中,网络舆情信息采集是基础和数据源,采集各种信息通过相关信息采集技术(如元搜索、微博OpenAPI等)在校园网(BBS、微博、微信等)舆情聚集区发布。这些数据量巨大,而且很多数据不是结构化的,所以采用Hadoop框架来实现分布式存储和计算。舆情信息预处理就是将舆情采集系统得到的数据进行编码、去重、去噪、分词、汇总等处理,提供给舆情信息分析系统进行下一步处理。舆情信息分析预测系统是本系统最重要的部分,主要完成话题检测与跟踪、热点话题识别与预警、智能预测等。 舆情结果分析阶段可以展示各种话题的诞生可根据用户需求,发展到消亡的全周期。

  4 基于Hadoop的高校舆情系统的实现

  与传统的舆情分析相比,自媒体时代的数据量非常大,数据类型也很多。数据可分为结构化数据、半结构化数据和非结构化数据,其中非结构化数据占比较高,传统方案效率较低,自媒体时代舆情挖掘需要更多时效性,是不错的选择使用大数据技术。目前大数据相关技术最成熟的应用是Apache基金会开发的Hadoop分布式架构。核心机制是HDFS和MapReduce。 HDFS提供海量数据的存储,MapReduce提供数据的计算[5]。通过Hadoop技术,可以将多台普通或低性能的服务器组成分布式服务器集群,提供大数据量、高性能的存储和处理能力。与传统的舆情分析系统相比,Hadoop可以将数据采集提升为分布式采集,可以大大提高数据采集的效率; Hadoop 的 HDFS 文件系统可以跨机器存储海量数据,减少对硬件和软件的需求。对用户的要求节省了使用成本。实验硬件:8台PC,CPU为IntelCorei3,2.4GHz,内存4GB,硬盘500GB,网络环境1000MB以太网。实验软件:Ubuntu10.10操作系统、MyEclipse集成开发环境、MySQL5.1、Hadoop0.20.205.0、Nutch1.4。 Linux操作系统非常适合Hadoop平台的搭建、开发和部署,可以保证系统的稳定性和安全性。 MyEclipse是Java的集成开发环境,可以轻松开发Web项目,集成Tomcat、Spring、Hiber-nate、Struts2、jUnit等框架。搭建好的Hadoop集群有8台PC,其中一台作为master部署NameNode和JobTracker,其余7台作为slave节点部署DataNode和TaskTracker。 Data采集使用元搜索引擎eTools搜索大学相关论坛、官方微博、热门微博等网址,获取网址列表。使用Nutch爬虫抓取网页并存储;数据预处理模块使用Tika对数据进行Clean和去噪,然后使用Lucene构建排序索引,使用中科院汉语词法分析系统ICTCLAS系统进行分词和词性标注。数据分析和预测模块将预处理模块的结果转化为可操作的文本向量,并使用TF-IDF算法计算项目权重获得文本特征向量,并使用聚类算法跟踪主题,发现敏感主题并发出警告。

  5 结论

  高校舆论是社会舆论的晴雨表。做好高校舆情分析工作,保障高校安全稳定发展,是高等教育的一项十分重要的任务。当今时代,自媒体在微博、微信等高校校园中的广泛使用,使自媒体公情成为高校网络舆论的重要形式。同时,传统的舆情发现系统面临自媒体海量数据显示成本过高。可扩展性高、可扩展性差等缺陷。为此,提出了一种基于Hadoop的高校舆情分析系统,可以对采集收到的海量数据进行分析处理,实现敏感热点舆情话题的发现、跟踪和预警,掌握舆情全局,生成舆情分析报告。为舆情管理决策提供支持。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线