一是人工采集,二是智能采集( 人工智能和大数据,以及这两种技术在新媒体当中的应用)
优采云 发布时间: 2022-03-08 15:17一是人工采集,二是智能采集(
人工智能和大数据,以及这两种技术在新媒体当中的应用)
欢迎收听高博士的“新媒体三十讲”。这是一门严肃的知识传授课程,我不会搞笑,但我会让无知的人看起来更可笑。我是主讲人高阳。
两个时代
在本次演讲中,我们来谈谈人工智能和大数据,以及这两种技术是如何在新媒体中应用的。
我们先来看看人工智能。人工智能,顾名思义,是人类创造的智能。
英文叫Artificial Intelligence,缩写是AI,所以AI就是人工智能。
人工智能的概念在 1956 年首次出现时,最早是在美国达特茅斯会议上提出的,称之为像人类人工智能一样思考的计算机。
人工智能是一个迭代和发展的领域。
根据科技史专家的研究,从1950年代到今天,人工智能大概经历了五个时期。
从最早的人工智能我们称之为“算法”,发展到今天我们称之为“深度学习”的人工智能时代。
如何理解这两个时代?
例如,基于算法的人工智能最早的代表是IBM的大型计算机Deep Blue。
这时的人工智能算法,比如它想解决一个像人一样思考的人工智能如何走出迷宫的问题,当时的人工智能采用了类似于人类决策的方法.
我们知道,真正的人类智能在解迷宫的时候总是采用一种试探的方法,比如绕到一个无法通过的地步,然后再改变方法。
而那个时候所谓的算法人工智能呢?
它区分道路。例如,在这个路口,它有三个选择,即ABC的三个选择,然后进一步推导。在每一个选项下,你进化出了ABC的三个选项,所以它不断地计算几个选项,推导出出来的几个选项统一起来形成一个算法和一个公式来克服这样一个难题。
乍一看,大家可以清楚地看到,这个计算其实很繁琐。它基于不断的尝试,类似于管理中的决策逻辑。
在这个逻辑下,其实当时的人工智能还不够聪明,但到底有多厉害?
它的强大之处在于计算的速度和效率会非常快,所以你看深蓝就是这样一个算法。
IBM 的 Deep Blue 实际上验证了什么?
是IBM计算机强大的计算能力,深度学习时代人工智能的代表就是谷歌AlphaGo。
它比深蓝时代的算法更进化,因为它将使用深度学习的方法。以前可以挑战深蓝的一个领域是围棋。
因为围棋是一种非常特殊的游戏,在选择的层面上,每一步棋实际上都有无限的数学选择。
因此,基于推理的人工智能是没有办法对付围棋的,但AlphaGo是一种基于自学习和深度学习的人工智能。它可以不断进化和学习,提出更优化的方法,它可以解决问题。国际象棋的挑战。
因此,我们这个时代的人工智能已经迭代到可以进行深度学习的程度。
采集 以外的数据
其次,我们来看大数据。或许大家对它的理解就是基于这个大词。
是的,大数据的第一个重要特点就是数据量海量,这和我们传统的数据处理在体量层面是有很大区别的。
基于这个大数据计算,我们可以获得更准确的结果,可以预测一些未来的世界和行动。
但我要强调的是,大数据,尤其是新媒体应用中的大数据,应该从两个层面来看待。
首先是从源头获取数据的方式。在我们媒体行业,从过去开始,我们的数据源都是基于采集。
数据本身的来源是一个链接。这个环节是通过采集采集专用采集数据的方法和逻辑,通过小样本调查统计计算得到的。数据来了。
它会有一个问题,就是即使执行的过程是完美的,也会有统计偏差,这是不可避免的科学偏差。
但是大数据的数据源不是采集得到的,而是记录下来的。
也就是核心媒体和互联网,当人类与它互动时,人类与新媒体的互动,你的浏览,你点击了哪个帖子,你在哪个帖子停留了多久,你在哪个帖子上放了多久帖子被分享了,你在某个内容中跳出的时间段等等。所有这些数据都被记录下来。
它的数据获取方式不再是一个独立的、专门化的动作,而是人类消费新媒体过程中的关联产物。
也就是说,它的数据不是专门采集和采集,而是基于人类与媒体和互联网的互动而记录下来的。它是一个伴奏,所以这是一个核心功能。.
从这个特性来看,大家可以分辨出来。如果数据以特殊方式来自采集,无论样本量有多大,数据量有多大,都不算大数据。
所以大数据的第一点一定是记录数据而不是采集。
第二点,所谓大数据,它的数据本质上是一种行为数据。
过去,无论是媒体行业还是快消品行业,我们在研究受众和消费者的时候,实际上在调研中得到的很多数据都是态度数据。
也就是说,如果你喜欢,一般来说,不喜欢,或者不喜欢这个品牌,它会验证或获取关于一种态度的数据,态度和真实的行为是有区别的,因为从态度到行为,从态度到行为,从人类本身就是两个不同的类别。
在相同态度的支持下,其他环境和情境原因导致不同的行为。
另一方面,作为一个被采访的人,他的动机非常复杂。有时为了伪装,有时为了个性,他会给出一些不符合自己真实意图的答案。
因此,态度数据的真实性和意义是有限的。
就像我们刚才说的大数据,因为它是忠实记录的,你接触过哪些社交媒体,接触过哪些内容,评论过哪些内容,在每个内容单元停留多长时间,在哪个链接跳下,所有数据都是根据您的真实行为记录的。
所以,这种大数据的行为数据,从这个意义上说,大数据更真实,指导意义更有效。
从这个角度来看,大数据并不关心用户对这些数据的基本来源有什么看法,它只关心用户做了什么,或者总是在分析和归因之前基于用户做了什么。得出用户的想法与传统数据有很大不同。
没有大数据的人工智能
接下来,让我们介绍一下大数据和人工智能之间的关系。
应该说,大数据和人工智能是密不可分的,尤其是人工智能更离不开大数据。
你为什么这么说?
这是为了了解人工智能和人类智能之间的区别。应该说,人工智能与人类智能的真正区别,最大的区别在于,人类是四肢和大脑的总和,而人工智能是有大脑的。
简单地说,人类可以通过感官、眼睛、耳朵和手来获取信息,然后通过大脑处理这些信息,输出决策。
而人工智能没有它只有大脑,那么在它没有视觉、触觉、听觉这样的港湾之后,它的决策数据从何而来?
你必须依赖大数据。
我们刚才说了,最新的人工智能是深度学习。深度学习是一个不断优化和反复改进的过程,在这个过程中,它与人类的行为模式是一致的。
人们总是通过感官对外部世界的感知做出决策,然后在做出决策后从外部世界得到反馈,从而优化决策。
人工智能也是如此。它必须基于大量的数据,让机器自主深度学习。机器学习的数据越多,机器就会越智能,越接近人类,人工智能的决策效果就越高。因此,人工智能离不开大数据。
站在这里,我们会看到一个明显的结果,为什么人工智能做出来的好品牌一定是那些产品覆盖面最大的公司。
比如百度、阿里巴巴、腾讯,这就是为什么只有这么大的公司才能把人工智能做好。
只有这样大的企业才能形成大平台,拥有大量用户,大量用户才能获得大量的大数据。拥有大量大数据后,机器的学习效率和学习的迭代过程会更快。数据更加发达。
因此,一句话,人工智能离不开大数据,人工智能必须诞生在互联网大平台之上。
那么第三个问题,人工智能和大数据在新媒体领域是如何应用的。
首先,我们要看到人工智能和大数据的结合。它首先解决了新媒体领域的一个匹配问题。
我们之前说过,社交媒体平台或新媒体对传统媒体的最大根本性颠覆是新媒体平台类型的新媒体,既不从事内容生产,也不从事内容消费。就是让更好的内容找到更好的人,让内容和消费更高效的匹配。
而如何实现更高效的匹配,就必须将内容和用户分开标注。刚才说了,标签是基于大数据反复计算优化的输出结果。
因此,在这个层面上,我们发现人工智能和大数据在新媒体中的第一个应用是提高整个新媒体平台的精准化效率。
内容越来越准确,即用户看到自己想看的内容也越来越简单快捷。对于商业广告来说,广告的准确性越来越高,广告商能够以更高的准确性和速度击中目标用户。.
无论是基于内容的、基于场景的,还是基于用户自身的特点,我们都可以在合适的场景下,将合适的内容和广告推送给合适的用户。
我们说这些匹配是基于人工智能和大数据的。除了匹配之外,第二个主要应用是生产。
这是一个非常大的区别。人工智能和大数据结合形成技术集群后,其实在新媒体时代和传统技术手段下,我们说媒体总是要靠技术进步。
不管是印刷还是*敏*感*词*技术,当然,那个时代的技术只是辅助生产的工具。在人工智能、大数据与新媒体结合的时代,科技本身就成为了生产者。
如何理解?
我们看到,不管是上文提到的新华社合成的AI主播,都变成了内容生产者,还是人工智能写作。大家都知道,人工智能写作现在已经全面进入新闻领域。
比如有些确认的消息,其实是一个5W的在线验证人等等,对吧?比如地震这种典型案例,地震发生时需要的新闻报道,第一要快,第二要准确,对吧?
如果不需要记者借助人工智能采访和写文章,那么几级地震总是在何时何地发生,地震烈度是多少?
这些基本事实就像填空题一样。只要地震局测出数据,人工智能作为作家,马上就能写出手稿。
同时,通过深度学习,人工智能在分析上一份报告后,还可以输出《纽约时报》的写作风格,比如《华盛顿邮报》的写作风格。
所以此时,人工智能已经成为新媒体领域的生产者。此时,它挤占了许多基础新闻报道岗位或内容制作岗位。
我们的创造力
无论是前期的计算人工智能,还是后期的深度学习人工智能,其实与人类相比,人工智能是这两者最大的优势。
第一点是效率,因为它的计算速度非常快,所以效率很高,但第二点更重要。
正是因为它是不知疲倦的,它可以不倦地生产,不带情绪,不休息,所以对于那些需要重复、大量计算、需要高效率和高投入的任务。可以说,人工智能已经基本取代了人类。
但人类智慧有一点是目前人工智能无法替代的,那就是创造力。
我们刚才说了,深度学习是这个时代最先进的人工智能,但在创造力方面还是落后于人类。
例如,如果你想识别猫和狗,一个人类三岁的孩子可能在几次之后就能识别出来。对于具有深度学习能力的人工智能,在观察、检测和识别上万张照片后,才能区分这是一只猫,这是一只狗。
但在下半场,它会很快。在它知道如何区分猫狗之后,即使你给它上亿张猫狗的照片,它也能快速区分和检索它们。这可能是在搜索领域。看过之后就会不知疲倦地学习。
所以这里我们得出一个小结论,人工智能目前非常聪明,但仍然无法替代人类,尤其是在媒体领域,需要高度原创在性领域而创造能力,人类还在上游。
最后让我用图灵测试作为验证。大家都知道,计算机的发明者之一、英国最伟大的数学家、世界上最伟大的科学家之一图灵提出了图灵测试。
也就是说,如果一个研究员和一台人工智能电脑对话,如果30%的工程师都无法判断你对面的人是人还是人工智能,那么人工智能才是真正超越人类的人工智能.
但好消息是,到目前为止,世界上还没有一个 AI 完成了这项测试。
今天就讲到这里,我们下期再见。