今日头条是如何获得1.2亿日活跃用户的呢?
优采云 发布时间: 2021-05-27 21:07今日头条是如何获得1.2亿日活跃用户的呢?
卢克·普赖尔(Luke Pryor)和布拉德·莱特卡普(Brad Lightcap)也为本文做出了特殊贡献。
头条通过机器和深度学习来创建和提供内容,创建了一种具有社交网络交互属性但没有社交关系图痕迹的产品。
今天的头条可能是您从未听说过的最受欢迎的应用程序。这是一种将新闻提要,YouTube和TechMeme结合在一起的产品。在中国,每天有1. 2亿用户使用头条。但是,关于头条的最有趣的事情不是用户在同一平台上消费如此丰富的内容,而是它提供内容的方式。头条不依赖任何明确的指示,社交关系图或用户的产品购买历史,而是使用机器学习和深度学习算法为用户提供个性化和高质量的内容推送。
头条不仅限于向用户展示内容,还通过算法创建内容。在2016年奥运会期间,头条机器人撰写了原创新闻报道,并以比传统媒体更快的速度报道了重大事件。平均而言,由机器人编写的文章的阅读率(读取次数和用户印象数)与人类编写的文章的阅读率类似,但速度较慢且成本较高。
普通用户每天在今日头条上花费的时间超过76分钟,超过了Facebook [1]的平均用户时间,是Snapchat [2]的平均用户时间的两倍多。超过一半的时间是花在观看短片上;加上每天超过100亿次的视频观看,Toutiao已成为中国的YouTube(当然,Toutiao提供的所有其他服务也是如此)。
那么头条怎么办呢?特别是当没有像阿里巴巴,百度和腾讯这样的中国互联网巨头构建*敏*感*词*的消费平台时?作者将使用本文来探讨头条如何每天增加2亿活跃用户。如今,头条的增长并不仅仅归因于任何单一因素,而是归因于产品发布之初做出的众多战术和战略决策的相互作用。具体来说,作者列出了以下五个优点。尽管“流行的应用程序”在美国并不常见,但作者认为,通过分析今天的投票情况获得的收益和启发可以为其他人在构建自己的产品和平台的过程中提供思路。
背景信息-今天的标题是谁?
2012年推出的今日头条,使用机器和深度学习算法过滤掉用户最感兴趣的内容并呈现出来。头条的底层算法通过用户习惯来理解用户,例如点击,滑动,在每篇文章上花费的时间文章,用户阅读新闻的时间段,停留时间,评论,与内容的交互以及地理位置等。时间,它不需要用户的明确指示,也不依赖用户的社交图谱。如今,头条通过数百万个维度来分析每个用户,以便每次用户打开程序时都生成并推送个性化,丰富,高质量的内容。
头条新闻后面的五种看不见的力量1.瞄准空白并抓住机会
对于一家初创公司来说,尽管时间决定一切,但要构建一个高度粘性的应用程序需要不懈的努力。头条发动的时机是偶然的,但发掘这一独特机会的确取得了很好的效果。今天的头条发布是在中国开始使用智能手机的时候:移动互联网的普及率从2010年的几乎空白提高到2014年的65%[3]。
此外,许多大型内容提供商尚未开发移动应用程序或便捷的移动终端访问网站,这意味着针对移动用户的真正优化的信息和娱乐内容稀缺。截至2012年中,中国Android平台上只有六个主要新闻应用程序。其中四个是现有新闻门户的直接扩展,移动优化乏善可陈,另外两个是聚合软件,它们完全依靠缓慢的,非个性化的编辑器输入来确定显示的内容。此外,微信和微博等中国社交媒体软件无法满足中国观众对内容(文章和视频)的需求。微信是一种信息交流工具。到目前为止,它已经形成了一个封闭的社交网络(也就是说,它只能与朋友共享内容并发布Moments)。
今天的头条通过创建一个易于使用,个性化,内容丰富且具有高度粘性的移动用户优先应用程序来填补这一需求空白。从头开始,头条的操作非常简单-用户只需要下载一次软件,就不需要创建帐户,设置密码或将其与社交媒体关联(除非用户是自愿的)或提供个人信息。 。兴趣或偏好。该应用程序的简单设计使其操作非常直观,并且用户不需要任何先验知识或教程。对于任何应用程序而言,推进初始用户交互(从下载到成为日常活动用户(DAU))都是极其困难的一步。在此过程的每一步中,用户可能会因为沮丧,困惑或恼火而失去它们,这在行业中很常见。
今天的头条的名字(用中文来表示当天的主要新闻)及其应用程序的图标对用户非常有吸引力,这促进了用户数量的快速增长。这也是第一个将各种新闻文章汇总到一个地方的APP。从发布开始,头条开始跟踪每个用户的信息-他们的点击,滑动,在每篇文章上花费的时间文章和地理位置等,以为推荐引擎提供支持。作者将在本文后面讨论。头条发布后一个月,它已成为许多用户的个性化新闻聚合软件。该产品是当时同类产品中唯一经过精心设计的产品,自那时以来发展迅速。仅用了四个月的时间就突破了100万个DAU。当互联网用户的移动时间还不足够时,今天的头条提供了一些“打发时间”的功能。发布第一年,头条通过不断的创新,迭代和功能和算法的改进,几乎每周发布一次更新,因此其用户保留率随着时间的推移而不断提高。
在接下来的几年中,移动用户关注度的竞争急剧上升-从2012年到2015年[4],中国的移动APP用户数量在三年内增长了两倍多。而且头条的早期领先优势意味着,当竞争对手涌入时,头条已经占据了重要且非常有价值的领域。
下图显示了两个不同用户的个性化推送:
2.在整个系统上精心打造的数据网络效果
您可以拥有世界上所有的算法,但是如果您没有高粘度的产品,就不会获得数据,没有数据,就没有算法可以演化系统。马特·图尔克(Matt Turck)写了一篇有关数据网络功能的文章文章。简而言之,用户使用您的产品越多,他们贡献的数据就越多。他们贡献的数据越多,您的产品就会变得越聪明。您的产品越聪明(例如,更好的个性化和推荐),就可以为您的用户提供更好的服务,并且用户越有可能回来使用您的产品并贡献更多的数据-这样就形成了良性循环。
通过创建高粘性产品,头条可以从用户生成交互式数据。这些数据已输入到今日的头条算法中,以进一步优化产品质量。最终,该公司计划利用这一良性循环来优化他们所谓的“内容生命周期”的每个阶段:内容生成,内容管理,推荐和交互。
创作:
自书面语言诞生以来,内容创作一直是人类的专有领域,而头条似乎正在改变这一事实。今天,头条启动了一个名为“小明机器人”的人工智能程序,该程序迄今已在该平台上发布了8,000多个报告。小明在2016年奥运会期间首次亮相,在发布重大赛事报道时(比赛结束后约2秒),他的成绩比传统媒体要快。实际上,平均而言,由机器人编写的文章的阅读率(阅读次数和推荐次数)与速度较慢且昂贵的手动写作文章相似。
下面的图片是Xiaoming Robot撰写的文章的屏幕截图,其中报道了Andy Murray和Juan Martin Del Potro在2016年奥运会网球男单决赛中的关系。
要实现此功能,头条必须克服两个主要的技术挑战:
首先,需要数据来撰写有关奥运会结果的故事。头条来自三个方面:1)奥林匹克委员会组织的实时比分更新; 2)从最近收购的照片采集公司获得的图片;在中获得相关的视觉媒体; 3)监视有关事件的实时文本评论。从技术的角度来看,该公司已针对四种体育赛事(机器人,乒乓球,网球,羽毛球和女子足球)进行了机器人报告,这些游戏更易于发布该游戏的报告(乒乓球,网球和羽毛球是“转弯,规则”比其他体育项目更简单。此外,女子足球高质量数据的独家来源使其成为第四次举报。)
第二,头条必须确定这三个来源的数据如何合并,以确保故事的内部一致性和相关性。这比访问和解释数据的第一步更具挑战性。任何选定的图像都需要与事件的结果相关,并且还适合从注释中提取信息。反过来,这需要头条的AI团队将自然语言处理功能与上下文图像识别功能结合起来。他们最终将集成基于语法表达生成的报告模板-用于从实时文本注释中选择相关句子的排序算法,以及图像文本匹配算法。该系统还通过卷积神经网络分析候选图像的内容。通过使用历史数据进行训练,模型可以为报告选择最相关且在视觉上更具吸引力的图片。他们还使用序列到序列的深度学习算法将现有报告汇总为每日新闻摘要,并为文章提供更好的标题建议。该系统使用递归神经网络来计算句子的向量表示,并将这些句子向量进一步馈送到排序模型,从而为每篇文章提取简洁的摘要文章。
通过这些努力,头条在里约热内卢奥运会期间发表了450篇500-1000字的机器人报道,这些内容取得了巨大的成功。这些文章的读取率(读取数除以用户印象数)可与速度较慢且成本较高的手动书写文章相提并论。如今的头条将这项内容的制作能力扩展到了体育赛事报道之外。迄今为止,它已经发表了8000多份报告,并且仍在积极研究以解决剩余的技术问题,以便其作品可以与人类作家相提并论。可比的。
内容审查:
在早期,“软新闻”是当今头条新闻的主要互动驱动力之一,例如名人八卦,流行文化和生活方式文章。这不是偶然的。与通过知名政府控制的新闻机构发布的官方新闻不同,软内容通过大量网站在Internet上发布。简而言之,没有集中的位置来获取这些内容:搜索这些消息的用户需要花费大量时间来访问不同的站点,并且不能保证他们将能够获得最感兴趣的信息。今天的头条新闻改变了这种情况。通过获取,集中和优化信息分发渠道,它可以将用户在内容搜索上的投资时间减少到几乎为零,并提高了用户发现最关注内容的信心。这为用户带来了真正的价值。
内容管理的核心需要解决两个问题:除了向用户提供内容之外,内容管理者还必须找到内容。内容管理员首先需要访问网站,查找信息并采集相关的元数据。其次,有必要不断更新中央信息数据库并创建尽可能多的个性化版本。两者都是过程密集型任务,这时该算法比人类具有明显的优势。当头条诞生时,头条在该领域面临的唯一主要竞争来自人工编辑处理此工作的门户网站网站,头条使用算法使其成为与人编辑比赛中的赢家。显着优势。
该系统以更快的速度处理人工编辑的工作,这直接转化为头条用户的价值。如今,头条可以以更低的成本更快地采集更多内容,在客户价值与内容质量,相关性和刷新率直接相关的行业中形成了巨大的优势。算法的使用还意味着,每个用户都可以基于不断更新的个人信息来获得个性化的兴趣,这是人类编辑没有时间去完成的事情。
Toutiao还使用算法来识别和过滤低质量的内容。内容分发平台分发的内容的质量决定了平台的质量。基于cookie偏好的*敏*感*词*分发cookie裁切器内容(例如报纸和杂志)的时代已经成为过去。在头条世界中,该平台只会向用户推送他们感兴趣的内容。虚假报道和垃圾邮件是媒体行业的主要问题。头条的基本算法使用文本分类算法确定文章文章是否为假新闻,是否为头条新闻或不符合头条的质量标准。在这方面,头条还使用用户主持人来标记为假文章,并聘请手动主持人来仲裁有争议的报告。
推荐:
内容推荐是头条最受好评的功能,也是头条的成功和声誉的重要贡献。在内容生命周期的现阶段,头条使用的机器和深度学习算法拉开了头条与同行之间的距离,并且是促进其用户持续增长和保留的关键。
推荐引擎需要解决的问题很简单:平台可以向每个用户推荐最有可能导致持续交互的100条文章文章?这是一个重要的问题-AI团队已经意识到100个标题是留住用户的“门槛”(长期丢失的用户通常会滑过100个标题后活动显着减少。类似于Facebook的“ 10个朋友”规则)。这也是人类不适合回答的问题:没有人类编辑者可以为应用程序的新用户定期,快速地确定最佳的标题集。
问题可能很简单,但是解决方案却非常复杂。对于每个新用户,头条将结合来自三个关键区域的信号来创建推送内容,以便与用户互动并推动用户突破100个内容的门槛:
接下来,基础算法必须识别用户的*敏*感*词*,个人内容信息和背景信息之间最强的统计匹配,并且必须继续这样做。此匹配项旨在优化用户阅读(点击)的百分比和用户阅读文章的百分比(以在页面上花费的时间来衡量)。当用户首次打开应用程序时,系统会使用*敏*感*词*中的基本数据进行匹配:例如,位于硅谷的用户更有可能点击与该技术相关的文章。该系统还确保显示大量文章以评估用户的好恶,这可以帮助用户发现以前未知的内容并测试其潜在兴趣。随着时间的流逝,随着应用程序继续采集用户信息,这些建议将进一步完善。推荐引擎可以快速学习-对于大多数用户而言,他们可以在不到一天的时间内完全了解他们的兴趣(使用80%的阅读率作为指标)。结果是非常高的用户保留率(> 45%)。这些数据类似于社交网络,是世界上单个用户使用时间最长的应用程序之一。
互动:
随着头条的发展,平台上的交互已越来越成为其用户价值主张的核心。如今,头条不再让用户自己查找相关内容,而是使用基础算法来帮助实现有意义的联系。这在其新开发的问答功能中尤为明显。在这个过程中,AI团队的任务是开发一个匹配引擎,将提问者与可以回答问题的用户联系起来。头条最近在ACL(计算语言学协会)会议上发表了一篇论文,论证了其发展成果。该小组提出的“有条件的,具有*敏*感*词*知识库的神经问题解答方法”在数据集中获得了7 0. 80,000个问题。 k32] 7%的准确率比当前的最新技术(优于内存网络和LTG-CNN方法)高1 1. 8%。
如今,头条的基本算法不仅可以创造更好的用户体验,而且还可以增强公司的竞争力。更具吸引力的内容和更多的交互性意味着用户将在平台上花费更多的时间,并且他们在平台上花费的时间越多,其算法将越先进。系统越智能,内容分发的效果就越好,从而吸引了更多的内容创建者。反过来,这将允许更多的用户进入平台,从而产生巨大的数据网络效应-系统的功能随着系统规模的增长呈指数增长。自成立以来,头条一直不乏竞争对手(尤其是目睹头条成功之后),但是头条的推荐引擎的准确性和有效性使对手难以匹配,从而确保了头条的持续快速增长。
3.从内容聚合到内容目标
各种应用程序都努力从内容聚合转换到内容目标,这并不少见。但是,就品牌和创意策略而言,这是非常具有挑战性的。以下是当今头条新闻的做法。该公司为平台上的内容提供者带来了两个重要的好处。
1)通过收益共享机制提供有力的激励机制,使作者从一开始就可以获得经济利益
2014年,头条启动了一项激励计划,以吸引更多内容创作者加入其平台。这些激励措施包括提供办公空间,工具,最低保证的月收入等,前提是它们达到了特定的关键里程碑(例如,职位数,阅读率等),并通过货币收益共享。头条自2014年以来一直从广告中获利,并允许内容贡献者获得收益分享的机会。
这是头条推出的功能,但是随着公司的发展,头条已转变为更深入的内容生成,消费和连接平台。如今,该平台上已有80万个头条帐户,包括专业媒体组织,博客作者和意见领袖,他们使用该平台与头条用户共享文章,图片和视频。提供更多用户通过微头条分享短文和帖子的服务。结果,今天的头条拥有广泛的内容,从新闻到股票,从技术到社交网络。前20个帐户仅占所提供内容的60%,没有一个内容类别的贡献率超过10%。
以下是用户可以选择的各种内容的示例(屏幕快照仅显示用户可以选择的50多个频道中的40个):
2)与其他平台相比,更大,更相关的受众群体为内容贡献者的品牌形象提升带来了立竿见影的效果。几乎所有内容提供者都在各种平台上创建和分发内容。但是对于许多内容创作者来说,得益于头条的强大推荐引擎,他们可以从平台吸引更多流量。 “ H子电视”就是一个例子,创作者制作了有关中国农村民间生活和习俗的简短视频。他的每个视频平均有700,000位观看者。在他的微信帐户上,观看人数不到头条的1/40。与中国的其他平台相比,“头条”使内容贡献者的长尾巴更加强大。无缝地接触最相关的受众。
4.没有格式限制
头条并未严格遵守其核心格式(例如表格文章,长篇文章和新闻)。当数据表明该平台应扩展到其他内容格式时,头条迅速采取了行动。 2015年,中国大多数视频平台都在关注长视频。头条增加了视频功能,并开始在其平台上支持PGC(专业制作内容)短视频(通常为1-5分钟)。今天的头条新闻注意到,随着互连和基础设施的显着改善,视频内容的供应在2014年显着增加。此外,头条还启动了许多激励计划,以促进其平台上视频内容的创建。从文本到图像再到视频的过渡类似于大多数美国平台上看到的过渡。
从那时起,2016年3月,头条推出了头条视频(现更名为西瓜视频),这是一个独立的PGC短视频应用程序,由与头条相同的算法引擎支持。与文本内容类似,底层算法会根据用户的兴趣图向用户推荐最相关的视频。如今,头条已成为PGC短视频内容的首选平台。头条用户平均每天在该平台上花费76分钟,其中一半以上用于观看短视频,每天的视频观看次数已超过100亿。
5.早期实*敏*感*词*币化和产品匹配
今天的头条在很短的时间内(推出5年后,三年后就实现了盈利)达到了空前的收入规模。令人难以置信的是,该公司无需依靠任何社交图谱或产品购买历史即可实现所有这些目标。的。头条的目标是今年实现收入超过150亿元*敏*感*词*(约合22亿美元),这是互联网历史上增长最快的应用程序之一。
在头条中,元素是模型的核心部分:擅长识别用户想要看到的内容。它的商业模式也完美地利用了这一优势。通过使用专有技术进行内容定位,头条将通过将相关广告与用户进行匹配来产生收入。此举有三个重要的好处:
首先,它可以减少创收时对用户体验的影响,并且实际上可以改善用户体验!通常,用户将广告视为干扰和减少他们的体验的元素,并且很少有与用户偏好匹配的广告。在提供与用户兴趣高度相关的广告时,头条在许多方面都充当了产品发现机制。
第二个是提高头条可以向广告商收取的费用。推式广告的核心问题之一是确定如何有选择地在最有潜力的客户面前放置广告。广告商花费大量时间和金钱来有效地达到目标群体。头条的技术自然可以解决这一定位问题,代表着可以为广告客户节省大量资金的解决方案。
第三,由于今日头条的主要用例是阅读和查看内容,因此用户更容易看到相关和针对性的广告,因此广告主可以使用更多的广告资源。
这三个因素的结合,使头条的点击率(CTR)高于竞争对手。根据第三方调查数据的估算,头条的点击率比同行高200%。
对未来内容发现的影响
头条正逐步达到其最终目标,即从根本上消除搜索的概念,并直接成为超相关聚合内容的提供者。在美国,我们已经看到许多短暂的“内容聚合器”,但是在当时这很可能是一个不成熟的商业想法,而更先进的算法将成为其成功的催化剂。 Facebook和Twitter都是当今美国新闻消费的主要来源。 Google是该领域的另一巨头。 Google在今年7月宣布,它将在其移动应用程序的内容推送中增加对机器学习的使用,以更好地向用户显示与他们最相关,最感兴趣的信息。收录所有类型的信息。内容推送。
特别感谢Toutiao团队,Sharon Pope,Craig Cannon,SonalChokshi,Kat Manalac和Daniel Gross等多次审查初稿并提出建议。
信息披露:作者今天是头条的个人投资者
[1]来源:Facebook 2016年第一季度收益电话会议。