Netflix在互联网时代的成功,是一件非常值得回味的事

优采云 发布时间: 2021-05-24 23:11

  

Netflix在互联网时代的成功,是一件非常值得回味的事

  

  Netflix在互联网时代的成功是一件令人难忘的事情。

  作为一家起初为租赁公司的公司,它已借助流媒体平台在世界科学和技术领域获得了普遍认可,该平台不是非常先进的公司功能,甚至可以与巨头竞争。显然,Netflix不仅在内容和品牌方面做得正确。

  例如,具有长期使用Netflix经验的朋友(尽管目前在中国有点困难)肯定会给Netflix的个性化推荐系统留下深刻的印象。实际上,Netflix在内容推荐方面的技术实力和效率已得到业界的广泛认可

  根据Netflix提供的官方数据,使用个性化推荐系统后,其平台用户的观看率提高了3到4倍,基于个性化推荐系统打开的视频数量是该推荐系统的4倍。从最受欢迎的列表中打开的数字。

  在过去的两年中,“千面人”和“内容寻找人”在中国也是非常热门的话题。但是很少有人分析内容推荐系统的内部逻辑,以及哪些因素需要更好的内容推荐系统。

  在Netflix上发布了最近备受期待的漫威电视剧“卫士联盟”之后,Netflix正式展示了他们基于该电视剧的内容推荐尝试和数据实验。以此为契机,我们或许可以瞥见“别人家的推荐引擎”。

  在理解内容的同时理解算法

  “捍卫者联盟”之所以特别与众不同,是因为,就像“*敏*感*词*者联盟”(许多联盟)一样,它是由几个具有独立情节的超级英雄组成的“混合戏剧”。

  对于Netflix而言,该节目的价值在于以下事实:这四个英雄都有自己的观众(《铁拳》不应该有中国观众),以及综合的性格和故事能否涵盖各自人口的总和,或者应该推向新的人群吗?

  

  (四个独立英雄观众的观看偏好和关键词标签不同)

  针对此问题,Netflix将“捍卫者联盟”作为测试领域。他们将密切关注本次展会的数据趋势,并针对具有不同身份的用户实施不同的推荐策略。测试的结果将形成一种新的机制,以确定如何向不同的兴趣小组提供有关“混合戏剧”的建议。同时,它还可以用于根据反馈确定将来是否制作更多具有不同角色的组合戏剧。

  与国内主流内容推荐引擎(无论是信息,短视频还是视频)相比,Netflix通常以用户为中心,并基于用户浏览,采集,付款和其他行为构建个性化推荐系统,向我们展示了另一种可能性:关注内容特征,分析可以向谁推荐不同的内容,如何推荐甚至调整内容。 “了解更多内容的个性化推荐”不仅基于对内容文本特征的掌握,更重要的是,技术能力足以支持这种创造力。

  否则,匹配用户和内容之间双向交互的推荐机制将是一项工作量巨大,错误率高的任务。所以问题是,Netflix推荐系统背后是什么样的技术系统?

  好的表演的基础是足够大的舞台

  简单地说,Netflix的个性化内容推荐机制的功能是在确保用户流畅使用的前提下不遗余力地装备越来越复杂的算法组合。

  我们稍后将讨论具体算法。需要明确的第一个问题是Netflix内容推荐系统的基础是什么。

  假设我们相信,更多的算法和技术可以带来更多的聪明的计算和结果,并且相互制约以得出合理的结论。然后,该平台的首要任务是确保计算能力能够承受复杂算法和数据挖掘技术的运行,并确保该平台将来可以快速,轻松地加入越来越多的算法。

  然后,第一个问题是计算能力的保证。我们知道,人工智能的多种算法需要极高的计算能力,而传统的CPU +服务器模型在成本方面难以满足复杂AI系统的操作。

  Netflix是最早尝试使用GPU在AWS上实现分布式神经网络的公司之一。尽管这种组合如今已逐渐成为一种标准配置,但几年前作为平台支持在大型集群中使用GPU代替CPU是一项开创性的举动。

  这不仅确保了计算能力的稳定性,而且为在平台上使用更多人工智能提供了机会。此外,Netflix率先将大量计算任务移交给云,并在AWS上执行分布式计算以确保高计算效率。

  此外,我们可以注意到Netflix在执行内容推荐计算时使用了三种计算方法的组合:在线计算,离线计算和近乎在线计算。

  分工的原因是要确保计算复杂性和计算效率的稳定性和统一性。其中,在线计算用于响应必须立即完成的交互行为,以确保实时响应用户指令。由于离线计算没有时间限制,因此可以在计算平台上完成更复杂的算法操作和更大的数据量处理。这种计算的工作方式是系统从用户那里采集数据,然后返回到后端进行计算分析,然后通过后续交互将其表达在内容推荐上。

  两者之间接近在线计算。这种计算所承担的任务可能会延迟,但也需要快速分析。分离数据和任务,以及对学习和计算进行分类是Netflix确保在计算能力和用户体验之间取得平衡的关键。但是这种模式并不容易。关键是要拥有精确和个性化的架构,将三种计算模式无缝结合,并以统一的方式规划在线和离线计算过程。

  

  (Netflix内容推荐系统的框架图,您可以看到整个计算分为三种计算方法,并且主要组件包括各种机器学习算法)

  在满足操作要求的同时,系统架构还需要确保灵活的访问功能。由于可以随时添加新算法,因此该体系结构必须确保即插即用并且可以在原创基础上进行开发。

  根据Netflix平台的运行经验,使用人工智能实现精确和个性化服务的前提是确保平台的计算能力能够满足复杂算法的执行,处理大量数据以及体系结构具有高度的兼容性。

  特别重要的一点是必须控制算法的部署成本和效率指标。

  Netflix绝不是为了技术而忽略成本的公司。例如,深度学习仅占其体系结构的一小部分。核心原因不是深度学习算法不是有效的,而是因为深度学习将占用大量的计算能力。而且成本很高。

  在足够大的舞台上,人工智能可以四处走动并聪明地执行。从多次发布的Netflix内容推荐系统来看,他们很高兴使用AI算法来构建迷宫。

  算法迷宫

  用于高端内容平台的推荐引擎不容易实现,因为在确保准确性的同时,必须实时更改外部内容和用户数据,以确保获得最大的推荐结果。

  Netflix认为,与专注于数据的搜索引擎相比,推荐引擎着重于知识的理解和应用,这大大增加了对推荐引擎算法的需求。由于既要满足用户肖像模型的准确性,又要为各种内容安排机制提供决策计算结果。

  这需要在需求分析,技术选择和推荐算法质量之间达到有效的平衡。 Netflix解决方案是将多种算法和多终端操作相结合。

  仅Netflix个性推荐系统中使用的机器学习算法包括线性回归,逻辑回归,弹性网和SVD(奇异值分解)。 ),(受限玻尔兹曼机),马尔可夫链,LDA(潜在狄利克雷分配),关联规则(关联规则),GBDT(梯度增强决策树),随机森林,矩阵分解(矩阵分解),并且列表在不断增加。

  我不讨论每种算法带给内容推荐的具体价值,但我想说明两点:没有一种算法可以解决所有问题,结合才是硬道理;算法模型之间结果的相互控制是为了确保Netflix推荐高质量的秘密。

  总结Netflix对于诸如机器学习之类的AI算法的态度,可以分为三点:

  1.仍然对新算法敏感和饥渴,并对现有算法创新保持乐观。

  2.愿意在多个产品特征树上使用算法矩阵。

  3.严格的算法测试。

  

  (Netflix测试内容推荐算法的结构逻辑)

  当然,Netflix的推荐引擎绝不是完美的,而且经常出现各种错误,但是其推荐引擎构建的整个故事值得考虑。

  在除特定技术之外的产品战略层面上,Netflix给AI产品带来的启示是“拥有AI”和“拥有非常有用的AI”实际上是两件事。

  大量的硬件部署,计算支持,框架开发,算法创新,应用程序测试以及对整个系统的严格检查都是巨大的投资成本。尽管AI可以解决问题,但在当前情况下它无法解决“非常便宜”的问题。如果您真的想参与AI,那么您必须对成本和投资有正确的了解。

  对于内容推荐引擎,“根据您刚刚单击的关键词进行推荐”和“根据您进行推荐”是两回事。

  好吧,现在我要复习“*敏*感*词*者”,等待“蜘蛛侠”并重温“惩罚者”的消息-我希望这些人可以减慢“捍卫者”的打击和伤害带给我.....

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线