关键词自动采集生成内容系统( 接下来|京东智联云开发者:AI技术是如何对电商领域进行赋能的? )

优采云 发布时间: 2021-12-14 11:06

  关键词自动采集生成内容系统(

接下来|京东智联云开发者:AI技术是如何对电商领域进行赋能的?

)

  

  

  来源 | 京东智联云开发者

  在过去的几十年里,人类的计算能力得到了极大的提升;随着数据的不断积累和算法的越来越先进,我们已经进入了人工智能时代。的确,人工智能的概念很难理解,技术更是可圈可点。其背后的数据和算法庞大而复杂。很多人想知道,人工智能现在或未来会有哪些实际应用?

  事实上,人工智能的实际应用及其带来的商业价值并没有那么“幻想”,很多时候它已经在我们身边。接下来,【AI论文解读】栏目将对相关AI论文进行深度解读,讲解AI技术如何赋能电商领域,以及相关的实现与实践。

  人工智能技术在电子商务领域有着丰富的应用场景。应用场景是数据录入,通过技术对数据进行细化,进而作用于技术,两者相辅相成。

  京东基于自然语言理解和知识图谱技术,开发了产品营销内容的AI写作服务。并将这项技术应用到京东商城【找货】渠道。

  通过人工智能创建的数十万种产品营销图文资料,不仅填补了专家编写的产品更新和内容更新之间的巨大空白,还增强了内容渠道的内容丰富度。

  同时,人工智能生成的内容在曝光点击率和传入业务的详细转化率方面实际上优于手动创建的内容。

  接下来,让我们来看看如何通过AI针对不同的群体采用不同的营销策略和不同风格的营销文案来提高营销转化率。

  与传统的文本摘要任务相比,商品摘要任务更具挑战性。一方面,客户对产品的第一印象来自产品的外观,它对客户的购买决定有着至关重要的影响。因此,产品摘要系统必须能够充分挖掘产品的视觉信息,体现产品的外观特征。另一方面,不同的产品有不同的卖点。例如,紧凑型冰箱具有节省空间的优点,而环保型冰箱具有节能的优点。因此,产品摘要应反映产品最独特的方面,从而最大限度地吸引消费者的购买。

  接下来,本文将介绍京东人工智能研究院提出的电商产品多模态汇总模型。该模型可以有效地整合产品的视觉和文本信息,生成突出、流畅、简洁的产品文本摘要。

  论文题目:Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products,发表于AAAI 2020。

  

  论文链接:

  

  多模态汇总模型

  如下图1所示,产品广告收录大量文字。客户很难在短时间内获得这些广告中有价值的产品信息。尤其是当客户要比较多个产品时,会花费很多时间。影响购物体验。产品摘要模型可以为产品生成文本摘要,为潜在消费者在短时间内了解产品提供便利。从消费者决策的角度来看,一个好的产品总结需要体现产品的外观特征和卖点。这也是本文提出的产品汇总模型的出发点。

  

  图1

  论文提出了一种基于产品要素的多模态产品汇总方法。如图 1 所示,该模型将产品图片、产品标题和其他产品描述作为输入来生成产品文本摘要。该模型不仅可以有效整合产品的视觉和文字信息,还可以从产品元素入手,使生成的产品摘要尽可能收录产品的特征元素,提高产品的流畅性和简洁性概括。

  论文构建了一个中文产品摘要数据集,收录约140万个“产品-摘要”对,涵盖家电、服装、箱包三大类。在该数据集上的实验结果表明,本文提出的模型在自动评价和人工评价指标上均明显优于其他比较方法。

  

  型号介绍

  如图2所示,论文中提出的产品汇总模型基于一个指针-*敏*感*词*网络(Pointer-Generator)。采用三种策略将产品图像信息集成到模型中,包括用产品图像的全局特征初始化编码器,用产品图像的全局特征初始化*敏*感*词*,以及利用产品图像的局部特征生成图像上下文向量通过注意力机制参与解码。

  

  图2

  首先对产品元素进行建模(所谓产品元素就是产品不同方面的属性。例如:对于洗衣机,产品元素包括容量和能耗等),然后从产品对建模的重要性、非冗余性和可读性的总结。

  (1) 使用基于产品元素的 RAML(奖励增强最大似然)训练,鼓励模型生成的摘要覆盖产品的特征元素。如图 2(b) 所示,ground-truth产品的特征元素是容量、控制和电机,该模型将鼓励生成描述容量和控制与电机相关的文本;

  (2) 一种基于商品元素的覆盖机制来消除冗余信息。传统的覆盖机制只能在词维度去冗余,很难处理相关词的冗余。如图2 (c)、“噪音”、“安静”、“宁静”都描述了“运转声”的商品元素,如果只把“噪音”去冗余,很难保证“安静”和“宁静”做到本文提出通过商品元素维度的去冗余化,可以避免“噪音”、“安静”、“宁静”同时出现在摘要中的模型;

  (3)通过产品元素的返回来提高摘要的可读性。如图2(d)所示,产品元素的返回描述降低了产品摘要的连续性,影响了消费者的阅读体验提出的模型本文通过在解码时禁用跳回元素词有效地避免了这种现象。

  

  实验结果

  如表1所示,本文提出的多模态产品摘要模型,MMPG模型取得了优于所有基于纯文本的模型的效果,证明了产品视觉信息和产品元素信息在产品摘要任务中一个重要的角色。

  

  表格1

  

  总结

  论文提出了一种多模态的产品摘要模型,可以使用产品图片、标题等文字介绍来生成产品摘要。文章提出的模型能够有效利用产品的视觉信息,反映产品的特征元素,从重要性、非冗余性和可读性的角度对产品元素进行有效建模。

  对于电子商务来说,海量产品的营销内容在提供海量产品内容的过程中,受限于专家的写作效率。产品更新速度明显高于营销内容上线速度,导致内容短缺。

  

  AI生成的内容,在生成效率、曝光点击率、订单转化率等方面,其实都比人工创建的内容要好。这种方式正在应用到垂直电商、综合电商、社交电商、新媒体平台等诸多场景中。

  【end】

◆精彩推荐◆

「AI应用技术大师课」是CSDN发起的“百万人学AI”倡议下的重要组成部分,4月份AI大师课以线上技术峰会的形式推出,来自微软、硅谷TigerGraph、北邮等产学界大咖就图计算+机器学习,语音技术、新基建+AI、AI+医疗等主题展开分享,扫描下方二维码免费报名,限时再送299元「2020AI开发者万人大会」门票一张。

  推荐阅读

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线