关键词自动采集生成内容系统-无需任何打理( 京东发现好货频道通过AI创作的数十万商品营销图文素材 )
优采云 发布时间: 2021-10-19 10:12京东发现好货频道通过AI创作的数十万商品营销图文素材
)
来源 | 京东智联云开发者
介绍:
在过去的几十年里,人类的计算能力得到了极大的提升;随着数据的不断积累和算法的不断进步,我们已经进入了人工智能时代。的确,人工智能的概念很难理解,技术更是可圈可点。其背后的数据和算法庞大而复杂。很多人想知道,人工智能现在或未来会有哪些实际应用?
事实上,人工智能的实际应用及其带来的商业价值并没有那么“幻想”,很多时候它已经在我们身边。接下来,【AI论文解读】专栏将深入解读AI相关论文并揭秘,AI技术如何赋能电商领域,以及相关实施与实践。
人工智能技术在电子商务领域有着丰富的应用场景。应用场景是数据录入,通过技术对数据进行细化,进而作用于技术,两者相辅相成。
京东基于自然语言理解和知识图谱技术,开发了产品营销内容的AI写作服务。并将这项技术应用到京东商城【找货】的渠道中。
京东【找货】渠道
通过人工智能创建的数十万种产品营销图文资料,不仅填补了专家编写的产品更新与内容更新之间的巨大空白,还提升了内容渠道的内容丰富度。
同时,人工智能生成的内容在曝光点击率和传入业务的详细转化率方面实际上优于手动创建的内容。
接下来,让我看看AAAI 2020入选的论文,看看如何利用AI来实现针对不同群体的不同营销策略和不同风格的营销文案,以提高营销转化率。
自动文本摘要(简称“自动摘要”)是自然语言处理领域的一项传统任务,于 1950 年代提出。自动摘要任务的目标是获得收录给定文本最重要信息的简化文本。常用的自动摘要方法包括Extractive Summarization和Abstractive Summarization。抽取式自动摘要通过抽取给定文本中现有的关键词、短语或句子形成摘要;生成自动摘要创建给定文本的抽象语义表示,并使用自然语言生成技术生成摘要。
本文介绍了一种基于关键词指导的生成句摘要方法。该方法结合了抽取式自动摘要和生成式自动摘要。与Gigaword句子摘要数据集上的对比模型相比,它取得了更好的Performance。
论文链接:
生成句摘要
Abstractive Sentence Summarization 任务的输入是长句,输出是输入句的简化短句。
我们注意到输入句中的一些重要词(即关键词)为摘要的生成提供了指导线索。另一方面,人们在为输入句创建摘要时,往往会先找到输入句中的关键词,然后组织语言将这些关键词串联起来。最终生成的内容不仅会覆盖这些关键词,还要保证其流畅性和语法正确性。我们认为,相对于纯抽取式自动摘要和生成式自动摘要,基于关键词指导的生成式自动摘要更贴近人们在创建摘要时的习惯。
图1:输入句与参考摘要关键词(红色标记)的重叠部分覆盖了输入句的重要信息。我们可以根据从输入句子中提取的关键词生成摘要
让我们举一个简单的句子摘要示例。如图1所示,我们可以粗略地将输入句子和参考摘要之间的重叠词(停用词除外)作为关键词。这些重叠的词涵盖了输入句子的要点。比如通过关键词“世界领袖”、“关闭”和“切尔诺贝利”,我们可以得到输入句的主要信息,即“世界领袖呼吁关闭切尔诺贝利”,这与《世界*敏*感*词*敦促支持切尔诺贝利核电站停工计划》的实际参考摘要一致。这种现象在句子摘要任务中很常见:在 Gigaword 句子摘要数据集中,参考摘要中超过一半的词会出现在输入句子中。
型号概览
句子摘要任务的输入是一个长句,输出是一个短文本摘要。我们的动机是输入文本中的 关键词 可以为自动摘要系统提供重要的指导信息。首先,我们将输入文本和参考摘要之间的重叠词(停用词除外)作为 Ground-Truth关键词,通过多任务学习,共享同一个编码器对输入文本进行编码,训练关键词提取模型和摘要生成模型。关键词提取模型是基于编码器隐藏状态的序列标注模型,摘要生成模型是由关键词引导的端到端模型。在关键词抽取模型和摘要生成模型训练并收敛后,我们使用训练好的关键词 提取模型提取训练集关键词中的文本,并使用提取的关键词对摘要生成模型进行微调。测试时,我们首先使用关键词抽取模型从测试集中的文本中抽取关键词,最后使用抽取的关键词和原创测试文本生成摘要。
1、多任务学习
文本摘要任务在某种意义上与关键词提取任务非常相似,都是为了提取输入文本中的关键信息。区别在于输出格式:文本摘要任务的输出是完整的文本,而关键词提取任务的输出是关键词的集合。我们认为这两项任务都需要编码器能够识别输入文本中的重要信息。因此,我们使用多任务学习框架来共享这两个任务编码器,以提高编码器的性能。
2、基于关键词指导的摘要生成模型
受到 Zhou 等人工作的启发。[1],我们提出了一种基于关键词指导的选择性编码。具体来说,由于关键词收录更重要的信息,通过关键词的引导,我们构建了一个选择门网络,对输入文本的隐藏语义信息进行二次编码以构建一个新的隐藏层。基于这个新的隐藏层执行后续解码。
<p>我们的*敏*感*词*基于指针*敏*感*词*网络 [2],这是一个收录复制机制的端到端模型。对于 Generator 模块,我们提出了直接连接、门融合和分层融合的方法来融合原创输入文本和 关键词 的上下文信息;对于 Pointer 模块,我们的模型可以有选择地将原创输入与