搜索引擎优化论文(美团技术团队共有7篇论文被ACL2021接收(组图))
优采云 发布时间: 2022-01-02 07:20搜索引擎优化论文(美团技术团队共有7篇论文被ACL2021接收(组图))
ACL 是计算语言学和自然语言处理领域最重要的顶级国际会议。根据谷歌学术计算语言学发表指数,ACL影响力排名第一,是CCF-A推荐会议。美团技术团队共有 7 篇论文(包括 6 篇长论文和 1 篇短论文)被 ACL 2021 接收。 这些论文被美团技术团队用于事件提取、实体识别、意图识别、新槽发现和无监督句子表示 在语义分析、文档检索等自然语言处理任务中的一些前沿探索和应用。
计算语言学协会年会(ACL 2021) 将于2021年8月1-6日在泰国曼谷召开(虚拟在线会议)。ACL是计算语言学和自然语言处理 本次会议由国际计算语言学协会主办,每年举办一次,根据谷歌学术计算语言学指数,ACL影响力排名第一,是CCF-A推荐会议,今年ACL的主题是“NLP for Social Good”。据官方统计,本次会议共收到3350篇有效投稿,共710篇主要会议论文(接受率21.3%),493篇发现论文(接受率为1< @4.9%)。
美团技术团队共有 7 篇论文(包括 6 篇长论文和 1 篇短论文)被 ACL 2021 接收。这些论文是美团的事件抽取、实体识别、意图识别、新槽发现、无监督句子的一些技术沉淀以及在表征、语义分析、文档检索等自然语言处理任务中的应用。
对于事件提取,我们显式地使用周围实体的语义级参数角色信息,并提出双向实体级*敏*感*词*(BERD)来逐步为每个实体生成参数角色序列;对于实体识别,我们首先提出了槽间移动性的概念,为此我们提出了槽间移动性的计算方法。通过比较目标槽和源任务槽的移动性,我们可以找到不同目标槽对应的解决方案。源任务槽就是它的源槽,仅根据这些源槽的训练数据为目标槽构建槽填充模型;对于意图识别,我们提出了一种基于监督对比学习的意图特征学习方法,通过最大化类间距离和最小化类内方差来提高意图之间的区分度;对于新槽发现,我们首次定义了新槽识别(Novel Slot Detection,NSD)任务,区别于传统槽识别任务。新槽识别任务试图基于域中现有槽标记数据在真实对话数据中发现新槽,从而不断改进和增强对话系统的能力。
另外,为了解决BERT原生句子表示的“崩溃”现象,我们提出了一种基于对比学习的句子表示迁移方法——ConSERT,它在目标字段的无监督语料上使用Fine-Tune使模型生成的句子表示更兼容下游任务的数据分布。我们还提出了一种新的无监督语义分析方法——同步语义解码(SSD),它可以结合释义和语法约束解码,同时解决语义差距和结构差距。我们也从改进文档的编码入手,提高文档编码的语义表示能力,不仅提高了效果,还提高了检索效率。
接下来,我们将对这7篇学术论文进行更详细的介绍,希望对从事相关研究的同学有所帮助或启发,欢迎大家在文末评论区留言交流一起。
01 通过双向实体级循环*敏*感*词*捕获事件参数交互
|论文下载|论文作者:奚翔宇、叶伟(北京大学)、张彤(北京大学)、张世坤(北京大学)、王全秀(RICHAI)、姜慧兴、武威|论文类型:主会议长论文(口头)
事件提取是信息提取领域中一项重要且具有挑战性的任务。它在自动摘要、自动问答、信息检索、知识图谱构建等领域有着广泛的应用,旨在从非结构化文本事件信息中提取结构。事件自变量提取提取特定事件的描述信息(称为自变量信息),包括事件参与者、事件属性等信息。这是事件提取中一项重要且极其困难的任务。大多数参数提取方法通常将参数提取建模为实体和相关事件的参数角色分类任务,对句子中实体集中的每个实体进行单独训练和测试,忽略候选参数之间的潜在交互关系;而部分使用参数交换信息的方法没有充分利用周围实体的语义级参数角色信息,同时忽略了特定事件中的多参数分布模式。
<p>针对当前事件参数检测存在的问题,本文提出显式使用周围实体的参数角色信息的语义级别。为此,本文首先将参数检测建模为实体级解码问题。给定一个句子和已知事件,参数检测模型需要生成参数角色序列;同时,它不同于传统的词级 Seq2Seq 模型。本文提出了一个双向实体级*敏*感*词*(BERD),用于逐步为每个实体生成一系列参数角色。具体来说,本文设计了一个可以同时使用当前实例信息和周围参数信息的实体级解码循环单元;并且还使用了前向和后向*敏*感*词*,可以分别从左到右和从右到左移动。预测当前实体,并在单向解码过程中使用左侧/右侧的参数信息;最后,本文在双向解码后,使用分类器结合双向编码器的特征进行最终的Prediction,从而可以同时使用左右两边的argument信息。