seq搜索引擎优化至少包括那几步?( IEEE-Vis可视化分析大会:AI黑盒问题的调试工具)
优采云 发布时间: 2022-02-01 07:15seq搜索引擎优化至少包括那几步?(
IEEE-Vis可视化分析大会:AI黑盒问题的调试工具)
作者 | 本·迪克森
翻译 | 刘旭坤
编辑 | 简
出品 | 人工智能技术大本营
近年来,随着深度学习和神经网络技术的发展,机器翻译也取得了长足的进步。神经网络结构越来越复杂,但我们仍然无法解释里面到底是怎么回事,“黑匣子问题”一直困扰着我们。我们不知道程序在翻译过程中是如何做出决定的,因此很难纠正翻译错误。随着深度学习在各行各业的广泛应用,深度学习的莫名性成为其面临的严峻挑战之一。
今年,在德国柏林举行的 IEEE VAST 视觉分析大会上,来自 IBM 和哈佛大学的研究人员展示了一种调试工具,旨在解决翻译中的 AI 黑盒问题。该工具名为 Seq2Seq-Vis,将人工智能的翻译过程可视化,让开发人员更容易调试模型。
Seq2Seq-Vis 针对机器翻译中最常用的 Seq2Seq 模型。该模型能够将任意长度的序列(即原创文本的句子)映射到目标语言。除了机器翻译任务,Seq2Seq 模型还主要用于自动问答和文本摘要等任务。
简单来说,机器翻译中 Seq2Seq 模型的工作原理就是将源语言映射到目标语言,得到目标语言的序列(即初步翻译的句子),然后对其进行优化以保证正确的语法和语义。虽然使用神经网络模型后机器翻译的结果有了很大的提升,但也非常复杂。
可视化机器翻译的过程
研究人员表示,开发 Seq2Seq-Vis 的初衷是为了拥有一个类似于传统基于规则的翻译软件中的规则表,以便开发人员可以通过比较规则表中的错误信息轻松修改模型。
Seq2Seq-Vis.io 网站 提供了从德语到英语的演示程序。德语“die längsten reisen fangen an , wenn es auf den straßen dunkel wird”。应该翻译成英语为“最长的旅程始于街道上天黑时开始。”但机器翻译为“最长的旅程始于街道上。” Seq2Seq-Vis 可视化序列到序列模型翻译的每一步,以便用户可以查找规则表以找出 MT 翻译错误的原因。
Seq2Seq-Vis的另一个有用的特性是它可以找到与某个词相关的训练集,这也是解决AI黑盒问题的一大难点。事实上,机器学习模型除了训练集之外什么都不知道,所以为了解决机器翻译中的错误,它最终会回到训练集。
通过可视化机器翻译过程,用户可以判断翻译错误是由于编码器和*敏*感*词*使用的训练样本的错误,还是注意力模型的设置或其他方面的错误。
更正的序列到序列模型
Seq2Seq-Vis 并不是第一个尝试解决 AI 黑盒问题的工具。很多大公司和研究机构之前都尝试过,甚至IBM自己也在努力。事实上,许多类似的工具比 Seq2Seq-Vis 需要的信息更少。例如,有些工具只需要神经网络的输出,而 Seq2Seq-Vis 还需要整个模型的训练集、架构和设置。但 Seq2Seq-Vis 是第一个既可以可视化模型的决策过程又允许开发人员直接修改模型的工具。开发者可以通过直观地修改模型的决策过程和观察反馈来实现探索性调试,例如修改输出序列中的单词或者修改注意力模型的配置。
听起来很酷,但 Seq2Seq-Vis 的目标用户是模型架构师或工程师,而不是机器翻译的最终用户。因为要让这个工具真正发挥作用,需要用户对“sequence-to-sequence”模型有比较深刻的理解。目标工具虽然只用在IBM内部项目中,但是是开源的,大家可以试试。