
芯科技消息(文/Allis),根据《VentureBeat 》报导,IBM 与哈佛合作,共同发表了一款除错工具,不只能让工程师看见AI 在转换两种语言时所做的决定,还能让使用者直接更正AI 模型的错误。
最近几年,由于深度学习以及神经网络发展迅速,机器翻译的技术大幅进步。然而,虽然得利于神经网络的功用,人类却不知道其内部运行过程,因此在发生状况时很难排除错误,去年脸书的自动翻译误将阿拉伯语当成希伯来文,将原意为「早安」翻译为「攻击他们」便是最明显的例子。神经网络未解的运算模式被视为黑盒问题,是AI 产业中数一数二的难题,尤其是随着深度学习的使用范围加广后,问题显得日益严重。为了解决此问题,IBM 的研究人员和哈佛大学共同开发了一款名为Seq2Seeq-Vis 的除错工具,并在上周的视觉分析科学技术研讨会中发表,该研讨会由电机电子工程师学会(IEEE) 在柏林举办。Seq2Seq-Vis 使用了序列对序列的模型,目前大多数的翻译工具都使用了此类的模型。IBM 实验的研究人员Hendrik Strobelt 说,此种模型非常强大,可以学习如何在两种语言间转换任意长度的序列。并表示除了翻译语言以外,该模型也能够运用于问答系统、长文摘要、图像标注等领域,是非常先进的技术。Seq2Seq-Vis 并非第一个为了了解AI 所做的决策而建造出来的模型,对于AI 产业来说,解决黑盒子问题十分重要,也引发了学术界、大型科技公司、国防高等研究计划署的关注。
Seq2Seq-Vis 需要取得AI 模型的详细资料才能够为其除错,而其他功能相似的模型只需要神经网络的输出就能解释该AI 模型的决策。然而,大部分的模型只能做到为AI 模型解释,Seq2seq-Vis 却能让使用者直接更正AI 模型的错误。举例来说,使用者可以在输出序列中选取或更改文字,或是重新配置AI 模型中输入输出的配置。另外,由于Seq2Seq-Vis 是针对建造AI 模型的工程师及训练者所设计的工具,因此,若想使用Seq2Seq-Vis ,必须具备序列对序列模型的基本知识。
至于目前有谁对Seq2Seq-Vis 感兴趣?Stobelt 表示,目前IBM 计划先在公司内部使用,但由于他们使用的编码皆为开放原始码,因此他们相信有许多公司会对这项工具产生兴趣。(校对/Oliver)
暂无评论哦,快来评论一下吧!
