×
嵌入式 > 技术百科 > 详情

借助深度神经网络,微软让自己研发的AI翻译出来的新闻文本已经媲美人类译员的水平

发布时间:2020-06-16 发布时间:
|

相比下棋下赢人类,AI能听懂人话、看懂人写的文字意义明显重要太多,当AI能把握人类说话意思的时候,人们肯定会驱使通晓各国语言的它去尝试挑战打破自然语言间的隔阂。继通过语音识别测试和机器阅读测试之后,微软成功让自己研发的AI又通过了机器翻译测试newstest2017,经双语语言顾问评估,翻译出来的新闻文本已经媲美人类译员的水平。

(微软技术院士黄学东先生,负责微软语音、自然语言和机器翻译工作)

懂得自然语言翻译的人都很清楚,翻译是没有标准答案的,表达同一个句子的“正确方法”不止一种,信达雅原则很大程度上受人主观因素影响。能让机器翻译和人工媲美,其中关键相信很多人都猜到了——微软所借助的技术是深度神经网络而非传统的统计式机翻。

在此处,对偶学习和推敲网络等AI新研究成果发挥了大作用,如一条中文新闻里的句子,让它把英文翻译结果再译回中文,然后与中文原文比对,从比对结果里总结反馈,修正机器翻译模型;推敲网络则是模仿人类撰写文字时的反复推敲修改过程,通过多轮翻译,检查和完善结果,从而使译文的质量得到大幅提升。

另外,微软的AI机翻模型里还加入了联合训练和一致性规范,联合训练的具体做法是把翻译的句子作为反向翻译的训练数据,一致性规范则要求机翻系统不论从左到右还是从右到左进行翻译,最终生成的翻译结果都应一致。

如果你很好奇它究竟能翻得多好,可以去亲自调戏一下微软的机翻AI。不过要先提醒的是,微软机翻AI所通过的测试是新闻内容的翻译:不带感情,客观陈述事实的翻译。一旦把不确定性极高的人类情感也掺杂在语言中的话,对AI来说翻译难度会提升n个维度,而且更不用提网络发达之后所产生的各种网络体句式和非正规用法,要让AI也学会人类操作模因(meme)的方式,目前看来是没什么可能性的。

但是微软这次通过newstest2017的意义仍然非凡,就如前面所说,翻译没有标准答案,让AI能接受和掌握这种有多个答案的工作方式,比在海量的选择之中暴力运算筛选出最优解来说强多了。如此的AI,肯定会拥有更广阔的应用空间。


『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
德州仪器推出稳压误差仅为1%的无电容LDO产品