AI同传的责难与正名,科技文明的进步与挑战

image

文丨阑夕

以色列历史学家尤瓦尔·赫拉利认为,语言是人类有别于其他动物拥有智慧之名的「最独特功能」,尽管从小到蚂蚁大到鲸鱼的不同物种都具备独特沟通方式,但唯有人类可以通过语言进行虚构、创作、逻辑、想象乃至沉淀思想,最终推动了心智的进化。

而随着科技文明的前行,语言本身所具备的技能属性逐渐消退,新兴技术推进落地下的机器翻译乃至AI同传正走上舞台中央。

早在2012年,谷歌就曾尝试把翻译系统融入进硬件终端,并为此画下了一个美妙的蓝图,即使用智能手机通话的双方可以各说各的母语,系统将其自动翻译转化为对方的母语,再传输给对方,这宛如科幻电影的一幕令人颇为期待。

可惜受限于彼时技术的不够成熟,这项尝试最终以搁浅收场。而近年来AI技术的快速发展再度为上述机器翻译的理想应用场景带来了曙光——去年谷歌以耳机配件的形式发布内置语言翻译应用的Pixel Buds。

然而,正如科幻小说家亚瑟·克拉克所提出的「克拉克第三定律」所说,「任何非常先进的技术,初看都与魔法无异。」

新兴技术在诞生初期往往要遭遇意料之外的挫折,今年9月下旬,科大讯飞被曝出在今年的创新与新兴产业发展国际会议上用人工翻译冒充AI同传,并在没有征得同传工作人员同意的情况下就冒名使用翻译成果。

尽管科大讯飞第一时间出面,以「从始至终都强调人机耦合——而非AI同传——才是机器翻译的未来」为由做出辩解,但依然挡不住舆论哗然,其股价也在此后的一个月里跌去了近三分之一。

而本身难度系数较大,涉及语音识别、机器翻译、语音合成等多项技术挑战的AI同传也因此陷入了业界责难与质疑的境地,「AI同传是否还有未来」这一辩题也再度被摆在了台面之上。

与科大讯飞的遭遇相映成趣的是,日前,搜狗旗下AI同传技术先后登场亮相本月上旬举办的中国网球公开赛、国际马术大师赛,以中英双语实时字幕帮助到场观众顺畅的了解诸如场地接受、选手采访等一系列信息,为观众们消除了共度体育盛会的语言隔阂,极大的优化了观赛体验。

一个更加直观的例子是,在中国网球公开赛上——亦是亚洲最高级别的综合型网球赛事——丹麦选手沃兹尼亚奇时隔8年再度斩获女单冠军,赛后采访中她面对镜头说出「感谢中网,中网是我最喜欢的赛事之一」时,大屏幕上同步展示了中文字幕,精准高效的翻译水准让所有观众秒懂了她的这句话,也瞬间响起了一片欢呼声。

一言以蔽之,搜狗AI同传在成为国内首个为国际赛事提供机器翻译的同传系统之余,也为「科技让世界无距」这一理念做出了又一次展示。

其实,一直以来,搜狗都以「语言」为核心持续推动AI技术的研发和落地,这一方面体现在其在2012年就已立项人工智能,时至今日已经实现在语音识别、语音合成、人机交互等多方面稳居全球领跑阵营。例如,搜狗语音识别拥有超过98%的识别率、每分钟可输入400字以上的国际领先技术水准。

正如上文所说,AI同传工作不仅要求机器能够流畅的记录、翻译内容,还必须能良好的识别词语和句子的停顿,需要覆盖语音断句、语音识别、文本断句、机器翻译等多个技术维度,以此方能实现稳定高效,媲美乃至超越人工同传的临场表现。

这就决定了AI同传始终面对的都是多项AI技术的挑战,对于优化资源整合,打通技术协作的要求更加严苛。

搜狗也正是这样做的,早在其语音识别系统构建之初就写进了搜索引擎的产品底层,每天4亿次语音请求的请求、33万小时的语料构成了机器学习的最佳教材,这最终融入了搜狗的硬件层面——诸如搜狗旅行翻译宝等硬件产品的推出也坐实了搜狗领先的技术落地能力。

而在难度系数更大的AI同传方面,搜狗在技术上的表现并不稍弱于谷歌等科技巨头。例如与谷歌GNMT的八层结构相比,搜狗同传的神经网络精简为五层,提高了自然语言处理和深度学习的效率。

来源:阑夕 微信号:techread

未经允许不得转载:博海拾贝 » AI同传的责难与正名,科技文明的进步与挑战