Esther| 撰文
《圣经》的创世纪11章曾提到,在创世纪初说着同样口音和语言的人类在大洪水过后,向东迁移到了古巴比伦附近的示拿地。他们齐心协力,要在此地建造一座塔顶通天的巴别(也有变乱的意思)塔,耶和华降临后见此情形,便将其分散在世界各地,还打乱了他们的语言。
如果人类过去真的都说同一种语言,那么AI的诞生,又是否能打破人与人之间的语言障碍?更具体点说,那些人力翻译的工作是否会被取代?
近日,外媒在一篇文章中阐述了AI与翻译行业的发展前景,其中提到在近两年里机器翻译的质量得到了大幅的提高,也许在几年后大部分企业文件都可以用AI翻译了。
不管这是不是真的,AI的确在翻译方面已经为人们带来了便利,比如医疗文件的翻译、语音翻译、字幕翻译,有道、百度和搜狗等公司甚至还推出了实景AR翻译,利用方便有趣的应用为语言不通的游客解决了不少问题。笔者在测试过科大讯飞1.0翻译机后发现,机器翻译相比于两三年前已经取得了长足的进步,随着科大讯飞2.·0的推出,想必会有更多人使用这种支持33中语言的机器来进行翻译工作了。
让笔者感受最深的,是以往看美剧的时候,字幕都是由人工字幕组翻译的,而随着今年年初网易见外AI智能语音转写听翻平台的出现,一些首发的美剧字幕已经变成了网易见外AI听翻+人工校对了,AI不仅能听写还能翻译,速度比人工还快,看到这里字幕君们是否有点瑟瑟发抖了?此外,就连Youtube小视频也开始提供多语言机翻功能了。AI技术竟连方言翻译都不放过,科大讯飞和亚马逊等公司也已经在研发实时方言转换系统了。
对此,世界上最大的人工翻译机构之一One Hour Translation的CEO Ofer Shoshan表示大家应该开始面对未来工作将会被机器取代这一可怕事实,而且在几年内,神经机器翻译(NMT)将会负责翻译市场一半以上的工作量。
从他的话来看,似乎未来AI的职责并不仅仅是辅助人类,而是会替代一些人类工作。
Shoshan补充,随着机器翻译在近两年来的跨越式发展,过不了多久50几万人工翻译和21000家翻译机构都会失业。这就好比数字摄影与柯达公司,柯达万万没想到未来市场会被数码相机取代,而再早之前的Corona打字机也是这么被文字处理软件取代了。
Shoshan还表示,阅读两年前机器翻译出来的东西只能了解个大概意思,那时候的翻译宁可自己手动翻译,但是现在的神经机器,已经可以将越来越多的内容翻译到只需要做一点点改动就可以达到人工标准的水平了。
目前,Shoshan公司用机器翻译的文件中,平均只有1成需要人工校对,翻译的结果足以让其财富500强的客户满意,而两年前这个数据为8成。
这是因为神经机器翻译,也就是深度学习,取代了之前的统计翻译技术,在大多数高级翻译工具上都得到了应用,谷歌、必应和亚马逊等公司的翻译技术都使用了神经机器翻译。
训练神经机器翻译的方法简单直接,只需要给其神经网络算法灌输大量的语言信息。因此,为了适应翻译市场的飞速转变,One Hour Translation也使用了翻译工具,并对其进行分类,与其最擅长的领域进行匹配。
比如,在旅游业领域,有些翻译机器擅长从德语翻译到英语,但是不太擅长日语。而有的翻译机器擅长法语,但是不擅长德语。One Hour Translation造了一个数据库索引来帮助企业和客户寻找最合适的翻译机器,可以及时快速地为任何类型的内容、任何语言匹配最合适的翻译工具。
从One Hour Translation这一做法,也许可以看到人工翻译在未来几年的出路,即对比神经机器翻译的质量,为其打分并整理成索引。据青亭网了解,One Hour Translation公司每一个季度做一次整理,重新评比每个翻译机器。
不过,Shoshan表示,这种工作并不需要太多的翻译专业知识,不管是给翻译机器打分还是人工校对机翻,需要的专业性远比人工翻译低得多。能胜任这项工作的应该是,语言技巧高的聪明人,不一定非要使专业的传统翻译,因为机翻内容上需要修改的地方很少,比人工翻译简单得多。
笔者不禁思考,AI的兴起会不会重现第一次工业革命的场景,会不会有一大群翻译跑到街上抗议、摧毁翻译机这种情况出现?反正最近笔者在一个Youtube视频中就看到一个真事,一个送外卖的女孩对着外卖机器人大喊:“你,就是你滚出我的地盘,我讨厌你。”
对此,Shoshan表示,说不好,不过被AI威胁的行业不只有翻译,目前美国400万左右卡车司机也将面临着被无人驾驶卡车抢走饭碗的威胁。
Shoshan上说道:“更重要的是,这件事会在1到3年内发生,而不是5到10年。很显然如果机器能做人的工作,那人就多余了,虽然很多翻译和翻译公司都说短时间内专业领域的机翻还需要人工校对。”
“对于有些内容来说也许是这样没错,但是估计目前市场上8成的企业文件在未来1到3年都能被机器翻译。”
说了这么多,那翻译们该怎么做才能不被时代淘汰呢?比较明显的一种办法,就是学习小语种。因为训练神经机器翻译依靠的是大量的语言数据,对于适用人群少的小语种来说,可能没有足够训练AI算法的数据,尤其是专业性强的技术类或科学类领域的内容。
另一种办法,就是像One Hour Translation一样,习惯和机器一同工作,让机器去做大量重复的工作,而人类来鉴定机翻的质量,并为不同的工作匹配合适的工具。
就像李开复曾说过的,在这场人工智能摧毁工作的浩劫中,唯有创造性工作才能从中全身而退。所以,面对时代的变迁,我们唯一不能做的就是对其充耳不闻,因为这样很容易导致失业。