因?yàn)槿祟愓Z(yǔ)言不通,《圣經(jīng)》故事中的“巴別塔”沒能建成,以失敗告終。如何打破人類語(yǔ)言之間的圍墻,讓人類能無障礙溝通,也成為了人類一直希望解決的問題。
在今年《MIT科技評(píng)論》推出的十大突破技術(shù)中,巴別魚耳塞成為入選。它可以做到雙方交流時(shí),會(huì)對(duì)所講的話進(jìn)行翻譯,并在智能手機(jī)上大聲播放。手持手機(jī)的人回應(yīng)后,回答被翻譯,然后在耳塞中播放,該技術(shù)還能實(shí)時(shí)翻譯,適用于多種語(yǔ)言,使用方便。
工業(yè)界對(duì)于機(jī)器翻譯已經(jīng)開始摩拳擦掌。近日,微軟宣布自己的機(jī)器翻譯系統(tǒng)達(dá)到了人類專業(yè)翻譯的水平。谷歌、百度、Facebook,包括其他一些科技公司也都在布局機(jī)器翻譯,并推出了在線翻譯系統(tǒng)。
可見,隨著技術(shù)的發(fā)展,機(jī)器翻譯在教育、旅游、社交、跨境交易等領(lǐng)域?qū)⒂懈蟮膽?yīng)用空間。那么,機(jī)器翻譯究竟是如何對(duì)人類語(yǔ)言進(jìn)行“理解”,進(jìn)而進(jìn)行翻譯輸出的;如果機(jī)器翻譯水平越來越高,從事語(yǔ)言翻譯的人是否會(huì)因此丟了工作;如果人類之間的語(yǔ)言障礙被清除,那時(shí)候的世界又會(huì)是什么樣的?
機(jī)器翻譯的三大飛躍
微軟技術(shù)院士黃學(xué)東告訴澎湃新聞,機(jī)器翻譯達(dá)到目前的水平,經(jīng)過了幾十年的發(fā)張,并經(jīng)歷了三次飛躍。
早在1954年,人類就開始嘗試過讓機(jī)器能識(shí)別人類的語(yǔ)言,但直到上世紀(jì)80年代,才有人摸索出方法。當(dāng)時(shí),IBM做了研究,利用一些規(guī)則方法,句法分析,語(yǔ)意分析等傳統(tǒng)方法讓機(jī)器看懂人類語(yǔ)言。但由于當(dāng)時(shí)的人工智能發(fā)展處于“凜冬時(shí)期”,效果一直不好,翻譯質(zhì)量也一直上不去。
機(jī)器翻譯的第一個(gè)飛躍也是IBM做出的。IBM的研究人員用了統(tǒng)計(jì)的方法來做機(jī)器翻譯。那時(shí),語(yǔ)音識(shí)別從傳統(tǒng)的人工智能方法專家系統(tǒng)轉(zhuǎn)為統(tǒng)計(jì)學(xué)習(xí)的方法,尤以隱馬爾科夫模型為代表。統(tǒng)計(jì)學(xué)方法的應(yīng)用讓機(jī)器翻譯在上世紀(jì)90年代有了質(zhì)的飛躍。
進(jìn)入21世紀(jì),機(jī)器翻譯迎來了自己的第二次飛躍。這次的進(jìn)步主要依靠深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的方法。這種方法也稱為神經(jīng)機(jī)器翻譯(Neural Machine Translation),這個(gè)技術(shù)先是用到了語(yǔ)音識(shí)別中,再推廣到圖像識(shí)別和機(jī)器翻譯上。
神經(jīng)機(jī)器翻譯,簡(jiǎn)要的說,就是對(duì)源語(yǔ)言的句子進(jìn)行編碼,即轉(zhuǎn)化為計(jì)算機(jī)可以“理解”的形式,編碼的結(jié)果會(huì)形成很多隱含變量,每個(gè)隱含變量代表從句首到當(dāng)前詞匯為止的語(yǔ)義信息。然后通過一個(gè)解碼的過程,一個(gè)詞、一個(gè)詞輸出譯文。
到了2018年,由微軟亞洲研究院與雷德蒙研究院研發(fā)的機(jī)器翻譯系統(tǒng),解決了NMT方法的一些局限,并借鑒了人類翻譯過程中的一些方式。例如:對(duì)偶學(xué)習(xí)(Dual Learning)、推敲網(wǎng)絡(luò)(Deliberation Networks)、一致性規(guī)范(Agreement Regularization)、聯(lián)合訓(xùn)練(Joint Training)等,讓機(jī)器翻譯水平得到了大大提升。
從機(jī)器翻譯的三次飛躍上不難看出,一家公司構(gòu)建的翻譯系統(tǒng)效果如何,主要取決與兩點(diǎn):一是算法是否足夠好,二是數(shù)據(jù)是否夠全、夠多。
這樣看,對(duì)于微軟、谷歌、百度等大公司來說,他們有足夠優(yōu)秀的人才來搭建神經(jīng)網(wǎng)絡(luò),也有足夠多的搜索數(shù)據(jù)可供自己搭建的網(wǎng)絡(luò)進(jìn)行訓(xùn)練。國(guó)內(nèi)的科大訊飛和搜狗公司,由于本身在語(yǔ)音識(shí)別上有較長(zhǎng)時(shí)間的積累,自然語(yǔ)言資料庫(kù)上有優(yōu)勢(shì)。
人類會(huì)被機(jī)器替代,機(jī)器翻譯能否改變世界?
機(jī)器翻譯技術(shù)領(lǐng)域的進(jìn)步,也讓人們看到了消除語(yǔ)言鴻溝,構(gòu)建“巴別塔”的新希望。但這樣的突破也引發(fā)了部分人的擔(dān)憂:人類是否會(huì)被機(jī)器替代?
關(guān)于這個(gè)問題,黃學(xué)東在接受澎湃新聞采訪時(shí)稱,舉了一個(gè)馬車與汽車的例子。當(dāng)汽車被發(fā)明出來的時(shí)候,英國(guó)為了保障馬車夫的生存,曾立法規(guī)定汽車行駛速度不能超過馬車。盡管最后馬車還是被淘汰了,但是出了很多司機(jī),產(chǎn)生了新的職業(yè)。
“所以很多事情不用擔(dān)心。其實(shí)我們只是把很多枯燥的工作讓計(jì)算機(jī)做了。就像以前是打字機(jī),現(xiàn)在有計(jì)算機(jī),現(xiàn)在計(jì)算機(jī)寫出來的文章想修改都很方便。30年前你要寫一篇文章,打錯(cuò)了,得讓秘書用修改液去涂,但現(xiàn)在機(jī)器解放了秘書的工作,而他們也沒有消失,只是去做更復(fù)雜,更專業(yè)的工作了。”黃學(xué)東說。
實(shí)際上,大多數(shù)的專業(yè)公司不但不擔(dān)心自己的飯碗會(huì)被搶走,甚至還非常擁抱技術(shù)帶來的便利。
美國(guó)語(yǔ)言公司協(xié)會(huì)與歐洲語(yǔ)言行業(yè)協(xié)會(huì)首次發(fā)布的“2015語(yǔ)言行業(yè)調(diào)查報(bào)告”稱,大多數(shù)公司在調(diào)查機(jī)器翻譯帶來的影響的時(shí)候,都選擇了“顯著影響”(5分權(quán)重下選擇4或者5),表明機(jī)器翻譯技術(shù)已經(jīng)開始發(fā)揮作用。這份報(bào)告還指出,在2014年,大量歐洲公司已經(jīng)開始使用機(jī)器翻譯,美國(guó)公司有21%的項(xiàng)目用到了機(jī)器翻譯,為有史以來最高值。機(jī)器翻譯系統(tǒng)也越來越普及,50%的歐洲公司和36%的美國(guó)公司擁有機(jī)器翻譯引擎。
值得注意的是,該報(bào)告是基于對(duì)歐美主流中小翻譯公司得出的結(jié)果,可見除了日常使用,機(jī)器翻譯已經(jīng)在專業(yè)翻譯領(lǐng)域發(fā)揮著越來越大的應(yīng)用。
這樣的市場(chǎng)也讓許多科技公司看到了價(jià)值,包括谷歌、微軟、Facebook、百度、科大訊飛、搜狗等公司都已紛紛布局翻譯機(jī)。
目前,谷歌已經(jīng)開發(fā)出了耳機(jī)Pixel Buds,可以實(shí)時(shí)翻譯,并存儲(chǔ)有40種語(yǔ)言,使用時(shí)就像有名翻譯家在你耳邊說悄悄話。只是,這款耳機(jī)還只能和Pixel智能手機(jī)聯(lián)用。
微軟也積極布局,除了開發(fā)有自己的小冰系統(tǒng)外,微軟近期還與小米合作,推出了魔芋AI翻譯機(jī)。它用了微軟的認(rèn)知服務(wù)技術(shù),就像iPod一樣,有一個(gè)雙鍵,可以做遠(yuǎn)場(chǎng)翻譯,支持60種語(yǔ)言的機(jī)器翻譯,并整合了智能助理。
國(guó)內(nèi)公司對(duì)于巨大的消費(fèi)市場(chǎng)也是虎視眈眈。科大訊飛和搜狗均在去年推出了自己的手持翻譯機(jī)??拼笥嶏w的曉譯翻譯機(jī)支持5種語(yǔ)言翻譯,具備離線功能和即時(shí)翻譯。搜狗翻譯機(jī)支持離線翻譯和拍照識(shí)別翻譯。
在機(jī)器翻譯技術(shù)的支持下,各家公司布局的翻譯機(jī)紛至沓來,可以預(yù)見的是,機(jī)器翻譯在教育、旅游、社交、跨境交易等領(lǐng)域有著巨大的應(yīng)用空間。信息技術(shù)的進(jìn)步在不斷的降低人們的溝通成本,當(dāng)機(jī)器翻譯進(jìn)步到可以替代專業(yè)翻譯,我們是不是可以拾起《圣經(jīng)》中的想象:一個(gè)能讓不同語(yǔ)言的人無縫溝通的世界會(huì)在不遠(yuǎn)的將來到來?