6/3/2018 10:37:00 AM
平頂山翻譯公司提供一則報(bào)道稱微軟AI的英中翻譯已經(jīng)可以媲美人工翻譯了
受人類(lèi)方法啟發(fā)盡管學(xué)術(shù)界和行業(yè)研究人員多年來(lái)一直致力于翻譯工作,但他們最近通過(guò)使用一種稱為深度神經(jīng)網(wǎng)絡(luò)的AI系統(tǒng)訓(xùn)練方法取得了重大突破。這使得他們能夠創(chuàng)造更流利,自然的聲音翻譯,考慮到比以前的方法更廣泛的背景,即統(tǒng)計(jì)機(jī)器翻譯。
為了達(dá)到這個(gè)數(shù)據(jù)集的人類(lèi)奇偶校驗(yàn)里程碑,微軟北京和華盛頓州雷德蒙德的三個(gè)研究小組共同合作,增加了許多其他培訓(xùn)方法,使系統(tǒng)更加流暢和準(zhǔn)確。
微軟亞洲研究院首席研究經(jīng)理Tie-Yan Liu表示:“我們的大部分研究都受到人們?nèi)绾巫鍪碌膯l(fā),他領(lǐng)導(dǎo)了一個(gè)負(fù)責(zé)該項(xiàng)目的機(jī)器學(xué)習(xí)團(tuán)隊(duì)。
研究人員還開(kāi)發(fā)了兩種新技術(shù)來(lái)提高翻譯的準(zhǔn)確性 - 聯(lián)合培訓(xùn)和協(xié)議正規(guī)化。周說(shuō),他預(yù)計(jì)這些方法和技術(shù)對(duì)于改進(jìn)其他語(yǔ)言和情況下的機(jī)器翻譯也很有用。他表示,他們也可以用來(lái)在翻譯之外制作其他的AI突破。
“這是機(jī)器翻譯研究可以應(yīng)用于整個(gè)AI研究領(lǐng)域的領(lǐng)域,”他說(shuō)。沒(méi)有“正確”的答案團(tuán)隊(duì)用來(lái)達(dá)到人類(lèi)奇偶校驗(yàn)里程碑的測(cè)試集包括來(lái)自專(zhuān)業(yè)翻譯的在線報(bào)紙樣本中的約2000個(gè)句子。
微軟對(duì)測(cè)試集進(jìn)行了多輪評(píng)估,每次隨機(jī)挑選數(shù)百個(gè)翻譯進(jìn)行評(píng)估。為了驗(yàn)證微軟的機(jī)器翻譯與人的翻譯一樣好,該公司超出了測(cè)試集的規(guī)格,并聘請(qǐng)了一群外部雙語(yǔ)語(yǔ)言顧問(wèn),將微軟的結(jié)果與人工生成的人工翻譯進(jìn)行比較。
驗(yàn)證結(jié)果的方法突出了教學(xué)系統(tǒng)準(zhǔn)確翻譯的復(fù)雜性。通過(guò)語(yǔ)音識(shí)別等其他任務(wù),可以很直觀地判斷一個(gè)系統(tǒng)的表現(xiàn)是否與一個(gè)人一樣好,因?yàn)槔硐氲慕Y(jié)果對(duì)于一個(gè)人和一臺(tái)機(jī)器來(lái)說(shuō)完全相同。研究人員稱這是一種模式識(shí)別任務(wù)。
“機(jī)器翻譯比純粹的模式識(shí)別任務(wù)復(fù)雜得多,”Zhou說(shuō)。 “人們可以用不同的詞語(yǔ)來(lái)表達(dá)完全相同的東西,但是你不一定說(shuō)哪一個(gè)更好?!毖芯咳藛T表示,復(fù)雜性是機(jī)器翻譯如此具有挑戰(zhàn)性的問(wèn)題,也是如此一個(gè)有益的問(wèn)題。
劉說(shuō),沒(méi)有人知道機(jī)器翻譯系統(tǒng)是否能夠很好地翻譯任何語(yǔ)言對(duì)中的任何文本,以及翻譯人員的準(zhǔn)確性和抒情性。但是,他說(shuō),這些最近的突破允許團(tuán)隊(duì)繼續(xù)邁向?qū)崿F(xiàn)這一目標(biāo)的下一個(gè)重大步驟,以及AI等其他重大成就,比如在言語(yǔ) - 語(yǔ)音翻譯方面達(dá)到人類(lèi)平等。
“我們可以預(yù)測(cè)的是,我們肯定會(huì)做得更好,”劉說(shuō)。