福建同聲翻譯系統(tǒng),基于NMT的智能化,同傳方案
時間:2021-03-20 11:41:17 信息來源:百睿德 點擊:80727次
在過去70年的發(fā)展歷程里,機(jī)器翻譯經(jīng)歷了從興起到高峰,從低迷到打開新研究思路的種種變化。當(dāng)下,當(dāng)5G的瞬時鏈接速度達(dá)到驚人的千分之三秒,我們又看到了同聲傳譯的機(jī)器化是否有可能?
早在1949年,美國科學(xué)家 Warren Weaver 就首次提出 “使用計算機(jī)進(jìn)行翻譯” 的思想,他也被公認(rèn)為是機(jī)器實現(xiàn)同聲傳譯的先驅(qū)者之一。1952 年,以色列著名哲學(xué)家、語言學(xué)家和數(shù)學(xué)家 Yehoshua Bar-Hillel 組織召開了第一次機(jī)器翻譯大會。
此后,由于機(jī)器翻譯質(zhì)量難以達(dá)到要求,其發(fā)展在長達(dá) 30 年間始終緩慢,直到 1990 年之后,大量的雙語、多語語料庫給機(jī)器翻譯注入新鮮血液,統(tǒng)計機(jī)器翻譯(SMT)應(yīng)運而生。這期間 IBM 研究人員也發(fā)表論文,詳細(xì)論述了基于詞典和轉(zhuǎn)換規(guī)則的機(jī)器翻譯方法和基于平行語料庫的實例機(jī)器翻譯方法。
(來源:GPI 同聲傳譯)
近些年,基于深度學(xué)習(xí)的神經(jīng)機(jī)器翻譯技術(shù)(neural machine translation,簡稱 NMT)發(fā)展迅猛。深度學(xué)習(xí)由圖靈獎得主 Geoffrey Hinton 等人在 2006 年提出,是一種深層的非線性數(shù)據(jù)處理技術(shù),與傳統(tǒng)的淺層次線性處理相比,同聲傳譯是基于高品質(zhì)翻譯能力的支持,它在處理模型分析和分類問題上更準(zhǔn)確,性能更高。
NMT 與以前的機(jī)器翻譯方法完全不同,一方面,NMT 在 SMT 中采用連續(xù)表示而不是離散符號表示;另一方面,NMT 使用單個大型神經(jīng)網(wǎng)絡(luò)對整個同聲翻譯過程進(jìn)行建模,從而無需進(jìn)行過多的特征工程。而且,NMT 的訓(xùn)練是端到端的(end-to-end),不像 SMT 中需要單獨調(diào)整組件。除了簡單之外,NMT 可適應(yīng)多種語言之間的同傳翻譯,實現(xiàn)先進(jìn)的性能對會議現(xiàn)場的二次處理。