防城港同聲翻譯系統(tǒng),基于NMT的智能化,同傳方案
時間:2021-03-20 11:41:17 信息來源:百睿德 點擊:80731次
在過去70年的發(fā)展歷程里,機器翻譯經(jīng)歷了從興起到高峰,從低迷到打開新研究思路的種種變化。當下,當5G的瞬時鏈接速度達到驚人的千分之三秒,我們又看到了同聲傳譯的機器化是否有可能?
早在1949年,美國科學家 Warren Weaver 就首次提出 “使用計算機進行翻譯” 的思想,他也被公認為是機器實現(xiàn)同聲傳譯的先驅(qū)者之一。1952 年,以色列著名哲學家、語言學家和數(shù)學家 Yehoshua Bar-Hillel 組織召開了第一次機器翻譯大會。
此后,由于機器翻譯質(zhì)量難以達到要求,其發(fā)展在長達 30 年間始終緩慢,直到 1990 年之后,大量的雙語、多語語料庫給機器翻譯注入新鮮血液,統(tǒng)計機器翻譯(SMT)應運而生。這期間 IBM 研究人員也發(fā)表論文,詳細論述了基于詞典和轉(zhuǎn)換規(guī)則的機器翻譯方法和基于平行語料庫的實例機器翻譯方法。
(來源:GPI 同聲傳譯)
近些年,基于深度學習的神經(jīng)機器翻譯技術(neural machine translation,簡稱 NMT)發(fā)展迅猛。深度學習由圖靈獎得主 Geoffrey Hinton 等人在 2006 年提出,是一種深層的非線性數(shù)據(jù)處理技術,與傳統(tǒng)的淺層次線性處理相比,同聲傳譯是基于高品質(zhì)翻譯能力的支持,它在處理模型分析和分類問題上更準確,性能更高。
NMT 與以前的機器翻譯方法完全不同,一方面,NMT 在 SMT 中采用連續(xù)表示而不是離散符號表示;另一方面,NMT 使用單個大型神經(jīng)網(wǎng)絡對整個同聲翻譯過程進行建模,從而無需進行過多的特征工程。而且,NMT 的訓練是端到端的(end-to-end),不像 SMT 中需要單獨調(diào)整組件。除了簡單之外,NMT 可適應多種語言之間的同傳翻譯,實現(xiàn)先進的性能對會議現(xiàn)場的二次處理。