在線翻譯(Online Translation)就是用戶將計算機連接到互聯(lián)網(wǎng)后,利用一些網(wǎng)絡(luò)上提供的在線翻譯服務(wù)(Online-Translation Service)進行網(wǎng)絡(luò)翻譯,主要指利用互聯(lián)網(wǎng)資源、在線詞典和編程、協(xié)議等來完成翻譯的一個實時查詢、瀏覽、翻譯系統(tǒng)。
在線翻譯屬于機器翻譯領(lǐng)域,隨著互聯(lián)網(wǎng)發(fā)展導(dǎo)致的文種多樣化趨勢應(yīng)運而生,其研究歷史可追溯至20世紀(jì)30年代,法國科學(xué)家G.B.阿爾楚尼提出了用機器來進行翻譯的想法。1949年,W.Weaver正式提出機器翻譯的思想。1957年,中國開始機器翻譯研究,是世界上第四個開始研究機器翻譯的國家。20世紀(jì)末21世紀(jì)初,基于統(tǒng)計的機器翻譯系統(tǒng)迅速發(fā)展。2016年,谷歌發(fā)布的神經(jīng)網(wǎng)絡(luò)機器翻譯大大改善機器翻譯的可讀性,機器翻譯的性能實現(xiàn)質(zhì)的飛躍。
在線翻譯工具主要包括詞典類、短文翻譯類和網(wǎng)頁翻譯三種,其最大特色在于龐大的語料庫。在線翻譯對查找單詞、詞組速度和翻譯速度、語法翻譯體系和屏幕還原能力等具有較高要求,它可使翻譯成果變?yōu)榭纱鎯Y源,實現(xiàn)舉一反三,資源共享。在線翻譯的發(fā)展方向包括多語語料的建設(shè)與加工、機器學(xué)習(xí)技術(shù)的應(yīng)用和語義資源的建設(shè)。常見在線翻譯工具包括百度翻譯、谷歌翻譯、有道詞典、必應(yīng)在線翻譯等。
產(chǎn)生背景
由于互聯(lián)網(wǎng)發(fā)祥于美國,所以網(wǎng)上信息絕大多數(shù)是用英文發(fā)布;加之各國爭相進入互聯(lián)網(wǎng),遂使文種出現(xiàn)多樣化趨勢;即便是同種文字,也因編碼的差異,導(dǎo)致瀏覽網(wǎng)頁時,出現(xiàn)亂碼而不知所云,給不懂外語或掌握語種不多以及不了解識別亂碼工具的人,帶來了極大的困難。因此,在線翻譯軟件應(yīng)運而生。
發(fā)展歷史
機器翻譯的研究歷史可以追溯到20世紀(jì)30年代。20世紀(jì)30年代初,法國科學(xué)家G.B.阿爾楚尼提出了用機器來進行翻譯的想法。1993年,蘇聯(lián)發(fā)明家II.II.特羅揚斯基設(shè)計了把一種語言翻譯成另一種語言的機器,并在同年9月5日登記了他的發(fā)明。但是,由于20世紀(jì)30年代技術(shù)水平還很低,他的翻譯機沒有研制成功。1846年,第一臺現(xiàn)代電子計算機ENIAC誕生。1847年,信息論的先驅(qū)、美國科學(xué)家W.Weaver和英國工程師A.D.Booth在討論電子計算機的應(yīng)用范圍時,提出了利用計算機進行語言自動翻譯的想法。1949年,W.Weaver發(fā)表《翻譯備忘錄》,正式提出機器翻譯的思想。
中國機器翻譯研究始于1957年,是世界上第四個開始研究機器翻譯的國家。中國社會科學(xué)院語言研究所、中國科學(xué)技術(shù)情報研究所、中國科學(xué)院計算技術(shù)研究所、黑龍江大學(xué)、哈爾濱工業(yè)大學(xué)等單位都在進行機器翻譯的研究。翻譯的語種和類型有英漢、俄漢、法漢、日漢、德漢等一對一的系統(tǒng),也有漢譯英、法、日、俄、德的一對多系統(tǒng)。此外,還建立了一個漢語語料庫和一個科技英語語料庫。中國機器翻譯系統(tǒng)的規(guī)模不斷擴大,內(nèi)容不斷完善。1987年,軍事科學(xué)院成功研制出“利譯1號”,標(biāo)志著中國在機器翻譯上的極大進步。
20世紀(jì)末21世紀(jì)初,基于統(tǒng)計的機器翻譯系統(tǒng)發(fā)展迅速。然而,由于大規(guī)模語料難以獲得、運行速度較慢、模型規(guī)模過于龐大等原因,統(tǒng)計機器翻譯技術(shù)一直未能應(yīng)用到翻譯軟件中去。隨著基于互聯(lián)網(wǎng)的在線翻譯系統(tǒng)的誕生,這一局面得以徹底改變,谷歌、微軟、網(wǎng)易等公司陸續(xù)推出了統(tǒng)計型在線翻譯系統(tǒng),并取得了一定的成功。2015年,百度集團以發(fā)布基于深度神經(jīng)網(wǎng)絡(luò)的端到端翻譯系統(tǒng),翻譯的必應(yīng)翻譯也同樣使用神經(jīng)網(wǎng)絡(luò)技術(shù)來改善自身的翻譯質(zhì)量。2016年,谷歌發(fā)布的神經(jīng)網(wǎng)絡(luò)機器翻譯大大改善了機器翻譯的可讀性。至此,機器翻譯領(lǐng)域又出現(xiàn)了一次革命性的巨變,使機器翻譯的性能實現(xiàn)了質(zhì)的飛躍,也開啟了基于互聯(lián)網(wǎng)的開放式服務(wù)的新天地。
分類
在線翻譯工具主要包括詞典類、短文翻譯類和網(wǎng)頁翻譯三種。
特點
在線翻譯系統(tǒng)的最大特色就在于其龐大的語料庫,這其中既包括用于訓(xùn)練翻譯模型的雙語平行語料庫,也包括用于培訓(xùn)語言模型的目標(biāo)語端的大規(guī)模單語語料庫。
技術(shù)要求
在線翻譯不同于離線全文翻譯,它實時地對瀏覽器屏幕內(nèi)容進行翻譯,要求系統(tǒng)具有能獲取窗口信息,快速分析版面,同時具有極高的查找單詞、詞組速度和翻譯速度以及更高水準(zhǔn)的語法翻譯體系和屏幕還原能力。最早的機器翻譯就是詞和語法規(guī)則,隨后出現(xiàn)統(tǒng)計機器翻譯方法,通過統(tǒng)計分析大量的平行語料庫,發(fā)現(xiàn)詞組規(guī)則,進行精準(zhǔn)翻譯。雖然詞語翻譯基本可以做到準(zhǔn)確,但是句子和段落翻譯還是存在很多誤譯的地方。之后,神經(jīng)網(wǎng)絡(luò)翻譯推出,機器翻譯可以模擬人腦神經(jīng)的層級結(jié)構(gòu),對信息進行抽象分析,自動識別語言規(guī)則和模式,做到精準(zhǔn)翻譯。
作用意義
在線翻譯是通過網(wǎng)絡(luò)和人工智能等技術(shù)使翻譯成果變?yōu)榭纱鎯Y源,實現(xiàn)舉一反三,資源共享。在翻譯詞組、短語、專有名詞時,在線翻譯基本上都能提供相當(dāng)規(guī)范甚至精當(dāng)?shù)淖g語。
發(fā)展方向
翻譯工具
在線翻譯工具是基于電子翻譯技術(shù)的一種翻譯輔助工具。針對不同用戶群體,在線翻譯工具具有詞典翻譯工具、漢化翻譯工具、全文翻譯工具等。
參考資料 >