訂閱
糾錯(cuò)
加入自媒體

機(jī)器翻譯真的可以取代翻譯員的工作嗎?

我們生活常用的機(jī)器翻譯成為翻譯活動(dòng)中的重要的輔助工具。而機(jī)器翻譯錯(cuò)譯、死譯頻出,給翻譯工作帶來諸多不便。近年來,“大數(shù)據(jù)”的出現(xiàn)為機(jī)器翻譯帶來了新希望,其獨(dú)特的“4V”特點(diǎn)將對(duì)機(jī)器翻譯產(chǎn)生革命性的影響?贫啻髷(shù)據(jù)帶大家來看看大數(shù)據(jù)在機(jī)器翻譯中的應(yīng)用是怎么樣的。

大數(shù)據(jù),即大量的數(shù)據(jù),在一定程度上可以理解為多個(gè)大語料庫的結(jié)合體。維克托·邁爾提出大數(shù)據(jù)有容量大、種類多、速度快和價(jià)值高四大特征。容量大、種類多保證了它為譯者提供一個(gè)包含各種資源的巨型共享資料庫;速度快、價(jià)值高可提高翻譯的效率和精確度。譯者要意識(shí)到大數(shù)據(jù)共享資源的重要性,充分利用其來查找翻譯所需的相關(guān)資源。

大數(shù)據(jù)時(shí)代,利用信息技術(shù)進(jìn)行輔助翻譯是翻譯工作者一項(xiàng)必備技能。經(jīng)濟(jì)全球化快速發(fā)展帶來各國(guó)交流頻繁,各種翻譯應(yīng)接不暇,利用信息技術(shù)進(jìn)行輔助翻譯是大勢(shì)所趨。下面主要圍繞兩種輔助翻譯工具展開:塔多思與谷歌。

Trados是一種翻譯記憶軟件。它將譯員做過的工作用Trados提供的工具存儲(chǔ)起來,放到兩個(gè)主要的數(shù)據(jù)庫中:句料庫和術(shù)語庫。Trados基于數(shù)據(jù)庫原理,利用翻譯記憶,將已譯資源以句子為單位存入數(shù)據(jù)庫,翻譯時(shí)系統(tǒng)自動(dòng)對(duì)源語言文本進(jìn)行分析,與數(shù)據(jù)庫中的翻譯記憶進(jìn)行匹配,100%匹配的句子可自動(dòng)替換;部分匹配的句子根據(jù)匹配度提出翻譯建議;全新的句子可通過系統(tǒng)提供的建議進(jìn)行人工翻譯;而每一次翻譯又作為新翻譯記憶積累入數(shù)據(jù)庫。這樣將機(jī)器與人工相結(jié)合就幫助譯者提高了翻譯效率和準(zhǔn)確性。Trados能夠自動(dòng)替換日期、時(shí)間和度量單位等,如句料庫中有2008年5月,譯文中出現(xiàn)May,2017時(shí)就會(huì)自動(dòng)替換為2017年5月。

谷歌翻譯使用的是基于統(tǒng)計(jì)的翻譯方法,所有語言知識(shí)都是從語料庫中自動(dòng)獲取,通過概率模型對(duì)語料庫中的句子進(jìn)行概率計(jì)算后生成。來自互聯(lián)網(wǎng)的幾乎所有語言文本,構(gòu)成了谷歌的龐大的語料庫。谷歌翻譯還利用網(wǎng)絡(luò)資源不斷補(bǔ)充和更新。所以在谷歌翻譯中輸入源語言文本后,系統(tǒng)會(huì)根據(jù)概率模型對(duì)語料庫中的句子進(jìn)行概率計(jì)算搜索出最優(yōu)化和使用頻次最高的譯文,如輸入“Nopains,nogains.”,便會(huì)生成譯文“不勞則無獲!

(一)優(yōu)勢(shì)

大數(shù)據(jù)時(shí)代,基于平行語料庫,翻譯多樣性和準(zhǔn)確性成為可能。語料庫幫助提供真實(shí)語料、提供統(tǒng)計(jì)數(shù)據(jù)、驗(yàn)證現(xiàn)行的理論、構(gòu)建新的理論。例如,紅樓夢(mèng)中前80回出現(xiàn)了1219個(gè)“某某笑道”,該如何翻譯呢?全譯為smiledandsaid,不僅重復(fù),而且抹去了經(jīng)典名作的文學(xué)特色。這時(shí)譯者可以借助大數(shù)據(jù)的優(yōu)勢(shì),查詢smile的平行詞找到chuckle,giggle,grin等或通過網(wǎng)絡(luò)向英語母語朋友和高人請(qǐng)教,再根據(jù)人物特點(diǎn)和上下文選擇適當(dāng)譯文。使用翻譯記憶軟件可以讓眾多譯員共享網(wǎng)絡(luò)術(shù)語庫,避免重復(fù)工作,降低翻譯成本,節(jié)省時(shí)間和精力,保持上下文術(shù)語前后一致,從整體上提高了翻譯效率和質(zhì)量。而且谷歌本身作為搜索引擎,為其語料庫內(nèi)容的充實(shí)和更新提供了便利條件。

(二)局限

大數(shù)據(jù)時(shí)代下的機(jī)器翻譯給人們帶來了諸多便利,但也有其局限性。

一,譯文好壞受到平行語料庫數(shù)據(jù)大小和領(lǐng)域的制約。由于語言規(guī)則復(fù)雜,樣本信息必須足夠大才能有好的效果。

二,運(yùn)用Trados進(jìn)行翻譯時(shí)極大地依賴于翻譯記憶,若翻譯記憶資源中有誤,翻譯記憶的質(zhì)量和數(shù)量都會(huì)影響譯文準(zhǔn)確度。

三,基于大數(shù)據(jù)的翻譯方法并不涉及規(guī)則,尤其是語法規(guī)則,機(jī)器翻譯不能識(shí)別語法信息,降低了譯文的可理解度。如輸入Ahorsestumblesthathasfourlegs時(shí),谷歌翻譯給出的譯文是“馬絆倒有四條腿”。

四,基于大數(shù)據(jù)的翻譯抑制了譯者的創(chuàng)新思維,譯者只會(huì)搜索而不是自己思考,或許會(huì)有更好的譯文也說不定。

五,在翻譯帶有情感的源語言時(shí),機(jī)器并不能像人那樣發(fā)揮譯者的主體性,給出合適的最符合語境的翻譯,體現(xiàn)不出原文人物內(nèi)心的感情色彩,在描寫人物的心理變化方面明顯不足。

六,機(jī)器翻譯無法處理多義詞。輸入的源語言文本內(nèi)容并不一定能夠百分之百地在語料庫中匹配到對(duì)應(yīng)的內(nèi)容。

七,機(jī)器不能考慮源語言的文化背景上下文等,不能選擇最恰當(dāng)?shù)淖g法。

盡管已取得巨大進(jìn)步,機(jī)器翻譯也有不足之處?傊,在大數(shù)據(jù)時(shí)代下,計(jì)算機(jī)翻譯工具只是一種輔助工具,最根本的還是要發(fā)揮譯員的主體性作用,在不斷改善翻譯記憶庫中所儲(chǔ)譯文質(zhì)量和數(shù)量情況下,機(jī)譯結(jié)合人譯,才能更好地做好翻譯工作。

相信大家都知道打鐵還需自身硬,我們要鞏固好自身的大數(shù)據(jù)技術(shù),才能更好的應(yīng)用在產(chǎn)品中并不斷的優(yōu)化完善,改善我們的生活。更多大數(shù)據(jù)與人工智能的相關(guān)學(xué)習(xí)資訊關(guān)注公眾號(hào)成都科多大數(shù)據(jù)即可免費(fèi)獲取。

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)