■策劃/發(fā)現(xiàn)工作室
■采寫/陳蘅
■供圖/《圖形科普》雜志社專供
西方圣經(jīng)上說,挪亞的子孫人口眾多,遍布天下,且只講一種語言。人們齊心協(xié)力用土坯磚和黑瀝青建造“通天塔”,上帝極不高興,就讓他們說不同的語言。由于突然之間大家語言不通,彼此無法交流和理解,工程不得不停止了,這座未完成的塔就叫“巴別塔”。從此以后,人類就一直在找尋溝通的途徑。
先是翻譯、再是世界語,直到目前的機(jī)器翻譯,甚至還有人提出隨著語言的逐漸消融,最終回歸到人類造“通天塔”之前的原初狀態(tài),說同一種語言。無論是哪種方式,人類是否真的能改變上帝的意旨,徹底掃除人類之間的語言障礙呢?
■科學(xué)家:“三五十年內(nèi),我們將為人類掃除語言障礙”
目前,隨著中國加入國際語音翻譯協(xié)會(huì)項(xiàng)目,“語言翻譯”前景看好,似乎在不久的將來能為人類掃清語言障礙。據(jù)中科院自動(dòng)化所模式識(shí)別國家重點(diǎn)實(shí)驗(yàn)室研究員徐波介紹,C-starⅢ項(xiàng)目將從2001年正式啟動(dòng),到2004年結(jié)束。其目標(biāo)是利用公共電話網(wǎng)絡(luò)和國際互聯(lián)網(wǎng),在四年內(nèi)實(shí)現(xiàn)通過手機(jī)、電話、計(jì)算機(jī)終端等設(shè)備進(jìn)行不同語種人類之間在旅行期間的同聲場景對(duì)話,包括預(yù)定旅館、購買機(jī)票、餐館對(duì)話、外幣兌換等,更重要的是該項(xiàng)目把多國語音的直接翻譯作為一個(gè)科學(xué)工程!通過建立系統(tǒng)性的平臺(tái)、演示而推動(dòng)該技術(shù)的迅速發(fā)展,在30至50年內(nèi)最終達(dá)到徹底掃除人類之間的語言障礙。
據(jù)中科院聲學(xué)所專門研究語音交互技術(shù)的杜利民博士介紹,中國著手研究語音翻譯系統(tǒng)已有兩年的歷史。七國語音同聲互譯的原理是,先將本族語識(shí)別后翻譯成中間語言,再用中間語言與其他語言互譯。但目前國際語音互譯計(jì)劃的詞匯量僅限于10000個(gè)字詞,對(duì)話場景也僅僅初步定為預(yù)定旅館、購機(jī)票、餐館對(duì)話、外幣兌換等場所。
縱然如此,在技術(shù)上進(jìn)行直接語音翻譯仍有很大的挑戰(zhàn)性。徐波介紹說,直接語音翻譯集語音識(shí)別、機(jī)器翻譯和語音合成于一體。首先是語音識(shí)別,盡管目前實(shí)驗(yàn)室里的語言識(shí)別率已達(dá)90%以上,但由于現(xiàn)實(shí)生活中的口音、方言、背景噪聲等一系列因素,識(shí)別率僅為60%左右,還需我們在近幾年內(nèi)有進(jìn)一步突破。
其次是機(jī)器翻譯,由于不規(guī)范的文本以及各種語言的自身特點(diǎn),如漢語的非時(shí)態(tài),句子的歧義等增加了翻譯的難度,而最難的是把兩者合在一起,即語音合成。目前除上述七國之外,許多國家都在進(jìn)行這方面的研究,國內(nèi)如IBM等公司,也一直在做相關(guān)研究,而日本的研究,幾十年來一直就沒有停止過。
況且,現(xiàn)在新的方法比較多,如語意法、實(shí)例法、模板法以及統(tǒng)計(jì)法等。對(duì)于像“Howdoyoudo?”一類的句子,對(duì)其進(jìn)行語法分析,怎么都分析不通,但用實(shí)例法像公理一樣把它規(guī)定下來,就簡單多了。今后若能有更多更好的方法并能把這些方法結(jié)合起來,語音翻譯勢必有很大突破,而且不久就會(huì)有突破。徐波描述了三五十年后的誘人場景:對(duì)于不用對(duì)外國進(jìn)行學(xué)術(shù)研究的人,將不必每天疲于學(xué)外語、過級(jí),不必有很多翻譯,即使聯(lián)合國開會(huì)時(shí)也一樣,只需每人帶上一副小巧精致的同聲自動(dòng)語言翻譯機(jī)器,就可實(shí)現(xiàn)與任何其他語種的人進(jìn)行自由交流。
徐波說,“我們的目標(biāo)就是想通過純技術(shù)的力量經(jīng)過哪怕幾十年努力,把人類徹底從語言障礙中解脫出來”。
微軟中國有限公司周明說:“語音翻譯系統(tǒng)之所以難攻克,是因?yàn)闋可娴搅饲ё內(nèi)f化的自然語言,但自然語言也不過很復(fù)雜而已,總有一天,或許要不了多久,人類終將會(huì)攻克它!
■學(xué)者:對(duì)能否違背“上帝的意旨”表示懷疑
即使發(fā)明了更高級(jí)的語音翻譯機(jī),就可以徹底掃除人類的語言障礙嗎?專家們有不同的看法。
北京語言文化大學(xué)計(jì)算機(jī)系主任、對(duì)外漢語研究中心教授宋柔告訴記者,語音翻譯系統(tǒng)的研制對(duì)一部分只需淺層交流的人們很有意義,如果研制成功并達(dá)到相對(duì)完美的情況下,將會(huì)解脫出一批疲于外語學(xué)習(xí)的人們,但卻無法徹底解決人類的交流問題。不同民族的思維對(duì)概念的切分是不同的,比如英語中的“uncle”,在漢語中就分為“伯伯”、“叔叔”和“舅舅”,英語中可對(duì)每個(gè)人都稱“dear”,在漢語中就不能亂叫。而漢語中的“仁儀禮智信”無論翻譯成哪種語言,都不大好對(duì)應(yīng)。語音翻譯歸根結(jié)底仍是機(jī)器翻譯,無論是對(duì)字詞的把握,還是對(duì)微妙的感情色彩的處理,都不可能達(dá)到百分之百的準(zhǔn)確。
中國中文信息學(xué)會(huì)常務(wù)理事董振東說,語音翻譯離不開機(jī)器翻譯作支持。而目前機(jī)譯與人譯的最大區(qū)別是,機(jī)譯只是句法結(jié)構(gòu)和詞匯的機(jī)械對(duì)應(yīng),而人譯則會(huì)基于他對(duì)源語言意義上的理解,不受源語言句法結(jié)構(gòu)的束縛,是一個(gè)再創(chuàng)造的過程。如果在本世紀(jì)機(jī)器翻譯能夠在以下三個(gè)方面有所突破:
第一,大語境,而不再是一個(gè)句子一個(gè)句子孤立地處理。
第二,基于理解而不再是停留在句法分析的層次上。
第三,高度專業(yè)化、專門化,而不再是“萬事通,樣樣松”。
語言學(xué)教授崔希亮則從另一個(gè)角度談到:
語言從大的方面分可大致分為四個(gè)不同的類型:一是孤立語,如漢語;二是曲折語,如英、法、俄、拉丁等語;三是粘著語,如日語、蒙古語;四是編插語,如太平洋等地的某些語言。尤其是編插語,與其他類型的語言差別最大,句子里根本就沒有“詞”這個(gè)概念,或者說一個(gè)“詞”就是一句話,這是一種整體語言。對(duì)于同一句話,只需要改變其中的1個(gè)或某幾個(gè)音素,就變成了完全不同的另一個(gè)意思。像這種語言,要完成與其他語種之間的語音翻譯,難度可想而知。但如果七國電話語音同聲自動(dòng)翻譯計(jì)劃順利完成,肯定會(huì)對(duì)其他語種的同聲翻譯起到促進(jìn)作用,甚至許多問題都能迎刃而解。
■語言“大同”人類方能溝通?
既然人類一直在尋求溝通的途徑,是否可以通過世界語或語言的自然消融而實(shí)現(xiàn)人類的最終無障礙溝通呢?社科院語言研究所研究員方梅介紹說,事實(shí)上,1881年波蘭人柴門霍夫就發(fā)明了世界語,試圖用它來實(shí)現(xiàn)人類的自由交流,但100多年來,世界語并沒有市場。另一方面,世界上的語言總體上在逐漸減少,由以前的6000多種減至今天的5000種左右,但最后消失到一至幾種語言,可能性不太大,即使可能,也需要很長時(shí)間。語言作為一種傳統(tǒng)的東西是有根基和背景的,不會(huì)一下子被打破。
語言學(xué)教授崔希亮則表示,語言的發(fā)展有分有合,要消除至少幾種語言來實(shí)現(xiàn)交流,短時(shí)期內(nèi)不可能。語言與政治、經(jīng)濟(jì)、軍事、文化等原因息息相關(guān)。同一個(gè)民族,若分隔得時(shí)間長了,就變成了兩種語言,不同的民族若融合的時(shí)間長了,就變成了同一種語言,如滿語與漢語融合后,滿語就消失了,這都是政治或政策的原因;再如英語,凡曾是被英國殖民的地方都說英語,但又有所變異。這是經(jīng)濟(jì)原因和軍事原因所造成的。
據(jù)專家介紹,每個(gè)民族都認(rèn)為自己的語言是最豐富最優(yōu)秀的,他們都會(huì)竭力保護(hù)自己的民族語言,像新加坡,一個(gè)還沒有海淀區(qū)大的國家,就有五種語,包括英語、華語、馬來語、印地語和泰尼爾語。有五種語言的出版物、廣播、電視和宗教場所以及學(xué)校等,他們的工作語言是英語,但很少有人只會(huì)說一種語言,若只會(huì)一種語言,尤其是只會(huì)說英語則很難融進(jìn)任何一個(gè)組織。因此,要靠語種的消失來突破人類的語言障礙,不是沒有可能性,但是需要極其漫長的過程。
人大社會(huì)學(xué)系博導(dǎo)教授周孝正則認(rèn)為,語音翻譯系統(tǒng)與語言的消亡本身就是一個(gè)對(duì)立的問題,若語音翻譯系統(tǒng)比較完善,能滿足一般人的溝通和交流,人們將會(huì)越來越依賴于這種機(jī)器,不再去用心學(xué)外語,而只說本族語言,這樣無形中又促進(jìn)了各民族自身語言的發(fā)展,延緩了語言的消融速度。同樣,語言消融速度的減慢,更增添了人類在不依賴于機(jī)器下的自然語言的交流難度。因此,要真正突破人類語言的障礙,并不是一件很輕易的事。
■幾千年前,人溝通障礙能從這塊古石碑(如圖)看出,這是埃及法老托勒密五世的一道詔令,上有古埃及象形文、通俗文、古希臘文三種不同語言。法國學(xué)者對(duì)比后破譯了天書般的象形文,發(fā)現(xiàn)象形文也有標(biāo)音作用,有些符號(hào)發(fā)音,有些不發(fā)音。圖中法老“托勒密”和埃及艷后“克麗歐佩脫拉”的名字寫法截然不同。