发新话题
打印【有0个人次参与评价】

[其他] 纽约时报:谷歌翻译与人工翻译(纯技术贴,与google.cn事件无任何关系)

纽约时报:谷歌翻译与人工翻译(纯技术贴,与google.cn事件无任何关系)

这篇文章与眼下的google.cn事件没有任何关系,只不过我曾经使用过一次谷歌翻译,感觉翻得不错,再加上人工修改,居然将领导的任务交了差。但一直弄不明白为什么谷歌能翻译得这么好,终于看到这一篇很好的介绍文章。但又没处可放,所以寄放在这个版块。

[ 本帖最后由 yoyopapa 于 2010-3-27 23:13 编辑 ].

TOP

  我们都有过这样的经历:在克罗地亚餐馆,你无法看懂菜单;在法国海岸边,警告标语让你哭笑不得。即使在一些较为重要的领域里,“人工”翻译的质量也不尽人意。译者的工作十分辛苦,但报酬却很低,无论是法庭还是医院,军事还是安保,在无数次至关重要的交流场合上,他们提供的翻译总是让人费解。机器翻译无疑也能胜任这些工作,因为比起那些经济困难的译者,它们犯的错误也差不到哪里。

  事实证明,机器翻译也能在情况紧急时发挥作用。今年一月,海地爆发了特大地震,许多救援团队来到这个破败的小岛上,他们操着各自的语言,但没人懂得当地的克里奥尔语。此时被困者应该如何用手机向救援队发出求救信息呢?若是坐待一位汉语、英语或土耳其语翻译,或许救援队还没明白,被困者就死了。有鉴于此,卡内基梅隆大学在震后迅速发布了一套有关克里奥尔语的口语和文本数据,大批网络志愿者用了差不多一个周末的时间,开发出一个简易的机器翻译系统。机器翻译的文字没有多少美感,但此时却有了用武之地。

  谷歌翻译(Google Translate)在机器翻译里可谓后起之秀。去年,谷歌翻译在研发上硕果累累,因而机器翻译的优劣成为了时下翻译界日趋热门的话题。不过,对这一话题的争论早在机器翻译诞生的那一刻便开始了。

  人们对机器翻译的需求可以追溯到冷战初期。那时,美国认为苏联泄露的任何只言片语都应详细审查,但当时根本没有足够的译者来完成这一任务(同样,对于所有需要监听的语言,美国目前也没有足够数量的译者)。冷战的需要引发了计算机的诞生,而“破解俄语”则成为了这些机器早期的任务之一。

  沃伦•韦弗(Warren Weaver)被誉为机器翻译的鼻祖。他抛却了俄语文本的含义,转而将其视为一堆“密码”。在美国和欧洲,他的团队和继任者在工作时都遵循着一个常理:任何语言都是由一堆词汇和一套语法规则组成。只要把两种词汇放到机器里,按照人类组合这两种词汇的方式,为之建立一套完整的规则,机器就能破译“密码”。

  以乔姆斯基(Noam Chomsky)为代表的一批语言学家也认为,语言是由词汇和语法构成,有限的语法规则可以产生无数个含义不同的句子。在牛津大学,反对乔姆斯基观点的语言学家却评论道,同一家英国汽车制造厂也可以生产出无数的汽车,而每辆汽车的故障却各有不同。随后的四十年,机器翻译虽然取得了许多可喜的成果,但犹如那个英国汽车厂,远远未能达到人们当初的期望。.

TOP

  可如今我们有了另一个强大的翻译工具。谷歌翻译采用的技术是统计机器翻译,它并不奢望解析或理解任意一句话。传统机器翻译是将句子拆开,按照“目标”语言重组,但谷歌翻译是在已经翻译过的网络文本中寻找类似语句。它运用高度智能和无比快捷的统计方法,找出最相似的匹配语句,而后提供草译版本,或经过细微修改的版本,这与译者头脑中的翻译过程十分相似。

  谷歌翻译迄今已能够应付52种语言。它并没有触及语言学中的理论问题,例如语言的定义及其在人脑中的工作机理。事实上,人们总是用语言描述同一事物,而谷歌翻译涵盖了95%左右的事物,因而它可以算是一个绝妙的翻译工具。但在使用谷歌翻译或其他统计机器翻译时,用户需要明白,这类翻译工具存在两大局限。

  首先,谷歌翻译提供的译文绝对不能当作“正确的译文”:因为世上根本就没有“完全正确的译文”,况且谷歌翻译提供的只是最匹配的语句,这些语句是对网上搜集的海量信息进行分析后得出的。

  这些信息很大一部分来源于国际组织的文献记录。在联合国和欧盟等国际组织工作的译者成千上万,他们耗费了无数个日日夜夜里翻译的译文现在却恰好成为了谷歌翻译选取的最佳材料。对谷歌翻译而言,先有人工翻译,而后才有自己。

  谷歌翻译在不同语言的转换上呈现出不同的翻译质量,这主要是因为网络上这些语言的人工译文数量存在着差异。.

TOP

  对于文学作品,谷歌翻译的质量又如何呢?可以说,谷歌翻译产生了意想不到的效果,因为它利用了资料最为丰富的谷歌图书(Google Books)。比如《悲惨世界》里那句爱情名言:“On n’a pas d’autre perle à trouver dans les plis ténébreux de la vie”,谷歌翻译得出了一个非常优秀的版本:“There is no other pearl to be found in the dark folds of life”(在生活的黑暗褶子里,是找不到其他珍珠的),而这一版本又恰好与一部英译本提供的译文相同。电脑完成这一工作不过是小菜一碟,但对我们人来说呢?恐怕只得潜入地下室去搜寻那部旧书了。

  不过,谷歌翻译程序还尚不健全。例如普罗斯特所著《追忆似水年华》的卷首语经谷歌翻译后,成了不符合语法规则的“Long time I went to bed early”,其余的大部分现代名著在经过谷歌翻译后也同样不堪卒读。

  谷歌翻译究竟能否创造出新的文学译作?首先,这一做法毫无必要,因为国内并不缺乏翻译外国文学的译者,他们都争先恐后地寻找机会出版自己的译作。

  即使有这样的需要,谷歌翻译也无能为力。它的设计和程序并没有考虑语言表达的目的、风格以及说话时的情景。如果有程序能够做到这一点,那绝对是一个划时代的成就,不过目前最先进的机器翻译开发人员也没有想过要实现这一奇迹。

  哪怕换个角度想一想,如果我们对当代国外小说的某种风格持有一种固执的偏见(比如,我们认为法国的小说围绕得都是通奸和继承问题),那么我们有可能以为:这类作品毫无新意、千篇一律,只要大量扫描并上传此类译作和原著,我们就可以借助谷歌,翻译好其他同类的外国作品。

  可那又怎样呢?这并非文学翻译的要旨所在。对于那些原汁原味而又值得翻译的外国作品,我们根本不能把希望寄托于机器翻译。纵然谷歌为我们在各个领域的生活工作提供了便利,但其设计之初的目的却并非是诠释不符合程序的文学作品,使它们更具可读性。同样,让谷歌翻译去尝试这一任务也是不公正的:毕竟,文学翻译也让人类伤透了脑筋。

  大卫•贝洛斯是普林斯顿翻译及跨文化交流项目主任。.

TOP

不错的文章,换了一个角度。.

TOP

这篇文章应该拿到外面去啊,怎么在圈子里?有点浪费..

TOP

发新话题