您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 大学实用翻译教程(英汉双向-)第三章--计算机辅助翻译
第三章计算机辅助翻译有史以来,人类对翻译方法的探求就不曾停止过。随着世界各国商贸、政治往来越来越频繁,经济全球化越来越迅速,对于翻译的需求量越来越大,人们对于更加快捷、更加简便的翻译方式的渴求也越来越强烈。电子计算机的出现,使人类的生活发生了翻天覆地的变化,通过网络,一方屏幕之间可以承载远隔千山万水的信息交流与传递,其高效的信息处理模式也给传统的人工翻译变革带来了新的曙光。可以说,计算机和翻译一样都是为了打破人们交流的障碍,重建属于世界的“巴别塔”,那么,将计算机技术与翻译相结合,产生的新兴课题“计算机辅助翻译”究竟是什么呢?本章将对机器翻译和计算机辅助翻译的发展历程进行回顾并展望其未来的发展前景,并且介绍几款主流软件和翻译工具的使用,详解如何利用搜素引擎和最大化地利用在线翻译,让读者对于计算机辅助翻译有一个较为清晰和全面的了解。第一节计算机辅助翻译的“前世今生”与前景展望•“计算机辅助翻译”这个概念从更早的“机器翻译”发展而来,经历了漫长的发展历程,伴随着人们认识的深入和实践的丰富,其内涵不断地得到扩充,应用范围也在不断地扩展和延伸,这一节将详解计算机辅助翻译的“前世今生”,并展望其未来发展的趋势和远景。1.1计算机辅助翻译的发展历程•“机器翻译”的概念可以追溯到20世纪30年代,40-50年代初经历了早期的尝试阶段,当时,大多数从事手工翻译人士对于“利用计算机进行翻译”不以为然,他们根本就不相信翻译会机械化,少数人则或多或少有一点担心,害怕有一天机器会把他们取而代之。•50—60年代中期学界对于“机器翻译”持高度乐观的态度。Systran翻译软件将“机器翻译”定义为利用计算机软件把文本内容从一种自然语言转换成另一种自然语言,这个定义就是说“机器翻译”是利用语言结构、规律和把原文(thesourcelanguage)的语言结构转换成译文(thetargetlanguage)的语言结构。“机器翻译”这一想法产生的时间正是结构主义语言学的观点盛行时期。由于人类对语言结构规律的研究越发深入,语言学家为翻译找到了更多的理论依据作为支撑,从而给翻译加上了科学主义的色彩。奈达、巴尔胡达罗夫以及彼得·纽马克等人的翻译观都是从结构主义理论开始的。(张治中,俞可怀,2002:54-58)结构主义者认为在各种复杂的表面现象的下都有着一种普遍性的规律,这些规律就是结构,人们通过分割归并作品的各种结构就可弄清语言信息变成文艺作品的奥秘。(吕俊,2001:96-111)•1966年美国的ALPAC(TheAutomaticLanguageProcessingAdvisoryCommittee)报告对机器翻译的研究和应用开发是一次沉重的打击,也是研究方向的转折点。经过十年左右的沉寂和停滞,70年代后期,研究和开发有了复兴。70年代出现、80年代形成的认知语言学认为:人在形成有意义的概念及进行推理的过程中,人类的生理结构、身体经验以及人类丰富的想象力发挥了重要的作用;任何语言形式本身没有意义,它们只作为线索激活我们脑中已经存在的意义——身体经验,并依据自身体验而有意义。翻译正是一项以人为主体的跨语际交际活动,只有人这个主体才能胜任,人类在其所处的社会群体中发生的交际活动是以社会环境和知识背景为基础的。而相比之下,计算机没有感情,没有对生命的理解和体验,仅仅依靠单一的逻辑,即使计算再精确也无法完成复杂的人类交际活动。•到了20世纪80年代,“机器翻译”的提法和研究进入了反思的理性阶段,其标志是开始有人质疑“机器翻译”这一概念,提出了我们必须区分以下三种概念:(1)机器翻译(machinetranslation):全部翻译由机器完成,但是其结果必须经人工修订;(2)辅助手段(computeraidsfortranslators):翻译活动由人工进行,机器翻译只是作为人们翻译时使用的辅助工具;(3)非翻译人员为获取梗概大意偶尔使用的机器翻译系统(translationsystemsforthe“occasional”non-translatoruser).(Hutchins,2001)JohnHutchins等人提出了“机器翻译”的提法不合适,应该是机器辅助翻译。时至今日,计算机人性化尚不能实现,即使随着科技的进步,计算机已经学会记忆并具备学习功能——有些辅助翻译软件具备简单的学习记忆功能(例如,我国北京实达的“雅信”翻译软件),但是仍然无法突破不会思维的障碍,不可能翻译出与人工翻译相媲美的译文来。况且计算机对于新兴的、或者特殊的表达形式根本就不会处理,根本不会“翻译”,直接导致了它学习、记忆的步伐永远落后于时代的进步。要获得地道的完整的译文必须要经过人工修改、加工。•80年代后期到90年代早期出现了新的转折点,“机器翻译”研究开始从纯理论研究转向实际应用,计算机科学的发展和计算机语言学的发展,使人们对计算机在辅助翻译方面抱有很大希望。从上面列举Systran系统翻译的例子我们可以看出,词的这一层次的转换准确率高达95%以上。如果作为辅助翻译,该系统是很有效的。值得注意的是,人与计算机在处理要翻译的材料时的速度差别甚大。以Systran翻译系统为例,它每秒可处理3700字,而人工翻译每天只能翻译2000-3000字。(张治中,俞可怀,2002:54-58)由于互联网发展神速,要翻译的多种语言的信息,远远超过人工翻译的承受能力。让我们不得不思考“机器翻译”与“人工翻译”究竟该如何选择的问题,其实二者并不矛盾,而且可以相辅相成、互补不足,在这个信息爆炸的时代,机译可以帮助我们收集只需梗概大意的信息,而人译则能使这些信息合理组合,获得极高的可读性,它们的结合便产生了“计算机辅助翻译”。这一概念逐渐为人接受,研发者着手为职业译者提供译者工作台(translatorworkstation),在受控语言和受限专业系统方面进行开发,并探讨在多语信息系统里如何应用翻译组件。1.2计算机辅助翻译的发展前景展望•根据前面对机器翻译的介绍可以看出,自然语言的复杂性决定了机器翻译技术发展的困难性。计算机语言学家提出了各种各样的机器翻译理论,但目前为止还没有哪种理论能够有效的解决所有问题。但是,机器翻译系统的应用领域正在发生变化。人们正在尝试将机译技术结合到信息访问、信息提取和自动文摘中。这类跨语言应用在全球范围内越来越引起人们的兴趣。未来对于口语的翻译也是市场迫切需求的,但尽管基于某些方面的需求,机器翻译的发展方向更加多元化,但无论从实际应用角度还是从理论研究角度来看,全自动的话语翻译还是很难实现的。当然,虽然机器翻译的发展有诸多阻碍,但仍然有更多的发展希望。目前,单语语料库加工技术以及应用在计算语言学领域内取得的成功,使建立双语或多语语料库并进行多层次的加工作为大规模的跨语言资源成为研究的焦点之一。另外,大规模的语料库适合于统计方法的应用,通过统计来自动进行知识获取,有助于克服自然语言处理中知识获取的瓶颈。把机器学习方法应用到机器翻译中,可以帮众系统实现在线学习功能,最终建立主动的智能翻译服务也是机器翻译的发展方向之一。•在全自动翻译的质量尚不能满足要求的情况下,计算机辅助翻译系统和软件的开发是机器翻译的突破性发展。计算机辅助翻译为译员提供一个半自动的工作环境,帮助译者提高工作效率的同时,更能保证翻译的质量。然而,目前的计算机辅助翻译技术大多是以句子为单位的,在未来的发展中,应该更加注意语境因素,将范围扩大到语篇,这将使翻译结果更为准确。另外,目前使用计算机辅助翻译软件的团体或个人往往不愿意将资源共享的情况,应努力改善这种状况,建立更多如中国知网一样的共享数据库。如果译员使用一个大型的共享翻译记忆库就能将重复的翻译劳动降至最少,并帮助解决语义的理解分析问题。与机器翻译一样,现在还没有能够进行口语翻译的计算机辅助翻译系统或软件出现,这也是机辅翻译的一个重点发展方向。除此之外,能够开发出操作更加简便、性价比更高的机辅翻译软件更是市场的迫切需求。(董晓波等,2011:328)•在过去的几十年里,信息技术翻译手段在曲折中前进。到如今,计算机翻译技术发展迅猛,展望未来,计算机辅助翻译发展前景广阔,无论是机器辅助人的翻译软件(MAHT——MachineAidedHumanTranslation,近来我们称之为CAT——ComputerAidedTranslation),还是人辅助机器的翻译软件(HAMT——HumanAidedMachineTranslation),将来都有其可用武之地,因此,开发出实用的、能满足使用者需要的翻译软件一直是研究者、研发人员们所探索的未来发展之路。第二节计算机辅助翻译的原理•计算机辅助翻译是语言学,数学,计算技术和自动化技术等学科部门结合的产物,但归根到底是个语言学问题(刘涌泉,1997:79-82)。早期的系统基本由双语辞典构成,一个源语词汇对应一个或多个目标语词汇,再配备有产出正确句序目标语的语法规则。但很快人们就意识到,仅靠词汇和词序是很不够的,还需要更为系统的句法分析。当时盛行的形式语法似乎能为此寻找一条出路。但随后,研究者又陷入机器在语义理解上的困境。80年代,机器翻译系统的主导策略是通过中间表述(intermediaryrepresentations)实现的间接翻译(indirecttranslation),过程涉及到语义、句法、词法层次的分析,有时伴有非语言的知识库。80年代末,IBM研究组公布了他们完全基于统计方法的机器翻译系统(Candide)的成果;一些日本研究组开始利用翻译语料的方法,这种方法后来被称为“基于例句”的翻译。与此前“基于规则”的翻译系统不同,这两种的特点都是不再利用句法或语义规则来分析文本或选择对等词汇,而是利用了大规模的文本语料,翻译模块混合了基于规则和基于语料的方法。•这个时期,几乎所有的研究活动都致力于在传统的基于规则和“中间语言”模式的基础上进行语言分析和生成方法的探索。这些方法都伴有人工智能类型的知识库,表现了更具创新性的潮流。译员的需要让位于商业兴趣:术语管理软件出现,如Mercury/Termex。ALPNET在80年代上市了一系列翻译工具,其中还包括“翻译记忆库”(TranslationMemory,TM)的早期版本,即将事先翻译好的双语文本对齐后形成的数据库。•90年代早期,机器翻译研究被新兴的基于语料库的方法向前推进,比如统计方法的引人(如IBM公司的Candide计划),以及基于实例的机器翻译等。统计技术为先前基于规则的方法带来了解放。消除歧义问题,代词指代以及更多的惯用法生成等问题,都因为基于语料库技术的应用而有了解决的希望。统计方法跟基于规则的方法一样也不能提供更多让人满意的答案,但是跟10年前相比,现在提高输出译文质量的希望似乎更大了,最有前途的方法可能是前文提及的整合了基于规则和基于语料库的方法。现在许多商用机器翻译系统正在集成翻译记忆库,而许多翻译记忆库又被机器翻译方法加强。(钱多秀,2009:49-54)第三节主流软件的介绍及使用•3.1TRADOS•Trados于1984年由德国工程师约亨·胡梅尔(JochenHummel)和希科·克尼普豪森(IkoKnyphausen)开发,在德国斯图加特成立了Trados公司。应该被称为是计算机辅助翻译软件的鼻祖,号称“翻译软件中的DOS”,SDLTrados是目前国际最流行的计算机辅助翻译软件,在全球已经拥有20多万用户,全球500强企业中有超过90%的公司都在使用SDLTrados辅助日常的本地化翻译工作。使用SDLTrados,用户通常能够将完成工作的速度提高50%左右,并可以显著减少翻译错误。除此之外,SDLTrados还设有专门的术语库,可以使文本中出现的相同术语翻译统一,使译文显得更为精准、工整、专业,这一点对科技、法律、医学等方面的翻译都尤为重要。(董晓波等,2011:303)•Trados的精髓在于创立了翻译记忆体的概念,即TM(Trans-lationMemory)。作为众多国外计算机辅助翻译系统中的典型代表。Tra
本文标题:大学实用翻译教程(英汉双向-)第三章--计算机辅助翻译
链接地址:https://www.777doc.com/doc-7052462 .html