您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 基于场景词库的翻译方法
一种翻译过程中基于场景词库的快速输入法文章来源:多语工程技术研究中心《云翻译技术》第12期专利名称为:一种翻译过程中基于场景词库的快速输入法,申请号为CN200710065015.6的该项专利是传神联合(北京)信息技术有限公司申请并获得授权的一项专利,之后转让给传神(中国)网络科技有限公司,受让者已通过专利质押获得收益。利用本发明提供的基于场景词库的快速输入法,有效提高的翻译过程中文本的输入效率,实现了翻译过程中的快速输入。随着社会科技与经济的飞速发展,不同语种之间的信息交流已经成为信息交往中的重要部分,随之而来的各种翻译需求也越来越广泛。除了译员的翻译功底,译员的文字输入速度对翻译速度的影响也是不可忽视的。如今常用的紫光华宇拼音输入法是一个完全免费的、面向用户、基于汉语拼音的中文字、词及短语输入法。它具有智能调整字序的功能,可根据用户前一次的输入情况,动态调整汉字的优先选择顺序,即紫光华宇拼音输入法具有可调频词库,能够根据用户使用词频的大小动态调整字或词的显示顺序,方便不同词汇需求的用户。而对于某些不可调频词库的输入法,用户只能按照词库预定的顺序选择需要的字词。申请号为200610109732.X的中国发明专利申请公开了一种获取新词的方法、装置以及一种输入法系统,在用户输入过程中,获取用户选择的字词并与现有字词相比较,根据比对结果获取用户个性字词并将这些个性字词加以收集获得新词。其中在此库的生成过程中,根据用户的输入过程记录用户所选字词及用户词频,并对字词相应地各用户词频进行权重修正,计算各字词的用户积累词频,以此生成词库。依据这种方法,能够从各用户的个性字词中分析获得具有普遍意义的新词,从用户输入的角度提供解决方案,可以简单方便的获取比较准确、具有普遍意义的信息。然而面对各种领域的翻译需求,上述两种输入方法并不能有针对性的快速输入,在翻译输入过程中仍存在输入效率低的问题,难于根据用户的翻译需求最先显示用户需要的字词,经常需要在字词选择栏中加以翻页才能找到用户需要的字词,而且上述输入法要求用户必须安装使用后才能生效,改变了用户的输入法习惯,增加了推广的难度。为了解决上述问题,本发明提供一种翻译过程中基于场景词库的快速输入法,基于场景词库的快速输入法流程如图1所示:(1)在翻译过程中,首先打开需要翻译的一句话;(2)获取该句子中每一个单词所对应的中文词汇;(3)从场景词库中取得对应的词条;(4)然后检测用户所选择的输入法;(5)将从场景词库中取得的相应词条注入到输入法词库中;(6)并将该词条在输入法输入框中的显示顺序优先级调到可以被首次选取输入的位置;对于词库可调频、不可调频两类不同的输入法,本发明提供了两种不同的处理方式:(a)对于支持可调频词库的输入法,将需要注入词条的频率调整到最高,使得根据所翻译句子中的词汇获得的词条总显示在最前面,方便用户在输入拼音后、相应字词显示最初就能选择合适的词汇;退出场景后,清除所注入的词条,恢复原词库固有的词频排列顺序;(b)对于使用不可调频词库的输入法,拦截输入法的词库查询命令,将需要注入的词汇以缓存的方式放在最前面,使得用户在输入相应拼音后,就能在计算机显示拼音相对应词汇的最初选择到需要的词汇;退出场景后,删除缓存中的词条,恢复原词库固有的词频排列顺序;(7)运行输入法词汇输入命令,查找所述词条,同时选取输入法输入框中的上述被调到可以被首次选取输入的位置的对应词条,并输入之;重复上述步骤,直至所有待翻译句输入完毕。举例来说,翻译“IcomefromChina.”这句话,依据本发明的方法会首先根据该句中英文所对应的中文词汇从场景词库中取得对应的词条“我”、“来”、“来自”、“中国”或者“我来自中国”,然后检测用户使用的输入法,将取得的词条注入到输入法词库中,通过调整注入词条频率或者连接输入法词库查询命令的方式,使用户输入“W”或者“I”的时候,“我”和“我来自中国”显示在最前面以供选择,输入“L”或者“Come”的时候,“来”和“来自”显示在最前面以供选择,输入“z”或者“China”的时候,“中国”显示在最前面以供选择。拼音或者英文所对应显示的词汇中,注入的词条显示在最前面,大大提高了翻译输入的速度。该句翻译完毕后,退出场景,自动删除所注入的或者缓存中的词条。本质上就是利用注入场景词库的内容以及最短的键码,乃至单键码实现输入,大大提升输入速度。本发明解决了现有的输入方法中不能对特定文本尤其是翻译文本进行有针对性的快速输入的不足,在不改变用户输入法习惯的情况下,采用词库与词汇注入的方案,在现有输入法的基础上,通过在翻译输入的过程中暂时的、有针对性地修改字词的显示顺序(词频),有效提高的翻译过程中文本的输入效率,实现了翻译过程中的快速输入。
本文标题:基于场景词库的翻译方法
链接地址:https://www.777doc.com/doc-2574545 .html