您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 商业计划书 > 第2课 互联网搜索引擎、信息服务与翻译实践
计算辅助翻译原理与实践俞敬松第2课互联网搜索引擎\信息服务与翻译实践主要内容•原理•介绍和分类•搜索技巧和高级搜索•例证搜索引擎的分类搜索引擎根据组织方式全文搜索引擎目录式搜索引擎根据搜索范围元搜索引擎独立搜索引擎根据信息内容综合搜索引擎专业搜索引擎全文搜索引擎•FullTextSearchEngine•国内:百度,搜狗,有道•国外:altavista,Google,YAHOO!,Yandex,Bing,Teoma搜索引擎的分类搜索引擎根据组织方式全文搜索引擎目录式搜索引擎根据搜索范围元搜索引擎独立搜索引擎根据信息内容综合搜索引擎专业搜索引擎目录式搜索引擎•SearchIndex/Directory•OpenDirectoryProject(DMOZ)•YAHOO!•About.com搜索引擎的分类搜索引擎根据组织方式全文搜索引擎目录式搜索引擎根据搜索范围元搜索引擎独立搜索引擎根据信息内容综合搜索引擎专业搜索引擎元搜索引擎•METASearchEngine•metacrawler•WebCrawler•dogpile搜索引擎的分类搜索引擎根据组织方式全文搜索引擎目录式搜索引擎根据搜索范围独立搜索引擎元搜索引擎根据信息内容综合搜索引擎专业搜索引擎综合性搜索引擎•检索全面,不限制信息类型和范围•使用频率高,满足更多需求•内容宽泛,噪音较大搜索引擎的分类搜索引擎根据组织方式全文搜索引擎目录式搜索引擎根据搜索范围独立搜索引擎元搜索引擎根据信息内容综合搜索引擎专业搜索引擎专业搜索引擎•垂直搜索引擎•针对具体一类或者几类信息•结果相对较少,命中率较高搜索引擎的使用技巧1.选对搜索引擎2.用准关键词3.运用语法和高级检索1.选对搜索引擎•不同搜索引擎有不同特点,同一关键词会得到不同的结果•同一搜索引擎的不同语言或版本之间的搜索结果也不相同百度GoogleHKGoogleUSBing国内Yahoo中国Bing海外2.用准关键词•主题限制词•多角度选词•避免口语词汇•双语检索2.用准关键词—主题限制词•限制领域范围•排除有歧义的检索词例:Across+本地化2.用准关键词——多角度选词•正确分析检索主题得到关键词•多方面提炼反映该主题的词汇以提高查全率。例如,希望查找搜索引擎的发展历史2.用准关键词——避免口语词汇•StopWords(停用词)•概念•口语中包含大量停用词•停用词主要有两种情况(精确匹配除外):•出现极为频繁的词语•出现频率高但单独使用没有意义的虚词2.用准关键词——双语检索•查找源语和目标语言的部分或全部词例1:“公民道德建设实施纲要”的英译例2:2.用准关键词——双语检索•查找源语和目标语言的部分或全部词例:“公民道德建设实施纲要”的英译3.使用语法和高级检索•布尔检索•概念:通过使用逻辑符号来增加或较少检索内容,从而提高检索精度。•逻辑检索符•逻辑“与”(×,AND)•逻辑“或”(+,OR)•逻辑“非”(-,NOT)Google中的布尔检索表达Google中的布尔检索表达•与:Google无需用明文的“AND”或“+”来表示逻辑“与”•或:Google用大写的“OR”表示逻辑“或”操作。例如“AORB”•非:Google用空格加减号“-”•表示逻辑“非”操作。例如“A-B”计算机OR显示器,搜索出包含“计算机”或“显示器”或两者均有的网页无需使用明文的and或加号未在减号前加空格,起不到“非”的效果在减号前加空格起到“非”的效果例如:直接搜索Englishtranslation,会怎样?Google中的引号使用Google检索语法•Google检索语法完成更加精确的检索。•Google常用检索语法包括:site:filetype:intitle:inurl:inanchor:link:define:related:intext:关键字[空格]site:网站•搜索结果局限于某具体网站。•“site:”可后接:•某具体网站,如pku.edu.cn•某域名范围,如jp,edu等•如果要排除某网站或者域名范围内的页面,只需用“[空格]-网站/域名”练习•在中国研究生招生信息网搜索招生简章•在中国研究生招生信息网和新浪教育搜索招生简章•在除中国研究生招生信息网外的范围内搜索招生简章•搜索中文教育科研网站(edu.cn)关于招生简介的页面。关键字[空格]filetype:文件类型•检索某些类型的文档。•支持文件格式:•MicrosoftOffice的xls/ppt/doc文档等•Adobe的pdf文档•ShockWave的swf文档•练习:搜索关于北京大学的pdf文档define:关键字•使用define查询包含关键词定义的页面•例如,搜索geek一词的定义:•define:geekinurl/allinurl:关键字•查询url中包含指定词语的页面•例如,inurl:cat•inurl与allinurl的区别,举例说明:•inurl:catdog•allinurl:catdogintitle/allintitle:关键字•查询网页标题中包含指定词语的页面•例如,intitle:Padora(sic)Japan•intitle与allintitle的区别intext/allintext:关键字•查询网页正文中包含指定词语的页面•例如,intext:CATMT•练习:intext与allintext的区别inanchor/allinanchor:关键字•inanchor指令返回的结果是导入链接锚文本文字中包含搜索词的页面•inanchor与allinanchor的区别•例如:allinanchor:computeraidedtranslationlink:网址•搜索所有链接到某个URL地址的网页。•例如:搜索所有链接到的网站•link:网址•搜索与要查询的网站结构内容类似的其他网站。•例如,搜索与中关村在线类似的其他IT资讯网站:related:…•authormovie•bphonebookphonebook•cacherphonebook•datarangesafesearch•groupsource•infostocks•insubjecttq•locationweather高级搜索•AdvancedSearch•设置高级选项,缩小搜索范围,精确检索结果•对应部分搜索语法,可以为不熟悉高级搜索语法的使用者生成所需的关键词。高级搜索•逐条缩小搜索范围,搜索引擎会自动生成搜索关键词。•例如:在计算机技术网站“geek.com”中查找有关“computervirus”的文章,同时还希望文中提到“antivirus”或“antispam”的信息。搜索栏出现以下语法:•computervirusantivirusORantispamsite:高级检索和翻译实战•用案例展示翻译相关的搜索技巧•回译•标示语“小草有生命,足下请留青”•固定用法“无历史依据”•查看论坛某用户全部发言1.回译•将A语言的译文B再翻译回A语言。例1:“昨天晚上,南京军区司令员朱文泉中将在南京会见了战略计划与政策局局长,以特雷西海军少将为团长的美军太平洋总部中级军官代表团,宾主进行了亲切友好的交谈。”——摘自对外传播新闻中的专名翻译技巧探析(中国翻译2011年第二期)1.回译•特雷西•战略计划与政策局•美军太平洋总部1.回译例1:“昨天晚上,南京军区司令员朱文泉中将在南京会见了战略计划与政策局局长,以特雷西海军少将为团长的美军太平洋总部中级军官代表团,宾主进行了亲切友好的交谈。”ZhuWenquan,commander-in-chiefoftheNanjingCommand,metonTuesdayinNanjingwithRearAdmiralMichaelTracy,DirectorforStrategicPlanningandPolicy,US.PacificCommand,whoisheadingadelegationofmiddle-rankingofficersfromtheUSPacificCommand.1.回译例2:Thousandsofyearsago,thegreatphilosopherMenciussaid:“Atrailthroughthemountains,ifused,becomesapathinashorttime,but,ifunused,becomesblockedbygrassinanequallyshorttime.”—奥巴马在2011年世界经济论坛上的致辞山径之蹊间,介然用之而成路。为间不用,则茅塞之矣。2.标示语•以“小草有生命,足下请留青”为例•译文:PleaseKeepOffTheGrass3.“无历史依据”怎么翻?•historicalbasis?•historicbasis?•其它?4.在论坛上查看某人的相关帖•在翻译论坛看到某人大作,感觉十分受益,想看和他相关的其他帖子•例如,查看北大BBS论坛上所有跟“王聪”相关的帖子•提示:使用site指令善用学术数据库,助力翻译•译员在翻译中需了解的专业背景知识与源语文本的专业性成正比。•专业知识的获取:•地毯式全网搜索大海捞针!•善用学术数据库手到擒来!•学术资源的一般特点:•针对性、规范性、科学性、可靠性学术数据库如何助力翻译?•1、背景知识建构•2、内容查询:•字词术语、语篇结构、图表数据•3、译文准确性验证:•术语使用、语篇结构的规范性、数据信息的表述等验证。•中外文电子期刊(包括学位论文)•电子图书和电子报纸•学科信息门户•专利资源、科技报告、标准文献等学术数据库分类中外文电子期刊数据库:•Electronicjournals,包括:1.与纸本期刊并行的电子期刊,如著名的《科学》杂志()等;2.纯电子期刊数据库,如Elsevier、Springer、JohnWiley、ProjectMuse、JSTOR、Nature、Science、IOP、ACS、AMS、AIP、ACM、RSC3.GoogleScholar谷歌学术搜索引擎:•国内常用学术资源数据库包括:•中国期刊网(中国知网)、万方数字化期刊、维普电子期刊等案例-烃源岩特征研究及相关剖面图开放获取的电子期刊•开放获取(OpenAccess)电子期刊,有影响的OA站点:1.HighWire:斯坦福大学图书馆创立于1995年:DirectoryofOpenAccessJournals,瑞典Lund大学,2003中国科技论文在线:开放获取期刊列表学科信息门户1.特定学科领域的网上信息资源、工具和服务的集合,信息检索和服务入口。2.学术资源的“hao123”,信息资源分类集中并经严格选择3.学科信息门户的特点:专业性、集成性、知识性学科信息门户介绍(国内)1.CALIS重点学科网络导航()现建成265个学科导航系统,其学科几乎覆盖了社会科学(75个),自然科学(190个)的各个学科领域。2.北京大学图书馆“INTERNET学术资源学科分类导航”()包括哲学、数学、图书情报学、工商管理、历史学、环境科学等学科。3.清华大学学科网络导航(ht
本文标题:第2课 互联网搜索引擎、信息服务与翻译实践
链接地址:https://www.777doc.com/doc-4614256 .html