您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > COCA语料库操作 演示.ppt
杨百翰大学COCA语料库使用说明1.杨百翰大学COCA语料库简介CorpusofContemporaryAmericanEnglish(1990-2012)能在线免费提供400+million词,在线网址为:但需要用电子邮箱注册才能使用,对不同使用者有不同层次的要求,对最低层的使用者,每天可检索100次,共10000个KWIC行。通过这个网址:还可以搜索到以下语料库:图1.1COCA界面简介1.显示方式2.关键词输入栏3.子语料库4.最小匹配5.结果栏6.KWIC栏2.主要搜索功能•2.1搜索words、phrases、lemmas、wildcards和其他更加复杂的字词•2.1.1输入单词“mysterious”(图2.1.1-1):•得到相关结果(图2.1.1-2):在各子库中的频率,每百万词使用的频率•若对图2中的相应条块进行点击,那么就可以看到KWIC,如图2.1.1-3(以点Fiction的条块为例):图2.1.1-1图2.1.1-2使用chart显示图2.1.1-3•2.1.2输入词组“white+名词”(图2.1.2-1)•得到的结果都是white后面跟的名词短语(图2.1.2-2),检索表达式为:white[n*]图2.1.2-1注意:选LIST规则:输入名词的话用正则表达式:[n*];动词:[v*];形容词:[aj*];副词:[av*]…..既可以直接输入,也可以从POSLIST栏选择对于“[n*]”,可选择“noun.All+”图2.1.2-2White+名词的短语•2.1.3输入通配符(wildcards),如分别输入un*ly和r?n*,结果如图2.1.3-1和.2.1.3-2图2.1.3-1图2.1.3-2•2.1.4输入lemma(即一个单词的单复数、时态等所有形式),若要得到sing这个单词的所有形式,可以如下图所示(图2.1.4-1)图2.1.4-1规则:若要得到某个单词的所有单复数和时态形式,那么就要在输入时,在这个单词外加[]。图2.1.4-2形容词early的原形,比较级和最高级三种形式一次性检索出来检索•2.1.5输入某种词性且部分带有某些字母的命令,如要得到以un-开头、-ed结尾的所有形容词的所有形式(见图2.1.5-1)和得到动词+任何词+ground的所有词组(见图2.1.5-2):•规则:若要得到某种词性且词中带有部分带有某些字母的形式时,如要得到以un-开头、-ed结尾的所有形容词的所有形式,那么输入:un*ed.[aj*];若要得到动词+任何词+ground的所有词组,那么输入:[vv*]*[ground]即可。前者用来研究词汇,后者用来查询特定词性的搭配。图2.1.5-1图2.1.5-2动词+任何词+ground的所有词组•2.2搜索搭配词和出现的频率•如“thick后跟的名词”(图2.2-1)图2.2-1规则:在COLLOCATES里输入[n*]后选择4,表示在thick后面(4跨距范围内)出现的任何名词•如跟在“smile前面的形容词”(图2.2-2)规则:在WORDS里输入:smile.[n*],表示作为名词smile;在COLLOCTES里输入:[j*]表示其前后出现形容词的语境。Confidence前使用的常用形容词图2.2-3•2.3搜索在子语料库(register)内(或之间)出现的频率(或比较)(不同语域中的用法)•如在Fiction和Spoken子数据库中passionate后面可以跟任何名词的词及频率,分别如两图(2.3-1和2.3-2)图2.3-1图2.3-2图2.3-2•但是也可以之间对两者子语料库中它们出现频率的对比,操作:分别选择section1&2,如下图(图2.3-3):图2.3-3•2.4进行语义倾向比较•2.4.1比较近义词•如:近义形容词hot和warm后面所跟名词的区别(如图2.4.1):图2.4.1规则:首先选择COMPARE显示。然后在WORDS的方格里分别输入hot和warm,再在COLLOCATES方框里输入[n*],表示后面所跟任何名词。当然也可以比较在某个子语料库中出现的频率比较。•2.4.2比较反义词•如:woman和man前面所跟的形容词的区别(如图2.4.2)图2.4.2规则:在WORDS的方格里分别输入woman和man,再在COLLOCATES方框里输入[j*],选在左3,表示前面3个跨距内所有的形容词。当然也可以比较在某个子语料库中出现的频率比较。•2.4.3搜索近义词•如:搜索beautiful的所有近义词(如图2.4.3-1)规则:在WORDS的方格里输入[=beautiful],表示和beautiful语义相近的所有形容词。•再如:搜索动词clean的所有近义词,如下图:图2.4.3-2•当然可以进一步搜索与clean语义相近的动词+the+名词的词组,[[=clean]].[v*]the[n*]如下图:图2.4.3-3思考:•1)如何查询多义词特定的词性的KWIC,如for作连词或介词等?•2)如何查询某个词前/或者后面特定词性的若干搭配词,如confidence前的形容词?•3)词性附码应放置在什么位置?
本文标题:COCA语料库操作 演示.ppt
链接地址:https://www.777doc.com/doc-3149128 .html