您好,欢迎访问三七文档
1语料库在外语教学研究中的应用及方法潘璠计算机辅助语言教学研究所华中科技大学外国语学院2008年4月2Outline:1.语料库和建库原则2.语料库检索方式3.运用语料库进行外语研究:方法和实例4.语料库资源介绍31.语料库和建库原则语料(corpus),又称为素材,是自然发生的语言材料(包括书面语和口语)的集合。可以用来作为描述一种语言的出发点或用于证实有关一种语言的假设的手段(Crystal,1991)。语料语言学(corpuslinguistics)是以语篇(text)语料为基础对语言进行研究的一门学科,是计算语言学的一个分支。4语料库对语料的处理由较为简单的机器可读形式发展到人工或自动词性附码(tagging)和句法分析(parsing)的注释(annotated)形式。利用语料对语言进行研究的成果已被用于辞典编纂和语言教学等实际工作中,例如1980年由Sinclair主持的Cobuild计划。这是Collins出版公司与Birmingham大学的合作计划。他们搜集了大量的现代英语口语和书面语素材,逐一分析每个单词的词汇、语法、语义、语体和语用特点。根据这些资料,陆续出版了一系列COBUILD词典和语法等工具书。这些书中的例句取自真实的语言素材,词典中词的释义排列顺序由语料库中得出的统计结果来决定,更加客观地反映了英语的使用情况。此外,词的释义方法更利于英语学习和教学。因此,受到语言学界和语言教师及学生的欢迎。5语料库建库原则语料库的主要用途之一是发现语言的主要的和典型的用法。一般用途语料库的语料随机地取自各种来源,在语域方面尽量避免偏向,例如Brown语料库在语域上分为15个类别(新闻报导、社论、新闻评论、宗教、技能和爱好、学术和科技、各类小说和幽默等等)。语料采集方式最根本的目的在于尽可能保证所采集的语料具有代表性,保证所收录的语料最大程度地涵盖具体语言在诸如语体、语域、地域变体、作品年代、作者性别、题材类型等多方面的比例合理性,进而保证建成后的语料库能囊括具体言语行为的普遍规律性。6语料库建库原则表1.“英语用法调查”语料库(I)原始书写语料(100篇)(A)印刷品(46)(B)非印刷品(36)人文科学6┌想象性5连续书写品┤自然科学7└资讯性6教学6┌一般新闻4┌亲密6报刊┤社交书信┤平等4└专门报导4└疏远4文书4┌平等4非社交书信1┤法律3└疏远4论说文5日记4散文小说7(C)口语(18)┌资讯性4剧本4谈话┤└想象性2正式演说(经转写)3故事2广播新闻37语料库建库原则(Ⅱ)原始口说材料(100)篇有准备的演说(未转写)6┌┌亲密24┌演说10│不公开┤自发言语┤┌体育4│└疏远10└评论┤│┌亲密20└其他4交谈┤可公开┤│└疏远6│┌亲密10│电话┤└└疏远682.语料库检索方式较为典型的检索工具是1996年牛津大学出版社推出的MikeScott所编制的Wordsmith软件包。这套软件不仅提供了词语检索(Concordancing)并共现上下文的常用功能,还可统计计算出索引单位搭配行为的T(或Z)值、信息相关值(即MI:mutualinformation)和x平方值,并予以列表显示。它还能快速识别某种文体中经常出现的多词集合,且提供在整个语料库中对英语教师和英语学习者具有价值的语言特征。就连传统的关键词(keyword)功能在Wordsmith软件包中也已赋予新用途,如可列选出在特定文本或文体类型中出现频率特别高的词,以帮助研究者得出某种语域或文体的显著词汇特征。93.运用语料库进行外语研究:方法和实例3.1分析词语的方法3.1.1不同语域词频差异的调查3.1.2根据搭配调查语义差异3.1.3根据搭配调查语义韵差异3.2学习者中介语的调查3.2.1学习者与本族语者之间的对比3.2.2不同母语背景学习者之间的对比3.2.3不同层次学习者之间的对比103.1分析词语的方法3.1.1不同语域词频差异的调查Rundell就曾利用BNC的口语部分调查发现:began在书面语中出现的次数几乎是started的两倍,而在口语中出现的频率要比started低得多。11certain,sure,definite在社会科学和小说中的频率分布图050100150200250300350400社会科学小说certaindefinitesure不同语域词频差异的调查12certain,sure,definite不同语域频率分布差异在社会科学类文本中,用的最多是certain(1百万词中359次),其次是definite(114次),sure最不常见(74次);而在小说类型的文本中,sure比certain要常见得多(353次对179次),而definite就极为少见(仅11词次)。这说明在表达比较严谨的文本中,更倾向于使用certain和definite,而在表达相对自由的小说中,较为口语化的sure用得更多。不同语域同义词的取舍有一定的指导意义,形成一定的优先原则。如在社会科学类的文本中,可优先考虑certain,其次为definite;而在小说中,则sure将是首选,其次才为certain。133.1.2根据搭配调查语义差异:takeajob和takeonajob1)topayoff,shecannotnowtakeajobpayinglessthanpounds12,000ayear.2)iver.HeisnowleavingtotakeajobinBrusselsasaEuropeancommissioner.3)akitchenassistantbeforetakingajobasapizzadeliverydriver18monthsa4)xyears.ThreeyearsagoItookapart-timejobandhavereceivedmytaxallow.5)eirboytobealawyer.HetookajobwiththeMinistryoftheInteriorbutsp6)seneuroses.At16,MooretookasummerjobworkingonthechassislineatGM7)ermovingtoNewYork,shetookamodelingjoband,whiledoinganadforOli8)blockanymoveforhimtotakeanotherjobinfootball.”Littlewouldseear143.1.2根据搭配调查语义差异:takeajob和takeonajob观察takeajob索引例句的搭配,尤其是右搭配,发现与它共现的词有:(1)工作类别:asaEuropeancommissioner,asapizzadelivery,withtheMinistryoftheInterior,modeling,infootball(2)工作时间:part-time,summer(3)工作报酬:paying由此可以看出,takeajob多指“干什么样的具体工作”,与之相关的有“工作付多少报酬,工作是全职或兼职”等,核心意思是“就业”。153.1.2根据搭配调查语义差异:takeajob和takeonajob同样观察takeonajob的索引例句可以看到与其共现的词语有:(1)工作内容(并非职业):scrappingexcesscapacity,compilingtheelectoralregister,defending,grainpreparation(2)工作压力:stressfuljob-loads,demanding,stress-loaded(3)无报酬:unpaid可见,takeonajob多表示“把责任赋予某项工作,不管有无报酬”,其它未在此列出的搭配词,还有诸如role(s),responsibility/ies,task(s),work,commitment(s),burden(s),challenge(s)等,它们都显示出takeonajob的核心在于“责任”。163.1.3根据搭配调查语义韵差异:cause和leadtocause多与表示疾病、伤害、不佳情绪、问题、困难等含义的词语一起出现,几乎全含有否定和消极的意味,这说明cause导致的基本都是坏的结果,语义韵特征上倾向于否定和消极。rash,greaterinjury,complaint,irritation,severeembarrassment,shortages,initialproblems,fluidretention,stylingproblems,difficulty,fatalproblems,allsortsofhavoc,anxiety,slowdownindeficiencydisease,moreviolence,laterharm,poorweather,ahostofproblems,terribledamage,heartattack,tension,cancerdamage,trouble,sorrow,confusion,lack.173.1.3根据搭配调查语义韵差异:cause和leadto而对leadto搭配的观察,则没有发现明显的倾向性:其客体既可是肯定的,如“notableimprovement,greatsuccesses,permanentopportunities,newdevelopments,professionalqualification,improvedhumanhealth,happiness,formation,specification”等;也可是否定的,如“lossoflife,moreproblems,unfairadvantageandconflict,immediatewithdrawal,drugtakingandcrime,anxietyattacks,seriousproblems,waterlossanddamage,scarring,holes,prosecutionincreasedrisk”等。就整体分布而言,两者几乎平分秋色。从这一点来看,leadto不存在语义韵的显著差别,既可引起好的结果,也可导致坏的结果。18语义韵差异的拓展研究:A.义韵冲突—反讽的出现义韵冲突不仅是非诚意性的信号,也可能是反讽出现的标志。因为任一反讽性言语行为的实施过程都存在着非诚意性,非诚意性因而成为判断话语是否具有反讽性的主要标尺,所以在一定条件下,义韵冲突---非诚意性--反讽成立。说话人(作者)有时为了实现反讽,会故意违反正常的语义韵律,有意打破人们的期待模式,使听者(读者)因为惊异于话语语义结构的不一致,而推测出说话人的反讽意图。19A义韵冲突—反讽的出现语用学认为,话语具有什么样的言外之力,是否具有反讽性,须借助语境和言外之力指示手段才能判断(涂靖,2000:52)。言外之力指示手段之一就是话语的语义结构中的冲突,即话语中含有明显违反选择性限制的用词,如例1中的thank和refusetohelp,例2中的congratulate和stupid。1.Ithankyouforyourrefusingtohelpme.我感谢你拒绝帮助我。2.Icongratulateyouonyourstupidspeechatthemeeting.我祝贺你在会上作出的愚蠢发言。20B词典编撰语义韵律作为词语语义的一部分,对学习者而言是很重要的信息,能帮助他们在合适的语境中正确地使用该词。但学习者赖以获取信息的词典是否提供了这方面的信息呢?词典中对rife的解释:Websters1979年版:1.prevalent;frequentlyorcommonlyoccurring;current.2.abundant;plentiful.3.filled;abounding;followedbywith.在牛津现代高级双解词典1988年版中,rife中文释义为流行的;普遍的,英文释义为widespread;c
本文标题:语料库语言学与教学
链接地址:https://www.777doc.com/doc-4128948 .html