您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 绩效管理 > AntConc的详细使用说明
1AntConc3.2.0的使用说明11.提取语境共现1.1设置检索项(1)单项检索a)点击file下拉菜单中的“openfiles”,选择要打开的语料(如果想打开整个文件夹,可以选择opendirectory);b)在“SearchTerm”一栏键入要检索的词项,如go;c)在“SearchWindowSize”一栏设置每一共现行出现的词数;d)点击,开始检索。检索结果如图1.1所示:图1.1单项检索结果(2)多项检索设置多项检索除了检索单个词项以外,AntConc还具有检索多个词项的功能,检索方法为在检索项间键入“|”符号。例:要检索动词go的各种时态形式,可在“SearchTerm”中输入go|went|gone|goes设置语境词检索为了限制语境共现的检索,可以设定一个语境词在检索项周边一定的语境范围内出现。例:如要研究a…of这一类词组,可通过AntConc提取所有的词项,检索方法如下:a)在“SearchTerm”一栏键入a;b)点击“SearchTerm”旁的,进入“AdvancedSearch”界面,如图1.2所示。点击“Usecontextwordsandhorizons”,然后在“ContextWords”一栏键入of,点击。如要重新设置语境词,可先点击清除原来语境词,后重复以上操作。另外,还需设定语境词距离检索项的1此说明书由华南师范大学外文学院2007研究生张杏娟编写,导师何安平订正和补充。其中限定范围的检索方法由香港城市大学D.Lee博士提供,仅此致谢。图1.2AdvancedSearch界面2位置,如本研究中,of在a的右二位置,所以“ContentHorizon”确定为,最后点击;c)回到语境共现的界面后,点击,开始检索。结果可提取alotof,abitof等词块。设置多字语检索在研究中,如需检索多个词项,除了使用“|”以外,也可使用以下方法,尤其适合检索项数目较多的情况。例:研究感官动词watch,sound,feel,hear,smella)在TXT文本中键入所有要检索的词项,可多达250个词。然后为该文本起名保存。需注意:键入的词项需以列的形式排列。如:feelfeelsfeltb)点击SearchTerm旁的,选择“Usesearchterm(s)fromlistbelow”。点击,在保存以上新建的文本的盘符路径点击文本名,然后点击;c)回到语境共现的界面后,点击,开始检索。(3)类别检索使用通配符检索符号意义检索项检索结果*零个或多个字符book*提取所有以book打头的词,如book、books、booking、bookshop等*book提取所有以book结尾的词,如book、notebook等*book*可以同时提取包括以上两类词+零个或一个字符book+提取所有以book打头的词,但之后有零个或一个字母,如book、books?任意一个字符?ough提取所有以字母组合ough结尾的,但之前有一个字母的词,如cough、rough等@零个或一个词think@of提取所有含有的词组,如thinkof、thinkhighlyof等#任意一个词look#提取所有与look的搭3配,如lookafter、lookat等附码检索因研究需要,有些语料经过整理加工并附加上各种符号标记,称为“附码语料库”。如附有词性标注的LOBTAG和附有错误类型标记的CLEC等。检索时只需键入某个标记符号便可提取带附有该标码的所有词。例:提取LOBTAG语料库中所有的名词,只需键入*_NN(NN为名词标码,关于其他词性的详细标记,请参阅何安平,2004,《语料库语言学与英语教学》一书的附录113页。(4)在指定范围内检索a)在concordance的检索界面上选择Regex(regularexpression),键入\[.*\]为检索项便可提取语料库中所有在起止符号“[”和“]”之间的所有文字内容,其他符号照似类推。b)在concordance的检索界面上选择Regex(regularexpression),键入\[.*write.*\]为检索项便可提取语料库中所有在起止符号“[”和“]”之内的“write”的语境共现行,其他词项照似类推。键入的检索项计较大小写,但是可以用通配符*。1.2分析检索结果(1)观察频数、分布频数即该检索项出现的次数,可在“ConcordanceHits”一栏中获得。点击,查看检索项在语料文本中的分布状况。(2)凸显周边语境词为了具体某个教学等目的,可通过凸显检索项周边的某些词汇。方法是选择“KwicSort”,R1和L1分别代表检索项右方和左方的第一个词,一次可设置三列凸现词,均按字母顺序排列。检索结果如图1.3所示。如想使凸显内容的颜色一致,可通过设置下拉菜单中的“ColorSettings”改变颜色。另外,若要凸显的部分不是一个词,而是单词中的字母,可选择下拉菜单中的“Concordance”选项中的“Sortbycharactersinsteadofwords”,如图1.4所示。图1.4ToolPreferences下拉菜单界面4图1.3凸显周边语境词检索结果(3)提取搭配词表通过点击主界面中的,可获得检索项的搭配词表,同时可以设置搭配词的位置、出现的最少次数与词表的排列方式。例:观察look右一的搭配词a)点击主界面中的;b)在“SearchTerm”一栏键入look;c)设置搭配词的位置,如;d)点击,开始检索,检索结果如图1.5所示。e)点击“SortbyFreq”可根据不同的需要设定搭配词表的排列方式,如按频数排,按拼写字母排等等。5图1.5提取搭配词表检索结果(4)提取搭配短语另外,也可以使用这一工具来提取搭配词块,且可设置检索项在词块中的位置。例:检索以ask开头的搭配词块a)点击主界面中的;b)在“SearchTerm”一栏键入ask;c)设置检索项的位置,如选择“Ontheleft”;d)设置搭配词块的长度,如Min.Size:3,Max.Size:3;e)点击,开始检索,检索结果如图1.6所示,所有的ask被列在词块的左边。(5)隐藏、分类和删除“隐藏”是指把检索结果中的检索项挖空,可用于教学或测试。具体操作方法如下:a)在“SearchTerm”一栏键入要检索的词项,如look;b)点击,选择“Concordance”,再选择“HidesearchterminKWICdisplay”,最后点击;c)点击,开始检索。检索结果如下:youalwaysdoyourownhomework?Doyou*******forhelpwhenyouthinkitnecessary?Doyouhelp图1.6提取搭配短语检索结果62.提取词频表2.1单字和N字语词频表单字词频表是指目标语料库的单词表,且词频表的检索结果是以每个词的形式及其频数排列。方法如下:a)选择要生成单字词频的目标语料库;b)进入界面,设置词频表排列排序方式,如“SortbyFreq”;也可以设置为按词头的或者词尾的拼写字母顺序排列。c)点击,开始检索,检索结果如图2.1所示。图2.1单字词频表检索结果N字语词频表是指目标语料库的多字语频数表。例如,检索句子“Thisisapen”的2字语词频表结果为:“thisis”、“isa”、“apen”。N字语词频表的提取方法如下:a)选择要生成单字词频的目标语料库;b)进入界面,后点击;c)设置N字语词频表的长度,如d)选择词表的排序方式,如“SortbyFreq”;e)点击,开始检索,检索结果如图2.2所示。7图2.2N字语词频表检索结果2.2词项重组---词簇化(lemmatizing)词簇化是将同一词性的某个词的所有曲折变化形式作削尾处理,并归为一个词簇来计算频数。其好处是可以简约词频表并且引起对构词法的关注。对词频表进行词簇化的方法如下:在界面生成词频表之后,拉下ToolPreference菜单,选择Lemmalistoptions,点击open和load,上传lemma1文档(可在本网站下载)点击Apply(如图2.3所示)。词簇化的部分结果见图2.4.图2.3设置词簇化界面8图2.4词频表被词簇化后的结果(部分)。图中1142例a和133例an被归为同一个词簇a共1275例。3.提取关键词表关键词表是指两个语料库的词频表相比,其中一个明显地高频于另一个的那部分词项表。前一个称目标语料库;后一个称参照语语料库,通常规模要大一些,以此来凸现目标语料库的一些特别高频词以浮现该语料库的主题或内容特色。3.1凸显目标语料库中显著性高频于对照语料库的词项具体操作方法如下:a)点击file下拉菜单中的“openfiles”,选择要对比的目标语料的语料(如果对比整个文件夹,可以选择opendirectory);b)点击主界面中的;c)点击,选择“KeywordList”,如图3.1所示;d)选择“Shownegativekeywords”,可在检索结果中显示对照语料明显高于目标语料的词;e)点击,选择对照语料,最后点击;f)点击,开始检索,检索结果如图3.2所示。图3.1ToolPreferences对话框9图3.2提取关键词表检索结果
本文标题:AntConc的详细使用说明
链接地址:https://www.777doc.com/doc-6259164 .html