您好,欢迎访问三七文档
AntConc开始是作为相对简单的索引程序,不过慢慢地进步成一个相对有用的文本分析工具。它是在ActiveState供应商的优良Komodo跨平台支持多种程序软件的开发环境下用Perl5.8程序语言写成的。这个程序只要双击可执行文件就可以打开,这个文件可以从LaurenceAnthony实验室网站下载。这个程序可以在任何窗口环境下运行,包括Win98/Me/2000/NTandXP,andalsoMacintoshOSXandLinux的电脑。如果用户发现任何这个程序在一个特定的操作系统下的使用问题,请让我知道。AntConc包括以下工具:索引**Concordance**索引定位**ConcordancePlot**文件查看**FileView**词丛**Clusters**N元模式(部分词丛)**N-Grams(partofClusters)**搭配**Collocates**词单**WordList**关键词单**KeywordList**注意每个工具都可以点击工具窗口上各自的选项卡或者使用功能键F1至F7打开。Contents[hide]1“索引”(Concordance)2索引定位(ConcordancePlot)3“文件查看”(FileView)4“词丛”(Clusters)5“N元模式”(部分词丛)6“搭配”(Collocates)7统计量(StatisticalMeasures)8“词单”(WordList)9“关键词单”(KeywordList)10“菜单选项”(MenuOptions)11“总体设置”o11.1“颜色设置”ColorSettingso11.2“字体设置”o11.3语言编码LanguageEncodings12“工具预设”o12.1其它评论o12.2致谢o12.3法律事务“索引”(Concordance)索引工具生成用户选择的一个或多个目标文件的索引行(concordancelines或上下文关键词:keywordincontext)行。concordance使用步骤1.从file菜单的openfile(打开文件)或opendir(打开目录)选择一个或多个要处理的文件,选出来的文件按顺序在主窗户的左边框里显示出来。2.在左边的按钮条的输入框里输入一个检索词3.使用右边SearchWindowSize(检索窗口大小)的按钮条的增加和减少按钮来选择在检索词两边显示的字符数。4.按“Start”(开始)键开始产生索引行的检索结果。检索过程中可按“stop(停止)键随时停止检索。5.使用KwicSort(上下文关键词分类)下的按钮条选择一个目标词来重排索引行,0是检索词,1L,2L是检索词左边的第一,第二个单词,1R,2R是检索词右边第一,第二个单词。注意,三级分类均可,软件刚启动时,二三级未选择。6.按“Sort”(分类)键开始分类处理。7.将指针移到其中一行索引行的突出的检索词之上,系统默认为蓝色。指针会转变成一个手形的图标。点击突出的检索词,可以使用户看到检索词在原文中出现的情况。见“FileView(文件查看)工具。注意:索引行的总数在按钮栏中间的ConcordanceHits(索引条数)下的输入框里显示出来,处理结束时,这个数字会闪一下“FINISHED”(结束),如果某个检索词没有产生索引行,则显示“NOHITS”(零条),如果是后面这种情况,索引行的窗户就不会更新,前面显示的索引行还会保留。检索词可以通过选择检索词输入框(SearchTerm)上面的word(单词)选项设定为“词(默认)”或“词的片断”,也可以通过选择case来决定区不区分大小写,不区分为默认,也可以选择“Regex”使用完整的正则表达式,可以参考很多有关正则表达式的文章。可以通过网上的搜索引擎来查。也可以在网站上找信息。(但是我发现这个网站不容易打开,亲们还是自己在百度google上搜吧)按一下检索词输入框右边的Advanced键,可以进行更为复杂的搜索。第一个高级搜索项是定义一组检索词,既可以一行一个地输入,也可以直接载入文件中的一个检索词单。注意每一行都被认为是一个单独的检索词。这个特征允许用户使用一大组检索词但不用每次重复输入。第二个高级搜索选项是定义上下文词(ContextWords)和一个上下文的范围,在这个范围中必须出现检索词。比如:要搜索student这个词,要求至少在它前三个或后三个单词中一定要出现university,就把检索词定为student,上下文词定为“university”,上下文范围定为‘From’3L‘to’3R索引定位(ConcordancePlot)进行索引定位的步骤与索引工具的使用方法一样。但是索引定位工具提供了索引行另一个不同的视角。每一个文件的所有索引条数都在一个以条形码上定位出来,表示文中有检索词的索引行的位置所在。这个工具提供了一个容易的方法来看哪些文件包含目标检索词,也可以用来确定检索词在哪儿碰到词丛。一个例子是确定某个特定的实义词在科技文献的哪里出现,又或者一个字符什么时候出现在小说或剧本的发展过程中。索引条数和每个文件的长度在条形码右边显示出来,定位本身的尺寸可以用左下角的PlotZoom按钮来增大或缩小。“文件查看”(FileView)任何时候目标文件都可以使用“文件查看”工具来查看原文。要查看原文,用户需要进行以下操作:1.在主窗口的左边框里选择一个要查看的文件2.如果已经指定了一个检索词,检索词将会突出显示(默认蓝色)。选定主窗口上的FlileView按钮,再按开始(Start),则得到检索词在原文出现的情况。3.使用左下角的HitLocation下的按钮,可以跳到上一个或下一个检索词上。4.改变检索词点击开始键查看其它的检索项。5.点击在原文中突出显示的检索词,主窗口会出现一组KWIClines(上下文关键词行或索引行)以下是一个“FileView”的快捷键Ctrl-Click(单击)=跳到窗口中最近的检索项上“词丛”(Clusters)词丛工具是用来生成目标文件检索词周围排列成序的词丛列单的。词丛既可以按照频率也可以按照词头或词尾排序,也可以按照词丛第一个单词的出现概率排序。所有的排列顺序可以反向。用户也可以选择每个词丛的最大或最小长度(单词数),以及列出词丛的最小频率。也可以选择检索词是否总出现在词丛左边或右边。(注意:在目前的版本中,如果超过一个单词指定为检索词,选择检索词在右,只有第一个单词出现在右边。)生成词丛列单,需进行以下操作:1.选定主窗口上的Clusters按钮,选择合适的排序选项。2.按开始键,任何时候可以使用停止键(Stop)中止。3.点击词丛会产生一组上下文关键词行或索引行。“N元模式”(部分词丛)“N元模式”工具是用来生成目标文件有序的N元列单的。N元模式是单词的N元,因此,大的文件将会产生大量的N元,比如,一个句子“Thisisapen.”中的二元是‘thisis','isa'和’apen'。就像和“词丛”工具一样,N元模式工具既可以按词频也可以按词头或词尾排列。也可以按词丛首单词的出现概率排列。所有的列单顺序都可以反向。同样,用户也可以选择每个N元的最大或最小尺寸(单词数),显示N元的最小词频。想要列一个“N元模式”的单子,用户需进行以下操作:1.选择Clusters窗口模式下SearchTerm右边的N-Grams选项2.选择合适的排列选项3.按开始键。任何时候都可以中止。4.点击词汇束会产生一组上下文关键词行。“搭配”(Collocates)“搭配”工具是用来生成目标文件的一组有序的搭配列单的。搭配既可以按词频,也可以按照检索词左边或右边的搭配频率,或者词头或词尾排列。也可以按照检索词和搭配间的统计量的值来排列。统计量的值测的是检索词与搭配度之间的相关程度。AntConc目前可行的统计量列在下面。所有的列单顺序可以反向。同样的,用户也可以选择检索词左右两边的单词跨度(单词数),显示的搭配的最小频率。比如:如果只要求一个单词跨度,要看哪些单词直接出现在检索词右边,选中右边WindowSpan(窗口跨度)的Same(相同)选项,使得单词跨度的最大值和最小值相同。统计量(StatisticalMeasures)交互信息(MI):使用M.Stubbs在CollocationsandSemanticProfiles,FunctionsofLanguage2,1(1995)此文中描述的方程式。交互信息测的是一个单词的出现意味着另一个单词出现概率大小的信息量。T值(T-Score):使用M.Stubbs在CollocationsandSemanticProfiles,FunctionsofLanguage2,1(1995)此文中描述的方程式。要列一个搭配的列单,用户需要进行以下操作:1.选择合适的排列选项2.按开始键。任何时候都可以中止。3.点击搭配会产生一组上下文关键词行。“词单”(WordList)词单是用来生成目标文件的有序的词单(单词表)的。词单既可以按词频,也可以按词头词尾的顺序排列,还可以反向。词单可以在大小写不敏感(case-insensitive)模式下生成,即不区分大小写,大小写同等对待;也可以在大小写敏感case-sensitive模式下生成,即区分大小写,大小写分别处理。要列一个单词表,用户需要进行以下操作:1.选择合适的排列选项2.按开始键。任何时候都可以中止。3.点击单词会产生一组上下文关键词行。“关键词单”(KeywordList)除了生成普通词单,AntConc可以比较目标文件中的单词和“参照语料库”(ReferenceCorpus)中的单词来生成一个“关键词单”,关键词单列出的往往是目标文件中频率很高或频率很低的词。要列一个关键词单,用户需要进行以下操作:1.选择一组目标文件2.到“Preferences”(预设)菜单中,选择“KeywordPreferences”(关键词预设)选项。3.选择一个统计量估计目标文件单词的“关键性”(keyness),推荐默认设定的对数相似值(Loglikelihood)。4.选择显示的关键词数的极限值(thresholdValue)。5.选择是否显示“负关键词”(shownegativekeywords),即与参照语料库相比目标语料库中不同寻常的低频词6.选择一个文本文件的参照语料库(.txt),步骤与选择目标文件相同。7.参照语料库的地址目录将显示出来(如果适当的话),参照语料库的文件列单将在参照语料库选项(ReferenceCorpusOptions)下的窗口中显示出来。8.点击应用“Apply”(应用),返回主窗口。9.选择生成关键词单的排列选项,方式同生成词单步骤1)10.按开始键。任何时候都可以中止。11.点击关键词会产生一组上下文关键词行。“菜单选项”(MenuOptions)菜单选项分为三组,“文件”(File),“总体设置”(GlobalSettings)以及“工具预设”(ToolPreferences)。每组可用选项如下所述:“文件”这里的选项与将文件读取到AntConc以及将包含各种不同类型的文件写入硬盘有关。也有选项是把所有当前的设置输出到文件(ExportSettingstoFile),或者引入文件上的用户设置(ImportSettingsfromFile)。如果用户设置文件由于某些原因损坏了,只要重启文件或使用“恢复默认设置”(RestoreDefaultSettings)选项将程序还原到原始状态即可。“总体设置”这里的范畴影响AntConc的多重工具。“文件设置”FileSettings文件设置范畴中,用户可以选择显示完整文件路径(Showfullpathname)或只是文件名。有个问题是FileSettings下面还有一个选择文件格式的项,DefaultfiletypetousewithOpe
本文标题:AntConc
链接地址:https://www.777doc.com/doc-7885858 .html