您好,欢迎访问三七文档
第二章语言测试的分类语言测试的分类决定着测试的形式,题目的类型。语言测试大体上可以从用途、构建、考察重点、评分方式、对测试分数的解释等方面进行分类。正如Henning(2001)指出的,语言测试有多少个目的,就会有多少种测试类别。语言测试的分类能够帮我们弄清“为什么测试?”、“测试什么?”、“怎样测试?”等问题。对于语言测试类型的了解能够帮助教师更有效地组织测试,更好地实现英语语言测试的信度和效度,更科学地根据测试的目的权衡信度、效度之间的关系。第一节以测试用途为标准的分类从测试用途角度进行分类,大致可以将语言测试分为五种测试形式,即水平测试(proficiencytests)、成绩测试(achievementtests)、分级测试(placementtests)、潜能测试(apititudetests)和诊断性测试(diagnostictests)。1.水平测试(proficiencytests)水平测试是用来测量人们的某一语言能力,往往与被测试者先前所受的语言训练无关。水平测试多针对于来自不同学校,不同国家,不同语言背景的受试者,因此水平测试与他们过去的学习内容、课程目标、课程大纲等没有直接联系。这里的水平更强调以某一特定目标为基础的,对于语言的充分驾驭。水平测试的目的之一是用来选拔。这种选拔可以是为某一工作岗位进行的招聘,此时的测试目标着重于受试者能否胜任某一工作,测试内容往往与这一工作中的实际场景相关,如联合国译员考试。这种选拔也可以是升学选拔,此时的测试内容是向前看的,如测量学生是否具有足够的语言能力来跟上大学中的课程和学业,如美国的托福考试,英国的剑桥英语水平证书测试(UniversityofCambridgeCertificateofProficiencyinEnglish)等。大多数试题内容来自国外大学本科生教材。升学选拔水平测试在范围上有所区分,有的只是针对于大学中某一具体专业,如艺术专业;而有的则是针对于所有专业,如牛津EFL考试。现以雅思考试为例对水平测试做一具体说明。雅思即国际英语水平测试(InternationalEnglishLanguageTestingSystem),简称IELTS。IELTS的考试中心遍布全球105个国家。考试可分为两种类型,学术类和培训类。学术类IELTS(AcademicIELTS)适合于计划申请报读国外高校本科或研究生课程的考生,专门测试考生是否具备一定的英语语言能力完成本科或研究生课程。因此如果计划出国留学深造或接受高等教育,应选择学术类IELTS考试。普通培训类IELTS(GeneralTraining)是针对去英语国家完成中学教育,学习非学位培训课程,以及赴加拿大、澳大利亚、新西兰等国移民定居的人员,主要测试在一般的社会和教育情景下的基本生存技能(basicsurvivalskills)。因此如果计划完成初级教育,接受非学术类培训,工作或移民到英语国家,应选择培训类IELTS考试。IELTS考生需要参加听力、阅读、写作和口语四项测试。每项测试不同的技能。听力要求考生理解日常生活中的口语和非正式场合的口语,比如在讲座,研讨时使用的口语,雅思的听力部分就是测试考生在这方面做得如何;阅读部分主要考察考生从许多信息来源中快速、准确地收集找到主要信息的能力,此部分主要针对日后学习中常面对的问题,即在学习中没有时间阅读书单上所有的书。写作部分测试考生在收集和组织信息后,以文章或报告的形式表述想法的能力;口语部分测试考生谈论自己的情况,表达对各种问题看法的能力。总之,雅思的所有考试都面对今后学习中常出现的情况,即在时间紧迫的情况下寻找信息,快速思维,并恰当地做出反应。我国的水平测试主要是全国公共英语等级考试,教育部和许多单位派遣出国留学人员的标准之一就是通过全国公共英语等级考试的第五级。水平测试往往事关重大,因此在水平测试试卷的设计上一定要有信度和效度。很多水平测试都往往委托于专业的考试机构。同时水平测试的出题机构应广泛吸收应试者的见意,使水平测试具有正面的“回波效应”(backwasheffect)。2.成绩测试(achievementtests)成绩测试用来测量学生对于所学知识的掌握,与所学课程直接相关,目的在于评价学生个体、小组或班级在学习目标实现方面的成功度。成绩测试一般包括:终结性成绩测试(finalachievementtests)和进程性成绩测试(progressachievementtests)。终结性成绩测试在学科结束时进行。试卷命题一般由年级组、学校教务部门、教育部官方命题机构等负责。考试内容与教学内容相关。就考试内容而言可分为基于教学大纲的内容模式和基于教学目标的内容模式。前者的考试内容多数是学生所熟悉的,但问题在于如果大纲设计不合理或教材选取不当,考试结果将会误导师生。例如,某一课程目标是发展学生的口语能力,但是课程本身和测试内容是要求学生在充分的准备下发表对家乡、对天气的看法,那么测试结果就不能反映出学生是否达到了课程目标所要求的程度。基于教学目标的内容模式使测试内容与课程目标直接相关,其优势在于首先使课程设计者更精细地描述目标;其次使测试结果更好地反映学生是否达到了课程目标所要求的程度;同时对于大纲的制作和教材选择有更好地规范作用。Hughes认为:“它能为个人和群体的成绩提供更精确的信息,并为教学提供更有益的‘回波效应’(backwasheffect)”(Hughes2000:11)。终结性成绩测试的试题一般是主观性和客观性试题相结合,试卷制作较为规范。每学年的期末考试、我国的中考及高考,严格来说都应属于终结性成绩测试,因为这些测试都是以教学大纲为内容的测试,并且试题多是检验学生对已学知识的掌握。进程性成绩测试,顾名思义,是测量学生在学习过程中的进步。对于进程的衡量可以通过建立短期目标来实现。教师多采用突击测验的形式来检查学生的学习进程,并使学生时刻保持警觉。因此进程性成绩测试的试卷制作相对不太严格,每一份试卷都具有其独特性,并且多根据具体任课教师对班级成员的了解及其自身制定的阶段性目标为命题依据。进程性成绩测试作为一种有效的测试方法,能够对教学和学习动机产生有益的回波效应。好的进程性成绩测试能够鼓励学生学习目标语言并获得自信,还能推动学习并巩固已学知识。成绩测试方法应当与教学中所使用的方法相一致。例如,教学中使用的是交际能力教学法,那么成绩测试的方法也应为交际能力测试方法而不是结构主义测试方法,否则就会导致考试不公平的问题。近年来对于标准化试题的争议多源自于测试方法与教学方法的分歧。目前,自我评估(self-assessment)测试方法逐渐融入到成绩测试中。所谓的“自我评估测试方法”就是鼓励学生参与到评估中,能对自己在不同情景中所表现出的语言能力给予评价。3.分级测试(placementtests)分级测试是根据学生的不同能力将学生分为不同的等级或不同的班级。分级考试的试卷设计应当量体裁衣,即在分级测试前要弄清不同级别的主要教学特点,然后根据这些教学特点设计具体的测试内容。分级测试的试题难度应包括不同难度水平的题目,即遍布从最简单到最难题目的两极之间。对于百分制的测试而言,最好以10分为一个段,每个分数段都有学生,以便于分班。分级测试符合现代教育理论所强调的因材施教,即针对不同水平的学生采取不同的教学方法和教学内容。但是分级测试也应考虑学生的心理承受能力,避免挫伤学习者的学习积极性。分班分级所导致的压力不仅影响到学习能力较弱的学生,也会影响到尖子班里的优秀生。心理学研究表明,压力大造成的过强学习动机反而会使学习者心情过分紧张、焦虑、影响记忆理解能力。因此如何恰当地使用这一测试方法,还有待于进一步的探讨。4.潜能测试(apititudetests)语言潜能测试也叫做预测性测试(prognostictests),是通过衡量学生在一门陌生语言中的语言表现,以预测其是否有学好这门语言的潜力。语言学习潜力受到多方面因素的影响,如智商、年龄、动机、记忆力、语言敏感度和语法结构敏感度等。语言潜能测试与之前所学的知识无关,很多情况下是学生以前从未接触过的语言。一些专家认为在实际操作中不太可能对应试者的语言潜能进行全面的测试,因此多数测试只是衡量考生某一部分的潜能如听、译领域的潜能。词汇测试常被认为是有效的潜能测试方法,因其与智商紧密相连并且能反应出应试者对这一领域的兴趣。测试语言多采用人工语言,多关注音位区分能力和系统运用语言结构的能力,潜能测试题目数量较多,如TheModernLanguageAptitudeTest。5.诊断性测试(diagnostictests)诊断性测试用来识别学生在学习方面的优势和劣势,从而确定未来的教学走向。诊断性测试较关注于学生在哪些方面犯了错误,并借此找出补救的办法。从广义上说,诊断性测试可以帮助改进教学,调整教学计划,进行个别指导。现行课堂中采用的诊断性测试多是教师根据教学重点、难点及本班实际情况自行进行的小测验,从而及时发现学生的问题,尤其是普遍性问题,以此给教师提供依据,对前一阶段的教学进行反思,对今后的教学给予指导。这种诊断性测试得分应在平均80%以上,以鼓励学生的学习。“诊断性测试可以作为形成性评价的组成部分,将一个学期的试卷存入学习档案就会使学生清楚地看到自己的学习进展情况”(武尊民2008:32)。这种课堂上的诊断性测试,从本质上来说,与成绩测试尤其是进程性成绩测试相吻合。正如Heaton所说:“尽管诊断性测试的术语被广泛使用,但几乎没有什么测试是只被做为诊断性测试而构建的”(Heaton2000:173)。成绩测试和水平测试经常被用于诊断性测试之中。原因在于,从大的方面,例如从语言技巧的角度而言,一套综合性试卷就可以帮助我们判断某一学生在听说读写译五个方面哪个方面最强,哪个方面最弱。在写作和口语方面,在现有的成绩测试和水平测试中,我们也可以根据测量标准,很容易地判断出学生在写作或口语中较弱的方面,例如词汇匮乏,或是不能较好地使用连接手段等。但是对于非常具体的内容,现有的测试手段和模式很难构建出真正具有诊断性特征的测试内容。例如,对于语法方面的考察,就缺少真正意义上的诊断性测试。假设我们想诊断学生是否具有对某两种相似语法结构或时态进行区分的能力,那么数量太少的题目尤其是选择题则不能实现诊断的信度和效度,因为样本过少则不能排除运气及猜题之嫌。此时的样本应尽可能的丰富,并应包含每一种它们能够实际应用的情景。但是,大量的样本之需常常使试题出题人和使用者避而远之。那么,是不是因此就要遗弃单纯的诊断性测试呢?显而易见,诊断性测试本身的意义就已否认了这种观点。尤其是在现代社会,人们大力提倡终生学习,自主学习。诊断性测试对于自主学习的意义是巨大而又明显的。对于这种矛盾的解决方法就要向计算机系统寻求帮助了。第二节以测试构建为标准的分类从测试构建的角度进行分类,英语语言测试可以分为直接测试(directtests)和间接测试(indirecttests)。换句话说,这种分类形式取决于测试者是想直接地测量语言实际运用能力,还是想间接地反映出某种语言能力。1.直接测试(directtests)当某一测试使应试者精确并直接地表现出我们想要测量的能力时,那么该测试就被视为直接测试。直接测试的结果能够直接反映应试者在某一方面的语言能力。如我们想考察学生的写作能力,就可以让他写一篇作文。再比如我们想考察学生的语音语调,就可以让他读一小段文章。直接测试较适用于产出性的语言技能,如阅读和写作。直接测试的优势在于:首先,如果我们很清楚想要测量的语言能力有哪些,那么就可以相对直接地创造出相应的情景,使考生产出的行为在该能力所要求的行为范围之内;其次,对于产出性技能,很容易直接地给予评估和阐释;此外,对于直接测试的准备则会督促考生多次训练相应的技能,对教学和学习有很好的回波效应。直接测试的选材要求尽可能真实,最理想的考试环境应当是现实中的实际环境而非人为策划出来的交际环境。因此这也是直接测试的瓶颈所在。因为任何的现行的直接测试从本质上来说
本文标题:语言测试的分类
链接地址:https://www.777doc.com/doc-7261282 .html