您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文档 > 10试谈语文教育与测量评价的原则
-1-试谈语文教育测量与评价的原则王萍1摘要:制定体现新课程理念的语文教育测量与评价方案,是当前语文教学改革面临的一个重要课题。为了保证语文教育测量与评价方案的可用性,必须遵循科学性原则、简洁性原则、区分性原则、公平性原则和可行性原则。关键词:语文教育测量与评价方案;信度;效度;可行性原则教育测量与评价有许多重要的功能,如评定的功能、判断的功能、选拔的功能、反馈的功能、导向的功能和预测的功能等,但这些功能否得到很好的发挥依赖于我们能否制定出科学的方案,能否正确地认识和使用测量与评价手段。如同任何教育一样,语文教育的效果究竟如何,也需要测量,需要评价。制定体现新课程理念的语文教育测量与评价方案,是当前面临的一个重要课题。为了保证方案的可用性,必须遵循如下原则:一、科学性原则语文教育测量与评价方案的质量性能要做到可靠稳定,必须遵循科学性原则。从测量与评价的结果来说,科学性是指测评结果能准确地反映被测对象的真实情况,达到测量的目的,即测量要具有较高的信度和效度。信度即测量结果的可信程度。也就是说如果用同一测量工具测量同一种特质对象,多次测量的一致性程度就叫信度。教育测量与评价运用到语文教学,与其他学科相比情况更复杂。最典型的就是对学生作文水平的测评。高考语文科作文题是高考所有科目中赋分值最大的试题,占语文科全卷赋分的40%。然而,当两位老师同判一份卷,或者同一老师不同时间判一份卷,其结果往往会大相径庭。有人在1983年高考作文试卷中取出一个考生的作文《一幅漫画的启示》,连同教育部规定的评分标准,复印后寄给近百名的中学教师评分,收回的67位教师的评分统计表明,这篇作文所评分数从6分到25分之间,分数达17种之多,最高与最低分相差19分。[1]为了提高信度,广西率先实现了无纸化阅卷,在阅卷过程中设置了可允许误差范围。试卷经两位阅卷人员评阅后,分值在误差范围内的则取平均值作为最后成绩;分值超出误差范围,则将该试卷交第三阅卷人评判。若仍出现较大误差,则将该试卷交第四人——核心专家评判,并由其作出最终评判。效度,顾名思义就是一次测量的有效程度。严格的说,效度就是一个测验或量表实际能测出其所要测量的特性的程度。例如,为了测量学生的语文水平,总是用分辨错字、作文之类的试题,不会用数学题目。效度是测量质量的一个极其重要的方面,测量工具如果无效或效度太低,就失去了存在的价值。在处理信度与效度的关系问题上,首先要保证高的效度。由于命题的质量将直接影响到测量结果的效度,笔者对历年来的语文高考试题进行了仔细的分析,并在分析过程中发现了语文高考试题存在的一些效度较低的题目。例:1994年全国普通高考语文试题第七小题:7、下列句子在修辞运用上与其他三句不同的一句是(2分)()A.这几天跟过节一样热闹。B.那里的蔬菜跟水果一样贵。*本文为湖南文理学院人文社科项目“基于网络的作文评价系统研究”(JJQD05020)的研究成果之一。作者简介:王萍(1979—),女,湖南郴州人,湖南文理学院讲师,广西师范大学语文课程与教学论硕士研究生,主要从事语文教学评价研究。-2-C.他的脸色跟纸一样白。D.这里的老鼠跟猫一样大。命题者为此题规定的标准答案是B。考试结束后,这道题在广大教师甚至在语言学家们之中纷纷议论。很多教师和语言学家都认为这道题有毛病。有人选C,其理由是只有C是比喻句,而其它三句都是夸张句。也有人认为B、D两句是夸张,C是比喻而A是补充主语。还有人认为这道题在客观上就不成立,比如说“那里的蔬菜跟水果一样贵”,蔬菜和水果种类繁多,怎能笼统地去区分孰贵孰贱呢?况且有些蔬菜确实比水果还要贵。最后命题者的解释是此题“着眼于表达效果的比较(而非着眼于修辞格的术语)”。显然这是自相矛盾的说法,因为题目上写的就是“从修辞运用上”辨析其中一句和其他三句的不同。[2]另外在“现代文阅读”中也存在一些问题,主要表现在选材本身不精当。例如,2001年高考语文(全国卷)现代文阅读题所选用的材料《门》是美国的克里斯托弗·莫利(1890-1957)的一篇散文。作者通过对各种各样的门的描写,赋予“门”以象征意义,写出了自己独特的人生感悟,其主旨是:人生正是由一次次开门和关门构成的,也就是说人的生命是由一个个重要阶段的开始和结束构成的。高考采用的译文选自《外国散文百年精华》(人民文学出版社2001年1月北京第一版)译者夏月。原文约1300字,为适应考试的需要,命题者对原文作了删节,个别文字也作了相应的调整,删节调整后的文字约1000字。高考结束后,有人批评这篇号称所谓哲理散文的东西,文字不顺畅,读起来拗口,语意晦涩。究其根本原因则在于使用的文本是译文而且又是删节本。下面撷取了几处值得商榷之处。例:原文选段英汉对照(1)原文:Therearetrapdoors,slidingdoors,doubledoors,stagedoors,prisondoors,glassdoors.Butthesymbolandmysteryofadoorresidesinitsqualityofconcealment.译文:更有活板门、滑门、双层门、后台门...、监狱门、玻璃门……然而一扇门的象征和奥秘在于它那隐秘的性质。(2)原文:Theclosingofadoorisirrevocable.Itsnapsthepack-threadoftheheart.Itisnoavailtoreopen,togoback.PinerospokenonsensewhenhemadePaulaTanqueraysay,“Thefutureisonlythepastenteredthroughanothergate.”Alas,thereisnoothergate.Whenthedoorisshut,itisshutforever.Thereisnootherentrancetothatvanishedpulseoftime.“Themovingfingerwrites,andhavingwrit—”译文:一扇门的关闭是无可挽回的。(删节处)它啪地折断了心脏的血脉。重新打开,转回去是没有用的。皮内罗让保拉·坦克里说:“未来只是从另一扇门进去的过去。”这是胡说八道。哎呀,没有其它的门。至于另一扇门是不存在的。门一关上,就永远关上了,通往消逝了的时间脉搏的另一个入口是不存在的。(删节处)“运指儿写书,字儿落纸……”对照英文原文,我们不难发现译文存在的一些问题会影响读者对原文的理解赏析。例如“后台门”是什么门?词典上都找不到。但是看英文“stagedoors”,我们就很容易理解,即在舞台中分出来的,相对于“前台门”而言的。再看那些被删掉的语句。例(2)中被删节的最后一句“Themovingfingerwrites,andhavingwrit—”引自英国作家爱德华·菲兹杰拉德所译11世纪波斯诗人海亚姆的作品四行诗集《鲁拜集》。海亚姆的诗探索宇宙、人生,悲叹生命短促、世事无常,而日月星辰却循环往复,千古不变。但宇宙的奥秘谁能探清?他认为,来世——天国或地狱都是虚幻的,俱不可信,应珍惜的是现实世界。这句话的意思是历史便是历史,白纸黑字已经写下。可见,被删的语句可以形象化的帮助考生理解试卷第23小题要求说明“一扇门的关闭是无可挽回的”这句话在文中的意思,即“当一个过程终结之后,再想让它重现是不可能的。”如果说《门》是一篇托物言志的哲理散文,在写法上亦实亦虚,再加上译文与原文总会不可避免地存在一些出入,我们不必吹毛求疵,那么2003年高考语文(全国卷)现代文阅读题存在的问题,我们就不容忽视了。-3-这道阅读题所选用的材料是柯灵先生的散文《乡土情结》。文章末尾本来还有一句话:“我们应该有鹏举鸿飞的豪情,鱼游濠梁的自在,同时拥有温暖安稳的家园,还有足以自豪的祖国,屹立于现代世界文明之林。”从上我们不难看出,柯灵先生在文末明确表达了试图在人的根柢与自由之间建立动态平衡的强烈愿望,他言下之意是,一个人理想的人生状态应当是既不忘自己的“根”,又不受土地和家园的束缚;既有温暖安稳的家园作为漂泊无羁的心灵的终极指归,又不失去对生命的自由状态的永恒追寻和持续拥有。然而,考生面对的经删减后的同名“试题文本”,既没有了最能显示柯灵先生渊博学识的典故、诗词、名言等,而且去掉了文章末尾这一句非常关键的话。这样一来,考生倒是易于理解与把握文本的主旨、进而易于按照要求做题了,但是经删减后的同名“试题文本”使众多考生在做题时混淆了乡土情结、安土重迁的传统、爱国主义之间的联系和区别,不假思索地在三者之间划了等号。一般而言,爱国主义是一个褒义词,乡土情结是一个中性的概念,安土重迁是中华民族的传统却并非优良传统。众多考生把乡土情结等同于安土重迁的传统、进而等同于爱国主义的直接结果是,他们在做第21小题时,纷纷引用“试题文本”中“金窝银窝,不如家里的草窝”这句话作论据,把一九九七年香港回归祖国怀抱前一些香港人“抛弃家业,纷纷作移民计”的行为选择作为不爱国的表现进行了严厉批评。这就把一个有着复杂政治背景的问题简单化、把安土重迁的传统价值化、把乡土情结政治化了。更值得注意的是,问题及其参考答案和评分细则的标准化有意识地把考生的思路引向这种“偏至”。其直接结果是,考生原本多向度的、具有多种可能性的思路被严重窄化了。张志平博士说他一共评阅、复查了近一万五千份试卷,发现仅有一个考生在做第21题时,批评了安土重迁的传统所衍生出来的中国人的保守性和因循守旧的思维模式。但是,按照高度标准化的参考答案和评分细则的要求,这位考生的答案是不得要领的,因而是不得分的。[3]二、简洁性原则简洁性指的是语文教育测量与评价方案的文字质量要高,对问题的表述要明晰、准确、通俗易懂,不引起被试或评价者对问题的误解。例:1985年高考语文试题第一小题1.下边这段文字,有的地方思路不清晰,请把它理顺(不能改动文字和标点)。不必重抄原文,可在需要调整的语句(包括标点)底下画横线,然后勾画到恰当的位置上。(2分)一切科学的研究,就其来源说是实践,就其功用说是指导实践。但是总的说来,还是要对指导实践起作用。如果科学研究离开了指导实践,它还有什么用呢?语言科学的研究最终也要归结到指导运用语言的实践上来。——当然,对于指导实践不能理解得太狭窄,有的研究课题在指导实践上不是那么直接,不是那么立竿见影。标准答案:把“但是总的说来,还是要对指导实践起作用。”移到“不是那么立竿见影。”的后面(或把“如果科学研究……立竿见影。”移到“但是……”之前),给2分,其他改动不给分。据说在20年前的考场上,不少考生在这道2分的试题上用去了十多分钟,个别考生甚至用去了半个小时左右还是急得抓耳挠腮。当然少数聪明的考生在无奈的情况下放弃了这道题转而去做下面的题目。总之,当时统计这道题的得分率极低。产生这种情况的原因与题意晦涩难懂有关,为了使题意简明,可以将此题设计成排序选择题。三、区分性原则区分性原则指的是语文教育测量与评价方案中的每一项内容、每一个指标及其相应的评分标准,必须符合目前教育的实际,能够区分和鉴别评价对象在该指标方面的不同的达到程度。为了提-4-高结果的区分性,方案中的问题应避免“社会认可效应”。所谓社会认可效应,指的是被试依照社会价值标准做答,而非提供真实答案。如果是这样,方案就肯定没有区分性。应该尽量使问题与答案呈中性,不存在社会道德评价意义,不会使被试产生社会认可与否的顾虑,真实作答。笔者参加了多次高考作文评卷工作,发现考生的语言是规范的,表达也是合情理的,但读起来总让人觉得生硬、做作。福柯提醒世人:我们必须了解我们的社会和文化具有一种力量,这种力量限制和控制了我们所使用的话语。考生的作文出现的这种“集体失语”的现象则与作文题目有直接关系。例如,2001年的作文题目“诚信”,考生只能正面阐发“诚信的积极作用”、“诚信的价值与可贵”等,而不敢反其意,因为它是人类公理、人类道德的底线;2002年的作文题目“心灵的选择”,说是“选择”,其实无可选择。任哪位考生,都必须选择“舍自我、顾他人”。这些作文题,大都“潜隐”着一个十
本文标题:10试谈语文教育与测量评价的原则
链接地址:https://www.777doc.com/doc-4079239 .html