您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 理学 > 2015年江西省研究生数学建模竞赛优秀论文
1竞赛网评结果的建模与分析摘要互联网的发展使得网络评分的机制也被应用到竞赛评阅当中,本文利用统计软件SPSS处理大量数据之后,针对网评阶段和集中评审阶段相结合的评阅方式,对评委素质和网评审核机制进行探究,得出将网评成绩加入总成绩的利弊。针对问题一:利用先定性再定量的方式来探究网评成绩与最终成绩的相关性,先利用SPSS处理附件中给出的数据,计算出网评平均标准分,再将最终成绩划分为四个不同等级,一等奖对应数字3,二等奖对应数字2,三等奖对应数字1,未获奖对应数字0,利用Excel作出网评平均标准分和最终成绩等级分的散点图(见图5-1~图5-5),定性得到是正相关关系,然后利用Spearman等级相关系数(5.11)处理网评平均标准分和最终成绩,最终计算出结果:A、B、C、D、E组别的Spearman的相关系数分别为0.768**、0.792**、0.762**、0.811**,0.803**,定量得到平均标准分和最终成绩等级分是呈正相关关系并且高度一致。针对问题二:考虑到评委自身打分风格以及是否科学打分,本文从两个角度来对评委素质进行度量:1、利用评委所评阅的所有论文的方差大小判断;2、利用皮尔逊相关系数(PearsonCorrelation)的大小来分析某评委所打标准分与四位评委网评平均标准分的一致性。针对问题三:根据问题二中已经建立的度量评委的指标体系,在此基础上构建了方差模型、克朗巴哈系数模型、皮尔逊相关系数模型和评委综合素质评判指标。首先利用SPSS计算出单个评委对其所有自身所批改论文分数的方差,然后计算出克朗巴哈系数,得到的结果为:α=0.7330.7,因此评委们相互之间的评分一致性是很高的。由于仅用单一标准度量评委会有误差,利用方差和皮尔逊相关指数相乘得到评委综合素质评判指标,最终用此结果来评判评委的基本素质,并对结果(见表-2)进行了详细分析。针对问题四:从比例角度出发,计算出A、B、C、D、E的获奖人数与对应该组的参与考试总人数的比例都在42%左右,然后分别计算出不同组别在此百分比的情况下网评成绩获奖人数占此百分比下网评成绩总数的比例系数,通过五组比例系数(表-3)的对比,从而得到A、C评委与B、D、E评委的整体表现存在显著性差异,并给出差异原因。针对问题五:从评阅论文的工作效率和网评成绩与最终成绩的相关性出发。计算出含有网评阶段的论文批阅时间为27549个单位,不含有网评方式的论文批阅时间为34132个单位,因此可判断出有网评的批阅方式更高效;利用问题一结论可知网评成绩与最终成绩有高度一致性;而弊端是出现一些偶然情况。关键字:SPSS评委素质相关系数方差21.问题重述某竞赛的评阅过程分两阶段进行,分别称为网评阶段与集中评审阶段。在网评阶段,竞赛论文被随机平均分配给每位评委,每份竞赛论文由四位评委评阅,每位评委以“百分制”记分,通过标准分计算公式(见附录),将评委的“原始分”转换成“标准分”,按照标准分总分排序,前55%的论文进入集中评审。集中评审阶段每份论文由三位评委按“百分制”独立评审,所有评委评审结束后,换算成标准分,然后将每份论文的三个标准分与网评中该论文的平均标准分一起求平均分,即为该论文的最终成绩。请完成以下建模任务:1.竞赛组织者希望知道网评成绩与最终成绩的相关性,请根据附件中的评审结果,给出你们的结论,并对网评结果作出评价。2.从不同角度出发,对竞赛评委有不同的基本素质要求,请给出你们认为合理的度量评委基本素质的指标体系。3.建立评价评委基本素质的数学模型,并将其运用于附件中的评审数据,给出你们的结论。4.附件中ABCDE表示不同题目,试分析不同题目的评委的整体表现之间是否存在显著差异?如果存在,分析出现差异的可能原因。5.试分析将网评成绩加入总成绩的利弊,并对如何更有效地利用网评成绩给出你们的建模结论。2.问题分析由于互联网的迅速发展,网络评测也开始被运用于竞赛评阅当中,针对此种网评和集中评审相结合的评审方式,对评委素质和网评审核机制进行探究,将有利于网评以更科学的方式运用于竞赛评阅当中。2.1问题一的分析考虑到题中要探究网评成绩与最终成绩的相关性,从先定性再定量的角度来解决此问题:先利用SPSS处理附件中给出的数据,根据题中所给公式计算出网评平均标准分,再将最终成绩看成四个不同等级,一等奖对应数字3,二等奖对应数字2,三等奖对应数字1,未获奖对应数字0,由于不清楚两者之间的关系,直接利用Excel作出两者的散点图,从直观上定性看待相关关系,然后引入Spearman秩相关系数来处理,由于最终成绩是以不同等级奖项来表示而不是具体的分数,因此可将秩相关系数优化成Spearman等级相关系数,然后利用Spearman等级相关系数处理网评平均标准分和最终成绩,最终计算出结果,结果为正数则为正相关,且越接近+1则正相关性越强;结果为负数则为负相关,且越接近—1则负相关性越强;若结果为0则无线性相关。2.2问题二的分析由于是要从不同角度探究出合理的度量评委基本素质的指标体系,考虑到评委自身打分风格以及是否科学打分,本文从两个角度来进行度量:1、利用评委所评阅的所有论文的方差大小判断;32、求出皮尔逊相关系数(PearsonCorrelation)并以此来分析某评委所打标准分与四位评委网评平均标准分的一致性。2.3问题三的分析由于问题二中已经建立了度量评委的指标体系,只要在此的基础上建立模型:1、利用SPSS计算出单个评委对其所有自身所批改论文分数的方差,方差越大,则说明此评委优劣论文分辨能力越强,并且能够熟练给出合适的分数;反之则说明评委水平不高。2、首先利用克朗巴哈系数来检测不同评委对论文的评分是否高度一致,之后利用SPSS求出皮尔逊相关系数,即评委评分与选手网评所得标准分的相关系数,此系数越大,则说明一致性越高,此评委打分符合主流,素质越高。最后用方差和皮尔逊相关系数相乘,得到数值越大的评委,说明他的打分综合素质越高。所以只需要把相乘结果展示即可。2.4问题四的分析由于所给题目要求从不同附件中分析不同题目的评委整体表现之间是否存在显著差异,因此不需要分析单个评委评阅的论文分数高低,只需要求出网评评委认为应该获奖的人数与最终实际获奖的人数的比例。利用SPSS计算出最终A、B、C、D、E组的获奖人数与对应该组的参与考试人数的比例,然后分别计算出不同组别在此百分比的情况下网评成绩获奖人数占此百分比下网评成绩总数的比例系数,通过五组比例系数的对比,从而得到评委的整体表现,再对此表现分析出差异原因。2.5问题五的分析评阅论文的效率是衡量评阅机制的一个重要手段,考虑到要分析网评成绩加入总成绩的利弊,假设出另一个没有网评阶段的评分体制,利用控制变量法,选定相同的论文数量和论文批阅专家个数,计算出两种论文评分机制批阅论文的时间,找出时间最短、效率最高的论文评阅方式,从效率方面分析利弊。并且从问题一中,可以得到网评成绩与最终成绩的相关性,从相关性的角度来分析利弊,判断网评阶段中的分数是否具有一定的科学性,能否被加入到评阅论文的过程中。3.模型假设1、假设评委与论文之间是相互独立的,即论文的差异不影响评委评分的水准;2、假设论文是随机平均的分给每位评委;3、假设评委公正,不会出现因情绪或者其他事件影响评分的现象;4、假设论文的评奖等级能很好地反映该论文的最终成绩;5、假设附件所给的全部数据都是真实可信的;6、假设评委的打分,体现了他对所阅论文的优劣判断;7、假设每一位评委评阅一份试卷的时间均相同,且约定为单位1。44.符号说明jx第j个评委评阅所有论文的平均值j第j个评委评阅所有论文的方差ijx第j个评委给第i份论文的原始分ijy第j个评委给第i份论文的标准分iy第i份论文网评最终平均标准分j第j个评委所打分与选手最终网评标准分的皮尔逊积差相关系数srSpearman等级相关系数n样本容量jdiy的秩和jx的秩的差j评判评委评分水平指标iK各组网评成绩前42%获奖人数iP各组网评成绩前42%总人数iM各组网评成绩前42%的获奖比例5.模型的建立与求解5.1问题一的模型建立与解决5.11模型的准备应用原理:相关关系是现象间不严格的依存关系,即各变量之间不存在确定性的关系,Spearman秩相关系数是用来检验n个观测序对(,)iixy的样本中变量X,Y之间的关系,对于每个变量,对其进行排序计算秩,确定每对秩之间的相对应程度,该方法用来确定观测序对是否具有线性相关的关系。具体计算步骤如下:51、对于每个观测值对其进行从小到大排序,记下秩(若为数字就对应此数字),于是对于每个个体,相应于X有一个秩,相应于Y有一个秩;2、用这些成对的秩计算检验统计量,即Spearman秩相关系数;3、当两变量之间存在单调增的关系时,相关系数为正(+1.00表示完全相关);当两变量之间存在单调减的关系时,相关系数为负(-1.00表示完全相关);当两变量之间不存在相关关系时,相关系数为0。若每个变量的观测值中没有等秩情况出现,则Spearman秩相关系数又可化成Spearman等级相关系数。【1】5.12模型的建立与求解由于不确定平均标准分和最终成绩之间的关系,决定先采用先定性分析再定量分析的方法。首先利用SPSS处理附件中给出的数据,根据题中所给公式计算出各篇论文网评平均标准分,再将各篇论文的最终成绩看成四个不同等级,一等奖对应数字3,二等奖对应数字2,三等奖对应数字1,未获奖对应数字0。借用Excel软件将所处理的数据利用阅卷号按升序排列从而得到相同论文的平均标准分和对应的最终成绩等级分,然后根据数据建立出平均标准分和最终成绩等级分的关系散点图,结果如下图所示:0.000.501.001.502.002.503.003.500.0010.0020.0030.0040.0050.0060.0070.0080.00附件A平均标准分与最终成绩关系散点图平均标准分最终成绩等级分成绩00.511.522.533.50.0010.0020.0030.0040.0050.0060.0070.0080.00附件B平均标准分和最终得分关系散点图平均标准分最终成绩等级得分成绩图5-1附件A关系散点图图5-2附件B关系散点图0.000.501.001.502.002.503.003.500.0010.0020.0030.0040.0050.0060.0070.0080.00附件C平均标准分和最终成绩关系散点图平均标准分最终成绩等级分成绩0.000.501.001.502.002.503.003.500.0010.0020.0030.0040.0050.0060.0070.0080.00附件D平均标准分和最终成绩关系散点图平均标准分最终成绩等级分成绩图5-3附件C关系散点图图5-4附件D关系散点图60.000.501.001.502.002.503.003.500.0010.0020.0030.0040.0050.0060.0070.0080.00附件E平均标准分和最终成绩关系散点图平均标准分最终成绩等级分成绩图5-5附件E关系散点图从所给图表中发现在网评过程中平均标准分越高,最终成绩等级分也会对应的变得更高,从直观上可以定性为正相关关系。在确定正相关关系之后,引入Spearman秩相关系数来定量处理数据,由于最终成绩等级分是由不同等级奖项转换成数字,因此等级分的秩和平均标准分的秩是不一样的,从而观测值当中没有等秩情形出现,所以建立出优化的spearman等级相关系数模型,计算公式如下:21261(1)niisdrnn·········(1)根据以上建立的模型,运用SPSS处理数据,编程计算Spearman等级相关系数,结果如下表所示:表-1spearman相关系数表组别所得结果参数名称NSig.(双侧)Spearman的相关系数A3550.000.768**B13660.000.792**C4890.000.762**D17100.000.811**E9590.000.803**7(**在输出结果中表示有显著意义的相关系数,sig<0.
本文标题:2015年江西省研究生数学建模竞赛优秀论文
链接地址:https://www.777doc.com/doc-5172411 .html