您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 非参数统计实验报告—两独立样本数据位置检验方法和尺度检验方法
非参数统计实验报告一、实验目的及要求学习两独立样本数据位置检验方法,包括Brown-Mood检验,Man-Whitney秩和检验,以及有打结情况的处理;尺度检验的方法,包括Mood检验,Moses检验。掌握不同方法的适用条件(如Mood检验假设两样本均值相等),检验原理,并能够运用R软件进行操作求解。二、环境R软件三、原理(一)Brown-Mood检验将YX、两样本混合,求混合数据的中位数xyM,记录样本X中大于xyM的个数A,A的分布服从超几何分布,A太小或太大时考虑拒绝原假设。(只有方向的信息,没有差异大小的信息)(二)Man-Whitney秩和检验假设,来自于样本来自于样本)(,...,,Y),(...,,2121bnamyFYYxFXXX相互独立。与并且nmYYYXXX,...,,,...,,2121把两样本混合,求混合数据的秩R,计算样本1821...,,XXX的秩和XW,样本1821,...,,YYY的秩和YW,并进行比较。其中2)1(,2)1(nnWWmmWWXYYYXX,),,(#imnjYXIjIiXYW,表示混合数据中样本1821,...,,YYY小于样本1821...,,XXX的个数。如果XW过大或者过小,那么数据将支持yHx1:或者yHx1:,将不能证明两样本形成的序列是一个随机的混合,将拒绝X、Y来自相同总体的零假设。(充分利用差异大小的信息)(三)Mood检验前提假定YX、两样本具有相同的均值,将YX、两样本混合,求混合数据中样本X的秩iR,构造统计量miinmRM12)21(,M偏大,则样本X的方差可能偏大,可以对大的M拒绝零假设。(四)Moses检验不需要假定YX、具有相同的均值,将样本X随机均分为1m组,每组k个数据,计算每组的偏差平方和12,...,2,1,)(mrxxSSArAxir,将样本Y随机均分为2m组,每组k个数据,计算每组偏差平方和sSSB,混合rSSA和sSSB,计算混合数据中rSSA的秩和S,计算统计量2)1(11mmSTM,如果MT值很大,考虑拒绝原假设。四、实验方案设计(一)题目4.4两个不同学院教师一年的课时量分别为(单位:学时):学院课时(学时)A321266256386330329303334299B488593507428807342512350672A221365250258342243298238317B589665549451492514391366469根据这两个样本,两个学院教师讲课的课时是否存在不同?估计这些差别。从两个学院教师讲课的课时来看,教师完成讲课任务的情况是否类似?给出检验和判断。(二)题目分析鉴于Brown-Mood检验仅利用了方向信息而没有利用差异信息,此题选择Man-Whitney秩和检验方法检验两个学院教师讲课的课时是否存在不同。因为Mood检验假定两样本具有相同均值,初步观察数据认为亮学员教师讲课的课时均值不同,需要使用Moses检验方法来检验教师完成讲课任务的情况是否类似。但是,还是要根据Man-Whitney检验的结果来说明是否可以使用Mood检验。(三)一般步骤1.Man-Whitney秩和检验(1)提出假设:yxH:0,yxH:1(2)给定显著性水平,单样本容量nm,(3)计算统计量2)1(mmWWYXX,其中),,(#imnjYXIjIiXYW(4)拒绝域为}{}{21rWrWXX或,由)(2)(21rWPrWPXX确定21,rr(5)如果是大样本,可以用正态分布近似,求xW的均值2)1()(xmnmWE,方差为ninijjjixxnmmnRRCovRVarWVar1)(112)1(),()()(。(6)在零假设下,若nm,,且nmm,则计算)1,0(12/)1(2/)1(NnmmnmnmWZx(7)对于打结情况下的修正)1-)((12)(12/)1(2/1(1i3xnmnmmnnmmnnmmWZgig),其中g表示结的个数,表示结长。2.Moses检验(1)做出假设:210:H,211:H(2)将样本X随机均分为1m组,每组k个数据,计算样本均值X;将样本Y随机均分为2m组,每组k个数据,计算样本均值Y;(3)计算每个样本组的偏差平方和12,...,2,1,)(mrxxSSArAxir,22,...,2,1,)(msyySSBBsyisi(4)混合rSSA和sSSB,计算混合数据中rSSA的秩和S,计算统计量2)1(11mmSTM。五、实验过程(一)Man-Whitney秩和检验两学校教师授课课时是否存在不同1.通过做折线图、boxplot观察两组数据的特征,发现A学校教师授课课时整体小于B学校,但是需要进一步做中位数检验。h-c(1:18)xc(321,266,256,386,330,329,303,334,299,221,365,250,258,342,243,298,238,317)yc(488,593,507,428,807,342,512,350,672,589,665,549,451,492,514,391,366,469)opar-par(no.readonly=TRUE)par(lwd=2,cex=1.5,font.lab=2)plot(h,y,type=b,pch=15,lty=1,col=red,ylim=c(200,900),main=AvsB)lines(h,x,type=b,pch=17,lty=2,col=blue)legend(topright,inset=.05,title=school,c(B,A),lty=c(1,2),pch=c(15,17),col=c(red,blue))#红色的线表示B学院,蓝色的线表示A学院par(opar)2.作出假设:yxH:0,yxH:13.计算统计量的值:(1)利用R软件把两样本数据混合,求混合数据的秩,计算出5.176xW,查表当,18,18nm时正态分布的临界值05.0q为110,所以拒绝原假设,认为B学院教师授课课时大于A学院。c-c(x,y)#将两学院数据混合rank(c)#求混合数据的秩[1]12.07.05.021.014.013.010.015.09.01.019.04.06.016.5[15]3.08.02.011.026.033.028.023.036.016.529.018.035.032.0[29]34.031.024.027.030.022.020.025.0w-sum(rank(c)[1:18])#求A学校18个数据的秩和w[1]176.5(2)因为每一个样本中都有18个数据,于是在没有注意到混合数据中有结的情况下,就用R软件中的),(.yxtestWilcox检验,发现有结存在,检验中警告:因为有结的存在不能够计算出准确的P值,需要进行连续性调整。(3)于是又在R中自己计算标准正太分布的Z值,并进行了相应的连续性修正,以及有结情况下方差的调整,得95176.4Z,07e677272.3P。最终拒绝原假设,认为A学校的授课学时小于B学校的授课学时。rank(x)#求A学院数据的秩[1]127518141310159117461638211m-max(rank(x))#计算A学院数据个数rank(y)#求解B学院数据的秩[1]815105181112171416136912437n-max(rank(y))#求B学院数据的个数u-(m*(m+n+1))/2#计算xW的均值v-(m*n*(m+n+1))/12#计算xW的方差t-(m*n*6)/(12*(m+n)*(m+n-1))#有结点的调整项p-pnorm(w,u,sqrt(v-t))p[1]3.677272e-07z-(w-u)/sqrt(v-t)z[1]-4.95176(二)Moses检验两学校教师完成讲课任务情况是否相似1.根据两样本位置检验的结果,决定要用Moses检验学校教师完成讲课任务的情况;2.假设:210:H,211:H3.将样本X随机均分为6组,每组3个数据,计算样本均值5556.297X;将样本Y随机均分为6组,每组3个数据,计算样本均值2778.510Y。mean(x)[1]297.5556mean(y)[1]510.2778a-rnorm(18,0,1)#利用正态分布产生一组随机数rank(a)#求随机数的秩[1]112141615101317612317458918b-rank(a)b[1]112141615101317612317458918c-x[b[1:3]]#利用随机数的秩将X分组c[1]3652663424.计算每个样本组的偏差平方和组数离差平方和秩13652663427519.808522982432218837.271632583213032143.927243292502564977.1534523838633012421.92763342993171708.36515.混合rSSA和sSSB,计算混合数据中rSSA的秩和25S,rSSB的秩和53S计算322/)1(11mmSTBM,30*025.021975.0WmmW,974.0WTM,所以不能拒绝1H,认为两学院教师授课课时完成情况存在差异。六、实验总结(一)题目结论1.经Man-Whitney检验,95176.4Z,07e677272.3P,两学校教师授课课时存在明显差异,认为A学校的授课学时小于B学校的授课学时。2经Moses检验,974.0WTM,说明两学院教师授课课时完成情况存在差异,B学院完成情况波动性大于A学院。(二)实验总结1.用R软件中的),(.yxtestWilcox检验,有结的存在不能够计算出准确的P值,需要进行连续性调整。2.在进行Moses检验时,数据随机分组遇到问题。后来自己随机分组发现结果并不能拒绝原假设,可能是因为数据太少,可能是因为随机分组不当造成的误差。于是又利用正态分布产生18个随机数,利用18个随机数的秩将两组样本数据重新分组,重新计算结果可以拒绝原假设。
本文标题:非参数统计实验报告—两独立样本数据位置检验方法和尺度检验方法
链接地址:https://www.777doc.com/doc-1960191 .html