您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 09 第九章 非参数检验-ws
非参数检验非参数检验是一种与总体分布状况无关的检验方法,它主要是利用样本数据之间的大小比较及大小顺序,对样本及其所属总体作差别检验,而不对总体分布的参数如平均数、标准差等进行估计推断。优点—计算简便、直观,—易于掌握,检验速度较快缺点—降低了检验的准确性,效率一般要低于参数检验方法本章只介绍常用的—符号检验(signtest)—秩和检验(rank-sumtest)第一节符号检验一、配对资料的符号检验二、样本中位数与总体中位数比较的符号检验一、配对资料的符号检验1、建立假设无效假设HO:两处理差值d总体中位数=0备择假设HA:两处理差值d总体中位数≠0或d总体中位数<0(一尾检验)或d总体中位数>0(一尾检验)2、计算差值并赋予符号d>0者记为“+”,总个数记为n+d<0者记为“-”,总个数记为n-d=0记为“0”,总个数记为n0n=n++n-检验的统计量为K为n+、n-中的较小者3、统计推断由n查附表15得临界值K0.05(n),K0.01(n),作统计推断:如果K>K0.05(n),P>0.05,则不能否定HO,两个试验处理差异不显著;如果K0.01(n)<K≤K0.05(n),0.01<P≤0.05,则否定HO,接受HA,两个试验处理差异显著;如果K≤K0.01(n),P≤0.01,则否定HO,接受HA,两个试验处理差异极显著。【例11.1】某研究测定了噪声刺激前后15头猪的心率,结果见表11-1。问噪声对猪的心率有无影响?表11-1猪噪声刺激前后的心率(次/分钟)猪号123456789101112131415刺激前617068738581656272847660807971刺激后757985778487887674818578888084差值-14-9-17-41-6-23-14-23-9-18-8-1-13符号----+----+-----1、提出无效假设与备择假设HO:噪声刺激前后猪的心率差值d总体中位数=0;HA:噪声刺激前后猪的心率差值d总体中位数≠0。2、计算差值并赋予符号噪声刺激前后的差值符号列于表11-1第4行和第5行,从而得n+=2,n-=13,n=2+13=15,K=min{n+,n-}=n+=2。3、统计推断当n=15时,查附表11得临界值K0.05(15)=3,K0.01(15)=2,因为K=2=K0.01(15),P≤0.01,表明噪声刺激对猪的心率影响极显著。二、样本中位数与总体中位数比较的符号检验1、建立假设HO:样本所在的总体中位数=已知总体中位数;HA:样本所在的总体中位数≠已知总体中位数。(若将备择假设HA中的“≠”改为“<”或“>”,则进行一尾检验)2、计算差值、确定符号及其个数统计样本观察值与已知总体中位数的差值的符号,n=n++n-检验的统计量K为n+、n-中的较小者。3、统计推断(同配对资料的符号检验)注意:样本的配对数少于6对时,不能检验出差别,在7—12对时也不敏感,在20对以上则比较有用。【例11.2】已知某品种成年公黄牛胸围平均数为140厘米,今在某地随机抽取10头该品种成年公黄牛,测得一组胸围数字:128.1,144.4,150.3,146.2,140.6,139.7,134.1,124.3,147.9,143.0(cm)。问该地成年公黄牛胸围与该品种胸围平均数是否有显著差异?表11-2成年公黄牛胸围测定值符号检验表牛号12345678910胸围128.1144.4150.3146.2140.6139.7134.1124.3147.9143差值-11.94.46.36.20.6-0.3-5.9-15.77.93符号-++++---++1、提出无效假设与备择假设HO:该地成年公黄牛胸围的平均数=140厘米,HA:该地成年公黄牛胸围的平均数≠140厘米。2、计算差值、确定符号及其个数样本各观测值与总体平均数的差值及其符号列于表11-2,并由此得n+=6,n-=4,n=6+4=10,K=min{n+,n-}=n-=4。3、统计推断由n=10,查附表11,得K0.05(10)=1,K>K0.05(10),P>0.05,不能否定HO,表明样本平均数与总体平均数差异不显著,可以认为该地成年公黄牛胸围的平均数与该品种胸围总体平均数相同。第二节秩和检验秩和检验也叫做符号秩和检验(signedrank-sumtest),或称Wilcoxon检验,其统计效率远较符号检验为高。秩和检验与符号检验法不同,要求差数来自某些对称分布的总体,但并不要求每一差数来自相同的分布。方法:—将观察值按由小到大的次序排列,—编定秩次,—求出秩和进行假设检验。一、配对试验资料的符号秩和检验(Wilcoxon配对法)1、建立假设HO:差值d总体的中位数=0;HA:差值d总体的中位数≠0。2、秩次和符号求配对数据的差值d;按d绝对值从小到大编秩次;根据原差值正负在各秩次前标上正负号3、统计量T分别计算正秩次及负秩次的和,以绝对值较小的秩和绝对值为检验的统计量T。4、统计推断根据n(正、负差值的总个数为n)查附表14(1)符号秩和检验用T临界值表,得T0.05(n),T0.01(n)。如果T>T0.05(n),P>0.05,则不能否定HO,表明两个试验处理差异不显著;如果T0.01(n)<T≤T0.05(n),0.01<P≤0.05,则否定HO,接受HA,表明两个试验处理差异显著;如果T≤T0.01(n),P≤0.01,则否定HO,接受HA,表明两个试验处理差异极显著【例11.3】某试验用大白鼠研究饲料维生素E缺乏与肝脏中维生素A含量的关系,先将大白鼠按性别、月龄、体重等配为10对,再把每对中的两只大白鼠随机分配到正常饲料组和维生素E缺乏饲料组,试验结束后测定大白鼠肝中维生素A的含量如表11-4。试检验两组大白鼠肝中维生素A的含量是否有显著差异。表11-3不同饲料鼠肝维生素A含量资料(国际单位/克)鼠对别12345678910正常饲料组3550200031003000395038003620375034503050维生素E缺乏组2450240031001800320032503620270027001750差值di1100-40001200750550010507501300秩次+6-1+7+3.5+2+5+3.5+81、提出无效假设与备择假设HO:差值d总体的中位数=0;HA:差值d总体的中位数≠0。2、编秩次、定符号计算表11-3中配对数据差值di,将d=0的舍去,共有差值n=8个。按绝对值从小到大排列秩次并标上相应的符号,差值绝对值为750的有两个,它们的秩次为3和4,所以其平均秩次为(3+4)/2=3.5,结果见表11-3。3、确定统计量T此例,正号有7个,其秩次为2,3.5,3.5,5,6,7,8,秩次和为:2+3.5+3.5+5+6+7=35;负号只有1个,其秩次为1,秩次和等于1。负号秩次和较小,所以T=1。4、统计推断由n=8查附表10(1)得,T0.05(8)=3,T0.01(n)=0,因为T0.01(8)<T<T0.05(8),0.01<P<0.05,否定HO,接受HA,表明两个试验处理差异显著。二、非配对试验资料的秩和检验(Wilcoxon非配对法)1、建立假设HO:甲样本所在的总体的中位数=乙样本所在的总体的中位数;HA:甲样本所在的总体的中位数≠乙样本所在的总体的中位数。2、求两个样本合并数据的秩次将两样本合并后的数据按从小到大的顺序排列,与每个数据对应的序号即为该数据的秩次,最小数值的秩次为“1”,最大数值的秩次为“n1+n2”。3、确定统计量T将两个样本重新分开,计算各自的秩和。将较小的样本含量作为n1,其秩和作为检验的统计量T。若n1=n2,则任取一组的秩和为T。4、统计推断由n1、(n2–n1)查附表14(2),得接受区域T’0.05——T0.05,T’0.01--T0.01。若T在T’0.05——T0.05之内,P>0.05,则不能否定HO,若T在T’0.05——T0.05之外但在T’0.01——T0.01之内,0.01<P≤0.05,则否定HO,接受HA;若T在T’0.01——T0.01之外,P<0.01,则否定HO,接受HA,【例11.4】研究两种不同能量水平饲料对5-6周龄肉仔鸡增重(克)的影响,资料如表11-4所示。问两种不同能量水平的饲料对肉仔鸡增重的影响有无差异?表11-4两种不同能量水平饲料的肉仔鸡增重及秩和检验饲料肉仔鸡增重(g)高能量603585598620617650n1=6秩次128.511141315T1=73.5低能量489457512567512585591531467n2=9秩次314758.51062T2=46.51、提出无效假设与备择假设HO:高能量饲料增重总体的中位数=低能量饲料增重总体的中位数;HA:高能量饲料增重总体的中位数≠低能量饲料增重总体的中位数。2、编秩次将两组数据混合从小到大排列为秩次。在低能量组有两个“512”,不求平均秩次,其;在高、低两组有一对数据为“585”,需求它们的平均秩次:(8+9)/2=8.5。结果见表11-4。3、确定统计量T以较小样本的秩次和为统计量T,即T=73.5。4、统计推断由n1=6,n2-n1=9-6=3查附表10(2)得,为31—65,为26—70。T=73.5在,即26—70之外,P<0.01,否定HO,接受HA,表明饲料能量高低对肉仔鸡增重的影响差异极显著。三、多个样本比较的秩和检验(Kruskal-Wallis法,H法)1、提出无效假设与备择假设HO:各个样本所分别代表的各总体分布位置相同;HA:各个样本所分别代表的各总体分布位置不完全相同。2、编秩次、求秩和将各个样本的所有观测值混合后,按照由小到大的顺序排成1,2,…,n个秩次。不同样本的相同观测值,取平均秩次;一个样本内的相同观测值,不求平均秩次。按样本把每个观测值的秩次一一相加,求出各样本的秩和。3、求H值式中,Ri为第i个样本的秩次之和;ni为第i个样本的含量;n=∑ni)1(3)1(122nnRnnHii4、统计推断根据n,ni查附表10(3),得临界值:H0.05,H0.01。若H<H0.05,P>0.05,不能否定HO,可以认为各样本代表的各总体分布位置相同;若H0.05≤H<H0.01,0.01<P≤0.05,否定HO,接受HA,表明各样本所代表的各总体分布位置显著不同;若H≥H0.01,P≤0.01,表明各样本所代表的各总体分布位置极显著不同。当样本数k>3,ni>5时,不能从附表10(3)中查得H值。这时H近似地呈自由度为k-1的分布,可对H进行检验。当相同的秩次较多时,按(11-1)式计算的H值常常偏低,此时应按(11-2)式求校正的H值HC:式中,tj表示某个数重复的次数。nnttHHjjC33)(1【例11.5】某试验研究三种不同制剂治疗钩虫的效果,用11只大白鼠做试验,分为三组。每只鼠先人工感染500条钩蚴,感染后第8天,三组分别给服用甲、乙、丙三种制剂,第10天全部解剖检查各鼠体内活虫数,试验结果如表11-5所示。试检验三种制剂杀灭钩虫的效果有无差异。表11-7三种制剂杀灭钩虫效果及秩和检验制剂甲组(a)制剂乙组(b)制剂丙组(c)活虫数秩次活虫数秩次活虫数秩次2796229421033381127452857334103109117119823038ni533Ri3718111、提出无效假设与备择假设HO:三种制剂活虫数总体分布位置相同;HA:三种制剂活虫数总体分布位置不完全相同。2、编秩次、求秩和三个组观测值混合后的秩次如表11-5所示,最后一行为各组秩次之和。3、求H值由(11-1)式,得4、统计推断当n=11,n1=5,n2=3,n3=3时,查附表10(3),得H0.05=5.65。因为H<H0.05,P>0.05,不能否定HO,表明三种制剂杀灭钩虫的效果差异不显著。38.2)111(3)311318537()111(1112222
本文标题:09 第九章 非参数检验-ws
链接地址:https://www.777doc.com/doc-3168429 .html