您好,欢迎访问三七文档
非参数统计实验主讲:蒋锋PhD中南财经政法大学统计与数学学院符号检验符号检验一、实验目的及要求二、实验环境三、实验原理五、实验过程六、实验结束语四、实验设计及知识回顾【实验目的和要求】掌握t检验法与符号检验,注意其区别掌握单一样本中位数检验的符号检验法,并会应用正态性修正会用R语言对建立的数据进行分析,并会编制符号检验法的R程序R软件【实验环境】【实验原理】非参数统计方法具有较好的稳健性,同时有较广泛的适用性。对非对称分布,由描述统计的结果可知,中位数较均值而言是对总体中心位置更稳健的估计。符号检验(SignTest)是利用正、负号的数目对某种假设作出判定的非参数统计方法。当原假设为真()时,大于的数据个数与小于的数据个数应该很接近;如果两者相差太远,就有理由拒绝原假设。00:MMH0M0MSS【实验设计及知识回顾】数据录入t检验法二项分布符号检验法统计量计算统计图决策假定分布结构确定检验的问题找原因【回顾理论知识】(1)对总体均值提出假设(单边或双边)(2)构造统计量(3)求p值进行推断01(())/XttnSn(1)对总体中位数提出假设(2)统计量(3)求p值进行推断+-=min{S,S}((,0.5))Kbn符号检验t检验正态性修正2014/(,)/KnCNn【实验背景】假设武汉市16座预出售的楼盘均价(单位:百元/平方米)如表问:该地区平均楼盘价格是否与媒体公布的57(百元/平方米)的说法相符?【实验过程】同学们请分组进行以下实验操作:实验软件:R软件检验方法:t检验符号检验正态性修正第一步:统计图①进入R控制台,在RConsole中输入16座预出售的楼盘均价数据x=c(56,52,51,45,48,56,60,52,61,46,55,55,52,107,53,55)②作直方图和qq图,初步判断是否是正态分布hist(x)#直方图qqnorm(x)#正态Q-Q图qqline(x)#QQ图相应的直线第一步:统计图从上图可看出,很可能不是正态分布,是否确实如此呢?shapiro.test(x)#备择假设:不是正态分布可以用Shapiro-Wilk检验来作正态性检验。Shapiro-Wilknormalitytestdata:xW=0.5691,p-value=8.388e-06P值较小,故而不是来自正态分布。第二步:t检验用R计算其样本均值、样本方差、样本标准差、中位数,比较中位数与均值是否一样mean(x)[1]56.5var(x)[1]200.5333sd(x)[1]14.16098median(x)假设检验问题:057:H157:H0/XtSn第二步:t检验•直接调用t.test命令t.test(x-57)•通过p值定义计算OneSamplet-testdata:x-57t=-0.1412,df=15,p-value=0.8896alternativehypothesis:truemeanisnotequalto095percentconfidenceinterval:-8.0458537.045853sampleestimates:meanofx-0.5t=(mean(x)-57)/(sd(x)/sqrt(length(x)))#求统计值t-0.1412332pt(-0.1412332,15)*2#求p值[1]0.889565用两种方法,计算t检验法的p值P-value0.05结论:不能拒绝零假设。第三步:符号检验(SignTest)假设检验问题:0057:;HMM10:HMM用R求检验统计量,SSsum(x57)[1]3sum(x57)[1]13第三步:符号检验(SignTest)12,~(,/)SSBiun由于,则用两种方法求其p值方法一:二项分布binom.test(sum(x57),length(x),0.5)orbinom.test(sum(x57),length(x),0.5)方法二:正态性修正Exactbinomialtestdata:sum(x57)andlength(x)numberofsuccesses=3,numberoftrials=16,p-value=0.02127alternativehypothesis:trueprobabilityofsuccessisnotequalto0.595percentconfidenceinterval:0.040473730.45645655sampleestimates:probabilityofsuccess0.1875第三步:符号检验(SignTest)12,~(,/)SSBiun由于,则用两种方法求其p值方法二:正态性修正2054/./Knntt=(sum(x57)-length(x)/2+0.5)/sqrt(length(x)/4)-2.25pnorm(tt)*20.02444895第三步:符号检验(SignTest)不论用何种方法求p值,都有p-value0.05结论:拒绝零假设,认为数据的中心位置与每平方米5700元存在显著差异。两种检验方法得到了看似相反的结论,到底哪一种结果才是对的呢?结果分析首先要明确仅从两种方法的结论上来比较显然是不恰当的,原因是两种方法采取的假设陈述本身就不一样,一个是均值,一个是中位数考虑,这表示我们对问题的理解角度是不同的,不同的理解完全有可能导致不同的结论。在t检验中,结论是不能拒绝零假设,它并不表示接受零假设,它仅仅说明要拒绝零假设还需要收集更多的证据。t检验是在假设了正态的总体的前提下得到得到了不可靠的结果。t检验没有成功的原因是分布假定不适当,于是我们有理由认为t检验在这里是不合适的。符号检验的结果较t检验的结果更可信。【实验结束语】在非正态总体前提下,使用正态分布的检验方法一般是不适当的,此时需要借助非参数统计,在非正态总体时,非参数统计方法具有较好的稳健性,同时有较广泛的适用性。对非对称分布,由描述统计的结果可知,中位数较均值而言是对总体中心位置更稳健的估计。【思考】如果中位数是对称中心,符号检验方法能否可以用?所得的结论是否可信?
本文标题:sign test
链接地址:https://www.777doc.com/doc-3352837 .html