您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 广义符号检验和有关的置信区间
第二章单样本问题•2.1广义符号检验和有关的置信区间•2.2Wilcoxon符号秩检验,点估计和区间估计•2.3正态记分检验•2.4Cox-Stuart趋势检验•2.5关于随机性的游程检验中心位置检验分布检验符号秩检验符号检验一般符号检验游程检验Cox-staut趋势检验正态记分检验分位数检验Lilliefor正态性检验K-S正态性检验拟合优度检验Wilcoxon符号秩检验单样本推断单一总体位置的点估计,置信区间估计和假设检验是参数统计推断的基本内容在经典统计中,人们关心总体均值(位置变量,描述总体的“中心”位置);方差、标准差和极差(关于数据散步的参数,描述总体的“尺度”的变量)在非参数统计中,我们也关心数据所包含的关于总体的位置和尺度的信息:(a)对总体位置参数的推断:均值、中位数、众数、分位数(b)数据的走势或走向,或者看一下这些数目是否完全是随机的在以前我们接触的统计方法中,得到一个样本,很自然的想知道它的“平均水平”是多少,这就涉及到统计中对总体的均值、中位数、众数等位置参数的推断。nsXt如果总体是均值为μ正态分布时,一个典型方法就是t-检验,它的检验统计量定义为:其中,s为样本标准差,为样本均值。•t-检验在大样本或已知总体是正态分布是可以得到很好的效果,但t-检验不稳健,在不知道总体分布,特别是小样本时,风险很大。这时就要考虑使用非参数方法了。•t统计量在零假设下服从n-1个自由度的t-分布。•t-检验统计量是用样本标准差s代替了标准正态分布的总体标准差之后而产生的。首先来看一个简单的例题:例1.假设某地16座预出售的楼盘均价,单位(百元/平米)如下表所示36323125283640324126353532873335问:该地平均楼盘价格能否与媒体公布的3700/平米的说法相符解一:用t检验法(假设在统计时楼盘价格服从正态分布)),(2N01:37:37HH其中是总体均值236.5,200.53.163037=0.1412/xSntXTSn根据样本数据计算样本均值样本方差由于,采用统计量计算检验统计值1161150.890.89ntp根据自由度为,得检验的值为在显著性水平以下都不能拒绝零假设One-samplet-Testdata:build.price-37t=-0.1412,df=15,p-value=0.8896alternativehypothesis:truemeanisnotequalto095percentconfidenceinterval:-8.0458537.045853sampleestimates:meanofx-0.5补充:R中的t检验法的用法1)t-test(x)X1,X2,…,Xn~N(a,σ2),H0:a=a0,H1:a≠a0补充:R中的t检验法的用法例如,某食品厂用自动装罐机装罐头食品,每罐质量为500g,现从每天生产的罐头中随机抽测9罐,其质量分别为:510,505,498,503,492,502,497,506,495(单位:g)欲检验H0:a=500,H1:a≠500t.test(x-500)data:x-500t=0.46,df=8,p-value=0.6578alternativehypothesis:meanisnotequalto095percentconfidenceinterval:-3.5674715.345249sampleestimates:meanofx0.88888892)配对t检验法X1,X2,…,Xn~N(a1,σ12),Y1,Y2,…,Yn~N(a2,σ22),H0:a1=a2,H1:a1a2补充:R中的t检验法的用法例如,欲比较甲乙两种轮胎的耐磨性,现抽取数据如下:甲:4900,5220,5500,6020,6340,7660,8650,4870乙:4930,4900,5140,5700,6110,6880,7930,5010欲检验H0:a1=a2,H1:a1a2x-c(4900,5220,5500,6020,6340,7660,8650,4870)y-c(4930,4900,5140,5700,6110,6880,7930,5010)t.test(x,y,alternative=“less”,paired=T)补充:R中的t检验法的用法Pairedt-Testdata:xandyt=2.8312,df=7,p-value=0.9873alternativehypothesis:meanofdifferencesislessthan095percentconfidenceinterval:NA534.1377sampleestimates:meanofx-y320接受H0,认为两种轮胎无显著性差异.•在上面的逻辑推理中,假设分布结构的正态性是否合理,是t-检验运用是否得当的关键•显然3:13支持的是3700元/平米不能作为正态分布对称中心的观点•现在,让我们换一个角度考虑位置推断问题:2.1.0符号检验•符号检验(SignTest)是最古老的检验方法,其检验最早可追溯到Arbuthnott于1701年一项有关伦敦出生的男婴比例是否超过1/2的研究•之所以称为符号检验,是因为该检验只有两类观测值,如果用符号+和-区分,符号检验就是通过符号+和-的个数来做统计推断,所以称为符号检验。•符号检验虽然是最简单的非参数检验,但它体现了非参数统计的一些基本思路。符号检验基本原理•基本思想:假定用总体中位数Me来表示中间位置,那么样本点取大于Me的值得概率与小于Me的概率应该相等。如果排除样本中等于Me的点,该概率应该为0.5。n1,,XX•检验统计量:如果Me的确是有关总体的中位数,则每个样本点都以0.5的概率小于(或大于)Me。这显然是一系列伯努利(Bernoulli)试验。大于Me的样本点的个数与小于Me的个数都服从二项分布b(n,1/2),与都可以作为检验统计量。SSSS{}1inXMeiSI{}1inXMeiSI令以例题1(楼盘价格问题)为例理解“符号检验的基本原理”如果假设问题的结构是一般连续分布,将37(百元)理解为总体的中位数,则假设检验问题表示为:01:37:37HMeHMe其中Me是总体的中位数。如果零假设为真,即37是总体的中位数,则数据中应该差不多各有一半在37的两侧计算每一个数据与37的差,用表示位于37右边的点的个数,表示位于37左边的点的个数,数据中没有等于37的数,+=16SSSS在零假设和独立同分布的随机抽样的条件下,每一个样本等可能地出现在37的左右,这也就是说~,0.5Sbn从有利于接受备择假设的角度出发,过大或过小,都表示37不能作为总体的中心,这个思路就是符号检验的基本原理。S同样的,在零假设和独立同分布的随机抽样的条件下,也有~,0.5Sbn下面给出规范的符号检验推断过程:假设Me是总体的中位数,对于假设检验问题:0010::HMeMHMeM其中M0是待检验的中位数值。n1,,XX{}1inXMeiSI{}1inXMeiSI假设是从总体中产生的简单随机样本,定义+,.SSnnn0min,.~,0.5~1,KSSKbnYbppPXM令则在零假设下,假设检验问题等价于另一个结构问题:,,01:0.5:0.5HpHp,0.5Kkbn此时可以按照抽样分布求解得到PKkkk(1).在显著性水平为下的检验的拒绝域为2其中是满足上式最大的.=KpKkpPKkp(2).也可以通过计算统计量的值作决策:如果统计量的值是,值2当时,拒绝零假设符号检验与t检验得到了相反的结论,到底选择哪一种结果呢?结论:符号检验在总体分布未知的情况下优于t检验!我们可以对例1(楼盘价数据问题)用符号检验法求解解二:用符号检验法1601613,216,0.520.02132kikpPKknpi值在显著性水平0.05下,拒绝原假设H0.认为这些数据与中心位置37存在显著差异.检验类型:需要说明的零假设一般就取等号。单边检验:右侧检验左侧检验0010::HMeMHMeM0010::HMeMHMeM0010::HMeMHMeM双边检验:类似地,给出单边假设检验问题的结果:其中c是满足上式的最小值0010::HMeMHMeM0010::HMeMHMeM,0.5PScnp,0.5PSknp或其中k是满足上式的最大值单边符号检验问题0010::HMeMHMeM0010::HMeMHMeM,0.5PSknp,0.5PSknp对于符号检验,使用检验的p-值进行检验将会比较简单:单边符号检验问题0010::HMeMHMeM0010::HMeMHMeM~,0.5PKsKbn,其中~,0.5PKsKbn,其中0010::HMeMHMeM双边符号检验问题2~,0.5/2=2~,0.5/2PKsKbnSnpPKsKbnSn,其中当时值,其中当时min,.=KSSKkpPKk或者写成其中的值是,则有值2•右侧检验思路:对于检验假设,当很大时(即很多观察值大于M0),基于零假设的概率,即p-值,也不大。0010::HMeMHMeMS因此M0可能太小,而Me应该比目前的M0大,这样,备择假设会更有理一些。如果上述概率小于指定的显著性水平,就可以拒绝零假设。这种情况等价于很小的情况。S在显著性水平下,检验的拒绝域为:其中,Sc**1inf{:()}2nnicnccip值还可以通过Excel中的函数Binomdist(S+-1,n,p,t/F)计算。本检验可以通过输入Binomdist(S+-1,n,0.5,1)计算。与参数的假设检验相同,也可以计算检验的p值,它等于一分布为二项分布b(n,1/2)的随机变量大于等于的概率:sPKs~,0.5Kbn其中判别规则为:p值大于,则不能拒绝零假设。p值小于,则拒绝零假设。•左侧检验思路:对于检验假设,当很小时(即只有少数观察值大于M0),基于零假设的概率,即p-值,也不大。0010::HMeMHMeMS因此M0可能太大,而M应该比目前的M0小,这样,备择假设会更有理一些。如果上述概率小于指定的显著性水平,就可以拒绝零假设。这种情况等价于很大的情况。S在显著性水平下,检验的拒绝域为:其中,Sd**11sup{:()}2dninddip值还可以通过Excel中的函数Binomdist(S+,n,p,t/F)计算。本检验可以通过输入Binomdist(S+,n,0.5,1)计算。与参数的假设检验相同,也可以计算检验的p值,它等于一分布为二项分布b(n,1/2)的随机变量小于等于的概率:sPKs~,0.5Kbn其中判别规则为:p值大于,则不能拒绝零假设。p值小于,则拒绝零假设。•双侧检验思路:对于假设检验,当不很大或不很小时,不能拒绝零假设。否则,应该拒绝零假设.0010::HMeMHMeMS检验的拒绝域为两个:或其中,ScSd**1inf{:()}22nnicnccidnc与参数的假设检验相同,也可以计算检验的p值。当,它等于二项分布b(n,1/2)的随机变量大于的概率的2倍:/2SnS2PKs~,0.5Kbn其中当,它等于二项分布b(n,1/2)的随机变量小于的概率的2倍:S/2Sn2PKs~,0.5K
本文标题:广义符号检验和有关的置信区间
链接地址:https://www.777doc.com/doc-5311405 .html