您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第三讲单样本定位问题
独立性问题第八讲简介•1.对基于符号(Kendall)的独立性自由分布检验•2.与Kendall统计量有关的一个估计•3.基于Kendall统计量一个渐进自由分布置信区间•4.基于秩(Spearman)的独立性自由分布检验P(Xx,Y)=P(Xx)P(Y)XYyy如果,则两随机变量和是独立的数据:我们得到二元观察值:每n个主体里面有一个观察值假设:n个二元观察值是来自连续二元总体的随机样本。也就是说,是相互独立,且与某连续的二元总体同分布。我们感兴趣的零假设是:),,(),...,,(11nnYXYX),,(),...,,(11nnYXYX),(YX)]()(),([:,0yFxFyxFHYXYX对所以的(8.1)),(yx对基于符号(Kendall)的独立性自由分布检验),(),(}0))({(121212121212XXYYPXXYYPXXYYP10))((21212XXYYP41)21)(21()()(),(12121212XXPYYPXXYYP如果X与Y是独立的,则有:对(8.1)的备择假设是变量X与Y之间的相依性,这也是我们最感兴趣的。在这里,我们集中通过Kendall群体相关系数来测量相依性类型。我们注意到事件发生当且仅当事件或事件发生,所以:0))((1212XXYY),(1212XXYY),(1212XXYY41)21)(21()()(),(12121212XXPYYPXXYYP类似地:(8.2)•所以,在零假设成立的条件下,即:变量X与Y是独立的,则:01)4141(2但是我们注意到并不一定表明变量X与Y是独立的。以下介绍符号(Kendall)的独立性自由分布检验。0为了计算Kendall样本相关统计量K,我们首先计算对符号统计量其中:)),(),,((jjiiYXYXQnji10))((10))((,1)),(),,((acbdif,acbdifYXYXQjjii也就是说,以于每对下标如果是正的,我们给1分,如果是负的,我们给-1分。因此,Kendall统计量K为:(8.6)从一对符号统计量相应地加1或减1。jiji),,())((ijijXXYY))((ijijXXYY111)),(),,((ninijjjiiYXYXQ步骤:2/)1(nn所以:一:单边的上尾检验,相应的备择假设是:如果,则拒绝零假设,其中:是第一类错误概率等于的值,反之,则接受零假设。二:单边的下尾检验,相应的备择假设是:如果,则拒绝零假设,反之,则接受零假设。三:双边检验,相应的备择假设是:如果,则拒绝零假设,反之,则接受零假设。kKk00kK02/kK大样本逼近•在零假设下:18)52)(1()(0)(00nnnKVarKE2/12/100*}18/)52)(1({)}({var)(nnnKKKEKK所以:一:单边的上尾检验,相应的备择假设是:如果,则拒绝零假设,反之,则接受零假设。二:单边的下尾检验,相应的备择假设是:如果,则拒绝零假设,反之,则接受零假设。三:双边检验,相应的备择假设是:如果,则拒绝零假设,反之,则接受零假设。zK*00zK*02/*zK•当应用大样本逼近时,如果在X或Y存在结时,则在零假设下,K的方差变为:)1(2})1(}{)1({)2)(1(9})2)(1(}{)2)(1({18)}52)(1()52)(1()52)(1({)(var1111110nnuuttnnnuuutttuuutttnnnKhjjjgiiihjjjjgiiiigihjjjjiii在这里表示X组不同数的数目,表示Y组中不同数的数目,是组i中X结的数目,是组j中Y结的数目ghitju例8.1:金枪鱼罐头和质量。表8.1的数据是由Rasekh,克莱默,和芬奇(1970年)旨在确定各种因素促成的金枪鱼罐头与质量的相对重要性,并找到客观的方法来确定质量参数,以及消费者的偏爱的一项研究中获得数据的一部分。表8.1提供对9个金枪鱼罐头的猎人L明度测量与小组成绩的值。原来的消费小组分数很好,很好,很好,公平,穷人,和不能接受的是转换为数值6,5,4,3,2和1。在表8.1小组积分是80这个值的平均值。(所以Y随机变量是离散的,连续性的部分假设A是不满意。尽管如此,因为每个Y是80这个值的平均值,我们不必过度的担心偏离假设)人们怀疑,猎人L值与小组评分是正相关的。因此,我们应用单边的上尾检验。(8.1)对为了说明起见,我们考虑了显著水平。查表我们找到,所以,如果,则拒绝零假设。14090.0k090.014K表8.19个金枪鱼罐头的猎人L测量与小组成绩的值标签猎人L值(X)小组成绩(Y)144.42.6245.93.1341.92.5453.35.0544.73.6644.14.0750.75.2845.22.8960.13.8来源:Rasekh,克莱默,和芬奇(1970年)cor.test(x,y,alternative=c(two.sided,less,greater),method=c(pearson,kendall,spearman),exact=NULL,conf.level=0.95,...)x,ynumericvectorsofdatavalues.xandymusthavethesamelength.alternativeindicatesthealternativehypothesisandmustbeoneoftwo.sided,greaterorless.Youcanspecifyjusttheinitialletter.greatercorrespondstopositiveassociation,lesstonegativeassociation.methodacharacterstringindicatingwhichcorrelationcoefficientistobeusedforthetest.Oneofpearson,kendall,orspearman,canbeabbreviated.exactalogicalindicatingwhetheranexactp-valueshouldbecomputed.UsedforKendall'stauandSpearman'srho.SeetheDetailsforthemeaningofNULL(thedefault).conf.levelconfidencelevelforthereturnedconfidenceinterval.CurrentlyonlyusedforthePearsonproductmomentcorrelationcoefficientifthereareatleast4completepairsofobservations.statisticthevalueoftheteststatistic.parameterthedegreesoffreedomoftheteststatisticinthecasethatitfollowsatdistribution.p.Valuethep-valueofthetest.estimatetheestimatedmeasureofassociation,withnamecor,tau,orrhocorrespondingtothemethodemployed.null.valuethevalueoftheassociationmeasureunderthenullhypothesis,always0.alternativeacharacterstringdescribingthealternativehypothesis.methodacharacterstringindicatinghowtheassociationwasmeasured.data.nameacharacterstringgivingthenamesofthedata.conf.intaconfidenceintervalforthemeasureofassociation.CurrentlyonlygivenforPearson'sproductmomentcorrelationcoefficientincaseofatleast4completepairsofobservations.x-c(44.4,45.9,41.9,53.3,44.7,44.1,50.7,45.2,60.1)y-c(2.6,3.1,2.5,5.0,3.6,4.0,5.2,2.8,3.8)cor.test(x,y,method=kendall,alternative=greater)Kendall'srankcorrelationtaudata:xandyT=26,p-value=0.05972alternativehypothesis:truetauisgreaterthan0sampleestimates:tau0.4444444cor.test(x,y,method=kendall,alternative=greater,exact=FALSE)Kendall'srankcorrelationtaudata:xandyz=1.6681,p-value=0.04765alternativehypothesis:truetauisgreaterthan0sampleestimates:tau0.4444444Kendall相关系数也能够写为:我们已经注意到如果X与Y是独立的,则。另一方面,如果,则或比它们的补事件或更有可能发生。所以,如果,虽然从到与从到有相同(不是相反)符号,但是从到更有可能改变。去解释X与Y之间这类关系作为正关联(用度量)的指示是合理的。类似的,去解释X与Y之间这类关系作为负关联(用度量)的指示是合理的。)].0))((()0))((([12121212XXYYPXXYYP00},{1212YYXX},{1212YYXX},{1212YYXX},{1212YYXX01X2X1Y2Y1X2X0的解释:协调对/不协调对.如果,则称是协调的。如果,则称是不协调的。所以,如果(a)且或(b)且,则是协调的,类似地,如果(c)且或(d)且,则是不协调的。现在K能够表示为其中是协调对的数目,是不协调对的数目。由于n个观察可能有种不同的方式配对,注意到如果的顺序与相同,则是协调的,当顺序不相同时就是不协调的。所以被看作是X与Y之间协调的一个平均测度,这里的协调涉及到顺序。0))((jijiYYXX),(),,(jjiiYXYX0))((jijiYYXX),(),,(jjiiYXYXjiXXjiYYjiXXjiYY),(),,(jjiiYXYXjiXXjiYYjiXXjiYY),(),,(jjiiYXYX'KKK'KK2)1(2nnnjiXX,jiYY,),(),,(jjiiYXYX}2/)1(/{nnKKendall的相关性度量:如果我们取,同时考虑niiXi,...,1,,)()),(),,((111111ninijijninijjiYYcYjYiQK这里:0,10,00,1)(aaaac如果如果如果则K能够被用做在单变量的随机样本中对时间趋势的一个检验。用K去对时间趋势进行检验被Mann(1945)所采用。nYY,...,1Kendall统计量K的趋势检验:步骤:基于统计量K(8.6)的Kendall群体相关系数(8.2)的估计是:(8.34)统计量是Kendall样
本文标题:第三讲单样本定位问题
链接地址:https://www.777doc.com/doc-4022213 .html