您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 习题/试题 > 非参数统计-2016.
华中农业大学数学建模基地非参数统计华中农业大学数学建模基地参数检验parametrictest如t检验:F检验:0:171.2Hcm012:kH一.问题的提出非参数检验(nonparametrictest)对数据的总体分布类型不作严格假定,又称任意分布检验(distribution-freetest),它直接对总体分布的位置作假设检验。已知总体分布类型,对未知参数进行统计推断依赖于特定分布类型,比较的是参数参数检验(parametrictest)非参数检验(nonparametrictest)对总体的分布类型不作严格要求不受分布类型的影响,比较的是总体分布位置优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“50mg”等)缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同应用非参数检验的情况1.不满足正态和方差齐性条件的小样本资料;2.总体分布类型不明的小样本资料;3.一端或二端是不确定数值(如<0.002、>65等)的资料;4.单向有序列联表资料;5.各种资料的初步分析。无效有效显效实验组61935对照组142024秩次(rank)——将数值变量值从小到大,或等级变量值从弱到强所排列的序号。例111只大鼠存活天数:存活天数4,10,7,50,3,15,2,9,13,60,60秩次364928157101110.510.5例27名肺炎病人的治疗结果:危险程度治愈治愈死亡无效治愈有效治愈秩次1276354平均秩次2.52.5762.552.5本次介绍的非参数的假设检验方法主要基于秩次秩次相同(tie)取平均秩次!!二.基本思想假设检验的基本步骤:(4)由样本值计算T的值,若T∊W,则拒绝H0否则,接受H0(1)根据实际问题提出原假设H0和备择假设H1(2)选取适当的统计量T,并在H0成立条件下确定出T的分布(3)确定拒绝域W,使P{T∊W|H0真}=α三.基本步骤华中农业大学数学建模基地四.非参数检验的方法介绍1.两组样本数据的检验1.1两个相关样本检验1.2两个独立样本检验2.多组样本数据的检验2.1多组个独立样本检验2.2多组个相关样本检验3.相关性指标与检验1.1两个相关样本检验配对样本比较的Wilcoxon符号秩检验(Wilcoxonsigned-ranktest)1.配对样本差值的中位数与0的比较2.单个样本中位数和总体中位数比较表12份血清两法测血清谷-丙转氨酶(nmol·S-1/L)的比较(1)配对样本差值的中位数与0的比较编号原法新法差值d正秩负秩(1)(2)(3)(4)=(3)-(2)(5)(6)160802082142152105319524348114808221.55242240-21.56220220071902051578253813692122433191038446411236200-3610951005312合计───54.511.50H:差值的总体中位数0dM;1H:0dM;0.051.建立检验假设,确定检验水平2.求检验统计量T值①省略所有差值为0的对子数检验步骤②按差值的绝对值从小到大编秩,相同秩(ties)则取平均秩③任取正秩和或负秩和为T,本例取T=11.5。3.确定P值,作出推断结论(1)当n≤50时,查T界值表判断原则:T在范围之外,P;T在范围之内,Pn=12,=0.10:13-53=0.05:10-56T=11.5(2)若当n>50,超出附表9范围,可用正态近似法作z检验。3(1)/4z()(1)(21)2448jjTnnttnnn注:tj(j=1,2,…L)为第j个相同秩次的个数datad1;inputidx1x2;d=x1-x2;cards;160802142152319524348082524224062202207190205825389212243103844112362001295100;procunivariate;vard;run;SAS程序UnivariateProcedureVariable=D1TestsforLocation:Mu0=0Test-Statistic------pValue------Student'stt1.60232Pr|t|0.1374SignM3.5Pr=|M|0.0654SignedRankS21.5Pr=|S|0.0566SAS输出结果(2)单个样本中位数和总体中位数比较尿氟含量(1)-45.30正秩负秩(1)(2)(3)(4)44.21-1.091.545.30046.391.091.549.474.17351.055.75453.167.86553.267.96657.3712.07763.1617.86867.3722.07971.0525.751087.3742.0711合计─64.51.511n,单侧0.05的T范围为13-53;T=1.5在此范围之外,P0.05,按0.05水准拒绝0H,接受1H,可认为该厂工人的尿氟含量高于当地正常人的尿氟含量。datad1;inputx;d=x-45.3;cards;44.2145.3046.3949.4751.0553.1653.2657.3763.1667.3771.0587.37;procunivariate;vard;run;SAS程序UnivariateProcedureVariable=D1TestsforLocation:Mu0=0Test-Statistic------pValue------Student'stt3.287539Pr|t|0.0072SignM4.5Pr=|M|0.0117SignedRankS31.5Pr=|S|0.0029SAS输出结果1.2两个独立样本检验Wilcoxon秩和检验Wilcoxonranksumtest1.区间(计量)数据的两样本比较2.有序(等级)数据的两样本比较1.区间(定量)数据的两样本比较符合参数条件时,采用两样本均数的t检验非铅作业组铅作业组血铅值秩次血铅值秩次51.517951.51810.5632012742514953415126431613744171581810.52113210n259.5T17n193.5T表15.1不同作业的两组工人的血铅值例数较小者为n1、T1检验步骤求检验统计量T值①把两样本数据混合从小到大编秩,遇数据相等者取平均秩;②以样本例数小者为1n,其秩和(1T)为T,若两样本例数相等,可任取一样本的秩和(1T或2T)为T,本例T=93.5。H0:两组总体分布位置相同;H1:分布位置不相同;α=0.05确定P值,作出推断下结论1.查表法(样本含量较小,根据T查P值)2.较大作正态近似性检验1312312(1)/2()(1)112(1,2,)jjjTnNzttnnNNNtjjNnn为第个相同秩次的个数Ldataa;inputyg;cards;5151617191121131151181211172182202252342432442;procnpar1waywilcoxon;classg;vary;run;SAS程序TheNPAR1WAYProcedureWilcoxonScores(RankSums)forVariableyClassifiedbyVariablegSumofExpectedStdDevMeangNScoresUnderH0UnderH0Score-----------------------------------------------------------------11059.5090.010.2343865.9500002793.5063.010.23438613.357143Averagescoreswereusedforties.WilcoxonTwo-SampleTestStatistic93.5000NormalApproximationZ=2.9313One-SidedPrZ0.0017Two-SidedPr|Z|0.0034tApproximationOne-SidedPrZ0.0049Two-SidedPr|Z|0.0098Zincludesacontinuitycorrectionof0.5.Kruskal-WallisTestChi-Square8.8813DF1PrChi-Square0.0029SAS输出结果2.单项有序列联表数据的两样本比较名义数据的两样本比较,采用率或构成比的卡方检验常错误采用卡方检验含量吸烟工人不吸烟工人合计秩范围平均秩秩和吸烟工人不吸烟工人(1)(2)(3)(4)(5)(6)(7)=(2)(6)(8)=(3)(6)很低1231~3224低823314~3419152437中16112735~6148768528偏高1041462~7568.5685274高合计40476~7977.5310039(1n)40(2n)79──1917(1T)1243(2T)表吸烟与不吸烟工人的HbCO(%)含量的比较注:HbCO:一氧化碳血红蛋白,HbCO不具有与氧气进行有效交换的功能,会导致携带氧气能力下降0H:吸烟工人和不吸烟工人的HbCO含量总体分布位置相同1H:吸烟工人的HbCO含量高于不吸烟工人的HbCO含量0.05①先确定各等级的合计人数、秩范围和平均秩,见表8-6的(4)栏、(5)栏和(6)栏,再计算两样本各等级的秩和,见(7)栏和(8)栏;②本例T=1917;3191739(791)/23.70233940(791)52230(1)127979Z查附表得单侧0.0005P,按0.05水准拒绝0H,接受1H,可认为吸烟工人的HbCO(%)含量高于不吸烟工人的HbCO(%)含量。139n,240n,394079N③计算Z值333333()(33)(3131)(2727)(1414)(44)52230jjttdataa;inputygFREQ;cards;1112183116411051412222233211424520;procnpar1waywilcoxon;classg;FREQFREQ;vary;run;SAS程序TheNPAR1WAYProcedureWilcoxonScores(RankSums)forVariableyClassifiedbyVariablegSumofExpectedStdDevMeangNScoresUnderH0UnderH0Score-----------------------------------------------------------------1391917.01560.096.42666349.1538462401243.01600.096.42666331.075000Averagescoreswereusedforties.WilcoxonTwo-SampleTestStatistic1917.0000NormalApproximationZ=3.6971One-SidedPrZ0.0001Two-SidedPr|Z|0.0002tApproximationOne-SidedPrZ0.0002Two-SidedPr|Z|0.0004Zincludesacontinuitycorrectionof0.5.Kruskal-WallisTestChi-Square13.7070DF1PrChi-Square0.0002SAS输出结果2.1多组个独立样本检验完全随机设计多个样本比较的Kruskal-WallisH检验1.区间(计量)数据的多个样本比较2.有序(等级)数据的多个样本比较(1)区间(定量)数据的多个样本比较Kr
本文标题:非参数统计-2016.
链接地址:https://www.777doc.com/doc-1960189 .html