您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据结构与算法 > 如何统计分析非正态分布的数据
如何统计分析非正态分布的数据小飞看了9月23日医咖会微信推送的“降糖药物利拉鲁肽,还能治疗心衰吗?”的研究(FIGHT研究)后[1],不明白研究方法II中的Wilcoxon秩和检验到底是什么,于是来找小咖讨论。小飞:Wilcoxon秩和检验到底是个什么鬼?小咖:这是一种非参数检验方法。小飞:非参数检验又是个什么鬼啊?小咖:平时我们常用的t检验、卡方检验、方差分析等方法都要求样本服从特定的分布(比如t检验要求样本服从正态分布),这些方法被称为参数检验方法。但有些数据并不符合参数检验的要求,最常见的情况是数据不符合正态分布,这时可以使用非参数检验的方法。非参数检验有很多种,Wilcoxon秩和检验就是其中一种。小飞:不明觉厉...你还是来个栗子呗。小咖:好吧。某医生为了评价A药对绝经后妇女的骨质疏松症是否有效,将30名绝经后妇女随机分为两组,干预组研究对象15例,给予A药+乳酸钙治疗;对照组15例,仅给予乳酸钙治疗。24周之后观察两组L2-4骨密度的改善率。数据如下图:两组骨密度改善率(%)干预组对照组ID改善率ID改善率1-0.201-0.8320.2120.2631.8630.4841.9741.0352.3151.0662.8061.1973.3071.2783.6081.7194.3191.75104.40102.33115.29112.66125.87122.80136.06133.22146.08143.34157.00153.34小飞:嗯,我明白了。对于这种两组平行设计、结局是不符合正态分布的连续变量,就应当使用Wilcoxon秩和检验对吧?小咖:很聪明,给你满分。接下来给你演示一下用SPSS22.0怎么操作。(1)数据录入SPSS(2)分析→非参数检验→旧对话框→2个独立样本(3)选项设置①将骨密度测量值BMD送入检测变量列表(T)→②将Group送入分组变量(G)→③定义组(D):组1、组2中分别输入Group变量的赋值→④检验类型选择Mann-WhitneyU→继续→确定(4)结果解读SPSS首先给出了两组的编秩情况列表。小飞:等等,什么叫编秩啊?小咖:所谓的秩,英文叫Rank,你可以理解为等级、排名的意思。秩和检验的做法是这样的:将原始数据由小到大排队,然后给每个原始数据一个秩次。最后,通过检验两组之间秩次的差异是否有统计学意义,而不是检验原始数据。小飞:我明白了,这也就是为什么非正态分布的数据可以使用秩和检验了,因为秩和检验不是检验原始数据,而是检验秩次是吧?小咖:嗯,很正确。上面这个表格,就是编秩后的汇总,干预组(Group1)的总秩次为293.5,平均秩次为19.57;对照组(Group2)的总秩次为171.5,平均秩次为11.43。小飞:不对啊,秩次是由小到大依次赋值1、2、3……,都是整数,不应该有小数啊。怎么出来的293.5和171.5呢?小咖:这个忘了说了,编秩时还有个原则:当原始数据相同但在不同组时,秩次取平均值(如对照组12、干预组6的秩次分别为17.5、17.5);当原始数据相同并且在同组时,秩次顺序排列(如对照组14、15的秩次分别为21、22)。(详见下表红色的数据)分组ID改善率秩次对照组1-0.831干预组1-0.202干预组20.213对照组20.264对照组30.485…………对照组112.6616对照组122.8017.5干预组62.8017.5对照组133.2219干预组73.3020对照组143.3421对照组153.3422干预组83.6023…………干预组146.0829干预组157.0030好的,明白了秩和检验的原理之后,咱们再来看看检验结果。SPSS给出了Mann-WhitneyU统计量、WilcxonW统计量、Z值、近似法计算的P值和确切概率法计算的P值。一般情况下,我们使用近似法计算的P值。(如果你想搞明白如何选择近似法计算的P值和确切概率法计算的P值,以及二者有什么差异,可以给我们留言哦,这里我就不讲了。)小飞:嗯。好的,我大致明白了。那对于这个例子,怎么撰写结论呢?小咖:可以这么描写,当然你也可以修改一下啊。小飞:嗯,小咖你实在是太棒啦。不过,怎么感觉你思维奔逸啊?开始咱们说的是Wilcoxon检,现在怎么又成了Mann-WhitneyU检验了?小咖:哈哈哈,我就知道聪明的你一定会提出这个问题的。是这样的,Wilcoxon检验和Mann-WhitneyU检验方法没有实质上的差别,检验原理和结果也完全等价,只是在计算统计量时略有差别。SPSS中没有Wilcoxon的模块,SAS中有。两种方法可以认为是等价的,在统计分析时,写清楚用哪种方法就行。小飞:我明白了。要想使用Wilcoxon检验的话,就得使用SAS是吧?小咖:对头。小飞:那你能教我一下SAS怎么做吗?小咖:干预组骨密度改善率的平均值为3.66%,中位数为3.60%;对照组骨密度改善率的平均值为1.71%,中位数为1.71%。采用Mann-WhitneyY检验:Z=-2.531,P=0.011,结合实际数据,可以认为干预组骨密度改善率高于对照组骨密度改善率,差异有统计学意义。procnpar1waywilcoxondata=bmd;classGroup;varBMD;run;小飞:太复杂,先不学了。回家吃饭更要紧。小咖:......推荐阅读文献1.MarguliesKB,etal.EffectsofLiraglutideonClinicalStabilityAmongPatientsWithAdvancedHeartFailureandReducedEjectionFraction:ARandomizedClinicalTrial.JAMA.2016Aug2;316:500-8.对方法学感兴趣?快快关注“医咖会”微信公众号
本文标题:如何统计分析非正态分布的数据
链接地址:https://www.777doc.com/doc-7032972 .html