您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > spss数据分析的统计方法选择小结0E
数据分析的统计方法选择小结0E`/[,h9p3F$~+G1A3@:f;_7_l0\f2w)S完全随机分组设计的资料一、两组或多组计量资料的比较1.两组资料:*c;U,j*r-w!M1)大样本资料或服从正态分布的小样本资料2w1tu8~9y8P$v3J.I7s&m!Y&A1L(1)若方差齐性,则作成组t检验5q-n$@(|7u:v-^#Z3g(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验;P2N5sR6X%C2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验2.多组资料:4h3m!f5})?#y)?1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。,C&F.[5`7{%_,U.P7U7Q1R/]1O9J$K6T'D2)如果小样本的偏态分布资料或方差不齐,则作KruskalWallis的统计检验。如果KruskalWallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。*gR2G#Ww,Z!H!D.j2y二、分类资料的统计分析5r;Z2q#c8g1.单样本资料与总体比较!F&z8u4BK#L*B4t0i&Y/}7z+p$v2`.C!x;A9Y7x1)二分类资料:3N!X'^4w:Q.}(1)小样本时:用二项分布进行确切概率法检验;I)G1U(s9J9Co*k!B2d5{(2)大样本时:用U检验。!r*J8r4Y&H;F'`6Z-T-m,@7`7a%{)C%{#[0y9f;S6b6g2)多分类资料:用Pearsonc2检验(又称拟合优度检验)。(I,}+W7m-}+e(U5y2.四格表资料1)n40并且所以理论数大于5,则用Pearsonc2&q!V#L&?;Z2i4L3R(`)_2)n40并且所以理论数大于1并且至少存在一个理论数5,则用校正c2或用Fisher’s确切概率法检验3)n£40或存在理论数1,则用Fisher’s检验0C/x+C:b#mj0b3.2×C表资料的统计分析/]4E?3f3aY1N1d*i+\1O*q/O1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMHc2或成组的Wilcoxon秩和检验:O0G&H$J*F2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验(v0n-a1c&yZ2o3)行变量和列变量均为无序分类变量0G5g&l!~9R(1)n40并且理论数小于5的格子数行列表中格子总数的25%,则用Pearsonc2/~q,u-Z(C;h5Z'i(2)n£40或理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s确切概率法检验1A'S/]0A.G#m*A3Z1h4.R×C表资料的统计分析*VE(c1k1\9x:R2Z1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMHc2或KruskalWallis的秩和检验/t)o0`'_&_%S0mj9b)@2B;u2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作nonezerocorrelationanalysis的CMHc2$u:y%\%A%L/v5k&o-Z;`&D0O*S+U%G3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析1n+_*L|)V5g)?6P)L/y/`4C*A4u3Z4)列变量和行变量均为无序多分类变量,'}'i4q.R!y9e(1)n40并且理论数小于5的格子数行列表中格子总数的25%,则用Pearsonc2'w*g#~0_(n.mx'w,_(2)n£40或理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s确切概率法检验,a6H.r3C&I2K三、Poisson分布资料+t(X'{7R/m!A#T1.单样本资料与总体比较:%^'[7{8|!I9{;U.f4_.@6g/S(G:]@1)观察值较小时:用确切概率法进行检验。6X)F,n%y8Gf2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。+`7Q4Nd5E6O配对设计或随机区组设计8c7H.f0j/p四、两组或多组计量资料的比较1.两组资料:1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验-_1[,`#R*F$s/?0]2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验/R;a!u0R$n1l$o8[7k;g0C#V(l!n2.多组资料:#P9j9M8H%L(Y)Q.N,K(W1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。(d5i9C(M$R7y5V3u%~五、分类资料的统计分析6@'g6A#f7p:f&G1.四格表资料1)b+c40,则用McNemar配对c2检验或配对边际c2检验!A!G$[&H7L*mO6A/@2)b+c£40,则用二项分布确切概率法检验0Z2M9QV1];^.\%Q2.C×C表资料:0U*S*XN'D,{0~4{.U'z5m$Pv1)配对比较:用McNemar配对c2检验或配对边际c2检验2)一致性问题(Agreement):用Kap检验@1?'S6p7r4H(w变量之间的关联性分析六、两个变量之间的关联性分析;D#{%r(Et9|/X%`6@0I2X&K1Y%]%A6p1.两个变量均为连续型变量1\(C(w&[1E;e*N1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析*g6])o1F9F#f3{6b.L7Y9D+D;l:|,\6x2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析'^!F!d0a2f2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析5s.P!Z5s6]2Qd.A8Y七、回归分析$^1]:}/l6k#e5d1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。W5u3U9?!H#D2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。-X&e*F/H7qs,A1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素,G9w-^3{3M1a2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用$y;W&C:}'m5_+T9t#\5D(e+W:A,Y$g,H8b&t*P&]3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1^8j&o5]b*d%D(C*~.T4G5k7I:n1)非配对的情况:用非条件Logistic回归*[9l:aJ/x,v'Y-d$@(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素%k;FH9Z+l#f0c2]1C(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用2)配对的情况:用条件Logistic回归5j7`'},q5p*x7@%^-`6Q-T7[(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素9r.]7J7U(q;A:z(c%R(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。\:[(U*};}8X.Nr9[7d1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用2N;a!Z%E:H9c%[)T,F+`%zK7D#j.z5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用八、生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间),S#i)_4e/v;N1.用Kaplan-Meier方法估计生存曲线2o$p#m$VT4~,g*^0x-p6H,k)k)b-L2.大样本时,可以寿命表方法估计3.单因素可以用Log-rank比较两条或多条生存曲线(d1d;_)K1n-~'T4.多个因素时,可以作多重的Cox回归9]+q#K!I)G!k4K,E+b)m1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素+d%`;O3A4E'S2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用各种检验的方法的应用前提(1)正态性检验:大样本用K-S检验,小样本用Shapiro-Wilk检验。具体方法有两种,一种是使用Explore,一种是使用1d6T:Q(R*l:F$d:X4B!h1SampleK-STest3i/H9k(R#d*x4J(2)标准化处理(去量纲):即将原有的一组数据转为符合N(0,1)分布的数据,从而达到去单位的效果。具体做法是在Descriptive下勾选Savestandardizedvaluesasvariables,即可得到相应的标准化数据。$s%A7Q%R2R&r9cm)h(3)单因素方差分析:$w3j8?!~7`%i0b(c4E1.前提条件正态性检验,独立性检验,方差齐性)f2F5J*Z8p#^6^%Y2.数据导入对于固定效应模型,可以利用CompareMeans/OnewayANOVA实现,亦可以用GLM/univariate实现,对于随机效应模型,可以用GLM/univariate实现。0`3B*k7ss如何判定该用固定效应模型还是随机效应模型:因为HAUSMANTEST的原假设是:采用随机效应模型:备选假设:采用固定效应模型.所以,直接看P值就行了,若P值小于0.01\0.05\0.1三者中的一个显著性水平(看你怎样定显著性水平),就可以拒绝原假设,而采用固定效应模型.(4)多因素方差分析1.前提条件正态性检验,独立性检验,方差齐性(m$Y+@(y!M8f(|9@0v3H2.数据导入对于固定效应和随机效应,都用GLM/univariate实现。*i:`)\%C8r;Y!x.D3.模型的选择对于有重复观测值的多因素方差分析,首先分析各个因素是否存在交互效应,如果不存在交互效应,则把交互效应并为误差效应,仅分析各因素的独立效应或主效应。(4.5)实际应用中
本文标题:spss数据分析的统计方法选择小结0E
链接地址:https://www.777doc.com/doc-2850215 .html