您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 统计学方法各种应用条件、校正条件
统计学各种应用条件、校正条件应用检验方法必须符合其适用条件,不同设计的数据应选用不同检验方法。一、第五章参数估计P74总体均数的置信区间1.正态近似法:总体标准差σ已知,或σ未知但n50时2.t分布法总体标准差σ未知,且n≤50时二、第六章计量资料两组均数t检验P93、P99(一)t检验的应用条件适用于计量资料(单样本、两配对样本、两独立样本),并要求:1.样本来自正态分布的总体。W检验(n≤50时),H0:样本来自正态总体,P0.05时尚不能认为两组资料的分布非正态;2.两独立样本均数比较时,两总体方差齐性。Levene检验,H0:方差相等。P0.05时尚不能认为两组资料方差不齐。(二)方差不齐或非正态时,两计量资料均数的比较方法方法1.仅方差不齐时,可采用近似t检验,即t′检验。方法2.变量变换:对数变换、平方根变换、倒数变换等方法3.非参数检验:Wilcoxon符号秩检验(两相关样本P142);Wilcoxon秩和检验、Mann-Whiney-U检验(两独立样本P145)等三、第七章计量资料多组均数的比较-方差分析(一)方差分析流程P1091、多个样本均数比较。若P0.05,均数不全相等,则进行第2步;2、作多重比较:LSD-t检验、Dunnett-t检验(多个实验组与一个对照组比较)、SNK-q检验(多个均数间全面比较)(二)方差分析的应用条件P1141、各样本相互独立,服从正态分布;W检验2、各样本方差齐性。Levene检验四、分类资料(计数资料)的比较- 检验(一)四格表资料(两独立样本率的 检验)P1231、n≥40,且所有T≥5时,计算普通Pearson 值2、n≥40,且有1≤T5时,用校正公式计算 值;3、n<40,或有T<1时,改用Fisher确切概率法计算P值。先估计表中最小的理论频数T值[ =( × )/n],也就是行合计最小值与列合计最小值所对应的格子的T值,结合n值,以确定是否采用校正公式(二)配对四格表资料(两相关样本率 检验)P1271、b+c40时,计算普通McNemar 值2、b+c40时,需校正(三)R×C表的 检验P1311、多个样本率的比较多个样本率比较,若P0.05,均数不全相等,则进行第2步:做多重比较,采用四格表 检验( 分割)P1312、多组构成比的比较分组变量无序而结果变量有序的单项有序资料改用等级资料的秩和检验3、若较多格子(1/5以上)的理论频数小于5或有一个格子的理论频数小于1,则易犯Ⅰ型错误。4、 检验并不能用于所有R×C表的分析:P133、1374.1适于行、列两个变量均为无序分类变量,研究目的为两(多)个样本率(或构成比)的比较,或分析两个变量之间有无关联性4.2适于分组变量↓为等级资料,而观察变量→无序。研究目的是分析不同文化程度首选疼痛量表的构成情况。4.3不适于分组变量↓无序,观察指标→为等级资料,其研究目的是比较不同疗法的疗效,则应采用秩和检验方法。因为, 检验只能反映构成比有无差异,不能比较效应的平均水平。五、第九章非参数统计方法(一)两相关样本资料的Wilcoxon符号秩检验1、两相关样本计量、二分类资料,不满足t检验、McNemar 检验条件时采用。P1422、确定P值:n≤50时,查T界值表;n>50时,做u检验。相持较多时应校正u值。P144(二)两独立样本资料的Wilcoxon秩检验1、两独立样本计量资料,不满足t检验条件时采用;R×C表资料,观察指标→是有序多分类资料(等级资料)时采用。P1452、确定P值:当n1≤10,且n2-n1≤10时,根据n和T查T界值表;当n1>10或者n2-n1>10时,计算u值。相持较多时应校正u值。P146(三)多组独立样本的Kruskal-WallisH检验1、多组独立样本计量资料,不满足方差分析条件时采用;R×C表资料,观察指标→是有序多分类资料(等级资料)时,比较各等级的疗效程度时采用。P1482、确定P值:当组数k=3,且各组例数ni≤5时可查H界值表;当k>3或者ni>5时,可查 界值表。相持较多时应校正H值。常需进一步用Nemenyi法作组间的多重比较。P150(四)多组相关样本的FriedmanM检验1、多组相关样本计量资料,不满足方差分析条件时采用。P1512、确定P值:当n≤15和g≤15时,查M界值表;当n15或g15时,用 近似法,计算 值。相持较多时应校正 值。P153(五)等级资料1、两组等级资料比较疗效/程度是否有差别。确定P值:计算u值。相持较多时应校正u值。P1552、多组等级资料比较疗效/程度是否有差别。采用H检验。P156六、第十章相关与回归(一)简单线性Pearson相关分析1、要求:两变量满足双变量正态分布(Ⅱ型回归)P164、P1792、在进行相关分析前应先绘制散点图;分层资料盲目合并易出假象3、线性相关分析的一般步骤:P165⑴绘制散点图,观察两变量的变化趋势;⑵若散点图呈直线趋势,计算相关系数r;⑶对相关系数r进行假设检验。(二)Spearman秩相关P1751、不服从双变量正态分布,或原始数据为等级资料,或总体分布类型未知2、Spearman等级相关系数 的计算:相持较多时应校正。3、P值的确定:当n50时可用查等级相关系数表;当n50时,计算检验统计量u,查u界值确定P值。(三)简单线性回归1、应用条件:线性、独立、正态、方差相等P169因变量X与自变量Y呈线性关系。(Ⅰ或Ⅱ型回归)每个个体观察值之间相互独立。在一定范围内,任意给定的X值,对应的随机变量Y值都服从正态分布。在一定范围内,不同的X值所对应的随机变量Y的方差相等。2、方差分析、t检验判断回归方程是否成立,即总体上X与Y的线性回归关系是否存在。P169决定系数R2反映了自变量X对应变量Y的影响大小。R2值越大表示X对Y的影响越大。3、在进行线性回归分析之前,应先绘制散点图;作回归分析时要注意是否有实际意义;分层资料盲目合并易造成假象。P174七、第十四章重复测量资料的方差分析(一)重复测量资料方差分析的条件:P2401、正态性处理因素的各处理水平的样本个体之间是相互独立的随机样本,服从正态分布;2、方差齐性相互比较的各处理水平的总体方差相等,即具有方差齐同(二)方差分析F值的自由度的校正P240若满足“球对称Mauchly检验/H型条件”,不需要校正;若不满足“球对称Mauchly检验/H型条件”,则需要校正。(三)不适用于:存在滞留效应、潜隐效应、练习效应八、第十五章协方差分析(一)协变量X的要求:P263连续型变量;不能影响处理因素,且协变量的取值应在施加处理因素前已获得;或虽然在研究中观察到,但不受处理因素的影响。(二)协方差分析的应用条件:P2631、各组观察指标服从正态分布,各组观察指标彼此独立,方差齐性;2、各组协变量与观察指标存在线性回归关系,且斜率相同(回归直线平行),即要求各组回归系数本身有显著性,且各组回归系数间的差别无显著性。2.1、回归直线是否平行的检验:通过多因素方差分析检验协变量与处理组的交互作用是否存在。若P>0.05,无交互作用,则可认为各组的回归直线平行,3、各组协变量均数间的差别应进行假设检验,若差别不大(P>0.05),则协方差分析的检验效果较好。(四)协方差分析流程P2591、检查协方差分析的应用条件2、检验误差项回归关系是否有统计学意义。(P<0.05有意义)3、检验校正后的观察值不同组别的差别是否有统计学意义(P<0.05有意义)4、计算各处理组观察值的修正均数5、各修正均数的两两多重比较SNK-q检验九、第十六章多重线性回归(一)多重线性回归模型的应用条件:P2711、Y与X1、X2,……Xm之间具有线性关系;2、各观测值Yi之间相互独立;3、残差ε服从(0, 2)的正态分布,即对于任意一组自变量X,Y均服从正态分布且方差相同。应用时的注意事项P2821、指标的数量化:Y为计量资料。2、多重共线性3、变量间的交互作用4、残差分析5、样本含量(二)多重线性回归分析的基本步骤:1、检查应用条件;2、根据样本数据建立多重线性回归方程3、多重线性回归方程模型的是否成立的假设检验(方差分析,P<0.05有意义)及评价(决定系数R2、复相关系数R、校正决定系数 )4、各自变量的假设检验(F检验/t检验:P<0.05时自变量Xj与应变量Y有线性回归关系)及评价(标准化的偏回归系数的绝对值越大,相应自变量对Y作用越大)十、第十七章logistic回归(一)logistic回归模型假设检验P2901、似然比检验整个模型(P<0.05有意义)2、Wald 检验单个回归系数(P<0.05有意义)(二)回归模型的应用条件P2961、各观测单位间的独立性2、自变量为连续或等级变量时,logit(P)与自变量呈线性关系;自变量为二分类变量时不考虑;3、自变量之间不存在多重共线性(二)根据应变量Y的类型选择合适的模型。二分类logistic回归,多分类广义logistic回归,等级累计比数logistic回归(三)样本含量为自变量个数的20倍以上(四)注意变量赋值形式和选择(五)Y多重线性回归连续计量资料logistic回归二分类、多分类、等级变量资料十一、生存分析(一)生存曲线的比较问题P310需对差异有无统计学意义进行假设检验:log-rank检验(基本思想:比较实际死亡数与理论死亡数是否有差别)(二)COX模型分析P322①设计阶段应注意的问题1、样本的代表性要好(样本量一般在40例以上,通常要求是协变量数的15-20倍,且截尾率不宜太高)。2、协变量在研究对象中的分布要适中。3、考虑危险因素要全面,避免遗漏重要因素和加入无关因素。②模型拟合时应注意的问题1、多重共线性问题。相关系数绝对值0.7的变量要避免同时进入。2、Cox模型要求各危险因素间不存在交互作用。3、Cox模型要求病人的死亡风险与其基础风险呈恒定的比例,即要求危险因素对生存时间作用不随时间变化而变化。3.1比例风险假定的检验⑴分类变量:绘制每个协变量不同水平的生存曲线,若无交叉则满足比例风险假定;⑵连续型变量:将每个协变量与对数生存时间的交互作用项[X*ln(t)]放入模型中,如无统计学意义,则满足比例风险假定。附:生存曲线意义由图可见:1.随着生存时间的递增生存曲线从1到0逐渐呈阶梯状下降,乙法曲线下降迅速;2.甲法生存曲线高于乙法,且无交叉,直观表明甲法生存率高于乙法;3.甲法删失个体多,散布在第2、3两年,乙法无删失;4.甲法的两年生存率约为0.43,而乙法为0;5.中位生存时间甲法约为10个月,乙法约为6个月。统计学资料类型及统计方法选择一、完全随机设计两/多组独立样本资料从不同总体中随机抽样,通过样本估测比较两总体从同一总体中随机抽样,并分配到不同处理组,观察比较不同处理效应配对设计两组相关样本资料异体配对:同种属、窝别、性别……自身配对:左右对照、部位对照、前后时间对照……随机区组设计多组相关样本资料配伍组设计二、计量资料连续型、离散型计数资料无序分类资料二分类、多分类等级资料有序分类资料三分类资料强度相对数(率)、结构相对数(构成比)、相对比等级资料单变量:秩次、秩和、平均秩和双变量:Spearman等级相关系数rs四、计量资料两组比较配对设计配对t检验P87Wilcoxon符号秩检验P142完全随机设计成组t检验P90Wilcoxon秩和检验P145多组比较随机区组设计方差分析P106FriedmanM秩和检验P151完全随机设计方差分析P105Kruskal-WallisH秩和检验P148等级资料两组比较配对设计Wilcoxon符号秩检验P142完全随机设计Wilcoxon秩和检验P145多组比较随机区组设计FriedmanM秩和检验P151完全随机设计Kruskal-WallisH秩和检验P148计数资料两/多组率/构成比,关联性检验卡方检验/fisher确切概率法P121相关计量Pearson相
本文标题:统计学方法各种应用条件、校正条件
链接地址:https://www.777doc.com/doc-7206702 .html