您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 统计学方法选择与结果解释
第22章统计学方法选择与结果解释统计方法选择的基本思路数据特征样本含量研究目的对比组数设计类型资料类型综合判断研究目的影响因素分析通过比较观测指标(分布)的差别说明是否归因于处理因素或分组因素——假设检验分析变量之间是否存在某种联系——相关或回归分析评价预测……总体间比较t检验(t’检验)2检验秩和检验方差分析Z检验(大样本正态近似)二项/Poisson分布变量间关系回归分析—数量依存关系简单直线回归多重线性回归—对反应变量为定量变量进行的多变量分析logistic回归—对反应变量为分类变量所进行的多变量分析Cox比例风险回归—对反应变量为含有截尾数据的生存时间所进行的分析曲线回归关联性分析直线相关秩相关偏相关列联系数生存分析结局时间截尾组别有效无效合计甲药271845乙药40545合计672390甲、乙两药治疗小儿上消化道出血的效果例如,一个四格表资料可以进行的统计分析或计算的统计量至少有差异性检验和独立性检验、列联系数、kappa系数、OR值、RR值、灵敏度、特异度等。设计类型研究总体水平1水平2水平m…外来施加自身带有可比性匹配随机限制设计类型涉及设计中引入的因素试验性研究完全随机设计—单因素配对/配伍设计(两因素无重复设计)—2因素析因设计(两因素有重复设计)—2因素+交互效应交叉设计—处理因素、顺序、阶段、个体观察性研究—独立总体横断面研究队列研究病例对照研究独立样本假设检验两样本(成组)t检验单因素方差分析2检验(独立样本)两样本Wilcoxon秩和检验或多样本Kruskal-Wallis秩和检验匹配设计配对t检验方差分析配对(Wilcoxon单样本秩和检验)或配伍设计的秩和检验(Friedman秩和检验)McNemar检验资料类型资料类型不同分布不同统计描述的指标不同定量资料定性资料等级资料分析条件—考察数据特征参数分析方法本身的分析条件正态独立方差齐变量变换非参数分析降低检验效能对比组数两总体间比较t检验或2检验秩和检验方差分析Z检验(大样本正态近似)二项分布多总体间比较—两两比较增大犯I型错误的概率调整水准多总体综合比较方差分析R×C2检验秩和检验进一步两两比较–LSD、SNK、2分割等样本例数分布t分布正态分布二项分布Poisson分布正态分布22分布样本例数足够大统计分析应注意的问题分析的步骤数据探测异常值/离群值直方图、散点图、趋势线图等正态性、方差齐性检验统计描述选择合适的指标表达群体指标分布最有代表性的值统计推断区间估计假设检验引例分析样本高原?统计描述统计推断目的一般n=60随机抽样=?次/分0=140g/L0=140g/Lx=155g/Ls=24g/Lx=155g/L混杂因素的控制综合效应处理因素非处理因素均衡/可比性—各组观测指标之间的差异只能归因于研究因素而不是其它原因混杂因素不具可比的非处理因素病情甲疗法乙疗法病人数治愈率(%)病人数治愈率(%)轻型8090.006090.00重型12070.004070.00合计20078.0010082.00某病两种疗效的治愈率比较混杂因素对于不具可比性的资料,基本的统计调整技术分层分析标准化CMH卡方检验多因素分析病情甲疗法乙疗法病人数治愈率(%)病人数治愈率(%)轻型8090.006090.00重型12070.004070.00合计20078.0010082.00某病两种疗效的治愈率比较混杂因素正确理解可比性均衡/可比性各组观测指标之间的差异只能归因于研究因素而不是其它原因表5.10间接法计算某地2000年恶性肿瘤标准化死亡率(1/10万)某地年龄组i(1)标准死亡率iP(2)人口数in(3)预期死亡数iinP(4)=(2)(3)0~4.8330660.14820~25.7325160.64740~149.1414402.14860~341.4817385.935合计53.8687608.878()iinP59.2878.823SMR比较A、B两地区肺癌死亡率的高低,总的肺癌死亡率A地区高于B地区,但B地区各年龄组肺癌死亡率却均高于A地区由于肺癌死亡率与年龄有关,通常随年龄增高而增高;A、B两地区各年龄组人口构成不同,A地区高年龄组人口构成大于B地区,这就造成了A地区总的肺癌死亡率高于B地区;上述矛盾是因为两地人口年龄构成不同造成的所谓可比性问题其实与研究目的有关。如肺癌一例,假定已知年龄是肺癌死亡率的影响因素,如果想探索除了年龄之外还有没有其它因素影响肺癌死亡率,那么就应该对年龄进行标准化(如果标化后A、B两地肺癌死亡率相同,则说明年龄是影响肺癌死亡率的唯一因素)数据的分组问题分组:就是将专业上认为性质相同的个体归在一起,将性质不同的个体区别开来试图在专业上反映出组内的同一性和组间的差异性在此基础上进行的数据分析才有可能揭示出事物的本质和规律损失信息专业意义同一性变异性美国儿科杂志曾报道了医生间关于口服氨苄青霉素副作用研究的一场有趣的争论。剂量(mg/kg天)无腹泻例数有腹泻例数合计例数507921100100703010015061391002006832100表1口服氨苄青霉素的副作用A医生认为:“腹泻副作用不论剂量大小均常发生,虽随剂量增加而增加,但无统计学意义(Pearson检验P0.05)”。见表1。2B医生认为,在缺乏未服氨苄青霉素对照组时,只好以50mg组与较大剂量组比较。若腹泻与剂量无关,则两组腹泻发生率差异应无统计学意义。因此,将较大剂量各组合并(见表2)。表2表1合并后的结果剂量(mg/kg/天)无腹泻例数有腹泻例数50792150199101结果:较大剂量组的腹泻发生率(约30%)高于50mg组(21%),检验P0.05。因此,认为腹泻与药物剂量有关。2C医生认为,假如上述合并后面三组再比较的方法妥当的话,则反过来并组也应一样,即200mg组的腹泻发生率应低于200mg组。结果:两组腹泻发生率分别为30%和32%,检验P0.5。因此,不能同意腹泻发生率与口服氨苄青霉素剂量有关。表3按另一种分组合并的结果剂量(mg/kg/天)无腹泻例数有腹泻例数2006832200210902结果的正确解释统计学检验与客观事实用概率的方法,利用样本信息验证客观事实是否真正存在概率基础上的结果—犯错误I型错误II型错误—样本例数过小,检验效能过低统计学结论和专业意义统计学结果和因果推论不同类型研究结果的论证强度横断面研究病例对照研究队列研究试验性研究不同分析单位数据分析结果生态学谬误群体数据结论向个体推论一个经典例子:Durkheim资料分析所下的结论对若干地区的调查发现,地区中基督徒人数所占比例越大,自杀率就越高。相关和回归分析结果表明,基督徒人数比例与自杀率呈现出很强的联系,即基督徒自杀率高于其它宗教人群。但这种因果推论很可能是有问题的!因为并不知道这些自杀者到底来自哪些人群,它完全可能是另外一种情况,即在基督徒占大多数的地区,天主教徒或其它宗教信徒由于宗教歧视而更可能趋向于自杀。2表1单变量资料差异比较的分析方法小结资料类型数据特征单组设计完全随机设计配对或配伍设计两组多组两组多组定量资料正态、方差齐样本与总体均数比较的t检验两样本t检验单因素方差分析配对t检验随机区组设计方差分析非正态和/或方差不齐Wilcoxon符号秩和检验检验、Wilcoxon秩和检验Kruskal-WallisH秩和检验Wilcoxon符号秩和检验Friedman秩和检验定性资料无序二项分布直接计算概率法、正态近似法(Z检验)检验、Fisher确切概率法表资料检验、Fisher确切概率法配对四格表检验配对列联表检验有序____Wilcoxon秩和检验Kruskal-WallisH秩和检验Wilcoxon符号秩和检验t¢RC22RR2数据特征分析方法相关分析定量资料x、y服从双变量正态分布直线相关分析x、y不服从双变量正态分布Spearman秩相关定性资料(表)双向无序检验双向有序、属性不同Spearman秩相关、线性趋势检验双向有序、属性相同一致性检验(kappa系数的假设检验)回归分析应变量为连续型定量变量,服从正态分布一个应变量,一个自变量:直线回归分析一个应变量,多个自变量:多重线性回归分析应变量为定性变量logistic回归分析应变量为含有截尾数据的生存时间Cox比例风险回归分析表2双变量(多变量)资料的关联性分析方法小结RC
本文标题:统计学方法选择与结果解释
链接地址:https://www.777doc.com/doc-7321151 .html