您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 临床研究资料常用统计分析方法
1第二军医大学临床流行病学与循证医学中心zhangluoman@yahoo.com.cn张罗漫临床研究资料常用统计分析方法2统计数据分析是一门综合技术,也是一门高超的艺术!医学专业知识医学统计学理论知识计算机统计软件技术3学习了统计学理论知识,并不代表已经有能力进行统计数据分析。要不断进行实践。实际科研工作中的“原型”资料与教科书上的“标准型”例子有一定差距。应用统计软件进行计算分析一定要有正确的综合的统计理论方法的后台背景指导。不但要注重对统计方法的选择,而且要注重对分析结果的解释。4一、概述二、原始数据的录入三、数据处理的几个基本问题四、统计方法选择的基本思路五、统计分析结果的表述5医学统计学研究设计数据处理观察性研究实验性研究统计描述统计推断假设检验参数估计(调查)6调查设计系统分层随机整群调查方法调查对象调查指标研究目的按范围按时间抽样普查横向(现况调查)非概率概率简单随机纵向病例对照研究队列研究调查工具调查员nestedcasecontrolstudy7实验设计实验分类动物实验临床试验社区干预试验基本要素处理因素受试对象实验效应诊断试验疾病防治病因疾病预后8实验设计基本原则随机化、盲法对照重复(样本含量)形式原则:专设、同步、均衡1-、、自身处理前后平行:无治疗安慰剂阳性治疗不同剂量9统计描述资料类型数学连续型(计量)离散型:计数计量:脉搏次数/分统计等级(有序分类)计量计数(无序分类)定比(0表示无,如体重kg)定距(0不表示无,如温度0C)10统计描述统计表制表原则制表要求简单明了主辞在左、宾辞在右一张表表达一个中心内容备注数字线条标目标题11统计描述统计图制图原则制图要求连续型资料(计量)离散型资料(计数、计量)图例刻度纵轴、横轴标目标题条图、圆图、百分比条图线图、直方图、散点图12统计描述SQR统计指标计量资料(单变量)中心位置正态:MX、非正态:GXM对数正态:离散程度个体值样本均数:正态非正态:XS量纲相同:CV量纲不同:计量资料(双变量)偏度:g1峰度:g213统计描述统计指标计量资料(单变量)计量资料(双变量)离散程度:r、brbSS、14统计描述中心位置:均数向量离散程度:离均差平方和矩阵协方差矩阵相互关系:相关矩阵计量资料(多变量)统计指标15统计描述等级资料统计指标计数资料率、构成比、相对比RR(OR)离散程度:标准误离散程度:秩号、秩和秩和的标准误单变量双变量:rs16统计描述参考值范围估计正态偏态或SuX双侧:单侧:SuX2/SuX双侧:单侧:x100xp~pxp或x100p17统计推断区间估计参数估计点估计2211ppXX22ggSSSSbrpX、、、、、、双侧:单侧:X,2/StXX,StX或X,StX双侧:单侧:p2/SuppSup或pSupRR(OR):2MH2/u1)OR(RR18统计推断假设检验步骤1.进行检验假设假设样本来自某一特定总体2.确定检验水准确定最大允许误差3.选定检验方法计算检验统计量计算样本与总体的偏离程度4.根据某一特定分布计算与检验统计量对应的P值5.作出结论根据小概率反证法思想作出推断19统计推断比较差别:2、t、F、q、log-rank、秩和检验等联系:相关、回归分析分类:回归分析、判别分析推测:回归分析筛选影响因素:回归分析综合变量信息:主成分分析寻找潜在支配因素:因子分析假设检验方法20统计分析软件SPSS(有人称“鼠标软件”)SAS(StatisticalAnalysisSystem)StataR(方法新、提供源程序、免费)21SPSS软件StatisticalPackageforSocialScience(社会科学统计软件包)后改名为:StatisticalProductandServiceSolutions(统计产品与服务解决方案)现改名为PASWPredictiveAnalyticsSoftware预测分析软件22一、概述二、原始数据的录入三、数据处理的几个基本问题四、统计方法选择的基本思路五、统计分析结果的表述23原始数据的记录形式肾衰病人预后研究的临床资料记录病人编号病案号性别年龄生理评分肾毒性黄疸昏迷肌酐胆固醇肾功能预后1004757男2614无有无520—治愈2007950女3113无无无5234.5治愈3011093男5517无无无2093.3治愈4017555男259无无无13034.1治愈┇┇┇┇┇┇┇┇┇┇┇274279183女8815有无无3316.1丧失行:观察单位列:变量24肾衰病人预后研究的临床资料记录病人编号病案号性别年龄生理评分肾毒性黄疸昏迷肌酐胆固醇肾功能预后1004757男2614无有无520—治愈2007950女3113无无无5234.5治愈3011093男5517无无无2093.3治愈4017555男259无无无13034.1治愈┇┇┇┇┇┇┇┇┇┇┇274279183女8815有无无3316.1丧失标识变量分析变量25肾衰病人预后研究的临床资料记录病人编号病案号性别年龄生理评分肾毒性黄疸昏迷肌酐胆固醇肾功能预后1004757男2614无有无520—治愈2007950女3113无无无5234.5治愈3011093男5517无无无2093.3治愈4017555男259无无无13034.1治愈┇┇┇┇┇┇┇┇┇┇┇274279183女8815有无无3316.1丧失标识变量分析变量自变量(解释变量)反应变量26原始数据的录入文件类型:数据库文件:EpiDataExcel文件:Excel统计软件数据文件:SPSS(PASW)、SAS、Stata变量名及标签:变量值及标签:名义变量值的量化:有序、无序分类资料27高血压患者治疗前后的舒张压(mmHg)处理组对照组顺序号治疗前治疗后顺序号治疗前治疗后1130114111181242124110121321223136126131341324128116141149651221021511812461181001612811871169817118116813812218132122912610819120124101241062013412828数据编辑窗口数据窗标题栏菜单栏工具按钮栏数据单元格显示数据文件建立原则一个观测占一行一个变量占一列2729变量度量类型变量名变量类型变量宽度保留小数位数变量名标签变量值标签缺失值显示数据列宽数据对齐方式数据编辑窗口变量窗2830定量变量Scale等级变量Ordinal名义变量Nominal2931标准数值型科学记数法圆点数值型逗号数值型日期型带美元符号数值型自定义字符型3032名义变量的哑变量化原资料姓名性别X1年龄X2疗法X3张三150中西医李四120西医王五018中医刘六070中医赵七135中西医孙八029西医哑变量化姓名X1X2X31X32张三15001李四12010王五01800刘六07000赵七13501孙八02910001001XX3231医中中西医医西法疗33一、概述二、原始数据的录入三、数据处理的几个基本问题四、统计方法选择的基本思路五、统计分析结果的表述34数据的净化逻辑检查计算检查离群数据的处理离群值(outliner)与P25或P75的距离为“四分位数间距”的1.5~3.0倍。极端值(extremevalue)与P25或P75的距离为“四分位数间距”的3.0倍以上。剔除离群或极端值要予以合理解释。35数据质量有问题,使用的统计方法越高级,欺骗性越大!36一、概述二、原始数据的录入三、数据处理的几个基本问题四、统计方法选择的基本思路五、统计分析结果的表述37设计类型:完全随机、随机区组、拉丁方、交叉、析因、正交、嵌套、裂区设计处理因素:单因素、双因素、多因素水平:单水平、两水平、多水平处理效应:单变量、双变量、多变量资料类型:计量、无序分类、有序分类数据情况:完全数据、不完全数据、重复测量数据、层次结构数据假设检验方法前提条件:独立、方差齐性、正态分布重要38A与B药联用产妇分娩镇痛时间(min)B药物剂量A药物剂量5μg15μg30μg1.0mg1051157580105956580852.5mg7512513511513012080901505.0mg8565180120120190125100160二个处理因素,观测指标为单变量。39一个处理因素,观测指标为三个变量。三组慢性胃炎儿童外周血T细胞百分比(%)治疗Ⅰ组治疗Ⅱ组对照组编号T3T4T8编号T3T4T8编号T3T4T8163.630.231.2153.422.525.0172.442.529.9260.030.033.4246.520.014.6275.049.529.3363.235.327.9338.125.918.1375.930.040.0432.112.111.8470.032.036.4572.836.733.140(一)单变量计量资料1.样本均数与总体均数比较单因素服从正态分布单样本t检验可信区间法不服从正态分布单个样本中位数与总体中位数比较412.两个相关样本均数的比较单因素配对设计或自身前后对照设计差值服从正态分布成对t检验可信区间法差值不服从正态分布Wilcoxon符号秩检验(一)单变量计量资料(1-α)可信区间不包括μd=0,Pα423.两个独立样本的比较单因素、完全随机设计服从正态分布且方差齐性两样本均数比较t检验两样本均数的差数可信区间法不服从正态分布或方差不齐性两独立样本Wilcoxon秩和检验反应变量为生存时间且含有截尾数据log-rank检验(时序检验)(一)单变量计量资料434.多个样本均数的比较(1)一个处理因素完全随机设计服从正态分布、方差齐性完全随机设计方差分析两两比较:SNK-q、Dunnett-t检验不服从正态分布或方差不齐性多个独立样本比较Kruskal-WallisH检验两两比较:Nemenyi检验(一)单变量计量资料444.多个样本均数的比较(2)一个处理因素、一个控制因素随机区组设计(对数据服从正态分布、方差齐性不作要求)随机区组设计方差分析处理因素各组均数间两两比较:SNK-q、Dunnett-t检验(一)单变量计量资料454.多个样本均数的比较(3)一个处理因素、二个控制因素(行、列)拉丁方设计(对数据服从正态分布、方差齐性不作要求)拉丁方设计方差分析处理因素各组均数间两两比较:SNK-q、Dunnett-t检验(一)单变量计量资料464.多个样本均数的比较(4)一个处理因素、二个控制因素(阶段、受试者)二阶段交叉设计服从正态分布、方差齐性前一阶段处理效应不持续作用到下一阶段二阶段交叉设计方差分析(一)单变量计量资料474.多个样本均数的比较(5)处理因素≥2、每个因素的水平数≥2完全随机分组析因设计服从正态分布分析各因素主效应与交互作用完全随机分组析因设计方差分析(一)单变量计量资料48A与B药联用产妇分娩镇痛时间(min)B药物剂量A药物剂量5μg15μg30μg1.0mg1051157580105956580852.5mg7512513511513012080901505.0mg8565180120120190125100160494.多个样本均数的比较(6)处理因素≥2、每个因素的水平数≥2正交设计分析各因素主效应与主要因素一阶交互作用正交设计直接分析、方差分析(一)单变量计量资料504.多个样本均数的比较(7)处理因素≥2,每个因素的水平数≥2处理因素中有一个为重复测量因素满足“球对称”(组间、组内方差齐性)假设分析各因素主效应与交互作用重复测量设计的方差分析(一)单变量计量资料51不同麻醉诱导方法在各时相的患者收缩压(mmHg)麻醉诱导时相诱导方法患者序号T0T1T2T3T4A1120108112120117A2118109115126123A3119112119124118A4121112119126120A5127121
本文标题:临床研究资料常用统计分析方法
链接地址:https://www.777doc.com/doc-6411616 .html