您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 同济医学院-《SAS》课件-SAS的t检验(正式)
华中科技大学公卫学院流行病与卫生统计系t检验SAS应用蒋红卫Email:JHWCCC@21CN.COM学习目标•掌握基本SAS过程的调用•掌握单样本、配对设计资料、两独立样本t检验的基础理论及其SAS分析程序;2概述•SAS系统的BASE软件提供了一些计算基础统计量的过程,如:means过程、univariate过程、ttest过程。•这些过程可完成单变量或多变量的描述统计量计算。•它们也可完成各种t检验。3MEANS过程•MEANS过程功能是对计量数据进行统计描述与单样本或配对设计资料的t检验,它的一般格式如下:procmeans输入数据集名选项列表;var变量列表;class变量列表;by变量列表;freq变量;weight变量;id变量列表;outputout=输出数据集名统计量关键字=变量名列表;run;4选项列表•vardef=df/weight/wgt/n/wdf——在方差计算中规定除数d.。•descending——规定输出数据集按_type_值下降的次序(缺省时为上升)。•order=freq/data/internal/formatted/——规定输出时class变量按所指定方式排序。•alpha=数字——设置计算置信区间的置信水平,值在0与1之间。56统计量名称含义统计量名称含义n未丢失的观测个数mode众数,出现频数最高的数nmiss丢失的观测个数sumwgt权数和mean算术平均max最大值stderr均值的标准误差min最小值sum加权和range极差,max—minstd标准偏差median中间值var方差T总体均值等于0的t统计量cv变异系数的百分数Prtt分布的双尾p值uss加权平方和Clm置信度上限和下限css关于均值偏差的加权平方和Lclm置信度下限skewness对称性的度量——偏度Uclm置信度上限kurtosis对尾部陡平的度量——峰度统计量关键字output语句中的选项•out=输出数据集名——输出数据集名。•统计量关键字=变量名列表——规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。•means过程对output语句的次数没有限制,可以使用几个output语句来创建内容不同的多个数据集。7其它语句•var语句——分析的连续型变量。•by语句——分组变量,须事先排序。•class语句——分组变量,无须事先排序。•freq语句——指定频数。•weight语句——指定权重。•id语句——在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里id变量具有的最大值。8UNIVARIATE过程•UNIVARIATE过程功能是对计量数据进行更为详细的统计描述、少量统计图、正态性检验与单样本或配对设计资料的t检验,它的一般格式如下:procunivariate输入数据集名选项列表;var变量列表;by变量列表;freq变量;weight变量;id变量列表;outputout=输出数据集名统计量关键字=变量名列表pctlpts=百分位数pctlpre=变量前缀名pctlname=变量后缀名;run;9选项列表•vardef=df/weight/wgt/n/wdf——在方差计算中规定除数d.。•normal——要求计算关于输入数据服从正态分布的假设的检验统计量。•plot——要求生成一个茎叶图、一个盒型图和一个正态概率图。•pctldef=1/2/3/4/5——规定计算百分位的五种方法,缺省值为5。1011统计量关键字统计量名称含义统计量名称含义n未丢失的观测个数mode众数,出现频数最高的数nmiss丢失的观测个数t总体均值等于0的t统计量nobs观测个数prtt分布的双尾p值mean算术平均q3上四分位数(75%)stderr均值的标准误差q1下四分位数(75%)sum加权和qrange上下四分位数差(q3-q1)std标准偏差p11%分位数var方差p55%分位数cv变异系数的百分数p1010%分位数uss加权平方和p9090%分位数css关于均值偏差的加权平方和p9595%分位数skewness对称性的度量——偏度p9999%分位数kurtosis对尾部陡平的度量——峰度msign符号统计量sumwgt权数和probm大于符号秩统计量的绝对值概率max最大值signrank符号秩统计量min最小值probs大于中心符号秩统计量的绝对值prange极差,max—minnormal检验正态性的统计量median中间值probn检验正态分布假设的概率值output语句中的选项•out=输出数据集名——输出数据集名。•统计量关键字=变量名列表——规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。•means过程对output语句的次数没有限制,可以使用几个output语句来创建内容不同的多个数据集。12其它语句•var语句——分析的连续型变量。•by语句——分组变量,须事先排序。•freq语句——指定频数。•weight语句——指定权重。•id语句——在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里id变量具有的最大值。13TTEST过程•对于配对设计定量数据,我们可以采用TTEST过程进行统计分析。TTEST过程功能是对两组数据的均数进行差别比较的t检验,它的一般格式如下:•procttestdata=options;class变量名称(分组变量);pairedvariables;var变量名称(待分析的数值变量);by变量名称(分组变量);run;14TTEST过程•PROCTTEST语句和CLASS(或PAIRED)语句是必需的,其余语句可以省略,CLASS语句、VAR语句及BY语句之间的顺序可以任意。CLASS语句所指定的分组变量是用来进行组间比较的,PAIRED语句专门用来进行配对t检验的数据分析,而BY语句所指定的分组变量是用来将数据分为若干个更小的样本,以便SAS分别在各小样本内进行各自独立的处理。VAR语句引导所要进行比较的所有变量的列表,SAS将对VAR语句所引导的所有变量分别进行组间均数比较的t检验。15单样本t检验的基础理论•单样本t检验实际上是推断该样本来自的总体均数µ与已知的某一总体均数µ0(常为理论值或标准值)有无差别。其检验统计量按下式计算1,//000nnSXnSXSXtX16例题•某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?17SAS程序•直接计算法•PROCMEANS•PROCUNIVARIATE•PROCTTEST18配对设计资料t检验的基础理论•在医学研究中,常用配对设计。–异源配对–同源配对–自身前后设计19配对设计资料t检验的基础理论•配对t检验的实质同于单样本t检验,可将此类资料看成是差值的样本均数所代表的未知总体均数与已知总体均数=0的比较,其检验统计量构造如下:1,//0nnSdnSdSdtdddddd020例题编号(1)哥特里-罗紫法(2)脂肪酸水解法(3)差值d(4)=(2)(3)10.8400.5800.26020.5910.5090.08230.6740.5000.17440.6320.3160.31650.6870.3370.35060.9780.5170.46170.7500.4540.29680.7300.5120.21891.2000.9970.203100.8700.5060.3642.724两种方法对乳酸饮料中脂肪含量的测定结果(%)21例题•计算检验统计量t:1)(22nnddSd1/0nvnSdtd22SAS程序•PROCMEANS•PROCUNIVARIATE•PROCTTEST23两独立样本的t检验•在日常工作中,我们经常要比较某两组计量资料的均数间有无显著差别,如研究不同疗法的降压效果或两种不同制剂对杀灭鼠体内钩虫的效果(条数)等。这时假若事先难以找到年龄、性别等条件完全一样的人(或动物)作配对比较,那么不能求每对的差数只能先算出各组的均数,然后进行比较。两组例数可以相等也可稍有出入。检验的方法同样是先假定两组相应的总体均数相等,看两组均数实际相差与此假设是否靠近,近则把相差看成抽样误差表现,远到一定界限则认为由抽样误差造成这样大的相差的可能性实在太小,拒绝假设而接受H1,作出两总体不相等的结论。24两独立样本t检验的基础理论•两样本t检验又称成组t检验,适用于完全随机设计两样本均数的比较,人们所关心的是两样本均数所代表的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两个不同的处理组。•当两样本含量较小,且均来自正态总体时,要根据两总体方差是否不同而采用不同的检验方法。25总体方差相等的t检验•当两总体方差相等,可将两样本方差合并,求两者的共同方差──合并方差,两样本t检验的检验统计量为2,)()(212121212121nnvSXXSXXtXXXX26总体方差相等的t检验)11(2)1()1()11(2/)(/)()11(212122221121212122222121212121221nnnnSnSnXXnnnnnXXnXXXXnnSXXtc27近似t检验•Cochran&Cox的检验统计量为t′,因t′分布较复杂,故常利用t分布计算其近似临界值。•Satterthwaite法•Welch法1,1,221122212121nvnvnSnSXXt28例题•为了研究新药阿卡波糖胶囊的降血糖效果,某医院用40名Ⅱ型糖尿病病人进行同期随机对照试验。实验者将这些病人随机等分到实验组(阿卡波糖胶囊)和对照组(拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值,能否认为该新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?29例题•提出检验假设H0与备择假设H1:H0:μ1=μ2,阿卡波糖胶囊组与拜唐苹胶囊组空腹血糖下降值的总体均数相等;H1:μ1≠μ2,阿卡波糖胶囊组与拜唐苹胶囊组空腹血糖下降值的总体均数不相等;•定显著性水准α,并查出临界t值。现令α=0.05,•计算检验统计量t:•实验组空腹血糖下降值均数=2.065mmol/L,标准差S1=3.0601mmol/L;对照组空腹血糖下降值均数=2.625mmol/L,标准差S2=2.4205mmol/L;。30例题•确定P值,作出推断结论:查t界值表得P0.50,所以检验假设H0得以接受,无统计学意义。尚不能认为阿卡波糖胶囊组与拜唐苹胶囊组空腹血糖下降效果不同。642.0204205.20601.3625.2065.2)11(2)1()1(22222121212122221121nSSXXnnnnSnSnXXt31SAS程序•PROCTTEST•Cochran&Cox•Satterthwaite•Welch32本章小节•介绍了单样本t检验的基础理论,并列举了单样本t检验分析实例──means、univariate过程。以MEANS过程实现对单变量分布位置的t检验,只需在PROCMEANS语句后添加t和probt两个选项,SAS即给出样本均数与0比较的t检验值和t分布曲线下该t值对应的双侧尾部面积。UNIVARIATE过程在默认状态下即可给出单变量分布位置的t检验结果。33本章小节•介绍了配对设计资料t检验的基础理论,并列举了配对t检验分析实例──means、univariate、ttest过程。•最后,本章介绍了两独立样本t检验的基础理论,并列举了独立样本t检验分析实例──ttest过程应用。•需要强调的
本文标题:同济医学院-《SAS》课件-SAS的t检验(正式)
链接地址:https://www.777doc.com/doc-3463636 .html