您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > SAS总体均数和t检验报告
第4章总体均数估计与t检验公共卫生学院陈帅印微信:37628994有趣的统计故事AB1、两个指标诊断疾病问题A敏感度为0.80,特异度为0.90B敏感度为0.85,特异度为0.87写了一篇论文:“B诊断方法敏感度高于A,特异度低于A”敏感度和特异度仅仅代表一个诊断界点下的诊断效能,无法反映总体诊断价值。这个故事说明:统计指标选错了,统计出来的结果往往难以“自圆其说”ROC曲线下面积:A0.80,B0.82.B优于A这种差异的原因有抽样误差和试验效应两种。统计学中,要通过统计学检验来确定0.82是否高于0.80这个故事说明:在医学科研中,没有统计学检验的结论是不科学的曲线下面积经统计学检验有差异(P<0.05)B是常见诊断指标,对医生不设盲法。A是近期新发现指标,对医生设置盲法。不公平这个故事说明:在医学科研中,实验设计有缺陷,再优秀、再正规的统计方法也于事无补。设置完全的盲法。曲线下面积:A0.80,B0.77(P<0.05)A诊断效能高于B,是可以用到临床的新指标。A和B间不是竞争关系,应是合作关系不差钱这个故事说明:在医学科研中,研究方向错了,即使无懈可击的设计和天衣无缝是统计分析,也无济于事。医学科研很痛苦,不重视统计学和科研设计,会走很多弯路。1总体均数估计2t检验3作业1总体均数估计1.1基本概念总体样本抽样误差:标准误点估计和区间估计总体均数的100(1-)%可信区间的计算公式为:(XstX,,XstX,)1.2总体均数估计实例例4-1已知某地27例健康成年男性血红蛋白含量的均数=125g/L,标准差S=15g/L,数据如下。试估计该地健康成年男性血红蛋白含量的95%和99%可信区间。血红蛋白量:123,134,105,140,127,112,113,145,127,125,110,130,138,112,100,110,147,155,104,125,126,137,122,100,133,127,1451.2.1用分析员作总体均数估计(1)运行分析员,并建立数据集eg4_12)(3)将变量hemoglob选入变量框中。(4)Tests的对话框。(5)点ConfidenceIntervals,Interval(区间)前的圆圈。(6)在ConfidenceLevel:后填入所需要的可信水平的百分位数95.0%(6)单击OK,返回上一级对话框,再单击OK显示结果,其中最后一部分为可信区间的结果(7)99%可信区间:1.2.2用SAS程序作总体均数估计proccapabilitydata=sasuser.eg4_1noprint;intervalshemoglob/method=4;run;程序4-1的说明:(1)数据集名后的选项noprint是为了在调用CAPABILITY时,不要输出变量的常规描述统计量的计算结果;(2)Method=4或6,method=4为计算均数的可信区间,method=6为计算标准差的可信区间。缺省时会提供6种不同的区间,包括预测区间、允许限等。为了得到其他的各种区间的估计,可用语句intervals的其它选项:●Alpha=α值,设定可信水平为1-α,缺省时为α=0.010、0.050、0.100。●Type=lower或twosided或upper分别表示计算可信区间的下限、区间和上限,缺省时为可信区间。1总体均数估计2t检验3作业2t检验2.1基本概念假设检验假设检验就是先对总体参数或分布作出某种假设,然后用适当的方法根据样本信息对总体参数进行推断,推断假设是否拒绝或接受。假设检验通常以选定的检验统计量来命名。如t和u分别对应与t检验(t-test)和u检验(u-test,称Z-test,SAS的菜单用该符号提示)。应弄清各种检验方法的用途、适用条件和注意事项。假设检验的步骤建立假设,确定检验水准;选择检验方法,计算检验统计量;确定P值,作出统计推断。t检验要求原始数据满足以下三个条件:①独立性(independence):各观察值间是相互独立的,不能相互影响;②正态性(normality):两组均数比较时,要求两组数据服从正态分布;配对设计时,要求差值服从正态分布。可用正态性检验来确认。③方差齐性(homogeneity):两样本所对应的正态总体的方差相等,可由方差齐性检验来认定。U检验的应用条件:正态分布样本含量较大如果以上条件未知:不清楚总体的分布类型或明显地呈偏态分布(经变量变换后仍达不到条件),此时就要用非参数统计方法进行分析,常用方法有:符号检验(Signtest)符号秩和检验(SignedRankTest)也称为Wilcoxon检验法t检验和u检验只适用于正态分布的总体或近似正态分布的总体符号和符号秩和检验法对总体分布类型不要求,适应范围较广。由于它们利用样本信息不如t检验和u检验充分,所以对正态分布的总体来讲,它们的检验效能不如t检验和u检验效能高。2.2样本均数与总体均数的比较例4-2已知北方地区一般儿童前囟门闭合月龄为14.1月。某研究人员从东北某县(缺钙地区)抽取36名儿童,测得前囟门闭合月龄均值为14.3月,标准差为4.10月,数据如下。问该县儿童前囟门闭合月龄是否大于一般儿童的前囟门闭合月龄?前囟门闭合月龄:20.3,19.4,7.5,20.6,8.7,19.2,12.3,18.8,17.7,14.0,13.0,14.8,14.2,13.0,13.0,10.0,18.0,9.4,15.3,12.6,15.8,12.1,18.5,17.8,15.7,8.5,19.5,9.6,19.7,7.3,14.8,17.7,8.5,15.0,14.1,8.22.2.1用分析员作样本均数与总体均数的比较(1)运行分析员,并建立数据集eg4_2。(2)单击Statistics(S),HypothesisTests(H),One-samplet-testforaMean(T)。(3)单击选中month变量选入变量框中。(4)在Hypoteses方框内找到无效假设Null:输入总体均数14.1(5)在Alternate:选择第2项(单侧检验),(6)单击OK,获得检验结果t分布图2.2.2用程序作样本均数与总体均数比较datawork.a;setsasuser.eg4_2;month1=month-14.1;run;procunivariatedata=work.a;varmonth1;run;程序4-2的说明:(1)用变量month减去总体均数14.1,生成临时变量month1,并利用data过程建立临时数据集a;(2)用univariate过程作样本均数与总体均数比较。datawork.a;setsasuser.eg4_2;month1=month-14.1;run;procunivariatedata=work.a;varmonth1;run;MEANS过程也可提供样本均数与总体均数比较的假设检验和相应的P值:datawork.b;setsasuser.eg4_2;month1=month-14.1;run;procmeansdata=work.btprt;varmonth1;run;2.3配对设计两样本均数比较配对设计有两种情况:(1)自身配对:同一对象接受两种处理,如同一标本用两种方法进行检验,同一患者接受两种处理方法;(2)异体配对:将条件相近的实验对象配对例4-3某地区随机抽取12名贫血儿童的家庭,实行健康教育干预三个月,干预前后儿童的血红蛋白(g/L)测量结果如表4-1所示,试问干预前后该地区贫血儿童血红蛋白(g/L)平均水平有无变化?序号(1)干预前(2)干预后(3)差值d(4)=(3)-(2)1364592466418353661345757056570566055-57427028845450925502510558025115160912596012.3.1用分析员作配对t检验(1)运行分析员,并建立数据集eg4_3(2)Two-samplePairedt-testforaMean(R)2.3.2用程序作配对t检验datawork.c;setsasuser.eg4_3;d=before-after;run;procunivariatedata=work.c;vard;run;程序4-3的说明:(1)用变量before减去after,生成临时变量d,并利用data过程建立临时数据集c。(2)用univariate过程作作配对t检验。datawork.c;setsasuser.eg4_3;d=before-after;run;procunivariatedata=work.c;vard;run;datawork.d;setsasuser.eg4_3;d=before-after;run;procmeansdata=work.dnmeantprtmaxdec=4;vard;run;说明:程序中nmeantprtmaxdec=4分别表示求例数、均数、t和P值、设定小数点后保留4位。datawork.d;setsasuser.eg4_3;d=before-after;run;procmeansdata=work.dnmeantprtmaxdec=4;vard;run;2.4两样本均数比较的t检验t检验对两样本均数进行比较时,要求原始数据满足以下三个条件:①独立性(independence):各观察值间是相互独立的,不能相互影响;②正态性(normality):两组均数比较时,要求两组数据服从正态分布;配对设计时,要求差值服从正态分布。可用正态性检验来确认。③方差齐性(homogeneity):两样本所对应的正态总体的方差相等,可由方差齐性检验来认定。如果两样本方差齐性检验认为两总体方差不等t检验就不适用,此时须用t检验例4-4某妇产医院的研究者欲探索孕妇在孕期补充钙制剂对血清骨钙素(ng/mL)的影响,选取孕妇的年龄、基础骨钙素值接近,孕周在26-28周的30名孕妇,随机分成两组,每组15人。试验组孕妇补充选定的某种钙制剂,对照组孕妇采用传统膳食。产后40-50天内测定两组孕妇血清骨钙素的改变值(产后骨钙素和产前骨钙素的差值),结果如下:试验组:10.2,8.9,10.1,9.2,-0.8,10.6,6.5,11.2,9.3,8.0,10.7,9.5,12.7,14.4,11.9对照组:5.0,6.7,-1.4,4.0,7.1,-0.6,2.8,4.3,3.7,5.8,4.6,6.0,4.1,5.1,4.7问孕期补钙和传统膳食的产妇骨钙素改变值的总体均数差别有无统计学意义?2.4.1用分析员作两样本均数比较的t检验(1)运行分析员,并建立数据集eg4_4(2)方差齐性检验(3)进行正态性性检验(4)两样本均数的t检验结果中(HypothesisTest下面)包括了方差相等和不相等的2种情形方差齐方差不齐2.4.2用程序作两样本均数比较的t检验procttestdata=sasuser.eg4_4;classgroup;varx;run;程序4-4的说明:使用这一过程要求将两样本中被比较数值变量输入到同一变量(x)下,不同的样本用另外一个分类变量(group)的不同取值加以区别,分类变量只能取2个水平(如1和2或0和1等)。procttestdata=sasuser.eg4_4;classgroup;varx;run;3作业P104习题4-1习题4-4习题4-5
本文标题:SAS总体均数和t检验报告
链接地址:https://www.777doc.com/doc-3869814 .html