您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第八章 计数资料的统计推断
第八讲计数资料的统计推断2020/1/28医学统计学2统计推断用样本信息推论总体特征的过程。包括:参数估计:运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。主要内容一、率(或构成比)的抽样误差和标准误二、总体率(或构成比)的估计:点估计、区间估计三、总体率(或构成比)的假设检验1.率(或构成比)的检验2.x2检验四、假设检验的注意事项五、非参数检验1.参数统计和非参数统计优缺点2.秩和检验一、率(或构成比)的抽样误差和标准误均数的标准差和标准误(复习)。抽样误差产生的原因、概念标准误的计算公式与样本量的关系:成反比。例题:56页某市为了解已婚育龄妇女子宫颈癌的患病情况,进行了抽样调查,随机抽取2000人,患者80例。试求此患病率的标准误。二、总体率(或构成比)的估计点估计:将样本率直接作为总体率的估计值.区间估计(对照总体均数的区间估计)公式:P±Uα.SP条件:nP5,n(1-P)5例题:意义:三、总体率(或构成比)的假设检验当两个样本率不同时,有两种可能:1.P1,P2所代表的总体率相同,由于抽样误差的存在,造成的不同,这种差别在统计上叫差别无统计学意义。2.P1,P2所代表的总体率不同,即两个样本来不同的总体,其差别有统计学意义。现在就是要用统计学的方法进行判断到底属于那种情况。2020/1/28医学统计学71.总体率(或构成比)的u检验目的:公式:其中符号的含义适用条件:已知π0nP5,n(1-P)5例题P582020/1/28医学统计学82.x2检验是一种假设检验的方法,当样本量不大,或几个率进行比较时可用x2检验。某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?组别发病人数未发病人数观察例数发病率(%)实验组148610014对照组309012025合计44176220202020/1/28医学统计学9x2分布规律自由度一定时,P值越小,x2值越大。当P值一定时,自由度越大,x2越大。=1时,P=0.05,x2=3.84P=0.01,x2=6.63P=0.05时,=1,x2=3.84=2,x2=5.99当自由度取1时,u2=x22020/1/28医学统计学10x2检验的基本公式x2=(A-T)2/TA:表示实际频数,即实际观察到的例数。T:理论频数,即如果假设检验成立,应该观察到的例数。:求和符号自由度:=(R-1)x(C-1)R行数,C列数注意:是格子数,而不是例数。2020/1/28医学统计学11基本原理x2=(A-T)2/T如果假设检验成立,A与T不应该相差太大。理论上可以证明(A-T)2/T服从x2分布,计算出x2值后,查表判断这么大的x2是否为小概率事件,以判断建设检验是否成立。(1)四格表资料的x2检验什么是四格表资料?凡是两个率或构成比资料都可以看做四格表资料。举例。组别发病人数未发病人数观察例数发病率(%)实验组148610014对照组309012025合计4417622020148630902020/1/28医学统计学13组别阳性阴性合计1aba+b2cdc+d合计a+cb+da+b+c+d四格表的一般形式理论频数与自由度的计算:A是实际频数,T是根据假设检验来确定的,当H0成立时,计算出的格子中的数。每个格子中的理论频数计算公式为:TRC=NRxNC/N,NR所在的行合计,NC所在的列合计,代入公式中求x2值。(求上例的4个T值)四格表资料的专用公式:四格表资料的专用公式x2=(ad-bc)2xN/(a+b)(c+d)(a+c)(b+d)该公式从基本公式推导而来,结果相同。计算较为简单。适用条件:N40且T5当不满足时用校正公式。x2=(|A-T|-0.5)2/T或x2=(|ad-bc|-n/2)2xN(a+b)(c+d)(a+c)(b+d)见62页。2020/1/28医学统计学15例题上例:问此药是否有效。第一步:建立假设H0:1=2=20%H1:1‡2第二步:确定显著性水平=0.05第三步:计算统计量:n=20040,每格的T值大于5,可选用公式??(计算过程)第四步:确定P值第五步:判断结果2020/1/28医学统计学16(2)配对计数资料的x2检验什么是配对资料?P64甲乙两种培养基的生长情况甲种乙种+-合计+11(a)7(b)18-3(c)7(d)10合计141428例:问两种培养基的效果是否不同第一步:建立假设H0:B=C=b+c/2H1:B‡C第二步:确定显著性水平=0.05第三步:计算统计量:b+c40时,基本公式:x2=(A-T)2/T,专用公式:x2=(b-c)2/b+cb+c40时,校正公式:x2=(|A-T|-0.5)2/Tx2=(lb-cl-1)2/b+c自由度:=(2-1)x(2-1)=1第四步:确定P值第五步:判断结果2020/1/28医学统计学18(3)行x列表的x2检验四格表是指只有2行2列,当行数或列数超过2时,统称为行x列表。行x列表的x2检验是对多个样本率(或构成比)的检验。基本公式:x2=(A-T)2/T专用公式:x2=nx(A2/nRxnC-1)自由度:=(R-1)x(C-1)适用条件:表中不宜有1/5以上格子的理论频数小于5,或有一个格子的理论频数小于1。2020/1/28医学统计学19四、注意事项1、计量资料的注意事项同样适用(见下张幻灯片)2、公式的适用条件n、T3、多组率经x2检验有显著性时,只能说明不全相同,但不能确定哪两个不同。需要进一步证明时,用行x列表的x2分割法。2020/1/28医学统计学202020/1/28医学统计学21练习书上作业。67页2020/1/28医学统计学22五、参数统计和非参数统计参数:总体的统计指标称为参数(、、)统计量:样本的统计指标叫统计量(X、s、p)参数统计:我们介绍的统计推断方法,通常要求样本来自正态总体,或方差齐等,在这些假设的基础上,对总体参数进行估计和检验,称为参数统计。非参数统计:有许多资料不符合参数统计的要求,不能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验,称为非参数检验。2020/1/28医学统计学23秩和检验非参数检验的方法很多,秩和检验是较常用的,检验效率较高的一种。其基本原理是编秩求和。2020/1/28医学统计学24成组资料比较的秩和检验秩和检验的方法很多。以此例说明秩和检验的基本原理。82页。研究不同饲料与雌鼠体重增加的关系,问高低蛋白饲料与体重增加有无关系?高蛋白低蛋白体重增加秩次体重增加秩次1341770114618118111047101611912853124141078.516119132161078.594483113210不同饲料的两组雌鼠在8周内所增体重(g)2020/1/28医学统计学26参数统计和非参数统计优缺点参数统计优点:对资料的分析利用充分统计分析的效率高缺点:对资料的要求高适用范围有限非参数统计优点:对资料的没有特殊要求不受分布的影响(偏态、分布不明的资料)不受方差齐性的限制不受变量类型的影响不受样本量的影响缺点:检验效率低(易犯Ⅱ型错误)对信息的利用不充分。小结一、率(或构成比)的抽样误差和标准误二、总体率(或构成比)的估计:点估计、区间估计三、总体率(或构成比)的假设检验1.率(或构成比)的检验2.x2检验四、假设检验的注意事项五、非参数检验1.参数统计和非参数统计优缺点2.秩和检验
本文标题:第八章 计数资料的统计推断
链接地址:https://www.777doc.com/doc-3354862 .html