您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 卫生统计学 第四章 均数的抽样误差
第四章均数的抽样误差与t分布第1节均数的抽样误差一、抽样与抽样误差抽样:从总体中随机抽取样本进行研究来推论总体。抽样误差samplingerror:由个体变异产生的,抽样造成的样本统计量与总体参数间差异,称~。抽样研究中不可避免,但可估计其大小。而系统误差可以避免。统计推断statisticalinference:在总体中随机抽取一定数量的观察单位作为样本进行抽样研究,通过样本指标来说明总体特征,这种从样本获取总体信息的过程,称~二、均数的标准误数理统计推论和中心极限定理centrallimittheorem表明:(1)从正态总体N(μ,σ)中,随机抽取例数为n的样本,样本均数也服从正态分布;(2)从均数为μ,标准差为σ的正态或偏态总体,抽取例数为n的样本,样本均数的总体均数也为μ,标准差用表示。通常将样本统计量的标准差称为标准误standarderror,SE,样本均数的标准差即均数标准误standarderrorofmean,SEM。SE:反映了样本均数间的离散程度,也反映了样本均数与总体均数间的差异,说明均数抽样误差的大小。xxx均数标准误的计算:为了说明均数的可靠程度,常在均数后面附上标准误的数值(常为标准误的估计值),表示为:nSSnXx的估计值为:差来估计均数抽样误差差未知,常用样本标准实际应用中,总体标准xSx第2节总体均数的可信区间与t分布一、大样本资料均数的可信区间从均数为μ,标准差为σ的正态总体中,随机抽取许多个样本量为n的样本,则这样本均数近似地以总体均数为中心呈正态分布。故95%的样本均数在的范围内。故:x96.1xxxxxxSxxx来代替标准误的差未知,常用样本均数实际中,由于总体标准上式移项得:96.196.196.196.1因此,总体均数95%的可信区间confidenceinterval为::指这个范围内包括总体均数μ的可能性有95%。用各样本计算得到的可信区间并不是固定不变。若仅知样本均数及标准误的估计值,且样本较小时,用标准误的估计值来代替标准误,误差较大,需要改用t值来推算可信区间。xxxxxSxSxx96.1)96.1(~)96.1(,简记为:估计实际中以二、t值与t分布样本均数与总体均数间的差如以均数标准误的估计值的倍数来表示,此倍数即为t值从正态分布总体中抽取若干个样本含量相同的样本,每个样本各计算一个t值,如抽取的样本很多时,可发现t值的分布是以0为中心,两侧对称的类似正态分布的一种分布。即tdistribution。t分布曲线的峰度kurtosis:受n的影响。当n小时,曲线低平;n越大越接近正态分布。即t分布曲线是随自由度的大小而有规律地变动的。xSxtdegreeoffreedom:ν=n-1(读:nu)t分布曲线不是一条曲线而是一簇曲线t分布曲线与横轴间的面积有规律:两侧外部面积为5%及1%的界限的t值常用t0.05(ν)、t0.01(ν)表示自由度趋于∞时,t分布趋向于均数为0,标准差为1的标准正态分布。一般情况下t分布曲线较正态分布低平,因而t0.05(ν)≥1.96,t0.01(ν)≥2.58t值与P值呈反向关系:t越大,则P越小;反之亦然。|t|≥t0.05(ν),P≤0.05三、小样本资料均数的可信区间小样本时t0.05(ν)和t0.01(ν)与1.96、2.58相差很大,因此计算总体均数95%和99%可信区间时,要改用:见P39例xxStxStx)(01.0)(05.0
本文标题:卫生统计学 第四章 均数的抽样误差
链接地址:https://www.777doc.com/doc-4212538 .html