您好,欢迎访问三七文档
项目4参数估计学习目标学习目的医药学研究中常常从总体中随机抽取样本进行研究,目的是通过样本的研究去推断总体,称为统计推断。统计推断包括两个重要方面:参数估计和假设检验。通过学习参数估计的点估计法和区间估计法,能够正确地进行总体参数估计,对总体做出推断。知识要求熟悉点估计与区间估计的概念和基本思想;掌握点估计的矩估计法;熟悉估计量的优良衡量标准;掌握正态总体参数(均值和方差)的置信区间的求法。能力要求熟练掌握正态总体参数(均值和方差)的区间估计的有关计算;学会查标准正态分布的双侧临界值表和分布表。2任务1总体参数的点估计与优良性一、参数的点估计定义1设总体X的分布函数形式为已知,是待估参数,是X的一个样本,是相应的一个样本值。所谓点估计问题就是要构建一个适当的统计量,用其观察值作为未知参数的近似值来估计未知参数,称为的估计量,为的估计值。简记为,这类对于参数值的估计称为点估计。(;)Fx12,,,nXXX12,,,nxxx12,,,nXXX12,,,nxxx12,,,nXXX12,,,nxxx定义2矩是描述随机变量最简单的数字特征,是以均值为基础的数字特征,均值是一阶矩,方差是二阶中心矩。总体期望值(均值)、总体方差与总体标准差的矩估计量分别是22__12__1221)(11ˆ)(11ˆ1ˆXXnSXXnSXnXniiniinii二、矩估计法例1对糖尿病患者随机选取10名经检验空腹血糖水平的测定值(mmol/L)为5.47,6.17,6.42,6.56,6.62,6.81,7.12,7.20,8.41,8.53。假定该批患者的空腹血糖值服从正态分布,其中,分别是正态总体的均值和方差。试求该批患者空腹血糖均值和方差的点估计值。2(,)N2解由10名空腹血糖的实测值计算得:样本均值=6.331样本方差=4.657故的点估计值是的点估计值是的点估计值是X2S331.6ˆX2657.4ˆ22S三、估计量优良的衡量标准(一)无偏性定义3设参数的估计量的数学期望存在且等于,即,称是的无偏估计量,否则称为有偏估计量。12(,,,)nxxx()E()E()E例2设总体X服从任意分布,且总体X的均值,方差,是取自该总体的样本,证明(1)样本均值是总体均值的无偏估计量;(2)样本方差是总体方差的无偏估计量。()EX2()DX12,,,nXXXniiXnX112211()1niiSXXn证样本相互独立,与总体服从相同分布,可以得(1)根据数学期望性质可得所以,是的无偏估计量:(2)根据样本方差公式可得12,,,nXXX2(),(),1,2,,iiEXDXin)(1)(1)1()(111niiniiniiXEnXEnXnEXEXXˆniiniiXnXnXXnS122122)(11)(11利用关于方差的定理得因此使用数学期望的定理得22222222)]([)()()]([)()(nXEXDXEXEXDXEiii])(11[)(212XXnESEnii])(11[)(212XXnESEnii])(11[122niiXnXnE所以,是的无偏估计量:222211[()()]1ninnn22S222ˆS(二)有效性定义4设与都是参数的无偏估计量,如果则称比更有效。例4设与都是总体均值的无偏估计量,证明样本均值比总体均值的另一个无偏估计量更有效。1112ˆˆ(,,,)nxxx2212ˆˆ(,,,)nxxx12ˆˆD()D()<niixnx11(1,2,,)ixinxix任务2区间估计概述定义5设总体X的分布函数中含有未知参数,对于给定的概率值,由样本确定的两个统计量和且,有则称随机区间为参数的置信度为的置信区间。)(;xF1(01)12,,,nxxx1112ˆˆ(,,,)nxxx2212ˆˆ(,,,)nxxx12ˆˆ<12ˆˆP()1<<)ˆ,ˆ(211任务3正态总体参数的区间估计一、正态总体均值的区间估计对正态总体均值的区间估计分为正态总体方差已知和未知两种情况。(一)已知时正态总体均值的区间估计因为22~(0,1)xuNn对于给定的置信度查标准正态分布的临界值表可得临界值使得:可得由此得12u1)(2uuP<2()1xPun221xPuun于是得到总体均值的置信度为的置信区间为:简写为:122xuxunn,nux2案例1某药厂随机抽取12名新入学的学生,用某批号结核菌素作皮试,皮肤浸润直径为正态总体,测得该12名新生皮肤浸润直径分别为(单位:mm):8.89.18.710.37.68.49.311.210.711.68.28.7试求该批号结核菌素皮试平均浸润直径的均值的95%置信区间。2,1.1N解计算样本均值因为置信度得,查附表2得,又n=12,故所以该批号结合菌素皮肤平均浸润直径的均值的95%置信区间为(8.77,10.03)。1(8.89.18.28.7)9.412x10.950.0596.1025.02uu1.121.11.19.41.969.49.41.221212xun(二)未知时正态总体均值的区间估计由于未知,可以用的无偏估计代替,得到样本统计量:222S22)1(ntnSxt~由于t分布曲线关于y轴对称,对于已给的置信度,结合其自由度df=n-1,查t分布的临界值表,得临界值,使得:于是即1)1(t2n1)}1(tt{2nP<1)1(tt))1(tP{22nn1)1(t/)1(tP{22nnSxn即故总体均值的置信度为的置信区间为:简写为:22P{t(1)t(1)1SSxnxnnn22t(1),t(1)nnSSxnxnnSnx)1(t21案例2某医师为了认证某新研制的安眠药的疗效,从已确认的神经衰弱的病人中随机抽取25例病人服用该种新药,计算得到平均睡眠时间为6.42小时,标准差为2.17小时。如果该药治疗的平均睡眠时间近似服从正态分布,试求该药治疗的平均睡眠时间的95%置信区间。解已知,自由度df=n-1=25-1,查附表4得:6.42,2.17,25xsn10.95,0.05064.2)24()1(025.02tnt由此得:所以该药治疗的平均睡眠时间的95%的置信区间为(5.52,7.32)22.17t(1)6.422.0646.420.89525Sxnn二、正态总体方差的区间估计设总体,未知参数,求未知参数的置信区间。由于分布曲线不关于Y轴对称,对于已给的置信度可选取适当的临界值,使得)(~2,NX2121)1(221n)1(22n1)1()1(222221nnP可得2222122(1)(1)(1)1nSPnn即所以得总体方差的置信度为的置信区间为:22222122(1)(1)1(1)(1)nsnsPnn2-1222212211,(1)(1)nSnSnn()()案例3某药厂对某批已打包药品进行随机抽检,测得9包药的重量(kg)如下:49.248.950.251.447.951.549.250.448.5,试求该批成包药品重量总体方差90%的置信区间。解由样本数据计算得,而n=9,因查附表3得临界值:585.12S507.1581205.022)()(n220.9512182.733n()()10.90则故总体方差的90%的置信区间为(0.818,4.640)。281.58515.5072210.818(1)nSn()22121S81.5854.640(1)2.733nn()学习小结一、学习内容二、学习指南1.估计未知参数分点估计和区间估计。在点估计中最常用的是矩估计法,使用的是替换原则,即总体期望值、总体方差与总体标准差的矩估计量分别是是2.矩估计方法直观而又简单,适用广,使用方便。对于同一参数,使用的估计方法不同,从而求出的估计量可能不相同,这就涉及用无偏性和有效性作为标准来评价估计量的优良性问题。3.样本均值与样本方差分别是总体均值与总体方差的无偏、有效和一致估计量。2ˆˆˆ2与,4.点估计由于样本的随机性,不能明确其与真值的误差与估计的可靠性,因而使用更加广泛的是参数的区间估计法。由于以置信区间按置信度对总体X的一个待估计参数进行估计,解决了参数估计的精确度和可靠度问题。在区间估计中,精确度(区间估计的长度)和可靠度即置信度(估计的区间包含未知量的概率)是相互制约的,在确保可靠度(置信度)的前提下,应最大限度提高精确度。正态总体均值的置信度为的置信区间分为两种情形:)ˆ,ˆ(2111(1)已知时为:未知时为:5.正态总体方差的置信度为的置信区间为:222,xuxunn222t(1),t(1)SSxnxnnn21222212211,(1)(1)nSnSnn()()
本文标题:医药数理统计
链接地址:https://www.777doc.com/doc-3469242 .html