您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 第五部分概率统计方法
第五部分概率统计模型定义1在统计学中,常把研究对象的全体称为总体,也称母体,而把组成总体的每个元素称为个体。定义2从总体X中,随机地抽取n个个体,这n个个体的指标分别为,通常记为,称为总体X的一个样本,或称子样,n称为样本的容量。nXXX,,,21),,,(21nXXX),,,(21nXXX定义3若总体X的一个样本满足代表性和独立性,则称为总体X的一个简单随机样本,或称为来自总体X的简单随机样本。),,,(21nXXX),,,(21nXXX),,,(21nXXX若总体X的分布函数是,由代表性知的分布函数为,再由独立性,显然可得样本的联合分布函数为)(xF),,1(niXi)(ixF),,,(21nXXX),,(),,(111nnnxXxXPxxF)()(11nnxXPxXP)()(1nxFxF若总体X为连续型随机变量,且其密度函数为,则的联合密度函数为)(xp),,,(21nXXX)()(),,(11nnxpxpxxp定义4设是来自某总体X的一个容量为n的样本,若样本函数中不含任何未知参数,则称T为统计量。),,,(21nXXX),,(1nXXTT例1设总体X服从正态分布N(),其中已知参数,为未知参数,是来自总体X的样本,则,,均是统计量,而,都不是统计量。2,2),,,(21nXXXniiXn11niiXn12)(1},,{max11nniXXniiX1221niiX122)(1(1)、样本均值),,,(21nXXXniiXnX11定义5设样本来自总体X,则称统计量为样本均值。性质1设总体X的数学期望EX=及方差DX=存在,样本来自总体X,则。2),,(1nXXnXDXE2,(2)、样本方差),,,(21nXXX212)(1XXnSniin2nnSS212)(11XXnSnii2SS定义6设样本来自总体X,则称统计量为样本方差,称为样本标准差。称统计量为修正样本方差,称为修正样本标准差。2),,,(21nXXX22221ESnnESn,性质2设总体X的数学期望EX=及方差DX=存在,样本来自总体X,则。(3)、样本的相关系数niYXii,,1),,(),(YXniniiiniiiYYXXYYXXr11221)()())((定义7设是来自二维总体的一个样本,则称统计量为样本的相关系数。),...,,(21nXXXXnikikXn11nikikXXnm1)(1定义8设样本来自总体,统计量称为样本阶矩或样本阶原点矩,其中k是正整数。而统计量称为样本阶中心矩,其中k是正整数。(4)、样本矩定义9我们称统计量的分布为抽样分布。)(~1212niiniiaaNU,),,(1nXX2,niiiXaU1定理1设是来自正态总体N()的一个样本,统计量U是样本的任一确定的线性函数,即则U也是正态随机变量,即niinNXnX12),(~1),,(1nXX2,X推论1设是来自正态总体N()的一个样本,则样本均值也是正态随机变量,即)1,0(~NnX),,(1nXX2,推论2设是来自正态总体N()的一个样本,则)(~22nnXX,,1niiX122=2定义10设是相互独立且服从于N(0,1)的随机变量,则称随机变量服从自由度为n的-分布,记作2(2)、-分布)(~),(~222121nXnX1X2X1X)(~2122nnX2性质3设,且和相互独立,则+。即-分布具有可加性。),,(1nXX2,niiXnX11niinXXnS122)(1)1(~)1(22222nSnnSnnX2nS定理2设是来自正态总体N()的一个样本,且则(1);(2)与相互独立。)(~ntT)1,0(~NX)(~2nYnYXT定义11设,且X与Y相互独立,则称随机变量服从自由度为n的t-分布,记作(3)、t-分布2221);(limxnenxt性质4t-分布的极限分布为标准正态分布N(0,1),即nXX,,12,N1nSXn1nt定理3设是来自正态总体的一个样本,则统计量~。nmFF,~(4)、F-分布nYmX22~,~nYmXFnm,F定义12设,且X与Y独立,则称随机变量服从自由度为的分布,其中m称为第一自由度,n称为第二自由度,记作。mXX,,1211,nYY,,1222,mXX,,1nYY,,1)1,1(~)1()1(21222221nmFmnnSmSFnm21mS22nS定理5设()是来自正态总体N()时一个样本,()是来自正态总体N()的一个样本,且()与()独立,则其中,的定义同定理4。一、点估计一般地,设nXXX,,,21是来自总体X的样本,点估计问题就是要求构造统计量niXXXT,,,21作为参数kii,2,,1的估计,称这一统计量为i的一个估计量,若nxxx,,,21是nXXX,,,21的一组观察值,代入iT得到具体的数值nixxxT,,,21,称它为i的估计值。1.矩估计法用样本矩作为总体矩的估计,即令nimimkmkmXn121)(,,2,1,1,,,,解这一含k个未知参数k,,,21的方程组,记其解为kiXXXnii,,2,1,,,,ˆˆ21,称它们为k,,,21的矩估计。例1设总体2,~NX,2,为未知参数,nXXX,,,21为来自X的简单随机样本,求2,的矩估计。2.最大似然估计法最大似然估计的直观想法是:既然在一次试验中得到了观察值nxxx,,,21,那么我们认为样本落入该观察值nxxx,,,21的邻域内这一事件应具有最大的可能性,所以应选取使这一概率达到最大的参数值作为参数真值的估计。记kiniknxpxLxxxL,,,;;ˆ,,,;,,,2112121,称它为似然函数。对于固定的nxxx,,,21,记),...,,(21n,选取kˆ,,ˆ,ˆˆ21,使得;maxˆ;xLxL,则称ˆ为的一个最大似然估计值。例4设总体2,~NX,2,未知,nXXX,,,21为来自X的样本,求和2的最大似然估计。二、估计的优良性准则11..一一致致性性定定义义11设设nXXX,,,ˆ21是是总总体体X分分布布的的未未知知参参数数的的估估计计量量,,若若ˆ依依概概率率收收敛敛于于,,即即对对任任意意的的0,,,1ˆlimPn则称ˆ是的一致估计。例8若总体X服从正态分布2,N,nXXX,,,21是来自总体X的容量为n的样本,iEX,2iDX,ni,,2,1,则由大数定律知,X依概率收敛于,即,1limXPn也即未知参数的最大似然估计或矩估计Xˆ是的一致估计。2.无偏性定义2如果nXXX,,,ˆ21的均值等于未知参数,即,,,,ˆ21nXXXE对一切可能的成立则称nXXX,,,ˆ21为的无偏估计。例11设),,,(21nXXX是抽自均值为的总体的样本,考虑的如下估计量:2ˆ,ˆ21211XXX),4(4ˆ1213nXXXXnn假设因为iEX,容易验证3,2,1,ˆiEi,所以321ˆ,ˆ,ˆ都是的的无偏估计,但是3ˆ,2ˆ21514XXX都不是的的无偏估计。3.有效性定义3设nXXX,,,ˆ211和nXXX,,,ˆ212均为参数的无偏估计,如果21ˆˆDD,则称1ˆ较2ˆ有效。当nXXX,,,ˆ21是所有无偏估计中方差最小时,称nXXX,,,ˆ21为最小方差无偏估计。例13设),,,(21nXXX是来自总体X的容量为n的样本,证明总体均值(即EX)的估计量X1ˆ比niiiXa12ˆ有效,其中,,,2,1,0niai且11niia。三、参数的区间估计定义4:设nXXX,,,21是来自总体X的样本,为总体分布中的未知参数,nXXX,,,ˆ211和nXXX,,,ˆ212为两个统计量,对给定的)10(,若1ˆˆ21P(4)则称21ˆ,ˆ为的置信度为1的置信区间,1ˆ称为置信下限,2ˆ称为置信上限。一般取较小的值,如0.05,0.01等,称为显著性水平。1.单个正态总体参数的区间估计(1).2已知时,求的置信区间对于给定的显著性水平,我们要找1ˆ和2ˆ,使1)ˆˆ(21P。对上式作等价变换得1)ˆ()()ˆ(01002XnXnXnP,即1)ˆ()ˆ(0102XnUXnP。有2102ˆuXn,2101ˆuXn,即nuX0211ˆ,nuX0212ˆ,这样,我们就得到了的置信度为1的置信区间为)ˆ,ˆ(21nuXnuX021021,。(2).2未知时,求的置信区间由于2未知,我们用2的一致最小方差无偏估计2S来代替,其中212)(11XXnSnii,考虑随机变量SXn)1(~)(1ntSXnSXnTn于是,对于给定的显著性水平,有)1(21nt,满足1)1(21ntTP,即1)1(21ntSXnP从而的置信度为1的置信区间为nSntXnSntX)1(,)1(2121(3).求2的置信区间考虑随机变量222nnS,由抽样分布定理,)1(~2222nnSn,因此,对于给定的显著性水平,存在21,CC,使12221CnSCPn。从而2的置信度为1的置信区间为)1(,)1(22212nCnSnCnSnn。例8-16从某超市的货架上随机地抽得9包5.0千克装的食糖,实测其重量分别为(单位:千克):0.5120.515,0.510,0.510,0.488,0.524,0.518,0.506,,497.0,从长期的实践中知道,该品牌的食糖重量服从正态分布),(2N,(1)已知2201.0,求的%95的置信区间;(2)2未知,求的%95的置信区间;(3)求2的%95的置信区间。2.两个正态总体参数的区间估计设总体),(~211NX,),(~222NY,mXXX,,,21和nYYY,,,21为分别抽自X和Y的相互独立的样本(1).当21和22已知时,求21的置信区间mNX211,~,nNY222,~nmNYX222121,~标准化后得到)1,0(~222121NnmYXU,由121uUP,可得到21的置信度为1的置信区间为nmuYXnmuYX222121222121,。(2).当22221,但2未知时,求21的置信区间由抽样分布定理知道,)2(~)2(222121nmtnmnmmn
本文标题:第五部分概率统计方法
链接地址:https://www.777doc.com/doc-3725383 .html