您好,欢迎访问三七文档
第5章总体分布、样本分布与参数估计5.1总体分布与样本分布5.2统计量与统计量的分布5.3点估计5.4判断点估计的优劣标准5.5区间估计5.1总体分布与样本分布5.1.1总体与总体分布1.反映总体特征的随机变量如果某总体有两个以上的指标,可以一个一个指标地进行研究,也可以作为指标向量进行研究。研究多指标时,就是多维随机变量,或称随机向量。2.总体(母体)3.总体分布(母体分布)取直径为随机变量X,通常服从正态分布。这个分布,就称为“生产线上生产出来的零件的直径”这个总体的分布。5.1.2随机样本与样本观察值(样本数据)1.随机样本每个个体被抽取到的机会(概率)均等。2.样本观察值5.1.3样本分布函数(抽样分布函数)设,随机变量x的样本观察值,可按大小排序(即,为顺序级以上的数据),排序后为x1≤x2,…,≤xn样本(累积)分布函数Fn(x),是对总体(反映总体特征的随机变量X)的(累积)概率分布函数Fn(x)的近似,n越大,Fn(x)对F(x)的近似越好,样本累积频率分布图越接近于总体的累积概率分布图。当n越来越大时,图中的折线样本分布函数Fn(x)所示的齿状,就会越来越细,越来越接近于总体概率分布曲线F(x)。总体(累积)概率分布曲线F(x)不一定是连续的。例如,有限(累积)概率分布曲线F(x)是阶跃式的。随着样本数n的增大,样本分布会越来越接近于总体分布。5.1.4格利文科定理用样本去推断总体的依据。定理:设总体X的分布函数为F(x),样本分布函数Fn(x),则对于任何实数x,有1}0|)()(|suplim{xFxFPnxn离散情况连续情况dxxxf)(2dxxfxXD)()()(22问:在样本方差中,什么与pk对应?离散情况连续情况5.1.5随机样本的均值函数5.1.6随机样本的方差函数5.2统计量与统计量的分布5.2.1统计量的定义统计量:不含未知参数的、随机样本X1,X2,…,Xn的函数f(X1,X2,…,Xn)。f(X1,X2,…,Xn)是随机变量。统计量的值:不含未知参数的、样本观察值x1,x2,…,xn的函数f(x1,x2,…,xn)。f(x1,x2,…,xn)不是随机变量。5.2.2基于N(0,1)的几个重要统计量的分布一、χ2(n)分布1.定义记为)(~22nX2(n)分布示意图2.χ2(n)分布的性质设~(n),则E()=n,D()=2n。设X~(n1),Y~(n2),且X与Y相互独立,则X+Y~(n1+n2)。设为X的样本,则2222222nXXXNX,,,),,(~212niinX1222)(~)(1)1,0(~NXi3.(n)分布的上分位点:设~(n),对于给定的正数,称满足条件的点为(n)分布的上分位点。)10()(222d)()}({nxxfnP)(2n22220f(x)x)(2n例:设总体X~N(0,1),X1,X2,…,X6为总体X的样本,Y=(X1+X2+X3)2+(X4+X5+X6)2,试确定常数c,使cY服从χ2分布。解:因为X1,X2,…,X6为总体X的独立样本,且服从正态分布,由正态分布的可加性可知,X1+X2+X3~N(0,3),X4+X5+X6~N(0,3)故因此,c=1/3)1,0(~)(31),(31654321NXXXXXX)2(~31)](31[)](31[226542321YXXXXXX二、t分布1.定义2.t分布的性质t(n)分布的概率密度关于y轴对称,且xxfxn,e21)(lim22f(x)x0n=10n=4n=1n值越大,峰值越高。3.t分布的上分位点设t~t(n),对于给定正数,称满足条件的点为t(n)分布的上分位点,且有)10()}({nttP)(nt)()(1ntnt)(1nt)(ntf(x)0x例:设随机变量X与Y相互独立,X~N(0,16),Y~N(0,9),X1,X2,…,X9与Y1,Y2,…,Y16分别是取自X与Y的简单随机样本,求统计量所服从的分布。2162221921YYYXXXZ解:由题意可知,X1+X2+…+X9~N(0,9×16),从而)1,0(~)(431921NXXX16,,2,1),1,0(~31iNYi)16(~)31(22161iiY)16(~16)31()(43116129212162221921tYXXXYYYXXXii则三、F分布1.定义2.F分布的性质若F~F(m,n),则),(~1mnFFxm=10,n=5m=10,n=25f(x)3.F分布的上分位点设F~F(m,n),对于给定正数,称满足条件的点为F(m,n)分布的上分位点,且有.)10()},({nmFFP),(1),(1mnFnmF),(nmFxf(x)),(nmF5.2.3由一般正态分布的随机样本构成的若干重要统计量的分布例1从总体N(52,6.32)中随机抽取一容量为36的样本,求样本均值落在50.8到53.8之间的概率。X解:。由,即,得所求概率为)1,0(~/NnX3.6,52,36n)1,0(~63.652NXu.8293.018729.09564.01)14.1()71.1()14.1()71.1(}71.114.1{63.6528.5363.65263.6528.50}8.538.50{uPXPXP例2设X1,X2,…,X10为总体N(0,0.09)的一个样本,求。101244.1iiXP解:由,则有)1,0(~3.0),1,0(~3.0NXNXi101222)10(~3.01iiX21012210123.044.13.0144.1iiiiXPXP10.0}16)10({2P(查表))(2n应给予5.2.5节以极大关注,一定要应当记5.2.4任意分布的随机样本均值函数的均值与方差1.一般情形5.2.5大样本均值函数的分布:中心极限定理中心极限定理的作用不论该总体服从何种分布,只要当样本容量足够大(),样本均值的分布都大致服从正态分布。30n),(~2nNX总体参数与样本统计量对照表例:网箱养鱼户在某年出售某类鱼的平均价格是每斤4.33元。假定售鱼价格的标准差是每斤0.75元。随机选择150户养殖该类鱼的养殖户,那么,这150养鱼户的售价均值构成了一个统计量,这个统计量的分布是一个抽样分布。问:a.这个抽样分布的平均值是多少?b.这个抽样分布的标准差是多少?解:设随机变量X是某类鱼的售价,其均值记为μ,标准差记为σ。由题意知,μ=4.33,σ=0.75,n=150。设为150户某类鱼的售价均值,的分布函数的均值为,标准差为。则,XXX33.4X06.015075.0nXX例:某高校在研究生入学体检后对所有结果进行统计分析,得出其中某一项指标的均值是7,标准差2.2。从这个总体中随机选取一个容量为31的样本。(1)计算样本均值大于7.5的概率,(2)计算样本均值小于7.2的概率,(3)计算样本均值在7.2和7.5之间的概率。解:n=31,由中心极限定理,样本均值的分布近似均值,标准差的正态分布,即X7X39.0312.2nX)39.0,7(~2NX(1)(2)(3)1.0)28.1(1)28.1(1)28.1()28.139.07()39.075.739.07()5.7(ZPZPXPXPXP69.0)51.0()51.0()51.039.07()39.072.739.07()2.7(ZPXPXPXP21.0)28.151.0()28.139.0751.0()39.075.739.0739.072.7()5.72.7(ZPXPXPXP例:已知某高校女生比例为46%,现对全体学生做两次随机抽样,n=200和n=1000,求这两次抽样中女生的比例在50%以上的概率。解:设p为女生的比例,当n=200时,).,.()).(.,.())(,200003520460N2004601460460Nnp1pN(p~p0.128136111361ZP11361ZP035204605003520460pP50pP).().().().....().(当n=1000时,).,.()).(.,.())(,200001580460N10004601460460Nnp1pN(p~p0.006538215382ZP15382ZP015804605001580460pP50pP).().().().....().(5.3点估计5.3.1点估计的概念5.3.2矩估计法对样本而言,存在对应的样本矩:样本均值是样本一阶原点矩。样本方差是样本二阶中心矩。例:从某厂生产的一批铆钉中随机抽取10个,测得其头部直径分别为:13.30,13.38,13.40,13.43,13.32,13.48,13.34,13.47,13.44,13.50试求铆钉头部直径总体的均值μ与标准差σ的估计。解:用矩估计法可得:406.13)50.1338.1330.13(101X0048771.0])406.1350.13()406.1330.13[(11012222S0698.00048771.02S例:设某批产品的寿命在[a,b]上服从均匀分布,但是参数a,b未知,随机地抽取五个产品,测得寿命分别是1265小时,1257小时,1276小时,1269小时和1266小时,试求a,b的矩估计值。解:均匀分布总体的均值μ=(a+b)/2,方差σ2=(b-a)2/12;样本的一阶原点矩(样本均值)样本的方差根据矩估计法,有:联立求得516.126651iiXX3.47)(1512512XXSii51512/)(iiXba2512)(151)(121XXabii95.1255,26.1277ba5.3.3极大似然估计法先看一个简单的例子。假定在一个箱子里放着黑、白两种球共4只,且知道这两种球的数目之比为1:3,但不知道究竟哪一种颜色的球多。设黑球所占的比例为P,由上述假定推知P仅可能取1/4和3/4这两个值,现在采用有放回抽样的方法,从箱子中随机地抽取三个球,观察到球的颜色为黑、白、黑,你会对箱子中的黑球数作出什么推断呢?即你认为P的值是1/4,还是3/4?直观上觉得P=3/4(即箱子中黑球数为3)更可信,因为当P=1/4时抽到这样一个具体样本的概率为:1/43/41/4=3/64当P=3/4时,抽到这样一个具体样本的概率为:3/41/43/4=9/64由于9/643/64,因此在观察到上述样本中的三个球的颜色之后,觉得P=3/4更可信,即你倾向于认为箱子中放有三个黑球,这里体现了极大似然法的基本思想。极大似然原理:一个随机试验有若干种可能的结果A,B,C,….,若在一次试验中,结果A出现,则一般认为试验条件对A出现有利,也即A出现的概率很大。因此极大似然估计就是要选取这样的数值作为参数的估计值,使所选取的样本在被选的总体中出现的可能性为最大,或者换句话说叫:已经出现的情况
本文标题:管理统计学第5章
链接地址:https://www.777doc.com/doc-3683007 .html