您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 贾俊平统计学第六章-抽样分布
第六章抽样分布第六章抽样分布6.1统计量6.2三种不同性质的分布6.3一个总体参数推断时样本统计量分布6.4两个总体参数推断时样本统计量分布6.5抽样平均误差学习目标1.区分总体分布、样本分布、抽样分布2.理解抽样分布与总体分布的关系3.掌握单总体参数推断时样本统计量的分布4.掌握双总体参数推断时样本统计量的分布5.掌握抽样平均误差的测度及其影响因素6.1统计量1.统计量的概念2.常用的统计量统计量的概念定义:设X1,X2,……,Xn是从总体X中抽取的样本容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,……,Xn),不依赖任何未知参数,则称行数T(X1,X2,……,Xn)是一个统计量。统计量是样本的函数统计量不依赖任何未知总体参数根据具体样本的观测值x1,x2,……,xn带入统计量函数,计算出来的值是一个具体的统计量的值。常用统计量1.样本均值,反映总体X数学期望的信息。2.样本方差、标准差,反映总体X方差、标准差的信息。3.样本变异系数,反映总体变异系数C的信息。其中,反映随即变量在以它的均值为单位时,取值的离散程度22111niiSXXn11niiXXnXEXDCXSV常用统计量4.样本k阶矩,反映总体k阶矩的信息。5.样本k阶中心矩,反映总体k阶中心矩的信息。6.样本偏度,反映总体偏度的信息。7.样本峰度,反映总体的峰度信息。nikikXXnv1111nkkiimXn2312133niiniiXXXXn3212144niiniiXXXXn6.2三种不同性质的分布一.总体分布二.样本分布三.抽样分布1.总体中各元素的观察值所形成的分布2.分布通常是未知的3.可以假定它服从某种分布总体分布(populationdistribution)总体1.一个样本中各观察值的分布2.也称经验分布3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)样本1.样本统计量的概率分布2.是一种理论概率分布3.随机变量是样本统计量样本均值,样本比例,样本方差等4.结果来自容量相同的所有可能样本5.提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据抽样分布(samplingdistribution)抽样分布(samplingdistribution)总体计算样本统计量例如:样本均值、比例、方差样本6.3样本统计量的抽样分布(一个总体参数推断时)一.样本均值的抽样分布二.样本比例的抽样分布三.抽样方差的抽样分布样本均值的抽样分布1.容量相同的所有可能样本的样本均值的概率分布2.一种理论概率分布3.进行推断总体总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)(重复抽样)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为x1=1、x2=2、x3=3、x4=4。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差5.21NxNii25.1)(122NxNii样本均值的抽样分布(例题分析)(重复抽样)现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为所有可能的n=2的样本(共16个)第一个观察值第二个观察值123411,11,21,31,422,12,22,32,433,13,23,33,444,14,24,34,4样本均值的抽样分布(例题分析)(重复抽样)16个样本的均值(x)第一个观察值第二个观察值123411.01.52.02.521.52.02.53.032.02.53.03.542.53.03.54.0计算出各样本的均值如下表。给出样本均值的抽样分布均值X的取值1.01.52.02.53.03.54.0均值X的个数1234321取值的概率P(X)1/162/163/164/163/162/161/16X样本均值的抽样分布1.000.10.20.3P(X)1.53.04.03.52.02.5样本均值的分布与总体分布的比较(例题分析)(重复抽样)=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(X)1.00.1.2.31.53.04.03.52.02.5X5.2X21.250.6252X样本均值的抽样分布(例题分析)(不重复抽样)如果从总体中抽取n=2的简单随机样本,在不重复抽样条件下,共有4×3=12个样本。所有样本的结果为所有可能的n=2的样本(共12个)第一个观察值第二个观察值123411,21,31,422,12,32,433,13,23,444,14,24,3样本均值的抽样分布(例题分析)(不重复抽样)16个样本的均值(x)第一个观察值第二个观察值123411.52.02.521.52.53.032.02.53.542.53.03.5计算出各样本的均值如下表。给出样本均值的抽样分布均值X的取值1.52.02.53.03.5均值X的个数22422取值的概率P(X)2/122/124/122/122/12X样本均值的抽样分布1.000.10.20.3P(X)1.53.04.03.52.02.5样本均值的抽样分布(例题分析)(不重复抽样)=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(X)1.00.1.2.31.53.04.03.52.02.5X5.2X21.2542524112X样本均值的抽样分布与中心极限定理=50=10X总体分布n=4抽样分布Xn=165x50x5.2x当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)中心极限定理(centrallimittheorem)当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布xn中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体xX中心极限定理(centrallimittheorem)的分布趋于正态分布的过程X抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布抽样分布样本均值的抽样分布与中心极限定理(例题分析)【例】设从一个均值为μ=10,标准差σ=0.6的总体中随机抽取样本容量为n=36的样本,假定该总体不是很有偏,要求:1.计算样本均值小于9.9的近似概率。2.计算样本均值超过9.9的近似概率。3.计算样本均值在总体均值附件0.1范围内的近似概率。解:根据中心极限定理,样本容量>30,可视为样本均值近似服从正态分布。样本均值的抽样分布与中心极限定理(例题分析)因此知,样本均值服从:(1)220.6,10,10,0.0136XNnNN~109.9100.10.1111110.1587XPXPPZPZ<9.9=<<<(2)9.910.15870.8413PXPX>9.9=1-样本均值的抽样分布与中心极限定理(例题分析)(3)9.9101010.1100.10.10.110.1109.9100.10.1112112110.6826XPXPPZPZPZPZPZ9.9<<10.1=<<<<<<-<1.样本均值的数学期望2.样本均值的方差重复抽样不重复抽样3.样本均值的抽样分布服从(大样本,或者总体正态条件下)正态分布样本均值的抽样分布(数学期望与方差))(XEnX22122NnNnXnNX2,~样本均值的抽样分布(数学期望与方差)比较及结论:1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/n为样本数目MnMXnixiX222122625.016)5.20.4()5.20.1()(5.2160.45.10.11MXniiX均值的抽样标准误1.所有可能的样本均值的标准差,测度所有样本均值的离散程度,又称为抽样平均误差2.小于总体标准差3.计算公式为nX1XNnNn重复抽样不重复抽样样本比例的抽样分布1.总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比2.总体比例可表示为3.样本比例可表示为比例(proportion)NNNN101或011nnppnn或1.容量相同的所有可能样本的样本比例的概率分布2.当样本容量很大时,样本比例的抽样分布可用正态分布近似3.一种理论概率分布4.推断总体总体比例的理论基础样本比例的抽样分布样本比例的抽样分布(例题分析)(重复抽样)【例】设某机床5台中有2台优、3台良,即总体单位数N=5。5个个体分别为优品A1、A2,良品B1、B2、B3。若抽到优品,记x=1;若抽到良品,记x=0。当n=2时,样本比例抽样分布如下表所有可能的n=2的样本(共25个)样本比率样本频率P(p)1(A1,A1)(A1,A2)(A2,A1)(A2,A2)4/250.5(A1,B1)(A1,B2)(A1,B3)(A2,B1)(A2,B2)(A2,B3)(B1,A1)(B1,A2)(B2,A1)(B2,A2)(B3,A1)(B3,A2)12/250(B1,B1)(B1,B2)(B1,B3)(B2,B1)(B2,B2)(B2,B3)(B3,B1)(B3,B2)(B3,B3)9/25样本比例的抽样分布(例题分析)(重复抽样)0.4210.240.40pEp重复抽样样本比例抽样分布04/25P(p)8/2512/2500.51.0p总体分布:抽样分布:220.12pEpEpPp样本比例的抽样分布(例题分析)(不重复抽样)【例】仍用上例,采用不重复随即抽样时,机床优质品比率p的抽样分布如下表所有可能的n=2的样本(共20个)样本比率样本频率P(p)1(A1,A2)(A2,A1)2/200.5(A1,B1)(A1,B2)(A1,B3)(A2,B1)(A2,B2)(A2,B3)(B1,A1)(B1,A2)(B2,A1)(B2,A2)(B3,A1)(B3,A2)12/200(B1,B2)(B1,B3)(B2,B1)(B2,B3)(B3,B1)(B3,B2)6/20样本比例的抽样分布(例题分析)(不重复抽样)p不重复抽样样本比例抽样分布00.10.20.3P(p)0.40.50.600.51.00.4210.240.40pEp总体分布:抽样分布:220.24520.09251pEpEpPp样本比例的抽样分布(例题分析)【例】设,试给出CX的分布。因此2,XN~ECXCEXC222DCXCDXC22,CXNCC~样本比例的抽样分布(例题分析)【例】假定某统计人员在其填写的报表中有2%至少会有一处错误,如果我们检查了一个由600份报表组成的随机样本,其中至少有一处错误的报表所占的比例在0.025~0.070之间的概率有多大?解:根据中心极限定理,样本容量>30,可视为样本比例近似服从正态分布。总体比例π=0.02。20057.0,02.0)1(,ˆNnNp~ˆ0.0250.07ˆ0.0250.071110.8778.770.1902pPpPnnn
本文标题:贾俊平统计学第六章-抽样分布
链接地址:https://www.777doc.com/doc-7184302 .html