您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第6章统计量及其抽样分布
6-1统计学(第四版)第6章统计量抽样分布作者:中国人民大学统计学院贾俊平6-2统计学(第四版)统计应用城市居民收入如何估计?在研究某城市居民家庭收入时,随机抽取1000户进行调查。在城市5个区各抽取250户选定城市一个区,只从这一个区抽取1000户6-3统计学(第四版)第6章统计量及抽样分布§6.1统计量§6.2关于分布的概念§6.3由正态分布导出的几个重要分布§6.4样本均值的分布与中心极限定理§6.5样本比例的抽样分布§6.6两个样本平均值之差的分布6-4统计学(第四版)学习目标1.判断识别统计量2.区分正态分布导出的几个重要分布3.掌握样本均值的分布和中心极限定理6-5统计学(第四版)§6.1统计量1.统计量的概念设X1,X2,X3,...,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,X3,...,Xn),不依赖于任何未知参数,则称函数T(X1,X2,X3,...,Xn)是一个统计量。样本均值和样本方差都是常用的统计量6-6统计学(第四版)§6.1统计量2.次序统计量3.充分统计量6-7统计学(第四版)§6.2关于分布的几个概念抽样分布精确,样本容量很小渐近分布样本容量无限增大时随机模拟获得的近似分布复杂问题6-8统计学(第四版)抽样分布(samplingdistribution)总体计算样本统计量例如:样本均值、比例、方差样本6-9统计学(第四版)6.3由正态分布导出的几个重要分布6.3.12分布6.3.2t分布6.3.3F分布第6章统计量及抽样分布6-10统计学(第四版)1.由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)分别于1875年和1900年推导出来2.设,则3.令,则y服从自由度为1的2分布,即4.对于n个正态随机变量y1,y2,yn,则随机变量称为具有n个自由度的2分布,记为6.3.12-分布(2-distribution)),(~2NX)1,0(~NXz2zY2~(1)Yniiy1222~()n6-11统计学(第四版)2-分布(性质和特点)1.期望为:E(2)=n,方差为:D(2)=2n(n为自由度)2.可加性:若U和V为两个独立的2分布随机变量,U~2(n1),V~2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布3.当时,2分布的极限分布是正态分布n6-12统计学(第四版)不同自由度的2-分布2n=1n=4n=10n=206-13统计学(第四版)6.3.2t-分布(t-distribution)1.提出者是WilliamGosset,也被称为学生分布(student’st)2.t分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布xt分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z6-14统计学(第四版)1.为纪念统计学家费希尔(R.A.Fisher)以其姓氏的第一个字母来命名2.设若U为服从自由度为n1的2分布,即U~2(n1),V为服从自由度为n2的2分布,即V~2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为6.3.3F-分布(Fdistribution)21nVnUF),(~21nnFF6-15统计学(第四版)不同自由度的F分布F(1,10)(5,10)(10,10)6-16统计学(第四版)6.4样本均值的分布与中心极限定理6统计量及其抽样分布6-17统计学(第四版)1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础样本均值的分布6-18统计学(第四版)样本均值的分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为x1=1,x2=2,x3=3,x4=4。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差5.21NxNii25.1)(122NxNii6-19统计学(第四版)样本均值的分布(例题分析)现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)6-20统计学(第四版)样本均值的分布(例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P(x)1.53.04.03.52.02.56-21统计学(第四版)样本均值的分布与总体分布的比较(例题分析)=2.5σ2=1.25总体分布样本均值分布5.2x625.02x00.050.10.150.20.250.31234x的取值P(x)6-22统计学(第四版)样本均值的分布与中心极限定理=50=10X总体分布n=4抽样分布xn=165x50x5.2x当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x的期望值为μ,方差为σ2/n。即x~N(μ,σ2/n)6-23统计学(第四版)中心极限定理(centrallimittheorem)当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布nx从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体xx6-24统计学(第四版)中心极限定理(centrallimittheorem)x的分布趋于正态分布的过程6-25统计学(第四版)抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本样本均值正态分布样本均值正态分布样本均值非正态分布6-26统计学(第四版)1.样本均值的分布2.样本均值的期望值和方差样本均值的分布(数学期望与方差))(xEnx22nNx2~,)10(~,Nnx6-27统计学(第四版)1.总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比2.总体比例可表示为3.样本比例可表示为6.5样本比例的分布(proportion)NNNN101或nnpnnp101或6-28统计学(第四版)1.在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布2.一种理论概率分布3.当样本容量很大时,样本比例的抽样分布可用正态分布近似,即样本比例的分布nNp)1(,~6-29统计学(第四版)1.两个总体都为正态分布,即,2.两个样本均值之差的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差方差为各自的方差之和6.6两个样本均值之差的抽样分布),(~2111NX),(~2222NX21XX2121)(XXE222121221nnXX6-30统计学(第四版)两个样本均值之差的抽样分布11总体122总体2抽取简单随机样样本容量n1计算X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X212抽样分布6-31统计学(第四版)1.从一个均值为10,标准差为0.6的总体中随机选取容量为n=36的样本,假定该总体并不是很偏,则样本均值小于0.9的近似概率为()2.假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布为()6-32统计学(第四版)结束
本文标题:第6章统计量及其抽样分布
链接地址:https://www.777doc.com/doc-419562 .html