您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第五章抽样与抽样分布
end1南昌航空大学end2第一节统计量第二节大数定律与中心极限定理第三节由正态分布导出的几个重要分布第四节常用的抽样方法第五节抽样分布第五章抽样与抽样分布end3第一节统计量统计量(statistic):描述样本特征的概括性数字度量,根据样本数据计算的一个随机变量,是对总体分布特征推断的工具。设X1,X2,…Xn为总体X的样本,如果样本的函数g(X1,X2,…Xn)是一个随机变量,并且不包含任何未知参数,则称g(X1,X2,…Xn)为统计量。end4几个常用的统计量:1.样本均值:niiXnX112.样本方差:212)(11XXnSnii3.样本标准差:21)(11XXnSniiend5第二节大数定律与中心极限定理一、大数定律大数定律(lawsoflargenumbers)也称大数法则,它是阐述大量同类随机现象的平均结果稳定性的规律。end6辛钦大数定理设随机变量X1,X2,…Xn相互独立,服从同一分布,且具有数学期望EXi=(i=1,2,…n)则对任意0,有定律表明:只要随机变量独立同分布,即使不存在有限方差,其数学期望仍可由n个随机变量的算术平均值作为其近似值。11lim1niinXnPend7二、中心极限定理在统计学中,论证随机变量和的极限分布是正态分布的一系列定理统称为中心极限定理(centrallimittheorem)。end8独立同分布中心极限定理设X1,X2,…Xn是独立同分布的随机变量序列,且存在有限的数学期望EXi=和方差DXi=2(i=1,2,…n),那么当n时,中心极限定理为均值的抽样推断奠定了理论基础。不论总体服从何种分布,只要期望和方差存在,对这一总体进行重复抽样,当样本量充分大,样本均值就趋于正态分布。),(~21nnNXnii),(~2nNX或end9棣莫佛—拉普拉斯中心极限定理定理表明,当n很大,np和n(1-p)(n是试验的次数,p是试验中事件A发生的概率)也都不太小时,二项分布可以用正态分布去近似。end10第三节由正态分布导出的几个重要分布由样本统计量对未知总体分布进行推断,必须知道统计量所服从的分布。本节介绍几个重要的常用统计量分布:2分布,t分布,F分布。end11一、分位数设X为随机变量,对给定的概率(10),若实数F满足不等式则称F为随机变量X分布概率为的上侧分位数。}{FXP若实数T/2满足不等式}|{|2TXP则称T/2为随机变量X分布概率为的双侧分位数。end12标准正态分布的上侧分位数Z0Zend13标准正态分布的双侧分位数/2/2Z0-Z/2Z/2end14设X1,X2,……Xn是取自标准正态总体的样本,则随机变量服从具有n个自由度的2分布,记为2-分布(2-distribution)niiX122)(~2nend15不同自由度的2-分布2n=1n=4n=10end161.变量值始终为正2.通常为不对称的右偏分布,随着自由度的增大逐渐趋于对称3.期望E(2)=n,方差D(2)=2n(n为自由度)4.可加性:若U和V为两个独立的2分布随机变量,U~2(n1),V~2(n2),则U+V服从自由度为n1+n2的2分布2-分布性质和特点end17t-分布(t-distribution)设X~N(0,1),Y~2(n),且X与Y相互独立,则称nYXt/服从自由度为n的t分布,记为t~t(n)end18t分布与标准正态分布的比较t分布标准正态分布tt(df=20)t(df=10)z0end19t分布的性质:(1)与正态分布一样,是对称的,但比正态分布要平一些。(2)自由度充分大时,t分布近似于正态分布。自由度趋向无穷大时,t分布就是标准正态分布。(3)t分布的均值为0,其方差为n/(n-2)。end20•设X~2(m),Y~2(n),且X与Y相互独立,则称••服从自由度m和n的F分布,记为F-分布(Fdistribution)nYmXF),(~nmFFend21不同自由度的F分布F(1,10)(5,10)(10,10)右偏分布end22第四节常用的抽样方法通常有以下几种抽样方法:简单随机抽样分层抽样系统抽样整群抽样多阶段抽样end23一、简单随机抽样对总体未作任何处理,按随机原则直接从总体中抽出若干单位构成样本.抽取样本的具体方法:抽签法:将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。随机数表法:将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。仅适用于规模不大、内部各单位标志值差异较小的总体直接抽选法end24先将总体按某一标志分层,然后从各层中按随机原则抽取样本单位组成样本。二、分层抽样实质上是分组法与随机原则的结合。例如,在居民生活水平调查中,先按职业分类,然后每种职业分别随机抽取部分居民进行调查。end25样本在各层间的分配方法:等比例分配法:按各层单位的比例分配样本单位。类型抽样的优点:能提高样本的代表性;组织起来较为方便;end26先将总体各单位按某一标志排队,然后按固定的顺序和间隔抽取样本单位。又称机械抽样或等距抽样。三、系统抽样系统抽样是不重复抽样,适合于对单位数不多且能进行排序的总体抽样。按无关标志排队按有关标志排队排序和所研究标志数值大小无关。如调查居民生活水平时,按姓氏笔划排队。排序和所研究标志数值大小有密切关系。如居民收入调查,按银行存款多少排序。end27根据样本抽选的方法不同,可分为:随机起点系统抽样半距起点系统抽样对称起点系统抽样······(总体单位按某一标志排序)······(总体单位按某一标志排序)······(总体单位按某一标志排序)end28系统抽样的好处:1.可以使抽样过程大大简化,减轻抽样的工作量;2.如果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。按有关标志排队系统抽样,实际上是一种特殊的分层抽样。end29将总体全部单位分为若干“群”,然后以群作为抽样单位,从总体中抽取若干群作为样本,并对中选群的所有单位进行全面调查。例:总体群数R=16样本群数r=4hipdnnnnn样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差四、整群抽样ABCDEFGHIJKLMNOPDPIHend30五、多阶段抽样某公司要进行全国性的产品售后服务满意度调查时,通常是先抽几个省,然后从抽中的省中抽取若干个城市,从抽中的城市中,再抽取若干个县、村,最后再抽到户,这种抽样方式就是多阶段抽样。end31第五节抽样分布一、抽样分布概念样本统计量取值的概率分布,叫抽样分布(samplingdistribution)。是推断统计中用样本推断总体时的重要理论依据。end321.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的概率分布2.推断总体均值的理论基础二、样本均值的分布end33=50=10X总体分布n=4抽样分布xn=165x50x5.2x总体服从正态分布N(μ,σ2),该总体的任何容量的样本均值x也服从正态分布,x的期望值为μ,方差为σ2/n。即x~N(μ,σ2/n)end34从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n(30)充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布样本均值的抽样分布趋于正态分布nx任意分布的总体xxend35样本均值抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本样本均值正态分布样本均值正态分布样本均值非正态分布end361.总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比2.总体比例可表示为3.样本比例可表示为三、样本比例的分布(proportion)NNNN101或nnpnnp101或end371.在重复选取容量为n的样本时,由样本比例的所有可能取值形成的概率分布2.当样本容量很大时(np≥5和n(1-p)≥5),样本比例的抽样分布可用正态分布近似,即3.样本比例的分布nNp)1(,~end38四、样本方差的分布1.在重复选取容量为n的样本时,由样本方差的所有可能取值形成的概率分布2.对于来自正态总体的简单随机样本,则比值的抽样分布服从自由度为(n-1)的2分布,即)1(~)1(222nsn22)1(sn
本文标题:第五章抽样与抽样分布
链接地址:https://www.777doc.com/doc-419813 .html