您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 数理统计第五章知识点.
第五章统计量及其分布第1页第五章统计量及其分布§5.1总体与样本§5.2样本数据的整理与显示§5.3统计量及其分布§5.4三大抽样分布§5.5充分统计量第五章统计量及其分布第2页§5.1总体与样本一、总体与个体总体可以看成是数的集合.总体:也称为母体.个体:注:总体可用随机变量的符号X、Y等或分布的符号F(x)可根据总体的分布类型称呼总体的名称.来表示,研究对象的全体构成的集合,总体中的每一个元素.第五章统计量及其分布第3页按元素的性质分为:2.总体的分类:按元素的个数分为:有限总体无限总体按元素的观测指标分为:一维总体多维总体具体总体抽象总体第五章统计量及其分布第4页例5.1.1考察某厂的产品质量,以0记合格品,以1记不合格品,总体{该厂生产的全部合格品与不合格品}{由0或1组成的一堆数}取值于0或1的随机变量(r.v.X).若以p表示这堆数中1的比例(不合格品率),两点分布表示:X01P1pp该总体为两点分布总体.则该总体可由一个第五章统计量及其分布第5页例5.1.2考察常见的测量问题.一个测量者对一个物理量进行重总体{该物理量的测量值}{来自于(,)的一堆数}取值于(,)的随机变量X.关于该总体的分布:由于Xμε,其中μ为确定的但未知的物理量,ε为测量误差.称之为参数,于是总体分布假定主要决定于关于ε的假定.复测量,第五章统计量及其分布第6页(1).假定随机误差),,0(~2N2未知,于是测量值总体为正态总体,).,(~2NX即(2).假定随机误差),,0(~20N20由测量系统本身的精度确定,).,(~20NX于是(3).假定没有理由认定误差服从正态分布,但可以认为误差的分布是关于0对称的,则该总体为一个分布类型未知但带有某种限制的分布,它通常不能有有限个参数来描述,称之为非参数总体.第五章统计量及其分布第7页二、样本1.抽样:从总体中按一定的规则抽出一些个体的行动.2.样本:从总体X中抽取的个体.,,1nXX样品:样本容量:样本中样品的个数n.4.样本空间:3.样本观测值:样本的取值nXX,,1.,,1nxx).,,(1nXX也记作样本中的个体).1(niXi),,(1nXX样本观测值的取值范围.也称为子样.第五章统计量及其分布第8页5.样本的性质:二重性随机性:抽样开始时,是来自于总体X的n个随机变量.确定性:抽样结束后,得到一组观测值.,,1nxx即样本抽样前是随机变量,抽样后是具体数值,在不至于引起混淆的情况下,以后总用表述样本.nxx,,1第五章统计量及其分布第9页例5.1.3啤酒厂生产的瓶装啤酒规定净含量为640克.由于随机性,事实上不可能使得所有的啤酒净含量均为640克.现从某厂生产的啤酒中随机抽取10瓶测定其净含量,得到如下结果:641,635,640,637,642,638,645,643,639,640.这是一个容量为10的样本的观测值,这样的样本称为完全样本.生产的瓶装啤酒的净含量.对应的总体为该厂第五章统计量及其分布第10页例5.1.4考察某厂生产的某种电子元件的寿命,选了100只进行寿命试验,由于一些原因,不可能每时每刻对试验进行观测,而只能定期进行观测,得到如下数据:寿命范围元件数寿命范围元件数寿命范围元件数(0,24]4(192216]6(384,408]4(24,48]8(216240]3(408,432]4(48,72]6(240,264]3(432,456]1(72,96]5(264,288]5(456,480]2(96,120]3(288,312]5(480,504]2(120,144]4(312,336]3(504,528]3(144,168]5(336,360]5(528,552]1(168,192]4(360,384]155213第五章统计量及其分布第11页这样的样本观测值没有具体的数值,只是一个个范围,称之分组样本.注:在样本量不很大时,分组样本较完全样本在信息量上有损失.在样本量很大()时,100n对样本进行分组整理,可用分组样本代替完全样本.第五章统计量及其分布第12页6.简单随机抽样:(1).代表性(即总体中的每一个个体都有同等机会被抽入样本,这意味着样本中每一样品与总体具有相同的分布,样品都具有代表性.)(2).独立性(即样本中的每一个样品的取值不影响其他样品的取值,这意味着相互独立.)nxx,,1称抽出的样本具有的抽样方法为简单随机抽样.即任一第五章统计量及其分布第13页7.简单随机样本:设为来自总体F(x)的样本,nxx,,1若即同有分布F(x),),(~,,...1xFxxdiin记作简称简单样本或样本,其联合分布函数为.)(),,(11niinxFxxF(2).有相同分布,nxx,,1则称为简单随机样本,nxx,,1(1).相互独立;nxx,,1independentidenticallydistributed第五章统计量及其分布第14页有限总体的有放回抽样所得的样本为简单随机样本;注:无限总体或虽为有限总体但样本容量n相对于总体的个体数本课程只讨论简单随机样本.近似地当作简单随机样本使用.也可以N来讲比较小(如)的无放回抽样所得的样本,1.0Nn第五章统计量及其分布第15页§5.2样本的整理与显示一、样本分布函数1.定义:设为取自总体F(x)的样本,nxx,,1由小到大排列,将样本观测值得到有序样本:称由有序样本)()1()()1(,1)1,,2,1(,,0)(nkknxxnkxxxnkxxxF为样本分布函数,或称经验分布函数..,,)()1(nxx定义的函数第五章统计量及其分布第16页经验分布函数Fn(x)满足分布函数的定义:注:(1).;1)(0xFn(2).Fn(x)是非减函数;(3).;1)(0)(nnFF,(4).Fn(x)右连续,即.)0()(xFxFnn经验分布函数的实质:事件{xix}的频率,对于样本的不同观测值x1,,xn,将得到不同的经验分布函数Fn(x),故Fn(x)是一个随机变量序列.Fn(x)就是在抽取样本x1,,xn的试验中,第五章统计量及其分布第17页2.经验分布函数与总体理论分布函数的关系(1).当样本量n相当大时,Fn(x)依概率收敛于F(x),即n时,对于任意的正数ε,.1}|)()({|limxFxFPnn有因为Fn(x)是随机变量,引进示性函数,01)(xxxxxIiii,,则经验分布函数可表示为,)(1)(1niinxInxF)),(,1()(,,)(),(21xFb~xIxIxIi.i.dn由于根据伯努利大数定律知,当n时,对于任意的正数ε,.1}|)()({|limxFxFPnn有验证:第五章统计量及其分布第18页(2).格里纹科定理:当时,nFn(x)以概率1关于x均匀地收敛于F(x),.1}0|)()(|suplim{xFxFPnxn即注:由样本推断总体的行为通常称为统计推断.定理说明:经验分布函数是总体分布函数的一个良好的近似,这是用样本推断总体的依据.当样本容量n相当大时,第五章统计量及其分布第19页E[Fn(x)]F(x),Var[Fn(x)]F(x)[1F(x)]/n.(3).经验分布函数的数字特征:证明:从而令,01)(xxxxxIyiiii,,)),(,1(,,1xFb~yyi.i.dn则由于.1)(1niinynxF),()(1)(1xFxFyE),()(1)(21xFxFyE从而)()(xFxF2)].(1)[(xFxF于是),()()]([1xFyExFEn)].(1)[(1)(1)]([1xFxFnyVarnxFarVn)(1yVar第五章统计量及其分布第20页这是一个容量为5的样本,经排序可得有序样本:x(1)344,x(2)347,x(3)351,x(4)351,x(5)355,其经验分布函数为.355,1355351,8.0351347,4.0347344,2.0344,0)(xxxxxxFn例5.2.1某食品厂生产听装饮料,现从生产线上随机抽取5听饮料,称得其净重(单位:克)351347355344351,第五章统计量及其分布第21页二、频数频率分布表1.对样本进行分组:即确定组数k,一般遵循如下的原则:对容量为300左右及以上的样本,通常将其分为12组对容量较小的样本,通常将其分为5组或6组;对容量为100左右的样本,通常将其分为7组或10组;对容量为200左右的样本,通常将其分为9组或13组;2.确定每组组距:各组区间的长度称为组距,也可以不相等.它们可以相等,实用中常要求各组距相等,.)1()(kxxdn相等组距为或20组.第五章统计量及其分布第22页3.确定每组组限:,)1(0xa,)(nkxa,0a取用分点,01daa,202daakdaak0,形成如下互不相交的分组区间:],,(10aa,],,(21aa.],(1kkaa通常用每组的组中值2组下限组上限组中值代表该组的变量取值.并列出其频数频率分布表.4.计算样本数据落入到第i个小区间的频数],(1iiaanxx,,1ni及频率,,,1,kinnfii第五章统计量及其分布第23页例5.2.2为研究某厂工人生产某种产品的能力,160196164148170175178166181162161168166162172156170157162154我们随机调查了20位工人某天生产的该种产品的数量,数据如下第五章统计量及其分布第24页对这20个数据(样本)进行整理,其频数频率分布表如下:组序分组区间组中值频数频率累积频率%1(147,157]15240.20202(157,167]16280.40603(167,177]17250.25854(177,187]18220.10955(187,197]19210.05100合计20由表可知:产量高的工人有3个,占15%.产量少于167个的工人有12个,占60%;40%的工人产量在157到167之间;第五章统计量及其分布第25页三、样本数据的图形显示纵轴刻度的选择,1.直方图:直方图是频数分布的图形表示,它的横坐标表示所关心变量的取值区间,按纵坐标的表示方法分为:频数直方图;频率直方图;频率/组距直方图;其中频率/组距直方图最准确,它使得诸长条矩形面积和为1.这三种直方图的差别仅在于直方图本身并无变化.第五章统计量及其分布第26页2.茎叶图:例5.2.3某公司对应聘人员进行面试,64677072747676798081828283858688919192939393959696979799100100102104106106107108108112112114116118119119122123125126128133茎:十位及以上部分|叶:个位部分.下面是50位应试人员的测试成绩(已经过排序)及其茎叶图.测试成绩总分为150分.第五章统计量及其分布第27页若要比较两组样本时,注:茎叶图的外观很像横放的图中增加了具体对数据具体取值一目了然,保留了数据中的全部信息.可用背靠背的茎叶图进行对比.直方图,的数值,第五章统计量及其分布第28页例5.2.4对某厂两个车间某天各40名员工生产的产品数量进行甲车间乙车间505256616162566667676868646565656767727274757575676871727474757676767678767677777882787980818183838586868788838384848486909192939397868787889292100100103105939598107
本文标题:数理统计第五章知识点.
链接地址:https://www.777doc.com/doc-2335683 .html