您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计量与抽样分布-textandfilefileurl
第六章统计量及抽样分布概率论和数理统计都是研究随机现象规律性的数学分支。(1)概率论特点:先提出随机现象的数学模型,然后研究其特性和规律(2)数理统计:(3)I)以概率论为理论前提,从实际观测或试验出发;II)研究如何有效的收集、整理和分析受到随机因素影响的数据,并为之建立适当的数学模型;III)对其进行检验,在此基础上对所研究的问题作出推断和预测,为采取行动和决策提供依据和建议。§1总体、样本与统计量一、总体与样本在实际问题中,我们往往只能通过观察和试验来获取研究对象的信息,但是,如果要把全体研究对象逐个一一检查,常常是不必要或不可能的.如:(1)对自动生产线上高速生产的零件逐个检查,要耗费很多的人力、物力、财力及时间,且非必要;(2)为考察某些产品如灯泡的寿命,横梁的耐冲击强度等而进行的破坏性试验,逐个检查将使生产失去意义所以,实际问题中,只能也只需通过测试部分对象的数据,由此来推断全体研究对象的性质,由部分推断总体。这是数理统计面对的基本问题。1、总体:研究对象的全体,如一批灯泡的寿命具体:研究对象的某个或某几个特性的数量指标,所有的可能取值所构成的集合。如,研究对象:一个城市的居民家庭;X:人均收入;Y:人均支出;Z:人均居住面积,则三个总体:121122111222,,...,,,,,,,,,,,,,nXXXXXYXYXYXYZXYZXYZ通常我们学习研究对象的一个特性的数量指标,所有可能取值所构成的集合。如,X:灯泡寿命,总体12,,Xxx,其中灯泡是研究对象,寿命是数量指标。2、个体:组成总体的每一个基本单元(集合中的元素)3、样本:从总体中随机地抽取几个个体所组成地集合,称为总体地一个样本:12,,nXXX,通常看为n维随机变量(1)样本容量:样本中所含个体地个数n,1,2,n总体中个体元素个数(2)样本值:12,,nXXX的一个观测,记为:12,,nxxx4、抽样:从总体中抽取样本的过程。这里指随机抽样。目的:通过样本得到总体的相应情况。(1)简单随机抽样:数理统计最常用的抽样方法。满足特点:代表性:总体中每个个体被抽入样本的机会均等,即每个iX(个体)与总体X具有相同分布;独立性:样本中每个个体取什么值并不影响其它个体取什么值,即12,,nXXX相互独立。(2)简单随机样本:简称样本(指用简单抽样方法获得的样本)。即:12,,nXXX为简单随机样本1212,,,,nnXXXXXX相互独立;与X具有相同的分布如,一批灯泡5万只,随机抽取1000只检查其寿命iX,1,2,1000i,其中4只寿命低于规律值,为次品,总体1250000,,XXXX,一个样本121000,,,XXX样本的次品率为0.4%。可推断,总体的次品率为0.4%。(4)这里可得到简单随机样本的方式:通常采用有放回地重复随机抽样:通常针对有限总体,尤其总体容量较小时;无放回…………………:指无限总体或样本容量相对较少,如小于等于总体的5%时。5、样本12,,nXXX的联合密度函数1212,,nnpxxxpxpxpx,其中:总体X是连续型随机变量,其密度函数为px。二、统计量1、统计量:设12,,nXXX为取自总体X的一个样本,12,,ngxxx为一个连续函数,且不含未知参数,则称12,,ngxxx为统计量。如:总体2~,XN,12,,nXXX为取自总体X的一个样本,(1)未知,已知,则含的不是;(2)未知,未知,则含或含的不是;简单地讲:统计量满足a)是样本12,,nXXX的实值函数;b)样本观测值12,,nxxx?,就可求出统计量的具体值。2、常用统计量设12,,nXXX为取自总体X的一个样本,(1)样本均值:11niiXXn(2)样本方差:2222111111nniiiiSXXXnXnn证明:(略)(3)样本均方差(标准差):2111niiSXXn样本方差2S与均方差S都反映了总体波动的大小,即反映总体,DXDX的信息。例1、从一批袋装食品中随机抽取6袋,测得其重量(单位:克),如下:462,465,451,472,459,448。求样本均值X和样本方差2S。解:总体X:指这批食品的重量(各袋重量构成的集合);样本126,,XXX是抽取6袋食品的重量样本值:(462,465,451,472,459,448)为这次抽取6袋食品测得的重量(1)612611462465448459.5666iiXXXXX(2)6222222212611166615iiSXXXXXX222214624654486459.579.55或2S2221462459.5465459.5448459.579.55§2样本分布函数设12,,nxxx为取自总体X的一组样本值,可用频率分布表和直方图粗略地描述总体X地分布。一、频率分布表1、设总体X是离散型随机变量,12,,nxxx是样本12,,nXXX地一组样本值。12,,nXXX取到的值为12,,maaa,且取到12,,maaa的个数分别为12,,mvvv,(1)频数:ia出现的次数i;(2)频率:iifn,其中,12mnvvv,即n个数据中,取到ia值的频率、比例;(3)频率分布表:可近似地反映(代替)总体X的分布律iXa1a2amaP1f2fmf二、直方图当总体X是连续型随机变量时,可采用直方图来处理样本值。1、方法:(1)将样本值12,,nxxx从小到大排列,***12,,nxxx样本值落入区间**1,,nabxx,a略小于*1x,比*1x通常多一位小数;b略小于*nx,比*nx通常多一位小数。(2)将n个样本值的各个不同取值所在的区间,ab1m等分1m等分,使ma的值落入分割的小区间中,0121mmatttttb,每一小区间长度:1,0,1,1iibattimmm大小,通常与样本容量对应,(3)依次数出样本值落在区间1,iitt中的个数i,0,1,imiifn——为样本值落入区间1,iitt中的频率;(4)画出(频率)直方图:每个直方条:宽1,iitt,长1iiiftt111iiiiiiiiffttSPtxttt小矩形(5)相应密度函数的大致曲线:光滑连接每条长方形上边中点。三、样本分布函数由样本的分布函数,推断(近似得出)总体X的分布函数。作法:将一组来自总体X的样本值12,,nxxx,从小到大排列***12nxxx*1**112**223*0,,,1,nnxxxxxnFxxxxnxx,nFx――称样本分布函数通常n越大,近似程度越好。§3常用统计量的分布四种常用的统计量及其分布一、X的分布1、定理:设12,,nXXX是取自正态总体X的样本。2~,XN,则有:样本均值2~,XNn,~0,1XNn样本12,,nXXX独立与X同分布,2,,iiEXDX121nXXXXn也服从正态分布,1211nEXEXXXnnn,22122211nDXDXXXnnn例1、设总体~12,4XN,抽取容量为16的样本。求样本平均值X的分布及13PX解:~12,4XN,16n(1)21~,12,4XNN,即X服从参数2112,4的正态分布;(2)13121311311311210.97720.022812PXPXF二、2-分布1、定义:若随机变量12,,nXXX相互独立,都服从同分布,~0,1iXN,则称随机变量222212nXXXX服从自由度n的2分布,记:2~()Xn(1)2~()Xn,X的密度函数图形2-分布的密度曲线是个对称的,其形状与自由度n有关,随自由度n的增大而渐趋于对称。(2)2-分布:已知自由度n,给定正数0,1,由2分布表临界值22PX例2、设随机变量2~(20)X,求下列情况下的k(1)0.05PXk,解:20,0.05n,查表:31.410.05,31.41PXk——即临界值22、定理:设12,,nXXX是取自总体X的样本,2~,XN,则样本均值X和样本方差2S相互独立,且2221~1nSn三、t-分布1、定义:若随机变量~0,1XN,2~()Yn,且X与Y相互独立,则称随机变量nTXY的分布为自由度为n的t分布,记为:~Ttn(1)t分布的密度函数图形:对称,当自由度n增大,其曲线趋于标准正态分布曲线(2)t分布表:已知~Xtn,给定正数0,1,自由度n查表临界值tnPXtn例3、已知:~15Xt,求下列情形中的k(1)0.05PXk,解:0.0515,0.05(15)1.75nkt,即1.750.05PX*2两个定理(1)设12,,nXXX是取自正态总体2~,XN的样本,则~1XTtnSn,其中:X:样本均值;S样本均方差(2)设X和21S为总体X的样本均值和样本方差,211~,XN,容量为1n;设Y和22S为总体Y的样本均值和样本方差,222~,YN,容量为2n。且2212,则12122211221212~211112XYTtnnnSnSnnnn。四、F—分布1、定义:若X、Y相互独立,且21~()Xn,22~()Yn,则随机变量21nXFnY的分布为自由度为1n和2n的F—分布,记为:12~,FFnn。(1)密度函数图形(2)F分布表:已知:12~,XFnn,对给定0,1,自由度1n和2n,查表临界值12,Fnn12,PXFnn例4、(1)120.050.05,10,12,10,122.952.950.05nnFPX(2)0.95,的值靠近1,则公式:121211,,FnnFnn0.95,0.950.051110,120.3412,102.95FF3、定理:设21S为总体X的样本方差,211~,XN,容量为1n,22S为总体Y的样本方差,222~,YN,容量为2n,X、Y相互独立,则2211122222/~1,1/SFFnnS。
本文标题:统计量与抽样分布-textandfilefileurl
链接地址:https://www.777doc.com/doc-420139 .html