您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第四章 概率 概率分布和抽样分布
第四章概率、概率分布和抽样分布STAT本章重点1、抽样调查的基本概念;2、大数定律和中心极限定理3、抽样误差本章难点1、一般正态分布标准正态分布;2、抽样误差的计算。第四章概率、概率分布和抽样分布STAT第一节抽样调查的基本概念一、抽样调查的概念和特点(一)概念按随机原则从总体中抽取部分单位进行调查,并根据这部分单位的调查结果推断总体的数量特征的一种方法。(二)特点1、随机抽取样本单位2、推断总体数量特征3、抽样调查结果有可控性误差第四章概率、概率分布和抽样分布STAT二、抽样调查的应用范围和作用(一)抽样调查的应用范围1、用于不可能进行全面调查的现象2、用于进行全面调查就会失去现实意义的现象3、用于经济上不允许或精度上不必要进行全面调查的现象4、用于时效性要求较强的调查(二)作用1、经济性好2、准确性高3、速度快4、可以取得比较详细的统计资料5、可以对全面调查的资料进行订正第四章概率、概率分布和抽样分布STAT三、全及总体与样本总体(一)总体:被观察(研究)的全体。N:总体单位数(二)样本:按随机原则从总体中抽取的部分单位。1、随机原则:机会面前、人人平等。每个样本都有同等被抽可能2、n:样本容量(样本可能数目)3、n30:大样本;n≤30:小样本(也有认为n50为大样本)(三)抽样框:包括所有抽样单位的名单框架。1、名单抽样框2、区域抽样框3、时间表抽样框第四章概率、概率分布和抽样分布STAT四、总体参数与样本统计量[例]某进出口公司拟进口10万台微型计算器,按规定,使用寿命小于4000小时即为次品,且次品率高于1%就不接受这批产品。现随机从中抽取1000台进行检验。1、总体参数:总体指标;2、样本统计量:样本指标名称总体参数样本统计量平均数(均值)NXnxx比率P=N1/Npˆ=n1/n(hat)方差NX22)(1)(22nxxs标准差s第四章概率、概率分布和抽样分布STAT五、抽样方法(一)重复抽样(回置抽样、有放回的抽样)样本可能数目:M=Nn(二)不重复抽样(不回置抽样、不放回抽样)M=N!/(N–n)!第四章概率、概率分布和抽样分布STAT第四节大数定律和中心极限定理一、抽样分布1、总体分布:总体某一变量的取值及其出现概率所形成的分布[例]总体三人(A、B、C)的年龄为1,2,3。N=3总体年龄分布年龄X123概率P1/31/31/3第四章概率、概率分布和抽样分布STAT2、抽样分布样本统计量的取值及其出现概率的分布。[例]N=3n=2,计算样本平均年龄样本及样本平均数样本xxA、AA、BA、CB、AB、BB、CC、AC、BC、C1,11,21,32,12,22,33,13,23,311.521.522.522.53样本平均年龄的抽样分布x11.522.53P1/92/93/92/91/9第四节大数定律和中心极限定理STAT一、大数定律及其意义是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称(一)独立同分布大数定律(二)贝努力大数定律11lim1niinXxnP1limpnmPn第四节大数定律和中心极限定理STAT二、中心极限定理中心极限定理是阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。(一)独立同分布中心极限定理(也称为列维-林德伯格定理)。设是独立同分布的随机变量序列,且存在有限的数学期望和方差,那么当时:或),(~21nnNxnii),(~2nNx2第四节大数定律和中心极限定理STAT中心极限定理论证了如下几点:①如果总体服从正态分布,样本均值也同样服从正态分布。②如果总体很大,但不服从正态分布,只要样本容量足够大,或就会趋近于正态分布。③样本均值的数学期望等于总体均值,即。④样本均值的方差为:重复抽样时,不重复抽样时,niix1x)(xE2xnx22122NnNnx第五章参数估计STAT第二节点估计和区间估计一、估计量与估计值1、待估参数:待估的总体指标;2、估计量:作为估计依据的样本指标3、估计值:估计量的具体取值。[例]1000只灯泡的使用寿命及标准差均未知,今随机取得4只灯泡,测得寿命为1502,1453,1367,1650(小时),试估计总体平均使用寿命及其标准差。解:ˆ.61.1181493小时小时和分别为与21,:待估参数)(61.1181)()(14932小时小时nxxsnxxsx21ˆ,ˆ:估计量第五章参数估计STAT第二节参数估计的基本方法一、估计量与估计值1、待估参数:待估的总体指标;2、估计量:作为估计依据的样本指标3、估计值:估计量的具体取值。[例]1000只灯泡的使用寿命及标准差均未知,今随机取得4只灯泡,测得寿命为1502,1453,1367,1650(小时),试估计总体平均使用寿命及其标准差。解:ˆ.61.1181493小时小时和分别为与21,:待估参数)(61.1181)()(14932小时小时nxxsnxxsx21ˆ,ˆ:估计量第五章参数估计STAT二、点估计22ˆˆsPpx??ˆ?22sPpx的无偏估计量为则若无偏性ˆ,)ˆ(:.1E三、估计量的优良标准第五章参数估计STAT2、有效性:对无偏估计量,方差越小越有效。3、一致性(大样本有益性)的一致估计量为则如果对于任意的ˆ1ˆlim,0)1(Pn第五章参数估计•三、区间估计•(一)含义•区间估计就是根据样本估计量以一定的置信度推断总体参数所在的区间范围。•(二)总体均值的区间估计第五章参数估计STAT四、参数估计的基本原理※(一)正态分布身高cm人数频率140—150150—160160—170170—180180—190520502050.050.200.50.200.05合计1001.00=165cm,=8.94cmP{150X180}=0.90频率身高1401501601701801900.50.40.30.20.1第五章参数估计STAT调整:“频率密度”(频率/组距)“频率”;直方或折线覆盖下的面积=1身高cm频率频密140—150150—160160—170170—180180—1900.050.200.50.200.050.0050.0200.050.0200.005合计1.000.1=165cm,=8.94cm频率密度身高1401501601701801900.050.040.030.020.01P{150X180}=0.90=相应直方的面积第五章参数估计STAT组数n∞,折线曲线。=165cm,=8.94cm身高cm频率频密140—150150—160160—170170—180180—1900.050.200.50.200.050.0050.0200.050.0200.005合计1.000.1频密身高1401501601701801900.050.040.030.020.01190.0)(}180150{180150dxxfXP概率密度函数)(xf190.0P),(~2NX第五章参数估计STAT注:参数、不同分布的位置与形状不同。),(~211NX),(~222NX),(~233NX1)(}{2121XXdxxfXXXP概率计算的困难1X2X22)(2121)(xexf标准正态分布标准化一般正态分布123X第五章参数估计STAT4=x1x2=8-Z0ZxZ标准化)2,6(),(~22NNX)1,0(~:NZ标准正态分布2222221)0(2)(0)(NZNXNZZEZxXZ10121ZxZx万名儿童的年龄1X?}84{XP?}11{ZP第五章参数估计STAT162170178-z/20z/2)8,170(~2NX)1,0(~NZXZ?}178162{)8,170(~100][2xPNX人的身高例81701788170162}178162{xPxP%27.68}1{}178162{2/ZZPxP122xZ变量1112/2/ZZZP第五章参数估计STAT154170186-z/20z/2)8,170(~2NX)1,0(~NZXZ?}186154{)8,170(~100][2xPNX人的身高例%45.95}2{}186154{2/ZZPxP12295.096.1;6827.0122PZPZ当当9973.03;9545.0222PZPZ当当xZ第五章参数估计STAT(二)抽样误差的计算※1、概念(1)定义:样本指标与总体指标之间的差距(离差)。抽样成数的抽样误差抽样平均数的抽样误差:ˆ:Ppx(2)实际抽样误差:某次抽样结果与总体指标之间的误差。1),(5.0),(1),(961xCCxCBxAAN=3(A,B,C)=(1,2,3)n=2样本数据ixix(A、A)(A、B)(A、C)(B、A)(B、B)(B、C)(C、A)(C、B)(C、C)1,11,21,32,12,22,33,13,23,311.521.522.522.53-1-0.50-0.500.500.51合计180=2第五章参数估计STAT(3)抽样平均误差()定义:所有实际抽样误差的平均数。A:抽样平均数的抽样平均误差nyixMxi2)(B:抽样成数的抽样平均误差MPpip2)ˆ(N=3(A,B,C)=(1,2,3)n=2样本数据ixix(A、A)(A、B)(A、C)(B、A)(B、B)(B、C)(C、A)(C、B)(C、C)1,11,21,32,12,22,33,13,23,311.521.522.522.53y1=-1y2=-0.5y3=0y4=-0.5y5=0y6=0.5y7=0y8=0.5y9=1合计180样本可能数目M=9,=20)(MxixiMx2)(第五章参数估计STAT2、抽样平均误差的计算(1)抽样平均数的抽样平均误差A、重复抽样32)(2NX2918)(xEnx312132N=3(A,B,C)=(1,2,3)n=2样本数据ix2)(ix(A、A)(A、B)(A、C)(B、A)(B、B)(B、C)(C、A)(C、B)(C、C)1,11,21,32,12,22,33,13,23,311.521.522.522.5310.2500.2500.2500.251合计183样本可能数目M=9,=258.03193)(2MxixMxix2)(第五章参数估计STATB、不重复抽样32)(2NX41.061)(2Mxix1NnNnx6113232132N=3(A,B,C)=(1,2,3)n=2样本数据ix2)(ix(A、A)(A、B)(A、C)(B、A)(B、B)(B、C)(C、A)(C、B)(C、C)1,11,21,32,12,22,33,13,23,311.521.522.522.5310.2500.2500.2500.251合计121样本可能数目M=6,=22612)(xE修正因子NNN1很大NnNnNNnN11NnnNnNnx11第五章参数估计STA
本文标题:第四章 概率 概率分布和抽样分布
链接地址:https://www.777doc.com/doc-4123869 .html