您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > 第4章 非确定型建模方法-第1节 经典统计建模方法(1)-统计检验法(2)抽样估计
为什么要进行抽样?如何进行简单随机抽样?正态分布、分布、F分布、t分布的定义、图形分布形态如何?2χ抽样估计1.1关于抽样的基本概念地理工作者在地理调查和研究中常用到抽样调查方法,并把抽样调查得来的资料(抽样资料)作为对该地区进行某些数字特征估计的基础,从而得到这一地区的一个整体印象,即常说的推断统计。一、抽样的原因•节约时间和费用。•通常情况下普查的必要性不大。•总体可能是无限的,例如要测定某一段河水的温度,有无数个时刻和深度。•抽样可能具有破坏性,如,测定灯泡的平均使用寿命。•总体可能不存在,如,灯泡,真正的总体是工厂将来要生产的灯泡。•总体是不可达到的,如,研究一个山区的冻融风化机制,不可能达到每一个山坡上进行研究。•来自总体普查的信息会快速过时。二、抽样的基本步骤:刘钦普,P691、确定总体2、建立抽样结构3、选择抽样方案4、确定应收集的数据信息5、收集数据在抽样设计中应根据调查目的和经济承受能力,认真考虑合适的样本容量。一般,n=30的样本为大样本,n30的样本为小样本。三、抽样的基本方法1、非概率抽样:不能用于统计推断(略)2、概率抽样:非空间抽样、空间抽样•非空间抽样:简单随机抽样系统随机抽样(等距抽样)分层随机抽样分群随机抽样•空间抽样样方抽样线性抽样点抽样四、样本统计量与抽样分布:在简单随机抽样中,样本具有随机性,样本的参数,s2等也会随着样本不同而不同,故它们是样本的函数,记为g(x1,x2,……,xn),称为样本统计量。统计量的概率分布称为抽样分布(Sampledistribution)x几种概率分布正态分布分布F分布t分布2χ1.2几种与正态分布有关的概率分布若随机变量X的概率密度函数,21)(222)(xexfx),(~2NX记为(1)正态分布(µ为总体均值)uttfuUPd)()(图1-1一般正态分布标准正态分布:当时,记为U~N(0,1)1,022221)(tet图1-2标准正态分布非标准正态分布向标准正态分布的转化若标准化因子则U~N(0,1)),(~2NXXU相互独立且均为服从N(0,1)分布的随机变量,则称随机变量所服从的分布是自由度为n的分布,且记。2χnxxx,,,21niixχ122)(~22n2χ定义(2)分布图1-3χ2分布图设相互独立的随机变量V和W分别服从自由度为n1,n2的分布,即,则随机变量服从F分布。n1,n2分别是它的第一自由度和第二自由度,且通常记为2)(~),(~2212nWnV21//nWnVF),(~21nnFF定义(3)F分布图1-4F分布图F设随机变量U服从标准正态分布,随机变量W服从自由度为n的分布,且U与W相互独立,则称随机变量服从自由度为n的t分布,记为T~t(n)。2χnWUT/定义(4)t分布(Students分布)图1-5n=∞正态分布n=10n=1t分布图性质:当n很大时,此时,tα/2≈uα/2,t分布近似标准正态分布。2221)(limtnetf•练习题:产品检验1、从某公司生产的100件产品重量中抽取8件进行检查分析。2、请检验样本均值的抽样分布与总体分布之间的关系。1、用excel进行抽样(1)利用抽样工具进行抽样•为总体样本编号•调用抽样工具:工具→数据分析→抽样:输入区域:$B$2:$B$101随机,8个样本输出区域:$D$2•显示样本结果:在E2中输入INDEX(A2:A101,D2),复制。(2)利用“RAND”函数进行抽样•抽取样本编号:在H2中输入公式CEILING(100*RAND(),1),复制•获取样本数据:在I2中输入公式INDEX(A2:A101,H2),复制。2、用excel进行抽样分布模拟•产生总体数据:工具→数据分析→随机数发生器。•样本抽取:在C2中输入公式INDEX(A2:A101,CEILING(100*RAND(),1)),复制,得到10个样本容量为10的抽样结果。•计算样本均值。在C12中输入公式AVERAGE(C2:C11),复制。•分别计算出总体分布与抽样分布的均值与标准差。•验证抽样分布与总体分布的关系:比较抽样分布与总体分布的均值与标准差的计算结果,可以验证:样本均值=总体均值抽样均值的标准差=总体标准差/n^(1/2)。
本文标题:第4章 非确定型建模方法-第1节 经典统计建模方法(1)-统计检验法(2)抽样估计
链接地址:https://www.777doc.com/doc-4026522 .html