您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计学第五章抽样和抽样估计
5-1统计学STATISTICS第五章抽样与参数估计制作时间:2004—20055-2统计学STATISTICS内容概要第一节抽样估计的基本问题第二节样本统计量的分布第三节参数估计的方法第四节其它抽样组织形式下的参数估计第五节统计软件Excel、SAS、SPSS在抽样与参数估计中的应用5-3统计学STATISTICS学习目标1.了解抽样和抽样分布的基本概念2.了解点估计的概念和估计量的优良标准3.掌握总体均值、总体比例和总体方差的区间估计4.掌握样本容量的确定原则和方法5.掌握运用统计软件Excel、SAS、SPSS进行抽样与参数估计方法5-4统计学STATISTICS第一节抽样估计的基本问题5-5统计学STATISTICS一、抽样估计的过程样本总体样本统计量如:样本均值、比例、方差5-6统计学STATISTICS二、抽样估计中几个基本概念5-7统计学STATISTICS(一)总体与个体1.总体(Population):调查研究的事物或现象的全体2.个体(Itemunit):组成总体的每个元素3.总体单位数:总体中包含个体的数量,记为N4.总体的特性:当研究目的一定时,总体具有唯一确定性5-8统计学STATISTICS(二)样本(Sample)1.样本(Sample):从总体中所抽取的部分个体构成的整体2.样本容量(Samplesize):样本中所包含个体的数量,记为n,当n≧30,称为大样本n30,称为小样本3.样本单位选取的原则:随机性原则4.样本的特性:当样本单位数(n)一定的情况下,从总体中可以抽到很多个可能的样本,也即样本不是唯一确定的。5-9统计学STATISTICS总体参数样本统计量及其计算公式总体平均数样本平均数总体比例P样本比例p=n1/n总体方差样本方差(若分母为n-1则称之为样本修正方差)总体标准差样本标准差(若分母为n-1则称之为样本修正方差)2nxxS/)(22nxxS/)(2nxx/(三)参数与统计量5-10统计学STATISTICS(四)抽样框1、抽样框:包括全部抽样单位的名单框架。2、编制抽样框的意义:它是有效实施抽样的基础,直接影响到抽样的随机性和抽样效果。3、抽样框的主要形式:(1)名单抽样框(2)区域抽样框(3)时间表抽样框4、抽样框的要求:一个理想的抽样框应该与目标总体一致,即应包括全部总体单位,既不重复也不遗漏。5-11统计学STATISTICS(五)抽样误差1、误差及其构成在抽样调查中,调查资料与实际情况不一致,两者的偏离称为误差。))登记性误差系统性的代表性误差(偏差误差代表性误差随机性的代表性误差(抽样误差5-12统计学STATISTICS2、抽样误差的概念及种类(1)抽样误差是指在没有登记误差和系统性误差的情况下,单纯由于抽样的随机性而产生的误差。(2)实际应用中,关于抽样误差,有三个密切联系而又有区别概念,即实际抽样误差、平均抽样误差、抽样极限误差。①实际抽样误差:实际抽样误差是指某一具体样本的估计值与总体参数的真实值之间的离差。实际抽样调查中,由于总体参数是未知的,因此,每次抽样的实际抽样误差是无法计算的。抽样调查中,所谓抽样误差可以计算和控制,并不是指实际抽样误差,而是指抽样平均误差和抽样极限误差。5-13统计学STATISTICS②抽样平均误差抽样平均误差是所有可能样本指标的标准差。它是由于抽样的随机性而产生的所有可能样本指标与总体指标之间的平均离差。记为和,其定义公式为:2211()()kkiixxxxkkkPpkix12)(XP样本个数5-14统计学STATISTICS③抽样极限误差抽样极限误差是指一定概率下抽样误差的可能范围,也称为允许误差。用△表示抽样极限误差,则这一概念可以表述为如下不等式:xxXppP5-15统计学STATISTICS三、抽样方法5-16统计学STATISTICS(一)重复抽样重复抽样,也叫回置抽样,是指从总体的N个单位中抽取一个容量为n的样本,每次抽出一个单位后,再将其放回总体中参加下一次抽取,这样连续抽n次即得到一个样本。同一总体单位有可能被重复抽中;每次都是从N个总体单位中抽取;n次抽取就是n次相互独立的随机试验。5-17统计学STATISTICS(二)不重复抽样不重复抽样,也叫不回置抽样,是指抽中单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取。同一总体单位不可能被重复抽中.每次抽取是在不同数目的总体单位中进行的n次抽取可看作是n次互不独立的随机试验。误差小于重复抽样5-18统计学STATISTICS四、抽样的组织形式5-19统计学STATISTICS简单随机抽样分层抽样整群抽样等距抽样二阶抽样与多阶段抽样概率抽样方便抽样判断抽样配额抽样非概率抽样抽样方式5-20统计学STATISTICS(一)概率抽样的组织形式按随机原则选取样本单位,样本的代表性强。主要形式有:1、简单随机抽样(纯随机抽样)2、分层抽样(类型抽样)3、等距抽样(机械抽样)4、整群抽样(成批抽样)5-21统计学STATISTICS1、任意抽样法(便利抽样)——从调查者方便出发所选取样本单位。简便易行,节省时间和费用,但调查所得样本的代表性小。适用于非正式的探测性调查,或调查前的准备工作。2、判断抽样法——是由调查人员根据经验判断选定样本的一种非随机抽样技术。一般采用“平均型”或“多数型”选样标准。在市场调查中,常用的典型调查、重点调查均属于判断抽样法的具体运用。3、配额抽样法——按照一定的标准,分配样本数额,然后在规定数额内由调查人员任意抽选样本单位的一种非随机抽样技术。具体可分为:独立控制配额抽样和交叉控制的配额抽样。(二)非随机抽样法5-22统计学STATISTICS独立控制配额抽样收入阶层高:30中:44低:72合计:146年龄人数20-2930-4445-6465以上30523420合计146性别男:73女:73合计:1465-23统计学STATISTICS交叉控制的配额抽样收入阶层总计高中低性别男女男女男女年龄20-2930-4445-6465以上446633226688553310101212995540523420合计1515222236361465-24统计学STATISTICS五、抽样方案的设计5-25统计学STATISTICS(一)抽样方案及其设计的基本准则抽样方案是对整个抽样工作过程的全面安排和工作计划。科学可行的抽样方案是整个抽样推断工作得以顺利完成的保证。设计抽样方案应遵循以下原则:1、随机性原则2、抽样误差最小3、费用最少5-26统计学STATISTICS(二)抽样方案设计的主要内容除了一般调查方案的内容外,主要还包括:编制抽样框确定抽样方法确定抽样组织方式确定样本容量5-27统计学STATISTICS第二节抽样分布5-28统计学STATISTICS一、抽样分布概述5-29统计学STATISTICS(一)抽样分布的概念(samplingdistribution)1、抽样分布:样本统计量的概率分布,是一种理论分布。2、抽样分布属于随机变量函数的分布。例如:样本平均数抽样分布,样本方差、标准差的抽样分布,样本比例的分布等。3、抽样分布反映了样本指标的分布特征,是抽样推断的重要依据。根据抽样分布的规律a、可揭示样本指标与总体指标之间的关系;b、估计抽样平均误差;c、说明抽样推断的可靠度。4、样本统计量分布的主要形式:正态分布、t分布、卡方分布、F分布等。5-30统计学STATISTICS(二)抽样分布的形成过程(samplingdistribution)总体计算样本统计量如:样本均值、比例、方差样本5-31统计学STATISTICS二、不同样本统计量的抽样分布5-32统计学STATISTICS(一)样本均值的抽样分布☞在选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布,称为样本均值的抽样分布。☞样本均值的抽样与原有总体的分布和样本容量的大小有关。xxx5-33统计学STATISTICS=50=10X总体分布n=4抽样分布xn=165x50x5.2x(1)设总体X~N(μ,σ2),按重复抽样方法从总体中随机抽取容量为n的样本,则样本均值x~N(μ,σ2/n);不重复抽样时,1、总体方差已知,样本均值的分布]1[~2)(,NnNnx。用图形表示如下:5-34统计学STATISTICS总体方差已知,样本均值的分布当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布nx(2)中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值近似服从正态分布,即~N(μ,σ2/n)。一个任意分布的总体xxx5-35统计学STATISTICSx的分布趋于正态分布的过程5-36统计学STATISTICS2、总体方差未知,样本均值的抽样分布设总X~N(μ,σ2),是其中的一个简单随机样本,样本均值为,样本标准差为S,则统计量:),,,(321nxxxxx)1(~ntnsxt5-37统计学STATISTICSt分布t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布xt分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z5-38统计学STATISTICS样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为x1=1,x2=2,x3=3,x4=4。总体的均值、方差及分布如下总体分布14230.1.2.35.21NxNii25.1)(122NxNii均值和方差5-39统计学STATISTICS样本均值的抽样分布(例题分析)现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)5-40统计学STATISTICS样本均值的抽样分布(例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P(x)1.53.04.03.52.02.55-41统计学STATISTICS样本均值的分布与总体分布的比较(例题分析)=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5x5.2x625.02x5-42统计学STATISTICS样本均值的抽样分布(例题分析)比较及结论:1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/n为样本数目MnMxnixix222122625.016)5.20.4()5.20.1()(5.2160.45.10.11Mxniix5-43统计学STATISTICS3、抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布样本分布5-44统计学STATISTICS(二)样本比例的抽样分布5-45统计学STATISTICS(1)总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比(2)总体比例可表示为:(3)样本比例可表示为:1、比例(proportion)NNPNNP101或nnpnnp101或5-46统
本文标题:统计学第五章抽样和抽样估计
链接地址:https://www.777doc.com/doc-1791193 .html