您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计课件9抽样与参数估计
第九章抽样与参数估计统计推断是统计学研究的重要内容。抽样是进行统计推断的基础性工作。参数估计是统计推断的重要内容之一。本章主要内容第一节抽样与抽样分布第二节参数估计的一般问题第三节一个总体的参数区间估计第四节两个总体的参数区间估计第五节样本容量的确定第一节抽样与抽样分布一、几个基本概念二、概率抽样方式三、总体分布、样本分布、抽样分布四、一个总体的抽样分布五、两个总体的抽样分布统计推断的过程样本总体样本统计量例如:样本均值、比例、方差•统计推断是在对样本数据进行描述的基础上,对总体的未知数量特征作出以概率形式表述的推断。一、几个基本概念㈠总体、个体、样本•总体是所要研究的事物或现象的全体,也称全及总体、母体。•个体是组成总体的各个基本单位或元素。•样本是从总体中按一定抽样技术抽取的若干个体组成的集合体,也称抽样总体、子样。㈡总体容量和样本容量•总体容量是总体全部单位总数,用N表示。•样本容量是一个样本所包含的单位数,通常用n表示。根据容量大小样本有大样本和小样本之分,一般当n30时为小样本,n≥30时为大样本。㈢总体参数和统计量•总体参数是根据总体各单位数据计算的量,又称全及指标。常用的有总体均值、总体比例(成数)、总体方差、总体标准差等。•统计量是由样本构造出的且随样本变化而变化的量,又称样本指标或抽样指标,常用的有样本均值、样本比例(成数)、样本方差、样本标准差等。•在一个总体中,总体参数是一个确定的量,而样本统计量因样本是随机抽取的可以有多个,因此统计量的值不是唯一确定的,是个随机变量。二、概率抽样方式•抽样方式按是否根据已知概率抽选样本单位(按抽样的随机性)可分为概率抽样(随机抽样)和非概率抽样(非随机抽样)。统计推断主要是概率推断,下面主要介绍概率抽样。㈠概率抽样(随机抽样)方式主要有:简单随机抽样,分层抽样,整群抽样,系统抽样,多阶段抽样。(如第二章所述)•本课程主要介绍简单随机抽样条件下统计推断方法。㈡重置抽样和不重置抽样•从总体抽取样本的方法有重置抽样和不重置抽样两种。1.重置抽样•又称重复抽样、有放回抽样,是每次从总体中抽取一个单位,观察记录后又放回,再抽取下一个。因此重复抽样的样本是由n次相互独立的连续试验所组成的,每次实验在相同条件下进行,在整个抽样过程中总体单位数始终不变,各单位被抽中的机会前后相等。•若重置抽样并考虑各单位的排列顺序,则样本的可能数目为Nn。⒉不重置抽样•又称不重复抽样、无放回抽样,是每次从总体中抽取一个单位,观察记录后不放回,再抽取下一个。因此不重复抽样的样本虽由n次连续试验所组成,而实质等于一次同时从总体中抽n个单位组成一个样本,每次实验不是相互独立的,在整个抽样过程中每抽一次总体单位就少一个,各单位被抽中的机会前后不等,越往后被抽中的机会越大。•若不重复抽样也不考虑各单位的顺序,则样本的可能数目为。•在实践中当总体单位数很大,样本单位数相对较小时,可以把不重复抽样看成重复抽样,这时的计算比较简单。nNC1.是总体中各元素的观察值所形成的频数或频率分布2.总体分布通常是未知的3.可以假定它服从某种分布三、总体分布、样本分布、抽样分布㈠总体分布(populationdistribution)总体1.是一个样本中各观察值的频数或频率分布2.也称经验分布3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布㈡样本分布(sampledistribution)样本1.是某一样本统计量的全部可能取值的概率分布。2.现实中不可能抽出所有样本,因此统计量的抽样分布实际是一种理论概率分布。统计推断中,常用的理论概率分布:正态分布、2分布、t分布和F分布。3.是样本统计量的函数。若样本是随机的,则样本统计量就是随机变量,如样本均值,样本比例,样本方差等为随机变量。4.结果来自容量相同的所有可能样本。5.提供了样本统计量稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据。㈢抽样分布(samplingdistribution)抽样分布(samplingdistribution)总体计算样本统计量例如:样本均值、比例、方差样本四、一个总体的抽样分布㈠样本均值的抽样分布㈡样本比例的抽样分布㈢抽样方差的抽样分布(略)㈠样本均值的抽样分布•性质及特点1)是容量相同的所有可能样本的样本均值的概率分布2)是一种理论概率分布3)是推断总体均值的理论基础•举例说明样本均值抽样分布的形成过程【例】设一个总体含有4个个体(总体单位),即总体单位数N=4。各单位标志值分别为X1=1、X2=2、X3=3、X4=4。总体标志值的分布律为:总体分布14230.1.2.3总体均值和方差5.2443211NXNii25.1)(122NXNiiP(X)XX1234P(X)0.250.250.250.25样本均值的抽样分布(例题分析)现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)样本均值的抽样分布(例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布。3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.00.1.2.3P(x)1.53.04.03.52.02.5样本均值的抽样分布(例题分析)•根据表中数据求得样本均值的均值为:样本均值的方差为:5.2160.45.10.11Mxxniix为样本数目MnMxxniix222122625.016)5.20.4()5.20.1()(比较及结论:1.样本均值的均值等于总体均值2.样本均值的方差等于总体方差的1/n样本均值的抽样分布(例题分析)=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5x5.2x625.02xP(X)X比较总体分布和样本均值的抽样分布,可以看出,此例尽管总体为均匀分布,但样本均值的抽样分布却是对称的钟型分布。•样本均值抽样分布的形式与特征=50=10X总体分布n=4抽样分布xn=165x50x5.2xP(X)•现实中不可能抽出所有样本,因此实际应用的样本均值抽样分布是一种理论概率分布。•数理统计理论证明:当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值也服从正态分布,样本均值的数学期望为总体均值,样本均值的方差为总体方差的1/n。即x~N(μ,σ2/n)。•若X~N(50,102),则有:当n=4,x~N(50,52);当n=16,x~N(50,2.52)•中心极限定理(centrallimittheorem)当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布xn•当总体为非正态分布时依据以下中心极限定理。•中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大(通常n30)时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。一个任意分布的总体xX中心极限定理(centrallimittheorem)的分布趋于正态分布的过程x抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本样本均值分布近似正态分布样本均值分布为正态分布样本均值分布为非正态分布•样本均值的数学期望•样本均值的方差–重复抽样–不重复抽样•样本均值的数学期望与方差(简单随机样本))(xEnx22NnnNnNnx11222•均值的抽样平均误差•是所有可能的样本均值的标准差,用于测度所有样本均值的离散程度,描述以样本均值推断总体均值的平均误差程度。•其数值小于总体标准差。•简单随机重置抽样下计算公式为:nx•比例(proportion)是总体或样本中具有某种属性的单位数与全部单位总数之比。例如:–不同性别的人数与全部人数之比–合格品(或不合格品)数与全部产品总数之比•总体比例可表示为•样本比例可表示为•总体或样本中具有某种特征的单位数服从二项分布。㈡样本比例的抽样分布NNNN101或nnpnnp101或1)样本比例的抽样分布是容量相同的所有可能样本的样本比例的概率分布2)当样本容量很大时,样本比例的抽样分布可用正态分布近似3)是一种理论概率分布4)是推断总体比例的理论基础•样本比例抽样分布的性质及特点•样本比例的数学期望•样本比例的方差重复抽样不重复抽样•样本比例的数学期望与方差(简单随机样本))(pEnP)1(2NnnNnNnP1)1(1)1(2五、两个总体的抽样分布㈠两个总体的样本均值之差的抽样分布㈡两个总体的样本比例之差的抽样分布㈢两个总体的样本方差比的抽样分布(略)•若两个总体都为正态分布,即1.2.则可以证明,抽自两个总体的两个样本的均值之差3.的抽样分布服从正态分布•其分布的数学期望为两个总体均值之差•其方差为各自的方差之和㈠两个总体的样本均值之差的抽样分布)σ,μ(N~X2111)σ,μ(N~X222221xx2121μμ)xx(E222121221nσnσσxx两个样本均值之差的抽样分布11总体122总体2抽取简单随机样本,样本容量n1计算x1抽取简单随机样本,样本容量n2计算x2计算每一对样本的x1-x2所有可能样本的X1-X212抽样分布•若两个总体都服从二项分布,则可以证明,分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差p1-p2的抽样分布可用正态分布来近似•其分布的数学期望为总体比例之差•其方差为各自的方差之和㈡两个总体的样本比例之差的抽样分布2121ππ)pp(E22211121121n)π(πn)π(πσpp第二节参数估计的一般问题一.估计量与估计值二.点估计与区间估计三.评价估计量的标准参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计1.估计量:用于估计总体参数的随机变量–如样本均值,样本比例、样本方差等–例如:样本均值x就是总体均值的一个估计量2.总体参数用表示,估计量用表示3.估计值:估计参数时计算的统计量的具体值–如果样本均值x=80,则80就是的估计值一、估计量与估计值(estimator&estimatedvalue)ˆ二、点估计与区间估计•用样本统计量对总体参数进行估计基本方法可分为两大类:点估计和区间估计矩估计法最小二乘法最大似然法顺序统计量法估计方法点估计区间估计㈠点估计(pointestimate)•又称定值估计,用样本统计量的值直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例:在某城市,随机抽取100户,调查其家庭收入,用这100户的平均家庭收入估计该城市所有家庭的平均收入。例如:用样本比例直接作为总体比例的估计例:某工厂要检验其产品的合格率,随机抽取了50个产品进行检测,发现有3个产品不合格,则样本产品合格率为94%,据此估计整批产品的合格率为94%。•点估计•点估计的特点:能明确估计总体参数,但没有给出估计值接近总体参数程度的信息,无法知道估计的可靠性。•点估计的方法有:矩估计法、顺序统计量法、最大似然法、最小二乘法等(略)。对于同一参数采用不同方法来估计,可能得到不同的估计量。㈡区间估计(intervalestimate)1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量的值加减抽样极限误差得到2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。比如,根据
本文标题:统计课件9抽样与参数估计
链接地址:https://www.777doc.com/doc-5302132 .html