您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 管理统计学-第3章-抽样分布与参数估计
第三章抽样分布与参数估计第三章抽样分布与参数估计•3.1抽样分布•3.2点估计•3.3区间估计第三章抽样分布与参数估计3.1抽样分布为什么要抽样?为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。抽样原因元素多,搜集数据费时、费用大,不及时而使所得的数据无意义总体庞大,难以对总体的全部元素进行研究检查具有破坏性炮弹、灯管、砖等第三章抽样分布与参数估计统计学基本概念•总体(全体)Population•所有感兴趣的对象•样本Sample•总体的一部分•总体参数Parameter•关于总体的概括性度量•统计量Statistic•关于样本的概括性度量•抽样•从所研究的对象中随机取出一部分进行观察,由此获得有关总体的信息。第三章抽样分布与参数估计•抽样分为概率抽样与非概率抽样•其中概率抽样分为:纯随机抽样、等距抽样、分层抽样、整群抽样第三章抽样分布与参数估计常用的总体参数•总体平均数•总体方差•总体标准差•总体比率(总体成数)NXNII1NXXNII122)(NNP1第三章抽样分布与参数估计•样本平均数•样本方差•样本标准差•样本比率(样本成数)nXxnii11)(122nxXsniinnp1s第三章抽样分布与参数估计•样本统计量经常被用作估计总体参数。•点估计就是运用样本数据值计算出一个样本统计量的值,将其作为总体参数的估计值。•如用去估计•问题是不同的样本提供不同的估计值•样本越大,估计的性质越好,但成本也越高•了解估计的性质有多好•解决办法:以样本的抽样分布作为理论基础。50x第三章抽样分布与参数估计抽样分布•从一个总体中随机抽出容量相同的各种样本,从这些样本计算出的某统计量所有可能值的概率分布,称为这个统计量的抽样分布。•从一个给定的总体中抽取(不论是否有放回)容量(或大小)为n的所有可能的样本,对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布。•样本统计量是一个随机分布量。第三章抽样分布与参数估计•设由四个同学组成的总体,•样本总体N=4。•随机变量X表示某个学生的年龄•X的所在取值为18,20,22,24。•总体均值和总体方差各为多少?212.236•总体概率分布?第三章抽样分布与参数估计•所有样本容量为2的样本第三章抽样分布与参数估计第三章抽样分布与参数估计第三章抽样分布与参数估计总体分布与样本抽样分布的关系第三章抽样分布与参数估计第三章抽样分布与参数估计第三章抽样分布与参数估计第三章抽样分布与参数估计样本均值的抽样分布•一个总体10,5,8,7,10,直方图012357911其他接收频率0.00%50.00%100.00%150.00%频率累积%第三章抽样分布与参数估计•有放回(withreplacement)抽样{,}ijXXX105871010{10,10}10{10,5}7.5{10,8}9{10,7}8.5{10,10}105{5,10}7.5{5,5}5{5,8}6.5{5,7}6{5,10}7.58{8,10}9{8,5}6.5{8,8}8{8,7}7.5{8,10}97{7,10}8.5{7,5}6{7,8}7.5{7,7}7{7,10}8.510{10,10}10{10,5}7.5{10,8}9{10,7}8.5{10,10}10第三章抽样分布与参数估计•一个样本统计量的概率分布被称为该统计量的抽样分布样本均值抽样分布直方图0510678910其他频率0.00%50.00%100.00%150.00%频率累积%第三章抽样分布与参数估计第三章抽样分布与参数估计第三章抽样分布与参数估计第三章抽样分布与参数估计正态分布均匀分布总体分布样本均值分布(n=2)样本均值分布(n=10)样本均值分布(n=30)指数分布第三章抽样分布与参数估计中心极限定理的作用•建立起值与样本均值之间的数值关系.•不论该总体服从何种分布,只要当样本容量足够大(),样本均值的分布都大致服从正态分布。Z30n),(~2nNX第三章抽样分布与参数估计•例:某高校在研究生入学体检后对所有结果进行统计分析,得出其中某一项指标的均值是7,标准差2.2。从这个总体中随机选取一个容量为31的样本。•(1)计算样本均值大于7.5的概率,•(2)计算样本均值小于7.2的概率,•(3)计算样本均值在7.2和7.5之间的概率。第三章抽样分布与参数估计•样本容量大于30,由中心极限定理可知,样本均值的分布近似均值为即的正态分布===标准差93.0312.2,7Xnx)39.0,7(~2NX第三章抽样分布与参数估计•(1)•(2)•(3)1.0)28.139.07()39.075.739.07()5.7(XPXPXP69.0)51.039.07()39.072.739.07()2.7(XPXPXP21.0)28.151.0()39.075.739.0739.072.7()5.72.7(ZPXPXP第三章抽样分布与参数估计•例:在北京一居室的房租平均为每月1500元,房租的分布并不服从正态分布,随机抽取容量为50的样本,样本的标准差是200元,请问样本均值至少为1600元的概率是多少?第三章抽样分布与参数估计第三章抽样分布与参数估计第三章抽样分布与参数估计第三章抽样分布与参数估计第三章抽样分布与参数估计第三章抽样分布与参数估计•例:已知某高校女生比例为46%,现对全体学生做两次随机抽样,n=200和n=1000,求这两次抽样中女生的比例在50%以上的概率。第三章抽样分布与参数估计3.2点估计第三章抽样分布与参数估计3.2.1点估计的概念•点估计是以样本统计量作为相应总体参数的估计量•例如:用样本均值直接作为总体均值的估计值•点估计的优点•能够提供总体参数的具体估计值,可以作为行动决策的数量依据•点估计的不足•任何点估计不是对就是错,并不能提供误差情况如何、误差程度有多大的信息X3.2.2点估计的优良性标准•无偏性–设总体的参数为,其估计量为,如果即估计量的数学期望等于被估计的总体参数,我们称估计量是参数的无偏估计量–样本平均数是总体平均数的无偏估计量–无偏性是对估计量的一个常见而重要的要求ˆ)ˆ(Eˆˆ点估计的优良标准(续)•一致性–设是参数估计量,若对于任意的,当时依概率收敛于,则称为的一致估计量–对任意有,•有效性–设和都是参数的无偏估计量,若对任意,,且至少对于某个上式中的不等号成立,则称较有效),...,(ˆ1nXXnˆ),...,(ˆ1nXX00)|ˆ(|limnnP),...,(ˆˆ111nXX),...,(ˆˆ122nXX)ˆ()ˆ(21DD1ˆ2ˆ矩估计法•借助样本矩去估计总体的矩–用样本的一阶原点矩来估计总体的均值–用样本的二阶中心矩来估计总体的方差例3.1矩法估计例题•设总体,为总体的样本,求,的矩法估计量。–解:2,~NXnXXX,,,21X矩ˆ2112211ˆnniiSXXn矩2例3.2灯泡平均寿命分析•设从某灯泡厂某天生产的灯泡中随机抽取10只灯泡,测得其寿命为(单位:小时)1050,1100,1080,1120,1200,1250,1040,1130,1300,1200。试用矩法估计该厂这天生产的灯泡的平均寿命及寿命分布的方差。–解:)(1147101)ˆ(101hxxXEii889.7578)ˆ(2XD极大似然估计法•求极大似然估计的一般步骤–写出似然函数–对似然函数取对数,并整理–求导数–解似然方程例3.4极大似然估计例题•设总体X服从N(,),是X的样本值,求,的极大似然估计–解:•似然方程为:),;,,,(221nxxxL222)(121ixnieniixnne1222)(222)()2(1)ln(2)2ln(22)(ln2122nnxLnii0)(2)()(21ln)(0)(1ln21222212nxLxLniiniiniimleniimlexxnxxn1221)(11ˆXXnnii11212)(1nniiSXXn,S2的极大似然估计量分别为,,22频次分析模块Analyz→DescriptiveStatistics→FrequenciesStatistics均值中位数众数样本数据值总和数据分布的斜度数据分布的峰度最大值与最小值之差标准差方差均值标准差最大值最小值计算四分点按顺序分组设置指定的百分点频次分析模块(续)Statistics净重NValid100Missing0Mean343.76Std.Deviation4.130Variance17.053从100个样本中推断总体的净重均值为343.76g,方差为17.053从100个样本中推断总体的净重均值为343.76g,方差为17.053从100个样本中推断总体的净重均值为343.76g,方差为17.053样本方差样本均值描述统计模块•Analyze→DescriptiveStatistics→Descriptives→Options标准差均值方差DescriptiveStatisticsNMeanStd.DeviationVariance净重100343.764.13017.053ValidN(listwise)100净重均值、方差估计值,结果同Statistics表标准差均值方差标准差均值净重均值、方差估计值,结果同Statistics表方差标准差均值标准差均值标准差均值方差标准差均值3.3区间估计3.3区间估计•用一个区间去估计未知参数,即把未知参数值估计在某两界限之间•设是来自密度的样本•对给定的,如能找到两个统计量及,使得•是置信度,置信度也称为置信概率•是置信度为的θ的置信区间•称为显著性水平(SignificanceLevel)。nxxx,,,21),(Xf),,,(211nxxx1)},,,(),,,({212211nnxxxxxxP),,,(212nxxx1nnxxxxxx,,,,,,,2122111)10(置信区间•区间示意图•置信区间表达了区间估计的精确度,置信概率表达了区间估计的可靠性,它是区间估计的可靠概率;而显著性水平表达了区间估计的不可靠的概率•可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度1-αθˆ1ˆ2ˆ)ˆ(f3.3.1总体方差已知时,总体均值µ的估计•,为来自总体的样本•样本均值服从数学期望为μ、方差为/n的正态分布,即•当已知时,•可得到1-α置信度下,μ的置信区间为•置信区间的宽度为:2,~NXnxxx,,,21xnNx2,~1,0~NnxU22xxnn,nL2/22222例3.6零件直径问题•已知某零件的直径服从正态分布,从该批产品中随机抽取10件,测得平均直径为202.5mm,已知总体标准差σ=2.5mm,试建立该种零件平均直径的置信区间,给定置信度为0.95。–解:已知,=202.5mm,n=10,=0.95,查标准正态分布表,得=1.96,所以在置信度下,的置信区间为–即[202.5-1.96×2.5/,202.5+1.96×2.5/],计算结果为:[200.95,204.05]2,~NXx211nxnx22,10103.3区间估计•用一个区间去估计未知参数,即把未知参数值估计在某两界限之间•设是来自密度
本文标题:管理统计学-第3章-抽样分布与参数估计
链接地址:https://www.777doc.com/doc-7225874 .html