您好,欢迎访问三七文档
BasicBusinessStatistics,11e©2009Prentice-Hall,Inc.Chap7-1第7章抽样和抽样分布商务统计学(第5版)BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-2学习目标在本章中你将学到:区分不同的抽样方法抽样分布的概念计算样本平均数和样本比例相关的概率中心极限定理的重要性BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-3为什么需要样本?选择样本比总体(人口普查)中的每一项要节省时间。选择样本比总体中的每一项要节省费用。分析样本要比分析整个总体容易且更加实际。BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-4抽样过程从抽样架构开始架构是对组成总体的一系列条目的列举。架构是类似总体清单,目录或者地图的数据源。如果架构里没有包括总体的某些部分,不准确或者有偏的结果可能产生。使用不同的架构得到数据会得出不同的结论。BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-5样本类型样本非概率样本判断样本概率样本简单随机样本系统样本分层样本群样本便利样本BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-6样本类型:非概率样本在非概率样本中,选中的条目不根据他们发生的概率。在便利抽样中,条目的选择简单,便宜,且方便抽样。在判断样本中,我们得到预先选好的专家就主题发表的意见。BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-7样本类型:概率样本在概率样本中,样本中条目的选择基于已知的概率。概率样本简单随机样本系统样本分层样本群样本BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-8概率样本:简单随机样本架构里的每一个条目都有同等的机会被选中抽样可以放回(选择了某一个条目之后再把它放回架构里,它再次被选中的概率仍然相同)或者不放回(选择的某一个条目,不能放回架构中)。样本通过随机数表或随机数产生器取得BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-9使用随机数表选择简单随机样本有850条目的总体抽样架构条目名条目号BevR.001UlanX.002........JoannP.849PaulF.850随机数表(部分)492808892435779002838116307275111000234012860746979664489439098932399720048494208887208401简单随机样本前5个条目Item#492Item#808Item#892--不存在所以忽略Item#435Item#779Item#002BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-10取决于样本容量:n架构中N个体分成含k个体的组:k=N/n从第一组随机选择一个个体接下来,每数到第k个数都依次选取概率样本:系统样本N=40n=4k=10第一组BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-11BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-12概率样本:分层样本根据一些常见的特征,把总体分成两个或两个以上的亚群体,即层(strata)。在每个层中根据层容量相应选择简单随机样本。分层选择的样本然后加以合并。当抽样总体是选民时,根据种族或社会经济层次分层是常用的技术。总体分成4个层BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-13概率样本:群样本总体分为若干个“群样本,”每个群代表整个总体。随机选择群样本使用选中的群里的所有项目或者从群里面选取基于概率的样本。群样本的通常应用是选举,其中选择特定选区并抽样。总体分成16个群样本。随机选择群样本抽样BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-14概率样本:比较抽样方法简单随机样本和系统样本使用简单可能不能很好的代表总体的潜在特性分层样本确保代表的个体覆盖整个总体群样本成本效率更高有效性较低(需要更大的样本以取得同等程度的精确性)BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-15估计调查价值调查的目的是什么?调查是否基于概率样本?覆盖误差–合适的架构?无回复误差–跟随测量误差–好的问题引出好的回复抽样误差–一直存在BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-16调查误差类型覆盖误差或选择偏误如果有些条目组没有被包括在架构里,没有机会被选到,就会产生。无回复误差或偏误不回复的人于回复的人可能是不同的。抽样误差随着样本的不同而不同,且是一直存在的。测量误差由于问题设计的缺陷,,回答的误差和受访者回复的努力(“霍索恩效应”)BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-17调查误差类型覆盖误差无回复误差抽样误差测量误差从架构中排出跟踪无回复随机样本,随着样本的不同而不同不好的或者主要的问题(续)BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-18抽样分布抽样分布就是选出所有可能的样本情况下结果的分布例如,假设根据那么学院学生的平均成绩选择50个学生。如果得到很多不同的50个学生的样本,将计算每个样本不同平均数。我们可以计算对于任意给定的50个学生的样本,我们对所有潜在的平均成绩感兴趣。BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-19建立抽样分布假设总体…总体容量N=4随机样本变量,X,是个体的年龄X的观测值:18,20,22,24(岁)ABCDBasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-20.3.2.1018202224ABCD均匀分布P(x)x(续)总体分布的概括度量:建立抽样分布21424222018NXμi2.236Nμ)(Xσ2iBasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-2116个可能的样本(有放回的抽样)现在考虑容量n=2的所有可能的样本第一个第二个观测值观测值182022241818192021201920212222202122232421222324(续)建立抽样分布16个样本平均数第一个观测值第二个观测值182022241818,1818,2018,2218,242020,1820,2020,2220,242222,1822,2022,2222,242424,1824,2024,2224,24BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-22所有样本平均数的抽样分布181920212223240.1.2.3P(X)X样本平均数的分布16个样本平均数_建立抽样分布(续)(不再是均匀分布)_第一个第二个观测值观测值182022241818192021201920212222202122232421222324BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-23该抽样分布的概括度量:建立抽样分布(续)211624191918NXμiX1.581621)-(2421)-(1921)-(18N)μX(σ2222XiXBasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-24比较总体分布与样本平均数的分布181920212223240.1.2.3P(X)X18202224ABCD0.1.2.3总体N=4P(X)X_1.58σ21μXX2.236σ21μ样本平均数分布n=2_BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-25样本平均数抽样分布:平均数的标准差同样总体相同容量的不同的样本导致不同的样本平均数样本与样本之间平均数的变动用平均数的标准差来度量:(这假设是有放回的抽样或者无限总体无放回的抽样)注意平均数的标准差随着样本容量增加而减少nσσXBasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-26样本平均数抽样分布:总体服从正态分布总体服从正态分布,平均数μ且标准差σ,抽样分布也服从正态分布且XμμXnσσXBasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-27平均数抽样分布的Z值抽样分布的Z值:其中:=样本平均数=总体平均数=总体标准差n=样本容量Xμσnσμ)X(σ)μX(ZXXXBasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-28总体正态分布抽样分布也正态分布(有同样的平均数)抽样分布特征(也就是说是无偏的)xxxμμxμxμBasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-29抽样分布特征随着n增加,减小较大的样本容量较小的样本容量x(续)xσμBasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-30确定包括固定比例的样本平均数的区间对于µ附近对称分布的包含95%的样本平均数区间当µ=368,σ=15且n=25.因为区间包含95%的样本平均数,5%的样本平均数将在区间之外因为区间是对称的,2.5%将大于上边界且2.5%将小于上边界。从标准正态分布表,2.5%(0.0250)低于其的Z值是-1.96且2.5%(0.0250)高于其的Z值是1.96。BasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-31确定包括固定比例的样本平均数的区间计算区间的下边界计算区间的上边界样本容量为25的所有样本平均数中的95%位于362.12和373.88之间12.3622515)96.1(368nZXLσμ(续)88.3732515)96.1(368nZXUσμBasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-32样本平均数抽样分布:总体非正态分布我们可以使用中心极限定理:即使总体非正态分布,…总体的样本平均数将近似正态分布只要样本容量足够的大.抽样分布的特征:且μμxnσσxBasicBusinessStatistics,11e©2009Prentice-Hall,Inc..Chap7-33n↑中心
本文标题:商务统计学Ch07
链接地址:https://www.777doc.com/doc-7518215 .html