您好,欢迎访问三七文档
武汉科技学院工商学院《统计学》PPT第七章统计指数教学目的要求:通过学习,掌握抽样推断的基本原理,熟练运用误差公式进行抽样估计,并能结合实际加以灵活应用。重难点:重点是抽样误差的计算原理、区间估计及简单随机抽样的基本原理;难点是抽样误差的基本原理。计划讲授课时:8学时.本章主要内容抽样调查的一般问题总体指标的推断必要抽样数目的确定抽样误差第一节抽样调查的一般问题本节主要介绍了抽样调查概念、优点、作用、组织方式等基本理论问题。重点掌握抽样调查的概念、优点及其组织方式.一、抽样调查的概念与作用(一)抽样调查的概念所谓抽样调查是指从总体中按随机原则抽取一部分单位构成样本进行观测,然后根据这一部分单位的资料推断总体数量特征的一种方法.(二)抽样调查的特点1.按照随机原则抽取样本单位;2.抽样调查建立在随机抽样的基础上;3.抽样调查的目的就是由样本指标推断总体指标;4.抽样调查结论存在抽样误差,但可以事先计算和加以控制.(三)抽样调查的优点抽样调查的优点节省费用时效性强实用性强准确度高(四)抽样调查的作用用于不可能进行全面调查的无限总体;用于不可能进行全面调查而又需要了解其全面情况的现象;用于不必要进行全面调查的现象;用于对全面调查资料的评价与修正;用于工业生产过程的控制,等等。上述作用也可以说是抽样调查的应用范围.(五)抽样调查的理论基础1.大数法则:是关于大量的随机现象具有某种稳定性质的法则。它论证了样本平均数趋近于总体平均数的趋势,从而为抽样推断提供了重要的理论依据。2.中心极限定理:是关于研究变量和的分布序列的极限定理。它论证了在大样本的情况下,抽样误差服从于正态分布,从而为抽样误差的概率估计提供了理论基础及使用的方便。(注意:本部分内容重在逻辑思维上的理解即可,深层次的内容可参看有关数理统计方面的书籍).二、抽样调查中的几个基本概念(一)总体与样本1.总体:指要调查研究对象的全体,通常称为全及总体或母体。2.样本:指在全及总体中按随机原则抽取的那部分单位所构成的集合体,通常称为抽样总体或样本总体或子体.(二)总体指标与样本指标1.总体指标:指根据全及总体各单位标志值计算的有关综合指标。由于全及总体是唯一确定的,故根据全及总体计算的总体指标也是唯一确定的。常用的总体指标有总体单位数、平均数、成数、标准差及方差等,常用各种大写符号表示。2.样本指标:是根据抽样总体各单位标志值计算的综合指标。由于从一个全及总体中可以抽取许多个不同的样本,故样本指标是一个不确定的随机变量。常用的样本指标有样本单位数、平均数、成数、标准差及方差等,常用小写符号表示.关于成数P的有关概念及计算问题在抽样调查中,成数是针对交替(或是非)标志而言的。所谓交替标志,是指只有两种可能结果的标志(是否,或是非)。如性别要么是男性,要么是女性;再如考试成绩要么及格,要么是不及格,等等。所谓成数,就是指交替标志中具有某种特征的单位数占全部总体单位数的比重.(1)成数的平均数下面以以总体成数为例说明。设:N表示总体单位数;0表示不具有某种特征;1表示具有某种特征。则:0N表示不具有某种特征的单位数;1N表示具有某种特征的单位数;NNN10显然有:QPQPNNQNNP1;1:;01故则:NNPQPPQfxfx110则成数的平均数为:即,成数就是指总体中具有某种特征的单位数占全部总体单位数的比重。(2)成数的标准差xfxf01QP0Q1P0-P1-P=Q合计P+Qp——xx2)(xxfxx2)(2P2QQP2PQ2PQQP22则:)1()(22PPPQQPQPPQQPPQQPP故:)1(2PPP各种抽样基本公式一览表;)1(:)(;)(:)1(:)(;)(::;::22222221PQPPFFXXNXXPQPPFFXXNXXNNPFXFXNXXNpxxpxx成数的方差平均数的方差成数的标准差平均数的标准差成数平均数单位数全及总体pqppSffxxSnxxSpqppSffxxSnxxSnnpfxfxnxxnpxxpxx)1()(;)()1()(;)(;22222221样本总体(三)重复抽样与不重复抽样1.重复抽样:是指把从总体中抽中的单位,经登记调查后,再将其放回去,重新参加下一次的抽选,直到抽取n个总体单位。又称为重置抽样或有放回抽样。显然,采用此方法抽取样本时,某个总体单位有重复抽中的可能,故其名。2.不重复抽样:是指把从总体中抽中的单位,经调查登记后,不再放回去参加下一次的抽选,直到抽取n个总体单位。显然,采用此法抽取样本时,某个总体单位不可能被重复抽中,故其名。(四)考虑顺序与不考虑顺序1.考虑顺序:指抽取样本单位时,要考虑抽中单位出现的先后顺序,如AB与BA是两种不同的抽样组合。2.不考虑顺序:指抽取样本单位时,不考虑抽中单位出现的先后顺序,如AB与BA只算一种可能的样本组合。注意:由于在社会经济统计中,抽中的样本单位的先后顺序,对所研究现象的数量计算结果没有影响,故通常采用不考虑顺序的抽样方法,而考虑顺序的抽样方法则在自然科学研究中采用较多。考虑顺序与不考虑顺序抽样所得到的样本组合是不同的。各种抽样方法下可能的样本组合计算公式!)!(!:)!(!:1nnNNCCDnNNANBnNnnNnNnNnnN不考虑顺序考虑顺序不重复抽样重复抽样(五)单阶段抽样与多阶段抽样所谓单阶段抽样是指某次抽样时一次就抽出样本单位的抽样。所谓多阶段抽样是指需经两次或两次以上的抽样,最后才抽样具体样本单位的抽样。如我国职工家计抽样调查采用省抽→县市→区(街)→居民家庭户三阶段抽样技术.三、抽样调查的组织方式(一)简单随机抽样1、简单随机抽样的概念和特点(1)概念:是从总体全部单位中不加任何排队或分类,完全按照随机原则抽取样本单位进行调查的方式。也叫做单纯随机抽样或纯随机抽样。(2)基本特点:按随机原则的定义直接从总体中抽取样本单位.(3)适用条件:简单随机抽样适宜于总体单位数不多且各单位之间差异不大时使用。(4)优缺点:简单随机抽样优点是最符合随机抽样原则;不足是编号做签的工作量较大,总体单位数较多时无法使用且误差往往较大.2、简单随机抽样抽取样本单位的方法简单随机抽样抽取样本单位的具体方法主要有:(1)抽签法(抓阄法)。具体作法是:当给总体各个单位编号后,把号码写在结构均匀的签(如同等大小的纸片等)上,将签混合均匀后即可以从中抽取。抽签法简便易行,然而对于较大的总体来说,编号、做签条的工作量很大,且不易做到混合均匀。因此,抽签法的应用有一定的局限性.(2)机械摇号法它是先对全部总体单位编号,然后再利用某种特制的机械,通过机械震动产生需要抽取调查样本单位号码的方法。此法抽取的样本单位随机性高,但购置设备的费用较高,只适宜于经常开展抽样调查的单位使用.(3)随机数字表法所谓随机数字,就是指用某种机械方法或电子计算机产生的数字序列,数中的0,1,2,…,9这10个数字出现的机会是等概率的,但排列顺序则是随机的。将随机产生的数字用表格的形式表现出来,就是随机数字表。所谓随机数字表法,就是利用随机数字表随机抽取样本单位的方法。有关随机数字表法的具体内容,详见教材(略).(二)类型抽样1、类型抽样的概念和特点(1)概念:是先将总体中所有单位按某一标志分成若干组(或类),然后再在各组中随机抽取样本单位的方式。(2)基本特点:先分组,再在各组中随机抽取样本单位。(3)适用条件:适宜于总体单位多、情况复杂、差异较大时使用。(4)优缺点:优点是样本代表性较高、误差较小;不足是误差的计算较麻烦.2、抽取样本单位的具体方法由于类型抽样是在分组后从各组中抽取样本单位,因此,类型抽样条件下抽取样本单位主要问题是,在总的样本容量确定后,样本数目如何在各个组之间分配的问题。类型抽样中,常用以下两种方法确定各层间样本单位的分配比例。(1)等比例抽样:即各组按相同的比例抽取样本单位。(2)不等比例抽样:即各组抽取样本单位的比例不完全相同。(三)等距抽样1、等距抽样的概念和特点(1)概念:是指先按有关或无关标志将总体单位按一定顺序排列,然后再按相等的距离或间隔抽取样本单位的方式,又叫机械抽样。(2)基本特点:先排队,再等距抽选样本。具体特点有二:一是抽取样本单位的方法简便易行;二是估计量的方差小,样本的代表性较高。(3)适用条件:适用面广,特别适宜于连续、大批量生产的现象的调查。(4)优缺点:优点是通常能保证样本均匀分布,减少误差,提高样本的代表性;不足是有时可能有系统(周期)性误差.2、抽取样本单位的具体方法只有不重复抽样方法。关键是第一个样本单位的抽选。先按N/n=K求出抽样间隔;再在第一组中按简单随机抽样的方法,抽出第一个样本单位;然后再按抽样间隔K随之确定其余样本单位。具体又可分为两种:(1)按有关标志排队的等距抽样;(2)按无关标志排队的等距抽样.(四)整群抽样1、整群抽样的概念和特点(1)概念:是先将总体全部单位划分为若干群(组),然后以群为单位随机抽取若干群,对抽中群内的所有单位全部进行调查的方式。(2)基本特点:先分群,再以群为单位抽取样本。(3)适用条件:适宜于群内差异较小而群与群之间差异较大现象的调查。(4)优缺点:优点是抽样组织工作较方便;不足是有时误差较大,样本代表性较低.2、抽取样本单位的具体方法在整群抽样中,为避免抽样误差过大,一般采用不重复抽样的方法;抽选群的方法与简单随机抽样相同.第二节抽样误差抽样理论是在研究误差的基础上逐步发展和完善起来的,误差理论是抽样理论的核心。本节介绍了抽样误差的概念、影响因素、抽样平均误差的概念及其计算原理。重点掌握简单随机抽样方式下抽样平均误差的计算方法.一、抽样误差的概念抽样误差是指随机抽样所得的样本指标与总体指标的随机误差。偏差随机误差抽样平均误差抽样误差抽样极限误差登记误差代表误差抽样实际误差(一)登记性误差与代表性误差所谓登记性误差,又称为调查误差或工作误差,它是指调查人员在调查过程中,由于工作不认真(如粗心大意抄错、写错、写漏等)或计量工具不准确而形成的调查结果与实际结果之间的差别。这种误差是可以尽量加以克服或避免的。所谓代表性误差,是指根据部分(少数)单位调查的结果去代表(或推断)全部单位的数量特征时,两者之间的差别。这种误差通常是不可避免的.(二)偏差与随机误差所谓偏差,是指在随机抽样中调查人员(有意识地)破坏了随机原则抽样(即不按随机原则抽样),由此形成的样本指标与总体指标之间的差别。在抽样调查中,通常所说的抽样误差是不包括偏差的,又称为系统性误差。所谓随机误差,是指由于随机抽样的随机性由此而形成的样本指标与总体指标之间的差别,通常也叫做抽样误差.(三)抽样误差所谓抽样误差,就是指在随机抽样中按随机原则从总体中抽取一部分单位构成样本,并计算出有关样本指标(如样本平均数或成数),再通过样本指标去推断总体有关指标(如总体平均数或成数)时两者之间存在着的差别。简而言之,抽样误差就是样本指标与总体指标之间的差别。抽样误差是抽样调查不可避免的误差。因为部分单位与全部单位的数量特征通常是不可能完全一致的.(四)抽样实际误差所谓抽样实际误差,是指在对某现象实际进行抽样时,其样本指标与总体指标之间的差别。如对某校大学生随机抽取100人进行身高调查,得知这100人的平均身高为168公分;又知该校全部大学生的平均身高为169公分,两者之间相差1公分,这就是抽样实际误差。抽样实际误差实际上是未知的。因为总体指标通常是未知的,如果总体指标已知,也就没有必要进行抽样调查了!.二、抽样平均误差1.抽样平均误差的概念:是指所有可能的样本的样本指标与总体指标之间的平均误差(标准差)。2.抽样平均
本文标题:7第七章 抽样调查
链接地址:https://www.777doc.com/doc-417215 .html