您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 社会调查方法04抽样(二)
第二章抽样(二)概率抽样的各种方法简单随机抽样系统抽样分层抽样整群抽样第五节概率抽样概率抽样:总体内的所有个体具有相同的被抽入样本的机会。一.简单随机抽样(SimpleRandomSampling)1.特点简单随机抽样对总体中的所有个体按完全符合随机原则的特定方法抽取样本,即抽样时不进行任何分组,排列,使总体中的任何个体都同样有被抽取的平等机会。要保证抽样框的充分性,如果某些个体被漏掉,它们就丧失了进入样本的机会,就破坏了随机原则。2.方法总体较小时抓阄,抽签法如果要你从3000总体中抽取100个,用抽签法如何?总体较大时随机数字表随机数法的步骤:1.确定总体N,并编号(N的位数决定所有号码的位数,如N=1000,编号为0001,0002……1000)2.随意指出随即表上其中一个同位数码——起点(如0556)3.确定选择规则(上-下,左-右或其他规则),依次选择足够样本——规则一旦确定,就不变,碰到大于总体的随机数和重复的随机数,跳过(舍去)2.评价优点:概率抽样的理想类型,无偏见,简单易行,能对总体进行推断,误差小。缺点:1.需要为总体每个要素编号,当总体所含个体的数目太多时采用这种方法费时费力;2.总体内分类明显时,这种抽样无法按类别特征自动分配样本数,若想保证样本的代表性,必须增大样本量,使工作量增大二.系统抽样(SystematicSampling)(等距抽样)(一)直线等距抽样(抽样间距K为整数)1.将总量的所有个体按一定顺序排列。2.计算抽样间距。抽样间距是由总体数目与样本数目决定的。如果总体数为N,样本数为n,则抽样间距应是:NK=——n3.在1—K范围内,随机抽取一个起点数r4.自r开始,每隔K个单位抽取一个单位,依次抽取的单位号码为r,r+k,r+2k,r+(n-1)k特点:每一列被选中的概率相同(图)直线等距抽样练习题:某大学有12000名学生,欲了解其生活态度,决定采用系统抽样的方法从中抽查200名学生,用简单随机抽样的方法抽出第一名学生序号为12,请计算第十位,第十五位学生的序号是多少?(二)循环等距抽样(k不为整数)方法1.1.将总体N首尾相连,NK=——,取接近K的整数;2.随机起点r从1-N中随机抽取n方法2.调整直线等距抽样1.将K的小数点后移,便为整数[K]2.确定整数的随机起点[r],从10-[K]中选3.确定非整数的随机起点r,即将[r]的小数点移回来4.从r开始,每隔K各单位抽取一个单位5.再将所有抽取的号码的小数点略去特点:所有单位有相同的中选概率1/K(三)因总体单位排列不同导致的不同抽样1.无序抽样——总体按与调查项目无关的指标排列,如住户调查按照门牌号码抽评价:容易忽视总体已有信息(与简单随机抽样一样)2.有序抽样——总体按与调查项目有关的指标排列,如住户调查按照平均收入抽评价:样本单位容易偏大或偏小(三)因总体单位排列不同导致的不同抽样3.总体周期性排列----抽样间距K=周期倍数代表性最差相当于从总体中抽取了一个单位----抽样间距K=半周期倍数代表性不高相当于重复抽取高低不等值----抽样间距K≠(半)周期倍数代表性好总体中大部分指标值都能入选解决方法:1.掌握总体的周期排列,选择合适的抽样间距2.打乱总体排列的周期性或放弃系统抽样等距抽样与简单随机抽样相比,样本分布更为均匀,抽样误差更小注意:等距抽样是以总体的随机排列为前提的,如果总体的排列出现有规律的分布时,会使等距抽样产生极大的误差,降低样本的代表性等距抽样最适用于同质性较高的总体,当总体内个体类别之间的数目悬殊过大时,样本的代表性可能较差。在这种情况下应采用另一种分层抽样方法。系统抽样练习某杂志对其订阅者进行一次邮寄访问,以更好地了解读者市场。N=150万,n=1500。如何抽取样本?练习从编号1到900的总体中用系统抽样的办法抽取9个样本某产品共有2563件,产品按出厂顺序编号,号码从1到1563,检测员要从中抽取15件产品进行检测,请给出一个系统抽样方案。要考察某商场2006年的日销售额,从一年时间中抽取52天的销售额作为样本,请给出你的系统抽样方案,并说说你的抽样方案的优点和不足三.分层抽样(StratifiedSampling)1.分层抽样的内涵:分层抽样是将总体N依照某一种或某几种特征分为几个子总体(层),然后从每一层中采取简单随机抽样或等距抽样方式抽取一个个子样本n1,n2……将这些子样本合在一起即为总体样本n。★使用什么分层变量?一般是选择与调查目标变量高度相关的变量。★要协调层的数量和每层样本量★分层抽样适用于总体数目较多,异质,一个或多个变量可能影响调查结果的情况,且对所研究的总体有详细的名单。分层后,每层同质,层之间不同质,然后在每层按照比例抽。★●★■■▼■●●★■▼▼★★★★★●●●▼▼▼■■■■■■▼★★●分类随机抽样N10000N11800N23500N33000N41700n118n235n330n417n100总体层(互不重叠)子样本样本确定分层特征2.分层抽样的种类:划分标准:各层子样本容量的确定方式(一)按比例分层抽样按比例分层抽样要求:各子样本在总样本中所占比例=各层在总体中所占的比例——简单便利,常用(二)非比例分层抽样(最优分层抽样)根据其他因素(如各层平均数或标准差的大小等),调整各层样本的单位数。各子样本在总样本中所占比例≠各层在总体中所占的比例,不同层的单位入样的概率不同,是不等概率抽样。——对总体中规模太小的层作比较研究不等概率抽样的后期统计一般要做特殊处理。举例:20000户居民,按经济收入高低分类,高收入居民4000户,占总体20%;中等收入12000户,占总体60%;低收入户4000户,占总体20%,从中抽取200户,进行购买力调查。等比例分层抽样高收入层样本数:200×20%=40户中收入层样本数:200×60%=120户低收入层样本数:200×20%=40户非比例抽样(最佳抽样法)上例:各层样本标准差高收入300元,中收入200元,低收入100元。公式高收入层样本数目:200×1200000/4000000=60户中收入层样本数目:200×2400000/4000000=120户低收入层样本数目:200×400000/4000000=20户各层次(收入)各层的调查户数各层样本标准差乘积高40003001200000中120002002400000低40001001200000200004000000NiSi∑NiSini=n分层抽样的适用性1.当一个总体内部分层明显时,分层抽样能够克服简单随机样和等距抽样的缺点。2.分层抽样可以提高总体参数估计的精确度。3.有些研究不仅要了解总体的情况,而且还要了解某些类别的情况。4.便于行政管理。同一层可看作一个总体,因此每层可由专人进行管理。某高一学生共500人,经调查,喜欢数学的学生占全体学生的30%,不喜欢数学的人数占40%,介于两者之间的学生占30%。为了考察学生的其中考试的数学成绩,如何用分层抽样抽取一个容量为50的样本某公司有500人,其中35岁以下的125人,35-49的280人,50以上的95人。为了调查员工的身体健康情况,从中抽取100人,怎样用分层抽样抽?某大学食堂为了了解新生的饮食习惯,以分层抽样方式从1500名新生中抽取200人进行调查,新生中南方学生500人,北方学生800人,西部学生200人,如何抽?某市电视台在网上征集节目现场观众,报名的总人数12000人,来自4城区,东城区2400人,西城区4605人,南城区3795人,北城区1200人。用分层抽样抽取60人参加,如何抽?四.整群随机抽样(ClusterSampling)P31将总体按照某种标准分为i个群(互不重叠),每个群作为一个抽样单位,用随机的办法从中抽取若干群,将抽出的群中所有个体合在一起作为总体的样本。整群抽样与分层抽样有相似之处,第一步都是按某种标准将总体划分为一些子群。但是分层抽样是在所有子群中均抽取一个子样本,作为总体样本的一部分,而整群抽样是抽取若干子群,并将抽出的子群中全部个体作为样本,总体样本只分布在几个群中。所以整群抽样的分群标准要求群间异质性低,群内异质性高。适用于界定不清的总体。★●★■■▼■●●★■▼▼★★●▼★■★●■▼■★●▼■★●▼■划分子群随机抽样N5000R153R250R358R448R153R448R3352R9850n250总体群(互不重叠)子群样本确定分群特征R11047……R13045整群抽样评价优点:节省人力物力;可以在没有总体名单即抽样框的条件下进行,扩大抽样的范围。缺点:样本的代表性较差,与其他方法比,在样本数量相同的情况下,抽样误差比较大。比较分层抽样和整群抽样分层抽样整群抽样样本每层均要选取子样本作为总样本的一部分只选择某几个子群作为整体的代表层与层的关系层的划分具有较高的代表性,即层之间异质性高群间异质性低层内性质层内则尽可能同质群内异质性高变量选择研究变量的选择与研究问题高度相关研究变量与研究问题相关思考和讨论对北京市现住人口进行调查,由于流动人口的不确定性,很难得到现住人口的住户清单。1.在这种条件下应该采取那种概率抽样方法?2.大概的思路应该如何?练习调查城市居民的情况,拟抽取1000样本。该城市有500个居委会,每个居委会平均有100户居民。利用整群抽样如何操作?五.多阶段抽样(MultistageSamlping)在整群抽样中,当子群数和子群内部个体数目较多,而彼此间的差异性不太大时,常常采用更加经济的方法,既不将样本子群中的所有个体作为样本,而是再从中用随机抽样的方法抽出最终样本。因最终样本的获取经过两次抽样,我们称之为二阶段抽样,同样地可进行三阶段,四阶段,即多阶段的抽样。通常在第一阶段使用严格的随机抽样方法,第二阶段起使用概率比例抽样,即根据每一群所含个体的多少分配样本额。•某市23个区,714万人,从中抽1000人的样本•将区作为初级抽样单位•每区人数不等,把每区人数的号码范围列出,东区是1-120000号,西区是120001-270000号……一直排到7140000号•从这些号码中用随机数字表确定10个号码,这10个号码所落入的区即为调查区。如抽中340000号,它落在南区,则南区为调查区•从这10个调查区中,每区再随机抽取100人就构成最终样本多阶段抽样举例多阶段抽样优点:不需要总体的全部名单适用:调查范围大,单位多,情况复杂的调查对象缺点:在每一阶段抽样都会产生误差多阶段抽样要注意平衡类别和个体举例:某市2.4万教师,分布在10个区200所学校,要抽1200教师组成样本。三阶段抽样第一阶段第二阶段第三阶段方案1抽10个区抽4所学校每所学校抽30教师方案2抽2个区抽20所学校每所学校抽30教师方案3抽10个区抽20所学校每所学校抽6教师方案4抽8个区抽15所学校每所学校抽10教师方案5抽5个区抽12所学校每所学校抽20教师方案6抽4个区抽10所学校每所学校抽40教师方案7抽3个区抽10所学校每所学校抽40教师方案8抽2个区抽10所学校每所学校抽60教师方案9抽1个区抽12所学校每所学校抽100教师选择—标准1.各个抽样阶段子总体的同质性程度同质性程度高—样本规模小2.人力和经费,方案9最节约3.样本误差一般,样本覆盖面越大,代表性越高——增加开头阶段的样本数,适当减少最后阶段的样本数,减少误差户内抽样within-household一、户内抽样——以家庭为单位时,从入选家庭中抽取一个成年人构成访谈对象的抽样方法。(一)方法:科什选择法(kish)第六节样本规模样本规模:样本容量,样本中所含个体的多少适当样本规模:既能有比较好的代表性,还考虑成本。统计学与社会调查的样本统计学中通常以30为界,把样本分为大样本和小样本,之所以这样区分,是因为当样本规模大于30时,其平均值的分布将接近于正态分布,从而许多统计学的公式就可以运用,也可以用样本
本文标题:社会调查方法04抽样(二)
链接地址:https://www.777doc.com/doc-3148115 .html