您好,欢迎访问三七文档
第七章整群抽样由Nordri®()设计提供LOGO本章要点对于整群抽样,本章给出了群大小相等和群大小不等的整群抽样方法及与之匹配的估计量、估计量的方差及方差的估计量。•具体要求:•掌握群大小相等情形对群进行简单随机抽样简单估计量的无偏性、方差及方差的无偏估计,掌握群的划分原则;了解群内方差、群间方差概念及其对整群抽样精度的影响。•掌握群大小不等情形与简单随机抽样相匹配的简单估计量、比率估计量及与抽样相匹配的汉森-赫维茨估计量及性质。•掌握估计总体比例的整群抽样方法及简单估计量、比率估计量。由Nordri®()设计提供LOGO第一节抽样方式一、整群抽样及其实施理由•定义:设总体由A个初级抽样单位组成,在总体中按某种方法抽取a个初级抽样单位,如果对被抽中初级抽样单位的次级单位不再进行抽样观测而是全部进行调查,则称此抽样方法为整群抽样(clustersampling),初级抽样单位称为群。将总体划分为若干群,以群为抽样单位,对群中的所有单位进行调查。一级抽样单位二级抽样单位由Nordri®()设计提供LOGO第一节抽样方式•实施理由:①缺少调查单位的必要信息无法对其直接编制抽样框实施概率抽样,而由调查单位组成的群是现成的或者群很容易划分从而编制群抽样框非常容易时,常采用整群抽样。②使调查实施便利、节省费用而采用整群抽样。③对某些由特殊结构的群组成的总体实施整群抽样能使精度有较大提高。由Nordri®()设计提供LOGO第一节抽样方式二、整群抽样的特点•调查精度:整群抽样估计量的精度(估计量方差)与群的划分有直接关系。•调查费用:整群抽样调查单位相对集中,平均单位调查费用较少,因此可以通过适当扩大群样本量以提高整群抽样的精度,同时使调查费用仍比较省。由Nordri®()设计提供LOGO第一节抽样方式三、群的划分原则一般群是自然形成的,或者是现有的单位。当群需通过划分确定时需考虑两个问题:•一是如何定义群的组成;(基本出发点是群的组成应有利于整群样本估计量精度尽可能高)•二是如何确定群的规模。(群的规模的选择取决于精度与费用之间的平衡)由Nordri®()设计提供LOGO第二节群大小相等的整群抽样一、符号说明总体由A个群组成,从中随机抽取a个群,对抽中群的所有单位全部调查。A:总体群数a:样本群数Yij:总体第i群的第j单位调查标志值yij:样本中第i群的第j单位调查标志值Mi:第i群规模(单位个数)本节中,M1=M2=……=MN=M由Nordri®()设计提供LOGO第二节群大小相等的整群抽样一、符号说明总体第i群总值及均值:样本第i群总值及均值:总体总值及按群平均的总体均值:样本总值及按群平均的样本均值:11MiiijjYYYMM1MiijjYY1Miijjyy11MiijijyyyMM11AiiYYYAA111YAAMiijiijYY11aiiyyyaa111aaMiijiijyyy由Nordri®()设计提供LOGO第二节群大小相等的整群抽样一、符号说明按调查单位平均的总体均值:按调查单位平均的样本均值:总体方差:总体群间方差:总体群内方差:总体第i群群内方差:11111AMAiijijiYYYYYAMAMAM11111aMaijiijiyyyyyaMaMaM22111()1AMijijSYYAM221()1AibiMSYYA2211()1MiiijjSYYM22211111()(1)AAMiwiijiijSSYYAAM由Nordri®()设计提供LOGO第二节群大小相等的整群抽样一、符号说明样本方差:样本群间方差:样本群内方差:样本第i群群内方差:22111()1aMijijsyyaM221()1abiiMsyya2211()1MiijijsyyM22211111()(1)aaMwiijiiijssyyaaM由Nordri®()设计提供LOGO第二节群大小相等的整群抽样二、估计量及其性质•总体均值的无偏估计:•方差:•方差的无偏估计:Y11111aMaijiijiyyyyyaMaMaM21()bfVySaM21()bfvysaM由Nordri®()设计提供LOGO第二节群大小相等的整群抽样二、估计量及其性质•总体总值Y的无偏估计:•方差:•方差的无偏估计:ˆYAMy22(1)ˆ()bAMfVYSa22(1)ˆ()bAMfvYsa由Nordri®()设计提供LOGO第二节群大小相等的整群抽样【例7.1】某居民小区共有600个单元,每个单元均居住10户。现以单元为群进行整群抽样,随机抽取15个单元,调查每户每周食品支出费用,调查结果及各单元样本均值和标准差如表7-1所示。试求该居民小区平均每户每周食品支出费用并给出其置信水平为95%的置信区间。由Nordri®()设计提供LOGO第二节群大小相等的整群抽样三、整群抽样效果分析及群的划分原则当直接对调查单位进行简单随机抽样时,有:在相同的调查单位样本量aM下,只有当群间方差比总体方差小时整群抽样才优于简单随机抽样。21()fVySaM220,bSS220,bSS221()()()bfVyVySSaM220,bSS2bS2S由Nordri®()设计提供LOGO第二节群大小相等的整群抽样总体方差分解:对于固定的总体,是常数,故当群内方差增大(或减小)时,群间方差必然减小(或增大)。群的划分原则:使群内差异尽可能大,群间差异尽可能小。222111111()[()()]11AMAMiiijijijijSYYYYYYAMAM2222111()()(1)(1)11AMAiiijijiwbYYMYYAMSASAMAM2bS2S2wS由Nordri®()设计提供LOGO第二节群大小相等的整群抽样四、群内相关系数与设计效应•群内相关系数定义:•分子:•分母:•经计算可以得到:2()()()ijikijEYYYYEYY1()()(1)2AMijikijkYYYYAMM212()1AMijijkYYAMSAMMN122()()(1)(1)AMijikijkYYYYAMMS由Nordri®()设计提供LOGO第二节群大小相等的整群抽样•变形:①当群内方差时,为极大值;②当群内方差与群间方差相等,即时,;(分群过程完全随机,为简单随机抽样)③当群间方差时,,为极小值,此时各群的均值都相等。•的取值范围是:•的样本估计是:222(1)(1)(1)(1)bMASAMSAMMS20wS1022wbSS20bS11M1,11M2222(1)bwbwssrsMs由Nordri®()设计提供LOGO第二节群大小相等的整群抽样•的方差用群内相关系数近似表示:•表明:整群抽样估计量精度与群内相关系数有密切关系,越大即群内调查单位之间相似程度越大,群内差异越小,估计量方差就越大。()()222(1)()11(1)1111-fAMVySMaMAfSMaMrr-轾=+-臌--轾?-臌yr由Nordri®()设计提供LOGO第二节群大小相等的整群抽样•若按简单随机抽样直接从总体中抽取aM个调查单位,则样本均值的方差为:•整群抽样的设计效应为:•表明:按调查单位的相同样本量,整群抽样的方差为简单随机抽样的方差的倍。21()srsfVySaM()1(1)()srsVydeffMVy1(1)M由Nordri®()设计提供LOGO第三节群大小不等的整群抽样一、符号说明总体由A个群组成,第i群含Mi个调查单位A:总体群数a:样本群数Yij:总体第i群的第j单位调查标志值yij:样本中第i群的第j单位调查标志值Mi:第i群规模(单位个数)M0:总体包含调查单位总数01AiiMM由Nordri®()设计提供LOGO第三节群大小不等的整群抽样一、符号说明总体第i群总值及均值:样本第i群总值及均值:总体总值及按群平均的总体均值:样本总值及按群平均的样本均值:11AiiYYYAA11aiiyyyaa1iMiijjYY11iMiiijjiiYYYMM111iMAAiijiijYYY1imiijjyy11imiijijiiyyymm111imaaiijiijyyy由Nordri®()设计提供LOGO第三节群大小不等的整群抽样一、符号说明按调查单位平均的总体均值:按调查单位平均的样本均值:110001AAiiiiiMYYYYMMM11aiiyya由Nordri®()设计提供LOGO第三节群大小不等的整群抽样二、按简单随机抽样抽群,采用简单估计量•总体总值Y的无偏估计:•方差:•方差的无偏估计:1ˆaiiAYyAya221()(1)ˆ()1AiiYYAfVYaA221()(1)ˆ()1aiiyyAfvYaa由Nordri®()设计提供LOGO第三节群大小不等的整群抽样•总体均值的无偏估计:,其中•方差:•方差的无偏估计:•及Y的简单估计量的方差主要取决于群总值之间的差异。•在实际问题中常有各个群规模差异很大,而群的均值之间差异很小,则群总值之间必然差异较大,此时简单估计量的精度很低。Y00ˆˆYAyyYMMM21220()ˆˆ()1()1AiiYYVYfVYMaMA0MMA21220()ˆˆ()1()1aiiyyvYfvYMaMaY由Nordri®()设计提供LOGO第三节群大小不等的整群抽样三、按简单随机抽样抽群,采用比率估计量•的比率估计量:(有偏)•方差:•方差的样本估计:11ˆaiiRaiiyYmY2221122()()ˆ11()11AAiiiiiiRYYMMYYffVYaMAaMA212ˆ()ˆ1()1aiRiiRyYmfvYama2222111ˆˆ1(2)(1)aaaiRiRiiiiifyYmYymaam11aiimma11AiiMMA由Nordri®()设计提供LOGO第三节群大小不等的整群抽样•Y的比率估计量:•方差:•方差的样本估计:•及Y的比率估计量的方差主要取决于群均值之间的差异。•在多数实际问题中,群均值之间的差异不是很大,即Yi与Mi之间大致有正比例关系,此时比率估计量的精度较高。1001ˆˆai
本文标题:第七章 整群抽样
链接地址:https://www.777doc.com/doc-3208453 .html