您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 抽样调查-第2章简单随机抽样
返回§2.1定义与符号一、定义简单随机抽样:从含有N个单元的总体中随机抽取n个单元组成样本。1.若抽样是放回的,则所有可能的样本有nN个,每个样本被抽中的概率为,这种抽样方法称为放回简单随机抽样。nN1nNC2.若抽样是不放回的,则所有可能的样本有个,每个样本被抽中的概率为nNC1,这种抽样方法称为不放回简单随机抽样。返回1.简单随机抽样是等概抽样,即每个总体单元都有相同的入样概率;2.随机抽取是有严格要求的,不是随便抽取,必须按照某一随机原则进行。注意返回【例2.1】设总体有5个单元(1,2,3,4,5),按放回简单随机抽样的方式抽2个单元,则所有可能的样本为2552个(考虑样本单元的顺序)1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,5(放回简单随机抽样所有可能的样本)返回【例2.2】设总体有5个单元(1,2,3,4,5),按不放回简单随机抽样的方式抽2个单元,则所有可1,21,31,41,52,32,42,53,43,54,5(不放回简单随机抽样所有可能的样本)能的样本为个。10nNC在实际工作中,更多地采用不放回简单随机抽样,所以以下讨论的简单随机抽样一般都指不放回简单随机抽样.返回二、符号大写字母表示总体单元的标志值:如小写字母表示样本单元的标志值:如NYYY,,,21nyyy,,,21调查的总体目标量主要有:总体总量Y;总体均值Y;总体某一指标的比例P;两个总体总量的比率R。对估计精度进行计算时,要涉及到总体方差和样本方差等。下面分别列出:返回总体方差样本方差NiiYYNS122)(11niiyyns122)(11还有一些其他符号,分别说明如下:返回总体NNiiYYYYY211NYYYYNYNNii2111NiiYNNAP11(10或iY)XYXYXYRNiiNii11,NiiYYNS122)(1121NN样本将左边式子中的大写字母改为小写字母。返回总体指标值上面带符号“”的表示由样本得到的总体指标的估计。如RPYY,,,称为RPYY,,,的估计。估计量的方差用V表示,如);(YV标准差用S表示,如).()(YVYS对)(YV的样本估计不用)(YV而用)(Yv.)()()(表示的估计用YvYsYS称Nn为抽样比,记为f.返回§2.2简单估计量及其性质无论调查对象是何种总体参数,其实所有估计量通常都是样本均值的某种线性组合,因此在抽样中不管讨论何种估计的基本性质,都只围绕样本均值进行。而对样本均值这个核心估计量的研究则分为两个方面:一方面是求样本均值对所有可能样本的数学期望(检验估计量是否无偏)。另一方面是求样本均值对所有可能样本的方差(检验估计量误差的大小)。返回为了讨论简单估计的性质,首先我们来看两个引理:引理一从大小为N的总体中抽取一个样本量为n的简单随机样本,则总体中每个特定单元的入样概率为:两个特定单元都入样的概率为:Nn1122NnNnCCnNnN返回NnCCnNnN/112222nNCCjY)1()1(/2222NNnnCCCnNnNnNCnNCiY引理一的证明:在N个单元中取n个单元为样本,共有个样本。在个样本中,包含某个特定单元的样本数为:每个样本被抽中的概率为:。1111nNCCiY同时包含两个特定单元的样本数为每个样本被抽中的概率为:返回引理二从总体规模为N的总体中抽取一个样本量为n的简单随机样本。若对总体中的每个单元,引进随机变量如下:iYia),,2,10,1NiYYaiii不入样(,若入样若由二项分布可知:返回1)1()1()1()()()(),cov()1()1()0()1()]([)()1()1()1()1(1(0)1()1(1)()1(01)(2222NfffNNnnaEaEaaEaaffNnfNnfaEaEaVNNnnNNnnNNnnaaEfNnNnaEjijijiiiijii)1()1(1}0{,)1()1(}1{1}0{,}1{NNnnaaPNNnnaaPNnaPNnaPjijiii所以,不难推出:返回简单估计量的性质YyE)(是性质1Y的无偏估计,即y下面我们用两种与数理统计中不同的方法来证明这一性质。思考:为什么不能用数理统计中常用的方法?返回有了这些准备,我们很容易证明YyE)(YYNnnNnYnaEYnyEYanynyNiiNiiiNiiNiiinii111111)(1)(1)(11根据前面提到的关于的定义,有下式ia返回第二种方法证明YyE)(证明:对于一个大小为N的总体,样本量为n的简单随机样本有nNC个,因此返回NiiNnNnNnNnNiiCiinNnCinNYYNYCYCYCnnCYYYnCyyynCyEnnNnN11121111112111)]([1)(1)(11)(21返回其他几个估计量的无偏性可容易推出:1、对于总体总量YYNyNEYEyNY)()(,2、对于总体比例PpEPEpP)()(,返回y性质2对于简单随机抽样,的方差为:式中,n为样本量;f=Nn为抽样比;1-f为有限总体校正系数。V(y)=221SnfSNnnN(2.5)返回证明方法一])1([)1(1])(111[1)(112)[1(1]}1)1([2)1({1)],cov(2)([1]1[]1[)(2112211212212212211NiiNiiNiiNiiNjijiNiijNjiiNiijijNjiiiNiiNiiiniiYNNYNnfYNYNNnNfYYNYfNnnNfNnYYfNnYnaaYYaVYnYanVynVyV返回)1()()1(1)()1(1][)1(1221122212fnSYYNnfYYNnfYNYNnfNiiNiiNii即21)(SnfyV返回证明方法二:由定义212212)]([1)1()()(YyEnYynEYyEyVniinii)])(([1])([12212YyYyEnYyEnjjiinii2121)(])([YYNnYyEniinii而))(()1()1()])(([YYYYNNnnYyYyEjjiijjii返回因此有)])(([1])([1)(2212YyYyEnYyEnyVjjiinii))(()1()1(1)(12212YYYYNNnnnYYNnnjjiinii))(()1()1(1)(1221YYYYNnnYYnNjjiiNii])(11)(112121YYNnYYNnNiiNii返回NiNiiiYYNnYYNnnN1122)]([11)()111(121)(11YYNnNnNNii221)(111SnNnNYYNNnNnNii21)(SnfyV即返回性质3V(y)的无偏估计为:21snf2s式中,为样本方差。)(yv212)(11yynsnii])()([11221YynYynnii证明:将改写成:2s返回由前面性质1证明用过的对称论证法有:由性质2有:22121)1()(])([SNNnYYNnYyENiinii2221)(SnNnNSnfYyE返回})(])([{11)(2212YynEYyEnsEnii])1([1122SnNnNnSNNnn22)]()1([)1(SnNNnnNS返回下面我们从关系式21)(SnfyV可以推出其他几个估计量的方差)1(111)()(1)()()(222PNPnnfpVPVSnfNyVNyNVYV返回总体总量的估计量方差是总体均值方差的直接推导,下面我们来推导总体比例估计量的方差。即可。(只需证明此时)111)1(111)(2PNPNSPNPNnfPV返回设N个样本单元中有N1个具有某一特性,即有N1个单元取值为1,有N-N1个单元取值为0.]))(()1([112112112NNNNNNNNSNNNNNNNNNNNN11111)(11)1(11PNPN返回同理对样本方差有)1(11pnpns)1(111)(PNPNnfPV因此返回)1(11)1(111)()(1)()(22ppnfpnpnnfpvPvsnfNyNvYv同样下面我们从关系式21)(snfyv可以推出返回估计量的方差是衡量估计量精度的度量。)(yV从式可以看出,影响估计量方差的因素有:21)(SnfyV①样本量n;③总体未入样比率1-f;2S②总体方差分析见教材P38,39返回N通常很大,当f0.05时,可将1-f近似取为1,这时影响估计量方差的主要因素是样本量n和总体方差。的大小是我们无法改变的,因此,要提高估计量的精度就只有加大样本量。2S2S注意返回【例2.3】我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,要估计总体平均水平并给出置信度95%的置信区间。序号i1234567891045204661508iy解:依题意,N=100,n=10,f=1.010010样本均值为:5105011niiyny返回样本方差为:111.199172)(11212yynsnii因此,总体平均值的估计为:5yYy的方差为:y的方标准差为:s.3115.1)()(YvY的置信度95%的置信区间为:)(.2YszyY即[2.4295,7.5705].72.1111.19101.0112snf)(Yv返回niiyny11,的无偏估计是Yy。其方差为:V(22111)nsnNNy的无偏估计为)(yV21)(snyv放回简单随机抽样简单估计量返回注意:不放回时的方差为放回时的约1-f倍,而1-f1,因此不放回抽样的估计精度比放回抽样的估计精度高。返回【例2.4】我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,要估计总体总量并给出在置信度95%的条件下,估计量的相对误差。序号i1234567891045204661508iY解依题意,N=100,由例2.3可知:1111.19,52sy,因此,对总体总量的估计为:Y=100×5=500。返回对V(Y)的样本估计为:17201111.19101.01100)(2Yv0其标准差为:1488.131)()(Yvys因此,在置信度95%的条件下(对应的t=1.96),Y的相对误差为:5141.05001488.13196.1)(YYst=51.41%返回【例2.5】解:已知n=200,a=130,1-f≈1%65200130nap某超市开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。该超市与附近几个小区居委会取得联系,在整体中按简单随机机样,抽取了一个大小为n=200人的样本。调查发现对该超市购物环境表示满意或基本满意的居民有130位,要估计对该超市购物环境持肯定态度居民的比例,并在置信度95%条件下,给出估计的绝对误差和置信区间
本文标题:抽样调查-第2章简单随机抽样
链接地址:https://www.777doc.com/doc-418861 .html