您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 简单随机抽样97347143
02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第三章简单随机抽样2本章要点简单随机抽样是抽样中最基本、最成熟、也是最简单的抽样设计方式,是所有概率抽样方法发展、比较的基础。①要求通过学习熟练掌握简单随机抽样的抽样方式和样本抽选方法;②熟知总体均值、总体总值和总体比例的简单估计;③掌握样本量的确定;了解子总体的估计。3第一节抽样方式4简单随机抽样也称纯随机抽样。对于大小为的总体,抽取样本量为的样本,若全部可能的样本被抽中的概率都相等,则称这样的抽样为简单随机抽样。根据抽样单位是否放回可分为放回简单随机抽样和不放回简单随机抽样。(一)放回简单随机抽样(二)不放回简单随机抽样(三)不放回与放回简单随机抽样的比较一、什么是简单随机抽样5(一)放回简单随机抽样如果抽样是有放回的,那么每次抽取都都是从个总体单位中抽取,这时可能的样本为个(考虑样本单位的顺序)或个(不考虑样本单位的顺序),每个样本被抽中的概率为或,这种抽样方式就是放回简单随机抽样,所得的样本称为放回的简单随机样本。考虑与不考虑样本单位顺序的放回简单随机抽样,有一个共同的特点,即同一个单位有可能在同一个样本中重复出现。但是他们也有明显的区别:一是可能的样本数不同;二是样本的概率分布不同,由此会导致估计量的概率分布不同。NnNnnNC1nN1nnNC116可以证明,不考虑顺序的放回简单随机抽样的估计量的方差大于等于考虑顺序的放回简单随机抽样的估计量的方差,因此在抽样实践中,若用到放回简单随机抽样这种方式,也只讨论和使用考虑顺序的情形。7(二)不放回简单随机抽样如果抽样是无放回的,即同一个单位不能在样本中重复出现,那么,若考虑样本单位的顺序,则可能的样本为个,每个样本被抽中的概率为;若不考虑样本单位的顺序,则可能的样本为个,每个样本被抽中的概率为。这样的抽样方式就是不放回简单随机抽样,所得的样本称为不放回简单随机样本。)!(!nNN!)!(NnNnNCnNC18考虑样本单位顺序与不考虑样本单位顺序的不放回简单随机抽样,除了单位不可能在同一个样本中重复出现这一共同特点外,还有一个共同点,即虽然他们的可能样本数不同,考虑顺序是不考虑顺序的倍,但是它们的样本却有相同的概率分布。由此会导致依据样本构造的估计量的概率分布也是相同的。由于这一共同点的存在,加之不考虑顺序的放回简单随机抽样的工作量更小,所以抽样实践中对于不放回简单随机抽样,只讨论和使用不考虑顺序不放回简单随机抽样这种方式。!n9(三)不放回与放回简单随机抽样的比较1、每次抽取样本单位面对的总体结构不同。这是二者的主要不同之处。这一点使得前者的数学处理相对简单。2、样本提供的信息量不同。显然,在样本量一定的条件下,由于后者提供的信息量大于前者,其抽样效率更高。在实践中,一般多采用不考虑顺序的不放回简单随机抽样,所以以下讨论如无特别说明,都指这一类简单随机抽样。10二、简单随机样本的抽选方法简单随机样本的抽选,首先要将总体个单位从1到编号,每个单位对应一个号;然后从所编的号中抽号,如果抽到某个号,则对应的那个单位入样,直到抽够个单位为止。(一)抽签法(二)随机数法nNN11(一)抽签法当总体不大时,可分别采用两种方法抽取。一种是全样本抽选法,另一种是逐个抽选法,按这两种方法抽到的个单位的样本是等价的,每个被抽到的样本的概率都等于。nNC1n12(二)随机数法当总体较大时,抽签法实施起来比较困难,这时可以利用随机数表、随机数骰子、摇奖机、计算机产生的伪随机数进行抽样。1、利用随机数表进行抽选。随机数表是一张由0,1,2,…,9这十个数字组成的,一般常用的是五位数的随机数字表,10个数字在表中出现的顺序是随机的,每个数字都有同样的机会被抽中。13用随机数表抽选简单随机样本时,一般可根据总体大小的位数决定在随机数表中随机抽取几列,比如=768,要从中抽取=10的简单随机样本,则在随机数表中随机抽取相邻的3列,顺序往下(或往上),选出前10个001到768之间的互不相同的数,如果这3列随机数字不够,可另选其他3列继续,直到抽够个单位为止。nNNn14用此种方法,当的最高位数较小,比如小于5,且不小时,由于读到的随机数被舍弃不用的比例较大,抽选效率较差。此时采用下面的方法。在随机数表中随机抽取3列,顺序往下,如果得到的随机数大于247,小于989(因为247的4倍为988,因此000及989到999的数字应舍弃),则用这个数除以247,得到的余数入样,显然这种方法效率要高得多。随机数表的起始页和起始点都应用随机数产生。Nn153、利用摇奖机进行抽选。4、利用计算机产生的伪随机数进行抽选。通常产生的伪随机数有循环周期。因此在有条件的情况下,一般不建议使用此种方法。2、利用随机数骰子进行抽选。16(一)简单随机抽样在抽样理论中的地位它是抽样中最容易掌握的技术、也是发展最成熟的技术,建立了最完备的理论。简单随机抽样也是比较其他抽样设计方法优劣的基础。其他抽样方法技术都是在它的理论技术基础上,针对它的局限发展起来的。三、简单随机抽样在抽样理论中的地位与局限性17若总体单位数很大时,编制抽样框困难;抽样框中即使有辅助信息也不加利用,使得估计的统计效率较其他利用辅助信息的抽样设计方法低;由于样本在总体中的地理分布范围较广,如果采取面访,则费时、费钱、费力,困难较大;可能得到一个“差”的简单随机样本;若不用计算机,而用随机数表或随机数骰子抽取一个大样本,比较劳神单调。N(二)简单随机抽样的局限性18四、有关指标与符号指标总体样本总值均值比例比率有限总体方差无限总体方差NiiYY1NiiYNY11)或(01,111iNiiYYNNNPXYXYXYRNiiNii1121221)(11NNYYNSNiNjYYN122)(1niiyy1niiyny11)或01(,111iniiyynnnpxyxyxyRniinii11ˆ212)(11yynsnii19第二节总体均值与总体总值的简单估计20(一)简单估计量的定义y(三)简单估计量的方差(四)简单估计量的方差的无偏估计y(二)简单估计量的无偏性(五)放回简单随机抽样的简单估计(六)设计效应(七)影响估计量精度的因素y一、总体均值的简单估计21(一)简单估计量的定义对于简单随机抽样,最简单的估计是利用样本均值作为总体均值的估计,即总体均值的简单估计量为:niiyny11也就是说,样本均值是总体均值的简单估计量。22(二)简单估计量的无偏性对于简单随机抽样,是的无偏估计,即有yyYYyE)(证明:nNCjjCyyEnN1)()(12111jnjCjjCjjyyynynNnNNiinNYCn1111YYNnnYCCnyENiiNiinNnN111111)(YYNnnyEnyENiinii111)(1)(这就是对称性论证法。由于总体中每一个单位的入样概率都相等,所以不放回简单随机抽样是一种等概率抽样。23(三)简单估计量的方差式中,抽样比;为有限总体校正系数。y21)(SnfyVNnff1证明:212)1()()(YynEYyEyVnii21)]([1YyEnnii]))(([1])([12212jijiniiYyYyEnYyEn21)(YYNnNii])([21YyEnii根据对称性论证法,有24jijiYyYyE)])(([))(()1()1(YYYYNNnnjjii因此有))(()1()1(1)(1)(2212YYYYNNnnnYYNnnyVjijiNii)})((11)({121YYYYNnYYnNjjiiNii}]([11)()111{(12121YYNnYYNnnNNiiNii2211)(11SnfYYNnNnNNii25(四)简单估计量的方差的无偏估计的无偏估计是:y)(yV21)(snfyv式中为样本方差。2s证明:212)(11yynsnii21)]()[(11YyYynnii])()([11221YynYynnii26根据对称性论证法及的表达式,有)(yV])([21YyEnii21)(YYNnNii2)1(SNNn])([2YynE2)(YynE)(ynV2SNnN由此可得:222)]()1([)1()(SnNNnNnSsE27(五)放回简单随机抽样的简单估计现实中有许多情况下,抽样必须是放回的,即从总体中抽中的单位每次都要放回总体中去。例如在城市中对行人、车辆的调查,对超市顾客、影剧院观众的调查等抽样都是有放回的,从而,有可能重复抽中某些单位。对于每次抽到的结果(视为随机变量)都有iyYYNyEiNii11)(221)(1)(YYNyViNii28由此可以证明:YyEnyEnii)(1)(1nyVnyVnii212)(1)(注意到])([21yyEnii)(212ynyEniiniiiyEyVnyEyV122})]([)({})]([)({)()(2222YnnYn2)1(n29因此样本方差212)(11yynsnii是无限总体方差的无偏估计量。2方差的一个无偏估计是:)(yVnsyv2)(考虑样本单位顺序的放回简单随机抽样也是等概率抽样。30)()(yVyVdeffsrsdeff11)()1(22nNNSnNnNSnNNdeffn这说明除非=1,否则在相同的样本量下,放回简单随机抽样的方差总是大于不放回的方差,即它的抽样效率一般比不放回简单随机抽样的低。根据抽样设计效应定义:放回简单随机抽样的为:31【例3-3】为调查某大学学生的电信消费水平,在全校=15230名学生中,用简单随机抽样的方法抽得一个=36的样本。对每个抽中的学生调查其上个月的电信支出金额(如表3-6所示)。试以95%的置信度估计该校大学生该月电信消费的平均支出额。样本序号消费额(元)样本序号消费额(元)样本序号消费额(元)123456789101112453671317089337522567951314151617181920212223244853243941931959111643576252627282930313233343536835133252890175743146194732,,,,,。因此,对该校大学生某月的电信消费的人均支出额的估计为53.64(元),由于置信度95%对应的=1.96,所以,可以以95%的把握说该校大学生该月的电信消费的人均支出额大约在53.64±1.96×6.1355,即41.61~65.67元之间。若采取放回简单随机抽样,则:,,,以95%的把握估计该校大学生该月的电信消费的人均支出额大约在53.64±1.96×6.1428,即41.60~65.68元之间。计算结果说明,不放回比放回简单随机抽样估计的置信区间略小一些。由于总体较大而抽样比较小,所以两者之间相差很小。1931iy)(64.53元y02771212.0/)1(nf41.13582s6444.37/)1()(2nsfyv1355.6)(yset64.53y7336.37)(2nsyv1428.6)(yse解:依据题意和表中数据,可计算得:33总体总值为总体均值的倍,即NiiYYNY1niiynNyNY1ˆN(一)简单估计量的定义N倍的样本均值是总体总值的简单估计量,即二、总体总值的简单估计只要我们有了总体均值的估计结果,就可以很容易地推出总体总值的估计结果。
本文标题:简单随机抽样97347143
链接地址:https://www.777doc.com/doc-420037 .html