您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 应用抽样技术课件第三章
02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第三章简单随机抽样2本章要点简单随机抽样是抽样中最基本、最成熟、也是最简单的抽样设计方式,是所有概率抽样方法发展、比较的基础。①要求熟练掌握简单随机抽样的抽样方式和样本抽选方法;②熟知总体均值、总体总值和总体比例的简单估计;③掌握样本量的确定。3从三皇五帝时的黄帝算起,直到1911年清王朝灭亡,中国经历了数千年的漫长历史时期,在这漫长的历史长河之中,先后经历了83个王朝,出现了559位帝王。在封建皇朝,臣下叩见皇帝时,先要三呼万岁,这万岁二字,等于是皇帝的尊称,其实真是莫大的讽刺。有史以来,皇帝总是要比普通人短命得多,而且大都是开国的皇帝比较长寿,越到后来,就越是短命。研究目的:为了估计我国历史上的这559位帝王的平均寿命,拟采用简单随机抽样方式从历代帝王中抽选三十位作为样本。问题1:如何实现简单随机抽样?问题2:如何做出具有一定可靠程度的区间估计?帝王寿命的抽样估计4第一节抽样方式5简单随机抽样也称纯随机抽样。(SimpleRandomSampling)对于容量为N的总体,抽取样本量为n的样本,若全部可能的样本被抽中的概率都相等,则称这样的抽样为简单随机抽样。一、什么是简单随机抽样例:从全班100名学生中选出10人作为代表参加座谈会,将每个学生的姓名写在同样质地、同样大小的纸条上,投入一个纸箱中充分混合均匀。然后从纸箱中一张接一张共抽出10张纸条。这10张纸条和其他任何10张纸条,被抽中的机会都一样。6根据抽样单位是否放回可分为放回简单随机抽样(重复抽样)不放回简单随机抽样(不重复抽样)7(一)放回简单随机抽样(重复抽样)重复抽样一般是考虑样本单位的顺序的,可能的样本为个,每个样本被抽中的概率为nNnN1随机抽取样本单位调查观测放回总体继续随机抽取特点:每次抽取都是从N个总体单位中抽取,同一个单位有可能在同一个样本中重复出现8例:用重复抽样方法(考虑顺序)从5个人(年龄为34,38,42,46,50岁)中随机抽取2人构成样本,样本个数为个,如下:(34,34)(34,38)(34,42)(34,46)(34,50)(38,34)(38,38)(38,42)(38,46)(38,50)(42,34)(42,38)(42,42)(42,46)(42,50)(46,34)(46,38)(46,42)(46,46)(46,50)(50,34)(50,38)(50,42)(50,46)(50,50)每个样本被抽中的概率都是1/2552=259(二)不放回简单随机抽样(不重复抽样)不重复抽样一般是不考虑样本单位顺序的。样本个数:每个样本被抽中的概率为。nNCnNC/1随机抽取样本单位调查观测继续抽取下一个特点:即同一个单位不能在样本中重复出现。10例:用不重复抽样方法(不考虑顺序)从5个人(年龄为34,38,42,46,50岁)中随机抽取2人构成样本共个样本。所有可能样本为:1025C每个样本被抽中的概率都是1/10•(34,38)(34,42)(34,46)(34,50)•(38,42)(38,46)(38,50)•(42,46)(42,50)•(46,50)11实践中一般多采用不放回简单随机抽样(不考虑顺序),以下讨论如无特别说明,都指这一类简单随机抽样。由于在重复抽样中一个单位有可能在一套样本中重复多次出现,造成信息的重复,因此,•在样本量一定的条件下,不放回抽样提供的信息量大于放回抽样,其抽样效率更高。12二、简单随机样本的抽选方法首先要将总体N个单位从1到N编号,每个单位对应一个号;然后从所编的号中随机抽号,如果抽到某个号,则对应的那个单位入样,直到抽够n个单位为止。具体方法:(一)抽签法(二)随机数法13(一)抽签法当总体不大时采用。用同质均匀的材料制作N个签,并充分混合。nNC1按这两种方法抽到的n个单位的样本是等价的,每个样本被抽到的概率都等于全样本抽选法逐个抽选法一次抽取一个签但不放回,接着抽下一个签,直到抽够n个签为止,签上号码所对应的单位入样从N个签中一次抽取n个,这n个签上的号码即为入样的单位号码方法14随机数法利用随机数表进行抽选利用随机数骰子进行抽选利用摇奖机进行抽选利用计算机产生的伪随机数进行抽选(二)随机数法当总体较大时采用。151、利用随机数表进行抽选。随机数表是一张由0,1,2,…,9这十个数字组成的表,一般常用的是五位数的随机数字表。10个数字在表中出现的顺序是随机的,每个数字都有同样的机会被抽中。抽选时,可根据总体容量N的位数决定在表中随机抽取相邻的几列数字。(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)13204469037296559211481034405820158477184857624650522382196070825928164208971074410903781530561959842538238394987664412867795961783463791609416424384843246831021792716358608938157956209671879554502091770559485676940221650141401413372310550937489564595298369500061958834309825070030054367481445978092771382772076464638113593255689822027138129352970250803355587140117964509409575334905935663631879530511052695293846475707167506137101523692053212203436144890208610594425924774955828359837883513478702079501352899061111818409519927932222754332793746214488722653641042126678568379648300230582200975600533176149814482427130593369834574023516854138448501152705692848104410914317229733477178703611581935037463192108537957051021595118883732693442991001429085214199935937602823664随机数表若N=99,n=10,哪些单位入样?若N=830,n=8,哪些单位入样?若N=327,n=8,哪些单位入样?17Nm1≤N≤10111≤N≤1002101≤N≤10003随机数骰子是均匀材料制成的正20面体,0~9共10个数字随机出现在20个面上,每个数字出现2次。根据需要选取一定骰子数m,规定每种颜色的骰子所代表的位数。例如,选用红、黄、蓝3种颜色的骰子,规定红色骰子出现的数字表示百位数,黄色骰子出现的数字表示十位数,蓝色骰子出现的数字表示个位数。所有m个骰子的数字均为0时,表示10m。2、利用随机数骰子抽选183、利用摇奖机进行抽选各类彩票的抽奖活动通常是利用摇奖机来完成的,我们也可以借助这一方法完成简单随机样本的抽取194、利用计算机产生的伪随机数进行抽选大多数统计软件都有现成的产生随机数的程序利用计算机产生的随机数具有快捷、方便的特点。但是利用计算机产生的随机数是伪随机数,并不能保证其随机性,通常产生的伪随机数有循环周期。一般不建议使用此种方法!20第二节总体均值与总体总值的简单估计21春秋晋文公29岁、战国秦孝公56岁、秦朝秦始皇49岁、新朝王莽68岁、东汉光武帝刘秀63岁、东汉顺帝刘保30岁、西汉哀帝刘欣25岁、魏文帝曹丕39岁、昭烈帝刘备61岁、吴大帝孙权71岁、西晋武帝司马炎55岁、东晋成帝司马衍22岁、南朝顺帝李淮12岁、金章宗完颜达葛40岁、元世祖忽必烈79岁、北朝孝庄帝元子攸24岁、隋炀帝杨广49岁、唐太宗李世民51岁、唐武宗李炎32岁、南唐后主李煜42岁、北宋赵匡胤49岁、北宋英宗赵曙35岁、南宋宁宗赵扩57岁、辽太祖耶律阿保机55岁、元太祖铁木真65岁、元文宗图帖木尔28岁、明太祖朱元璋70岁、明熹宗朱由校23岁、清圣祖玄烨68岁、清光绪帝载恬37岁。如何根据以上数据,以95%的概率保证程度,对我国559位帝王的平均寿命作出估计?从我国历史上的559位帝王中用随机数表选取了以下三十位,他们的寿命如下:帝王寿命的抽样估计22有关指标与符号指标总体样本总值均值比例有限总体方差无限总体方差NiiYY1NiiYNY11)或(01,111iNiiYYNNNPNiiYYNS122)(11niiyy1niiyny11)或01(,111iniiyynnnp212)(11yynsniiNiiYYN122)(123一、总体均值的简单估计(一)简单估计量的定义总体均值的简单估计量为样本均值:niiyny11Y24(二)简单估计量的期望与方差对于简单随机抽样(不放回),是的无偏估计,即有yyYYyE)(f=n/N为抽样比;1-f为有限总体校正系数。21)(SnfyV的方差:y由于每个单位的入样概率都是n/N,不放回简单随机抽样是等概率抽样。25是的无偏估计。2s)(vy21)(snfyv样本方差是总体方差S2的无偏估计量,所以2s由于总体方差S2未知,需用样本方差估计它。)(yV26(三)放回简单随机抽样的简单估计对于放回简单随机抽样(考虑顺序),是的无偏估计21)(nyVyYYyE)(由于每次抽取时总体中任一单位都有1/N的概率被抽中,考虑样本单位顺序的放回简单随机抽样也是等概率抽样。由于N往往很大,N-1≈N,所以21)(nyV2221)(SnyVS,27由于样本方差212)(11yynsnii是总体方差的无偏估计量,所以2可得到的无偏估计量nsyv2)()(yV28)()(yVyVdeffsrsddeff11111112222nNNSNnNnSNNnSnfndeff这说明除非n=1,否则在相同的样本量下,放回简单随机抽样的方差总是大于不放回的方差,即它的抽样效率一般比不放回简单随机抽样的低。根据抽样设计效应定义:放回简单随机抽样的为:29【例3.1】在某区10000户家庭中,按简单随机抽样抽取400户,调查每个月的人均伙食费(单位:元)。经计算:若对该地区平均每人每月的伙食费做估计,则抽样标准误是多少?62.35528.414400165712sy301、计算估计量和样本方差2、计算抽样标准误3、计算置信区间(1)根据给定的1-α,找到相应的t值(2)计算抽样极限误差(3)确定总体均值的估计区间)(yseyyY,估计总体均值的步骤y【例3.2】为了估计我国历史上的这559位帝王的平均寿命,随机选取了以下三十位,他们的寿命如下:春秋晋文公29岁、战国秦孝公56岁、秦朝秦始皇49岁、新朝王莽68岁、东汉光武帝刘秀63岁、东汉顺帝刘保30岁、西汉哀帝刘欣25岁、魏文帝曹丕39岁、昭烈帝刘备61岁、吴大帝孙权71岁、西晋武帝司马炎55岁、东晋成帝司马衍22岁、南朝顺帝李淮12岁、金章宗完颜达葛40岁、元世祖忽必烈79岁、北朝孝庄帝元子攸24岁、隋炀帝杨广49岁、唐太宗李世民51岁、唐武宗李炎32岁、南唐后主李煜42岁、北宋赵匡胤49岁、北宋英宗赵曙35岁、南宋宁宗赵扩57岁、辽太祖耶律阿保机55岁、元太祖铁木真65岁、元文宗图帖木尔28岁、明太祖朱元璋70岁、明熹宗朱由校23岁、清圣祖玄烨68岁、清光绪帝载恬37岁。如何根据以上数据,以95%的概率保证程度,对我国559位帝王的平均寿命作出估计?32【例3.3】从某区400户个体户饮食店中简单随机抽取10
本文标题:应用抽样技术课件第三章
链接地址:https://www.777doc.com/doc-4395258 .html