您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 抽样方法与总体分布的估计
中国奥博教育:浙江省杭州市学院路146号第一教学楼507室TEL:0571—85028528FAX:0571—850285781课题:抽样方法与总体分布的估计●知识梳理1.简单随机抽样:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.两种抽样方法的比较(略).4.总体:在数理统计中,通常把被研究的对象的全体叫做总体.5.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.6.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.●点击双基1.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是1002.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个容量为3的样本,则某特定个体入样的概率是A.310C3B.89103C.103D.1013.一个容量为n的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n的值为A.640B.320C.240D.1604.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.5.某班学生在一次数学考试中成绩分布如下表:分数段[0,80)[80,90)[90,100)人数256分数段[100,110)[110,120[120,130)人数8126分数段[130,140)[140,150)人数42那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).●典例剖析【例1】(2004年湖南,5)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法)中国奥博教育:浙江省杭州市学院路146号第一教学楼507室TEL:0571—85028528FAX:0571—850285782【例2】(2004年福建,15)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是___________.【例3】把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.【例4】对某电子元件进行寿命追踪调查,情况如下:寿命(h)100~200200~300300~400400~500500~600个数2030804030(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估计电子元件寿命在100~400h以内的概率;(4)估计电子元件寿命在400h以上的概率.剖析:通过本题可掌握总体分布估计的各种方法和步骤.解:(1)频率分布表如下:寿命(h)频数频率累积频率100~200200.100.10200~300300.150.25300~400800.400.65400~500400.200.85500~600300.151合计2001(2)频率分布直方图如下:100200300400500600寿命(h)频率组距100200300400500600寿命(h)1.000.800.600.400.20累积频率(3)由累积频率分布图可以看出,寿命在100~400h内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400h内的概率为0.65.(4)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400h以上的概率为0.35.评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义.●闯关训练夯实基础1.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一中国奥博教育:浙江省杭州市学院路146号第一教学楼507室TEL:0571—85028528FAX:0571—850285783天平均每人的课外阅读时间为2015105人数(人)时间(h)00.51.01.52.0A.0.6hB.0.9hC.1.0hD.1.5h2.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别抽取的人数为A.7,5,8B.9,5,6C.6,5,9D.8,5,73.某单位共有N个职工,要从N个职工中采用分层抽样法抽取n个样本,已知该单位的某一部门有M个员工,那么从这一部门中抽取的职工数为___________.4.下图是容量为100的样本的频率分布直方图,试根据图形中的数据填空:频率组距0.090.080.0226101418样本数据(1)样本数据落在范围[6,10)内的频率为___________;(2)样本数据落在范围[10,14)内的频数为___________;(3)总体在范围[2,6)内的概率约为___________.●思悟小结1.采用什么抽样方法,要视情况来定:当总体中的个体较少时,一般可用随机抽样;当总体中的个体较多时,一般可用系统抽样;当总体由差异明显的几部分组成时,一般可用分层抽样.2.用样本估计总体,是研究统计问题的一个基本思想方法.用样本估计总体,本节主要研究在整体上用样本的频率分布估计总体的分布.教学点睛1.常用的抽样方法有三种:简单随机抽样、系统抽样、分层抽样,其中第一种是最简单、最基本的抽样方法.三种抽样方法的共同点:都是等概率抽样,体现了抽样的公平性;三种抽样方法各有其特点和适用的范围.2.总体分布反映了总体在各个范围内取值的概率.当总体中所取不同数值比较少时,常用条形图中国奥博教育:浙江省杭州市学院路146号第一教学楼507室TEL:0571—85028528FAX:0571—850285784表示相应样本的频率分布;否则,常用频率分布直方图表示相应样本的频率分布.3.系统抽样的步骤:(1)将总体中的个体随机编号;(2)将编号分段;(3)在第1段中用简单随机抽样确定起始的个体编号;(4)按照事先研究的规则抽取样本.4.分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.5.解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估计.6.条形图是用其高度表示取各值的频率;直方图是用图形面积的大小表示在各区间内取值的频率;累积频率分布图是一条折线,利用任意两端值的累积频率之差表示样本数据在这两点值之间的频率.
本文标题:抽样方法与总体分布的估计
链接地址:https://www.777doc.com/doc-418368 .html