您好,欢迎访问三七文档
章末复习提升课第二章统计一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量(单位:辆)如下表:轿车A轿车B轿车C舒适型100150z标准型300450600抽样方法按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中A类轿车有10辆.(1)求z的值;(2)用分层抽样的方法从C类轿车中抽取一个容量为5的样本,则舒适型、标准型的轿车应分别抽取多少辆?【解】(1)设该厂本月生产轿车n辆,由题意得50n=10100+300,所以n=2000,则z=2000-100-300-150-450-600=400.(2)设所抽取的样本中有m辆舒适型轿车,因为用分层抽样的方法从C类轿车中抽取一个容量为5的样本,所以由(1)知4001000=m5,解得m=2,则在C类轿车中抽取2辆舒适型轿车,3辆标准型轿车.应用抽样方法抽取样本应注意的问题(1)用随机数表法抽样时,对个体所编的号码位数要相等.当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法抽样时,如果总体容量N能被样本容量n整除,则抽样间隔为k=Nn;如果总体容量N不能被样本容量n整除,则先用简单随机抽样剔除多余个体,抽样间隔为k=Nn.Nn表示取Nn的整数部分(3)三种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数表法;当总体容量较大,样本容量也较大时,可采用系统抽样;当总体中个体差异较显著时,可采用分层抽样.在100个零件中,有一级品20个,二级品30个,三级品50个,现从中抽取20个作为样本.(1)采用简单随机抽样,抽签取出20个;(2)采用系统抽样,将零件随机编号为00,01,02,…,99,分成20组,每组5个,然后抽取20个;(3)采用分层抽样,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.对于上述三种抽样方法,下列说法中正确的是________(填序号).①三种抽样方法中每个个体被抽到的概率都是15;②只有(1)(2)的抽样方法中每个个体被抽到的概率是15;③只有(1)(3)的抽样方法中每个个体被抽到的概率是15;④三种抽样方法中每个个体被抽到的概率各不相同.解析:三种抽样方法中每个个体被抽到的概率都相同,因为只要是随机编号、随机抽取,不管采用什么方法,每个个体被抽到的概率都相等,因此只有①是正确的.答案:①下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:cm):区间界限[122,126)[126,130)[130,134)[134,138)[138,142)人数58102233区间界限[142,146)[146,150)[150,154)[154,158]人数201165(1)列出样本的频率分布表(频率保留两位小数);(2)画出频率分布直方图;(3)估计身高低于134cm的人数占总人数的百分比.用样本的频率分布估计总体的分布【解】(1)列出样本频率分布表:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158]50.04合计1201.00(2)画出频率分布直方图,如图所示.(3)因为样本中身高低于134cm的人数的频率为5+8+10120=23120≈0.19.所以估计身高低于134cm的人数约占总人数的19%.与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出了频率分布表和频率分布直方图,如图所示:分组频数频率[10,15)100.25[15,20)24n[20,25)mp[25,30]20.05合计M1(1)求表中M,p及图中a的值;(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数.解:(1)由分组[10,15)的频数是10,频率是0.25,知10M=0.25,解得M=40.因为频数之和为40,所以10+24+m+2=40,得m=4,p=mM=440=0.10.因为a是对应分组[15,20)的频率与组距的商,所以a=2440×5=0.12.(2)因为该校高三学生有240人,分组[10,15)的频率是0.25,所以估计该校高三学生参加社区服务的次数在区间[10,15)内的人数为240×0.25=60.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125]频数62638228用样本的数字特征估计总体的数字特征(1)根据上表画出产品质量指标的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【解】(1)产品质量指标的频率分布直方图如图.(2)质量指标值的样本平均数为80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+02×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.用样本的数字特征估计总体的数字特征应注意的问题(1)众数、中位数、平均数的含义及求法.(2)方差、标准差的计算.(3)中位数用来描述分类变量的中心位置,众数体现了数据的最大集中点,平均数反映样本数据的总体水平.(4)标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小.某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如图:甲部门乙部门3594404489751224566777899766533211060112346889887776655555444333210070011344966552008123345632220901145610000(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)根据茎叶图分析该市的市民对甲、乙两部门的评价.解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表:x12345y7.06.55.53.82.2线性回归分析(1)求y关于x的线性回归方程y^=b^x+a^;(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z取到最大值?(保留两位小数)参考公式:b^=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2=∑ni=1xiyi-nx-y-∑ni=1x2i-nx-2,a^=y--b^x-.【解】(1)x-=3,y-=5,∑5i=1xiyi=62.7,∑5i=1x2i=55,解得b^=-1.23,a^=8.69,所以y^=8.69-1.23x.(2)年利润z=x(8.69-1.23x)-2x=-1.23x2+6.69x,所以当x≈2.72时,年利润z最大.即当年产量约为2.72吨时,年利润最大.(1)线性回归方程的意义回归直线方程y^=b^x+a^中,当回归系数b^>0时,说明两个变量成正相关关系,它的意义是:当x每增加一个单位时,y就增加b^个单位;当b^<0时,说明两个变量成负相关关系,它的意义是:当x每增加一个单位时,y就减少|b^|个单位.(2)相关性检验①散点图法(粗略判断线性相关关系)②相关系数法(定量判断线性相关关系)r的范围为-1≤r≤1,r为正时,x,y正相关;r为负时,x,y负相关;|r|越接近于1,x与y的相关程度越大;|r|越接近于0,二者的相关程度越小;当|r|=1时,所有数据点都在一条直线上.若x,y具有线性相关关系时,可求线性回归方程,否则即使求出回归直线方程也毫无意义.在7块并排、形状大小相同的实验田上进行施化肥量对水稻产量影响的试验,得数据列表(单位:kg):施化肥量x15202530354045水稻产量y330345365405445450455(1)画出散点图;(2)求水稻产量y与施化肥量x之间的回归直线方程;(3)当施化肥50kg时,对水稻的产量予以估计.解:(1)画出散点图如图:由散点图知,施化肥量与水稻产量是线性相关的.(2)借助计算器列表:i1234567xi15202530354045yi330345365405445450455xiyi49506900912512150155751800020475x-=30,y-≈399.3,∑7i=1x2i=7000,∑7i=1xiyi=87175计算得:b^=87175-7×30×399.37000-7×302≈4.75,a^=399.3-4.75×30=256.8.即得回归直线方程y^=4.75x+256.8.(3)施化肥50kg时,可以估计水稻产量约为494.3kg.1.(2019·河北省沧州市期末考试)某学校高一、高二年级共有1800人,现按照分层抽样的方法,抽取90人作为样本进行某项调查.若样本中高一年级学生有42人,则该校高一年级学生共有()A.420人B.480人C.840人D.960人解析:选C.由题意需要从1800人中抽取90人,所以抽样比为901800=120.又样本中高一年级学生有42人,所以该校高一年级学生共有42×20=840(人).故选C.2.(2019·黑龙江省大庆第一中学期末考试)一支田径队有男运动员560人,女运动员420人,为了解运动员的健康情况,从男运动员中任意抽取16人,从女生中任意抽取12人进行调查,这种抽样方法是()A.简单随机抽样法B.抽签法C.随机数表法D.分层抽样法解析:选D.总体由男生和女生组成,比例为560∶420=4∶3,所抽取的比例也是16∶12=4∶3.故选D.3.(2019·陕西省西安市长安区第一中学期末考试)如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[5,10]内的频数为()A.50B.40C.30D.20解析:选D.第一个小矩形的面积为0.04×5=0.2,所以样本落在[5,10]内的频数为0.2×100=20.故选D.4.(2019·广西钦州市期末考试
本文标题:2019-2020学年高中数学 第二章 统计章末复习提升课课件 新人教A版必修3
链接地址:https://www.777doc.com/doc-8288646 .html