您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 2019-2020学年高中数学 第二章 统计章末总结课件 新人教A版必修3
章末总结网络建构2.抽签法抽签时,先抽签的人占便宜.()3.利用随机数表抽样时,开始位置和读数方向可以任意选择.()4.分层抽样中,为确保公平性,在每层都应用同一抽样方法.()5.频率分布直方图中每个小长方形的面积等于相应组的频率,各个小长方形面积之和小于1.()6.从总体中抽取一个样本,用样本的分布估计总体的分布,样本容量越小估计越准确.()知识辨析判断下列说法是否正确.(请在括号中填“√”或“×”)1.抽签法和随机数法都是不放回抽样.()√×√×××7.在样本数据中,频率分布最大值所对应的样本数据是众数.()√8.线性回归直线ˆy=ˆbx+ˆa必经过点(x,y).()√题型归纳·素养提升题型一抽样方法的应用解析:(1)由于小学、初中、高中三个学段学生的视力情况差异较大,而男女生视力情况差异不大,因此可以按学段分层抽样.故选C.[典例1](1)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()(A)简单随机抽样(B)按性别分层抽样(C)按学段分层抽样(D)系统抽样答案:(1)C(2)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.答案:(2)60解析:(2)设应从一年级本科生中抽取x名学生,则300x=44556,解得x=60.规律方法三种抽样方法中每个个体被抽中的机会均等,系统抽样抽取的号码成等差数列,公差为间隔.分层抽样在各层中抽取的数目取决于抽样比,即各层抽取数目=抽样比×各层个体总数.即时训练1-1:我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()(A)134石(B)169石(C)338石(D)1365石解析:因为28254×1534≈169,所以这批米内夹谷约为169石.故选B.题型二用样本的频率分布估计总体分布[典例2]有1个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表(含累积频率);解析:(1)样本的频率分布表如下:分组频数频率累积频率[12.5,15.5)60.060.06[15.5,18.5)160.160.22[18.5,21.5)180.180.40[21.5,24.5)220.220.62[24.5,27.5)200.200.82[27.5,30.5)100.100.92[30.5,33.5]80.081.00合计1001.00(2)画出频率分布直方图;(3)估计小于30的数据约占多大百分比.解析:(2)频率分布直方图如图.(3)大于30的频率为0.53×0.10+0.08≈0.097,1-0.097=0.903.则小于30的频率约为0.903.即小于30的数据约占90.3%.规律方法频率分布直方图中,各个矩形的面积为对应数据组的频率,且所有矩形的面积和为1.题型三用样本的数字特征估计总体的数字特征[典例3]每年高考结束后,处于休养状态的高中毕业生旅游动机强烈,旅游可支配收入日益增多,可见高中毕业生旅游是一个巨大的市场.为了解高中毕业生每年旅游消费支出(单位:百元)的情况,相关部门随机抽取了某市的1000名毕业生进行问卷调查,并把所得数据列成如表所示的频数分布表:组别[0,20)[20,40)[40,60)[60,80)[80,100]频数22504502908则所得样本的中位数是(精确到百元).解析:设样本的中位数为x,则21000+2501000+4501000·(40)20x=0.5,解得x≈51,所得样本中位数为51(百元).答案:51规律方法样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差.我们常通过样本的数字特征估计总体的数字特征.即时训练3-1:从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):甲:25414037221419392142乙:27164427441640401640问:(1)哪种玉米的苗长得高?解:(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=110×300=30(cm),x乙=110(27+16+44+27+44+16+40+40+16+40)=110×310=31(cm).所以x甲x乙.故乙种玉米的苗长得高.解:(2)2s甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=110(25+121+100+49+64+256+121+81+81+144)=110×1042=104.2,2s乙=110[(2×272+3×162+3×402+2×442)-10×312]=110×1288=128.8.所以2s甲2s乙.故甲种玉米的苗长得整齐.(2)哪种玉米的苗长得齐?题型四茎叶图的应用[典例4]为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5根据两组数据画出茎叶图,从茎叶图看,哪种药的疗效更好?解析:由观测结果可绘制如图茎叶图.从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎“2.”“3.”上,而B药疗效的试验结果有710的叶集中在茎“0.”“1.”上,由此可看出A药的疗效更好.规律方法利用茎叶图统计相应数据,要先根据所给数字的位数选好茎,叶上的数字只能为一位数字;如果绘制两份数据的茎叶图,则茎在中间,叶放两边.注意,茎上的数字位数可以不一致.题型五线性回归分析[典例5]某企业上半年的某种产品的月产量与单位成本数据如下:月份123456产量/万件234345单位成本/(元/件)737271736968(1)产量与单位成本是否具有线性相关关系?若有,试确定回归直线方程;解析:(1)设x表示每月产量(单位:万件),y表示单位成本(单位:元/件),作散点图如图.由图知y与x之间成线性相关关系,设线性回归直线方程为ˆy=ˆbx+ˆa.经计算得,x=3.5,y=71,621iix=79,61iiixy=1481,由公式可求得ˆb≈-1.818,ˆa≈77.363.所以线性回归直线方程为ˆy=-1.818x+77.363.解:(2)由线性回归直线方程知,每增加10000件产品时,单位成本下降1.818元/件.(2)指出产量每增加10000件时,单位成本下降多少?(3)假定产量为60000件时,单位成本是多少?单位成本为(3)当x=60000(件)=6(万件)时,ˆy=-1.818×6+77.363=66.455;当y=70时,70=-1.818x+77.363,得x≈4.050(万件)=40500(件).即当产量为60000件时,单位成本为66.455元/件,当单位成本为70元/件时,产量为40500件.规律方法两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量是否具有相关关系.若两变量具有线性相关关系,代入公式求回归直线方程,由直线方程预测变量,估计和预测分析实际问题.即时训练5-1:某研究机构对中学生记忆能力x和识图能力y进行统计分析,得到如下数据:记忆能力x46810识图能力y3…68由于某些原因,识图能力的一个数据丢失,但已知识图能力样本平均值是5.5.(1)求丢失的数据;解:(1)设丢失的数据为m,依题意得3684m=5.5,解得m=5,即丢失的数据值是5.解:(2)由题表中的数据得x=468104=7,y=5.5,41iiixy=4×3+6×5+8×6+10×8=170,421iix=42+62+82+102=216.ˆb=41422144iiiiixyxyxx=2170475.521647=45=0.8,ˆa=y-ˆbx=5.5-0.8×7=-0.1,所以所求线性回归方程为ˆy=0.8x-0.1.(2)经过分析,知道记忆能力x和识图能力y之间具有线性相关关系,请用最小二乘法求出y关于x的线性回归方程ˆy=ˆbx+ˆa;解:(3)由(2)得,当x=12时,ˆy=0.8×12-0.1=9.5.即预测他的识图能力值是9.5.(3)若某一学生记忆能力值为12,请你预测他的识图能力值.题型六易错辨析[典例6]在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的数量按5天一组分组统计,绘制了频率分布直方图.已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?错解:(1)第三组的频率为4234641=15,因为第三组的频数为12,所以这次活动参加评比的作品共有1215=60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×6234641=18(件).(3)第四组的获奖率高,因为该组的小长方形面积最大,而且获奖件数最多,故第四组获奖率高.纠错:各组中的小长方形的高指各组的频率组距,面积指频率,而不是获奖率,获奖率=获奖件数该组参评作品数×100%,错解(3)中混淆了频率与获奖率.(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×6234641=18(件).正解:(1)依题意知第三组的频率为4234641=15,又因为第三组的频数为12,所以本次活动的参评作品数为1215=60(件).(3)第四组的获奖率是1018=59,第六组上交的作品数量为60×1234641=3(件).所以第六组的获奖率为23=69,6959,显然第六组的获奖率较高.真题体验·素养升级1.(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()(A)x1,x2,…,xn的平均数(B)x1,x2,…,xn的标准差(C)x1,x2,…,xn的最大值(D)x1,x2,…,xn的中位数B解析:标准差衡量样本的稳定程度,故选B.2.(2017·山东卷)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系.设其回归直线方程为ˆy=ˆbx+ˆa.已知1021iix=225,101iiy=1600,ˆb=4.该班某学生的脚长为24,据此估计其身高为()(A)160(B)163(C)166(D)170C解析:因为1021i
本文标题:2019-2020学年高中数学 第二章 统计章末总结课件 新人教A版必修3
链接地址:https://www.777doc.com/doc-8288639 .html