您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 【优化方案】2014届高考数学二轮复习 专题7第2讲统计、统计案例课件 新人教版
第2讲统计、统计案例要点知识整合1.统计(1)抽样方法:简单随机抽样、系统抽样、分层抽样.(2)利用样本频率分布估计总体分布①频率分布表和频率分布直方图.②总体密度曲线.③茎叶图.(3)用样本的数字特征估计总体的数字特征①众数、中位数.②平均数x=x1+x2+…+xnn.③方差与标准差方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].标准差s=1n[x1-x2+x2-x2+…+xn-x2].2.变量之间的相关关系(1)散点图.(2)线性相关性回归直线方程为y^=b^x+a^,则b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2a^=y-b^x3.统计案例(1)回归分析的基本思想及其初步应用①随机误差;②(x,y)称为样本点的中心;③总偏差平方和;④残差;⑤残差平方和;⑥回归平方和;⑦残差分析;⑧残差图.(2)用相关指数可以刻画回归的效果,其计算公式是R2=1-i=1nyi-y^i2i=1nyi-y2(3)独立性检验的基本思想及其初步应用K2=nad-bc2a+bc+ba+cb+d,其中n=a+b+c+d为样本容量.利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.热点突破探究典例精析题型一抽样方法例1(2010年高考湖北卷)将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为()A.26,16,8B.25,17,8C.25,16,9D.24,17,9【解析】∵总体数为600,样本的容量是50,∴600÷50=12.因此,每隔12个号能抽到一名,由于随机抽得第一个号码为003,按照系统抽样的操作步骤在第Ⅰ营区应抽到25人,第Ⅱ营区应抽到17人,第Ⅲ营区应抽到8人,故选B.【答案】B【题后点评】(1)解决有关随机抽样问题首先要深刻理解各种抽样方法的特点和适用范围,如分层抽样,适用于数目较多且各部分之间具有明显差异的总体.(2)系统抽样中编号的确定和分层抽样中各层人数的确定是高考重点考查的内容.变式训练1.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是_________.若用分层抽样方法,则40岁以下年龄段应抽取_______人.解析:(1)设第1组抽出的号码为n,则第5组抽出的号码是n+4×20040=n+20=22,故n=2.所以第8组抽出的号码是2+7×20040=37.(2)40岁以下年龄段应抽取的人数占总抽取人数的50%,故40岁以下年龄段应抽取40×50%=20人.答案:3720题型二频率分布直方图或频率分布表例2(2010年高考北京卷)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=______.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.【解析】∵0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,∴a=0.030.设身高在[120,130),[130,140),[140,150]三组各有x,y,z人,∴x100=0.030×10,∴x=30,同理y=20,z=10.∴从[140,150]中抽取1030+20+10×18=3.【答案】0.0303【题后点评】解决该类问题时,应正确理解图表中各量的意义,通过图表掌握信息是解决该类问题的关键.频率分布指的是样本数据在各个范围内所占的比例的大小,一般用频率分布直方图反映样本的频率分布.变式训练2.根据《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精度在20~80mg/100mL(不含80)之间,属于酒后驾车,处暂扣一个月以上三个月以下驾驶证,并处200元以上500元以下罚款;血液酒精浓度在80mg/100mL(含80)以上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2000元以下罚款.据《法制晚报》报道,2009年8月15日至8月28日,全国查处酒后驾车和醉酒驾车共28800人,如图是对这28800人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为()A.2160B.2880C.4320D.8640解析:选C.由题可知,属于醉酒驾车的酒精含量为80mg/100mL及以上,其占有的频率为(0.01+0.005)×10=0.15,所以查处的醉酒驾车的人数为28800×0.15=4320人,故选C.题型三茎叶图例3(2010年高考天津卷)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图所示,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天中甲、乙两人日加工零件的平均数分别为_________和________.【解析】x甲=110×(19+18+20+21+23+22+20+31+31+35)=24,x乙=110×(19+17+11+21+24+22+24+30+32+30)=23.【答案】2423【题后点评】(1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.(2)在作茎叶图或读茎叶图时,首先要弄清楚“茎”和“叶”分别代表什么.变式训练3.某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)作出品种A、B亩产数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.解:(1)茎叶图如图所示:(2)由于每个品种的数据都只有25个,样本容量不大,画茎叶图方便,茎叶图不仅清晰地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A的亩产平均数比品种B大;②品种B的亩产量比品种A的亩产量更集中.题型四众数、中位数、平均数、方差、标准差例4(2009年高考上海卷)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3【解析】逐项验证,由0,0,0,2,4,4,4,4,4,8可知,A错;由0,0,0,0,0,0,0,0,2,8可知,B错;由0,0,1,1,2,2,3,3,3,8可知,C错.D中x=2,x1-22+x2-22+…+x10-2210=3,即(x1-2)2+(x2-2)2+…+(x10-2)2=30,显然(xi-2)2≤30(i=1,2,…,10),即xi≤7.故选D.【答案】D【题后点评】求解选择题时要善于从题目的特点出发,灵活选用简洁、恰当的方法进行求解,特值排除法是解决选择题的一种重要方法,例如本题通过列举具体的数值;一一进行检验,排除了错误选项,获得了正确答案.变式训练4.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表学生1号2号3号4号5号甲班67787乙班67679则以上两组数据的方差中较小的一个为s2=__________.解析:x甲=15(6+7+7+8+7)=7,s2甲=15[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=25.x乙=15(6+7+6+7+9)=7,s2乙=15[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=65.由于s2甲<s2乙,∴s2=25.答案:25题型五回归分析与独立性检验例5(本题满分12分)(2010年高考课标全国卷)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:P(K2≥k)0.0500.0100.001k3.8416.63510.828kK2=nad-bc2a+bc+da+cb+d【规范解答】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.4分(2)K2=500×40×270-30×1602200×300×70×430≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关…..8分(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好….12分【思维升华】(1)独立性检验的关键是准确计算K2,而计算K2时,要正确绘制2×2列联表.(2)两个变量的独立性检验,在统计学中有着广泛的应用,学习时一定要结合实际问题,从现实中寻找例子,增强学习数学的动力.变式训练5.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;(2)判断性别与休闲方式是否有关系.解:(1)2×2列联表如下休闲方式性别看电视运动总计女432770男213354总计6460124(2)假设“休闲方式与性别无关”,计算K2=124×43×33-27×21270×54×64×60≈6.201,因为K25.024,所以有理由认为假设“休闲方式与性别无关”是不合理的,即有97.5%的把握认为“休闲方式与性别有关”方法突破转化与化归例(2009年高考福建卷)某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是_______.8989923x214作品A【解析】若最高分为90+x,则平均分为89×2+92+93+92+91+947≈91.43,不合题意,故最低分为88,最高分为94,
本文标题:【优化方案】2014届高考数学二轮复习 专题7第2讲统计、统计案例课件 新人教版
链接地址:https://www.777doc.com/doc-4094663 .html