您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 高考重点突破课四 概率与统计
题型一频率分布直方图例1某乡镇加大投资建设美丽乡村,大力发展乡村旅游产业,显著提高了农民收入.为了提升旅游质量,打造特色旅游品牌,镇政府聘请有关专家和环保部门工作人员50人,对A,B两个特色旅游村进行评价(满分100分),并得到A村评价分数(单位:分)的频数分布表和B村评价分数的频率分布直方图,如下:A村评价分数的频数分布表分数[60,65)[65,70)[70,75)[75,80)人数25810分数[80,85)[85,90)[90,95)[95,100]人数14641B村评价分数的频率分布直方图有关专家与环保部门工作人员对旅游村的评价分数的规定如下:分数[60,75)[75,90)[90,100]等级Ⅰ级Ⅱ级Ⅲ级等级越高旅游资源开发越好,如Ⅱ级好于Ⅰ级.(1)估计A村评价分数的众数,并求a的值(同一组中的数据用该组区间的中点值作代表);(2)从参与评价的50人中随机抽取1人,估计该人对A村评价分数等级比B村评价分数等级高的频率;(3)以评价分数为依据,比较A,B两村旅游产业发展质量情况.解(1)因为A村评价分数频数最多的出现在[80,85),所以估计A村评价分数的众数为80+852=82.5(分).由5×(0.012×2+0.020+0.024+2a+0.036+0.040)=1,解得a=0.028.(2)设从参与评价的50人中随机抽取1人,该人“对A村评价分数等级为Ⅱ”的事件为A2,“对A村评价分数等级为Ⅲ”的事件为A3;“对B村评价分数等级为Ⅰ”的事件为B1,“对B村评价分数等级为Ⅱ”的事件为B2.由题表可知,P(A2)=10+14+650=0.6,P(A3)=4+150=0.1.由题图可知,P(B1)=(0.012+0.020+0.028)×5=0.3,P(B2)=(0.036+0.040+0.024)×5=0.5.A村评价分数等级比B村评价分数等级高的概率为P(A2B1)+P(A3B1)+P(A3B2)=P(A2)P(B1)+P(A3)·P(B1)+P(A3)P(B2)=0.6×0.3+0.1×0.3+0.1×0.5=0.26,所以该人对A村评价分数等级比B村评价分数等级高的概率估计值为0.26.(3)A村评价分数的平均数x-A=250×62.5+550×67.5+850×72.5+1050×77.5+1450×82.5+650×87.5+450×92.5+150×97.5=79.3(分).B村评价分数的平均数x-B=5×[0.012×(62.5+97.5)+0.020×67.5+0.028×(72.5+92.5)+0.036×77.5+0.040×82.5+0.024×87.5]=80.4(分).因为x-A<x-B,所以从评价分数来看,B村旅游产业发展质量要高于A村.感悟提升1.频率分布直方图的性质.(1)小长方形的面积=组距×频率组距=频率;(2)各小长方形的面积之和等于1;(3)小长方形的高=频率组矩.2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.训练1为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.题型二成对数据的统计分析角度1回归方程及其应用例2下表是国际数据公司(IDC)研究的全球近6年每年数字媒体阅读产生的数据量(单位:ZB)及相关统计量的值:年份201520162017201820192020序号x123456年数据量y7917223443x-y-z-∑6i=1(xi-x-)2∑6i=1(zi-z-)∑6i=1(zi-z-)2∑6i=1(xi-x-)(zi-z-)3.522218141249表中zi=lnyi,z-=16∑6i=1zi.(1)根据上表数据信息判断,方程y=c1·ec2x(e是自然对数的底数)更适宜作为该公司统计的年数据量y关于年份序号x的回归方程类型,试求此回归方程;(2)根据(1)中的回归方程,预计2024年的全世界数字媒体阅读产生的数据量是2021年的多少倍?并说明理由.(参考数据:e≈2.718,e≈1.648,结果精确到0.1)参考公式:回归方程y^=a^+b^x中,斜率最小二乘法公式b^=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2=∑ni=1xiyi-nx-y-∑ni=1x2i-nx-2,a^=y--b^x-.解(1)由y=c1·ec2x,两边同时取自然对数得lny=ln(c1·ec2x)=lnc1+c2x,设z=lny,则z=lnc1+c2x.因为x-=3.5,z-=2,∑6i=1(xi-x-)2=18,∑6i=1(xi-x-)(zi-z-)=9,所以c^2=∑bi=1(xi-x-)(zi-z-)∑bi=1(xi-x-)2=918=12,lnc^1=z--c^2x-=2-0.5×3.5=0.25.所以z=0.25+0.5x=lny,所以y=e0.25+0.5x.(2)令x=7,得y^1=e0.25+0.5×7=e3.75.令x=10,得y^2=e5.25,y^2y^1=e1.5=ee≈4.5,预计2024年全世界产生的数据规模是2021年的4.5倍.角度2独立性检验例3(2020·新高考全国Ⅰ卷改编)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:SO2PM2.5[0,50)[150,475]合计[0,75)641680[75,115]101020合计7426100依据小概率值α=0.01的独立性检验,分析该市一天中空气中PM2.5浓度是否和SO2浓度有关?解零假设为H0:该市一天中空气中PM2.5浓度与SO2浓度无关.χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(64×10-16×10)280×20×74×26=3600481≈7.4844>6.635=x0.01,依据小概率值α=0.01的独立性检验,可以判断H0不成立,即认为该市一天中空气中PM2.5浓度和SO2浓度有关.感悟提升成对数据的统计分析包括:(1)成对数据的相关性,主要是建立一元线性回归模型;(2)独立性检验:通过计算随机变量χ2的值,推断两个分类变量是否有关系.训练2(2022·济南模拟)某创新公司在第1个月至第7个月的5G经济收入y(单位:百万元)关于月份x的数据如下表:时间(月份)1234567收入(百万元)611213466101196根据以上数据绘制散点图:(1)根据散点图判断,y=ax+b与y=c·dx(a,b,c,d均为大于零的常数)哪一个适宜作为5G经济收入y关于月份x的回归方程类型?(给出判断即可,不必说明理由)并根据你的判断结果及表中的数据,求出y关于x的回归方程;(2)请你预测该公司8月份的5G经济收入.参考数据:∑7i=1yi∑7i=1vi∑7i=1xiyi∑7i=1xivi100.45100.5446210.78271150.122.823.47其中设v=lgy,vi=lgyi.参考公式:对于一组具有线性相关关系的数据(xi,vi)(i=1,2,3,…,n),其回归直线v^=β^x+α^的斜率和截距的最小二乘估计公式分别为:β^=∑ni=1xivi-nx-v-∑ni=1x2i-nx-2,α^=v--β^x-.解(1)根据散点图判断,y=c·dx适宜作为5G经济收入y关于月代码x的回归方程类型.∵y=c·dx,两边同时取常用对数得lgy=lg(c·dx)=lgc+lgd·x.设lgy=v,∴v=lgc+lgd·x.∵x-=17(1+2+3+4+5+6+7)=4,v-=17∑7i=1vi=17×10.78=1.54,∑7i=1x2i=12+22+32+42+52+62+72=140,∴lgd^=∑7i=1xivi-7x-v-∑7i=1x2i-7x-2=50.12-7×4×1.54140-7×42=728=0.25,把样本中心点(4,1.54)代入v=lgc+lgd·x,得1.54=lgc^+0.25×4,∴lgc^=0.54,v^=0.54+0.25x,∴lgy^=0.54+0.25x,∴y关于x的回归方程为y^=100.54+0.25x=3.47×100.25x.(2)∵当x=8时,y^=3.47×100.25×8=347,∴预测8月份的5G经济收入为347百万元.题型三概率与统计角度1离散型随机变量及其分布列例4(12分)某市某超市为了回馈新老顾客,决定在2023年元旦来临之际举行“庆元旦,迎新年”的抽奖派送礼品活动.为设计一套趣味性抽奖送礼品的活动方案,该超市面向该市某高中学生征集活动方案,该中学某班数学兴趣小组提供的方案获得了征用.方案如下:将一个4×4×4的正方体各面均涂上红色,再把它分割成64个相同的小正方体.经过搅拌后,从中任取两个小正方体,记它们的着色面数之和为ξ,记抽奖一次中奖的礼品价值为η.(1)求P(ξ=3);(2)凡是元旦当天在该超市购买物品的顾客,均可参加抽奖.记抽取的两个小正方体着色面数之和为6,设为一等奖,获得价值50元的礼品;记抽取的两个小正方体着色面数之和为5,设为二等奖,获得价值30元的礼品;记抽取的两个小正方体着色面数之和为4,设为三等奖,获得价值10元的礼品,其他情况不获奖.求某顾客抽奖一次获得的礼品价值的分布列与数学期望.[规范答题]解(1)64个小正方体中,三面着色的有8个,两面着色的有24个,一面着色的有24个,另外8个没有着色,∴P(ξ=3)=C18·C18+C124·C124C264=6402016=2063.……………………4分(2)ξ的所有可能取值为0,1,2,3,4,5,6,η的取值为50,30,10,0,……………………5分P(η=50)=P(ξ=6)=C28C264=282016=172,……………………6分P(η=30)=P(ξ=5)=C18·C124C264=1922016=221,……………………7分P(η=10)=P(ξ=4)=C224+C18·C124C264=4682016=1356,……………………8分P(η=0)=1-172-221-1356=83126.……………………9分所以随机变量η的分布列为η5030100P172221135683126……………………10分∴E(η)=50×172+30×221+10×1356+0×83126=37063.……………………12分第一步确定随机变量的所有可能值第二步求每一个可能值所对应的概率第三步列出离散型随机变量的分布列第四步求均值和方差第五步反思回顾、查看关键点、易错点和答题规范角度2概率与统计的综合问题例5某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校200名学生的课外体育锻炼平均每天运动的时间(单位:分钟)进行调查,将收集的数据分成[0,10),[10,20),[20,30),[30,40),[40,50),[50,60]六组,并作出频率分布直方图(如图),将日均课外体育锻炼时间不低于40分钟的学生评价为“课外体育达标”.(1)请根据直方图中
本文标题:高考重点突破课四 概率与统计
链接地址:https://www.777doc.com/doc-12816757 .html