您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 第34节 统计(原卷版)
第34节统计基本技能要落实考点一求线性回归方程【例1】(2022·四省八校双教研联考)越接近高考学生焦虑程度越强,四个高三学生中大约有一个有焦虑症,经有关机构调查,得出距离高考周数与焦虑程度对应的正常值变化情况如下表:周数x654321正常值y556372809099(1)作出散点图;(2)根据上表数据用最小二乘法求出y关于x的线性回归方程y^=b^x+a^(精确到0.01);(3)根据经验观测值为正常值的0.85~1.06为正常,若1.06~1.12为轻度焦虑,1.12~1.20为中度焦虑,1.20及其以上为重度焦虑,若为中度焦虑及其以上,则要进行心理疏导,若一个学生在距高考第二周时观测值为103,则该学生是否需要进行心理疏导?其中b^=i=1nxiyi-nxyi=1nx2i-nx2,i=16xiyi=1452,i=16x2i=91,a^=y-b^x.【方法技巧】线性回归分析问题的类型及解题方法1.求线性回归方程(1)利用公式,求出回归系数b^,a^.(2)待定系数法:利用回归直线过样本点的中心求系数.2.利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.3.利用回归直线判断正、负相关,决定正相关还是负相关的是系数b^.【跟踪训练】1.(2022·福州市第一学期抽测)随着我国中医学的发展,药用昆虫的使用相应愈来愈多.每年春暖以后至寒冬前,昆虫大量活动与繁殖,易于采集各种药用昆虫.已知一只药用昆虫的产卵数y(单位:个)与一定范围内的温度x(单位:℃)有关,于是科研人员在3月份的31天中随机挑选了5天进行研究,现收集了该种药用昆虫的5组观测数据如下表:日期2日7日15日22日30日温度x/℃101113128产卵数y/个2325302616(1)从这5天中任选2天,记这2天药用昆虫的产卵数分别为m,n,求事件“m,n均不小于25”的概率.(2)科研人员确定的研究方案是:先从这5组数据中任选2组,用剩下的3组数据建立y关于x的线性回归方程,再对被选取的2组数据进行检验.①若选取的是3月2日与30日这2组的数据,请根据3月7日、15日和22日这3组的数据,求出y关于x的线性回归方程;②若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问①中所得的线性回归方程是否可靠?附:回归直线的斜率和截距的最小二乘估计公式分别为b^=i=1nxi-xyi-yi=1nxi-x2,a^=y-b^x.考点二相关系数及其应用【例2】(2019·合肥市第二次质量检测)为了了解A地区足球特色学校的发展状况,某调查机构统计得到如下数据:年份x20142015201620172018足球特色学校数y/百个0.300.601.001.401.70(1)根据表中数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱(已知:0.75≤|r|≤1,则认为y与x线性相关性很强;0.3≤|r|0.75,则认为y与x线性相关性一般;|r|≤0.25,则认为y与x线性相关性较弱);(2)求y关于x的线性回归方程,并预测A地区2019年足球特色学校的个数(精确到个).参考公式及数据:r=i=1nxi-xyi-yi=1nxi-x2i=1nyi-y2,i=15(xi-x)2=10,i=15(yi-y)2=1.3,13≈3.6056,b^=i=1nxi-xyi-yi=1nxi-x2,a^=y-b^x.【方法技巧】模型拟合效果的判断(1)残差平方和越小,模型的拟合效果越好.(2)相关指数R2越大,模型的拟合效果越好.(3)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.【跟踪训练】(2022·贵阳市第一学期监测)互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下简称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:1日2日3日4日5日外卖甲日接单x/百单529811外卖乙日接单y/百单2310515(1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经营状况;(2)据统计表明,y与x之间具有线性关系.①请用相关系数r对y与x之间的相关性强弱进行判断(若|r|0.75,则可认为y与x有较强的线性相关关系(r值精确到0.001));②经计算求得y与x之间的回归方程为y^=1.382x-2.674,假定每单外卖业务,企业平均能获取纯利润3元,试预测当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润的大致范围(x值精确到0.01).相关公式:r=i=1nxi-xyi-yi=1nxi-x2i=1nyi-y2.参考数据:i=15(xi-x)(yi-y)=66,i=15xi-x2i=15yi-y2≈77.考点三独立性检验【例3】(2019·福州市质量检测)中国房地产业协会主办的中国房价行情网调查的一份数据显示,2018年7月,大部分一线城市的房租租金同比涨幅都在10%以上.某部门研究成果认为,房租支出超过月收入13的租户“幸福指数”低,房租支出不超过月收入13的租户“幸福指数”高.为了了解甲、乙两小区租户的幸福指数高低,随机抽取甲、乙两小区的租户各100户进行调查.甲小区租户的月收入以[0,3),[3,6),[6,9),[9,12),[12,15](单位:千元)分组的频率分布直方图如图所示.乙小区租户的月收入(单位:千元)的频数分布表如下:月收入[0,3)[3,6)[6,9)[9,12)[12,15]户数38272492(1)设甲、乙两小区租户的月收入相互独立,记M表示事件“甲小区租户的月收入低于6千元,乙小区租户的月收入不低于6千元”,把频率视为概率,求M的概率;(2)利用频率分布直方图,求所抽取的甲小区100户租户的月收入的中位数;(3)若甲、乙两小区每户的月租费分别为2千元、1千元.请根据条件完成下面的2×2列联表,并说明能否在犯错误的概率不超过0.001的前提下认为“幸福指数与租住的小区”有关.幸福指数低幸福指数高总计甲小区租户乙小区租户总计附:临界值表P(K2≥k)0.100.0100.001k2.7066.63510.828参考公式:K2=nad-bc2a+bc+da+cb+d.【跟踪训练】2.(2019·郑州市第二次质量预测)为推动更多人去阅读和写作,联合国教科文组织确定每年的4月23日为“世界读书日”,其设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,这200人中通过电子阅读与纸质阅读的人数之比为3∶1.将这200人按年龄(单位:岁)分组,统计得到通过电子阅读的居民的频率分布直方图如图所示.(1)求a的值及通过电子阅读的居民的平均年龄;(2)把年龄在[15,45)的居民称为中青年,年龄在[45,65]的居民称为中老年,若选出的200人中通过纸质阅读的中老年有30人,请完成下面2×2列联表,并判断是否有97.5%的把握认为阅读方式与年龄有关?电子阅读纸质阅读总计中青年中老年总计附:P(K2≥k0)0.1500.1000.0500.0250.010k02.0722.7063.8415.0246.635K2=nad-bc2a+bc+da+cb+d.解:(1)由题中频率分布直方图可得10×(0.01+0.015+a+0.03+0.01)=1,解得a=0.035,所以通过电子阅读的居民的平均年龄为20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5(岁).(2)这200人中通过电子阅读的人数为200×33+1=150,通过纸质阅读的人数为200-150=50.因为(0.01+0.015+0.035)∶(0.03+0.01)=3∶2,所以通过电子阅读的中青年的人数为150×33+2=90,中老年的人数为150-90=60.2×2列联表为电子阅读纸质阅读总计中青年9020110中老年603090总计15050200由表中数据,得K2=200×90×30-20×602110×90×150×50≈6.0615.024,所以有97.5%的把握认为阅读方式与年龄有关.达标检测要扎实一、解答题1.某校高一年级学生全部参加了体育科目的达标测试,现从中随机抽取40名学生的测试成绩,整理数据并按分数段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组,假设同一组中的每个数据可用该组区间的中点值代替,则得到体育成绩的折线图(如图).(1)体育成绩大于或等于70分的学生常被称为“体育良好”.已知该校高一年级有1000名学生,试估计高一年级中“体育良好”的学生人数;(2)现从体育成绩在[60,70)和[80,90)的样本学生中随机抽取2人,求在抽取的2名学生中,体育成绩在[60,70)的学生人数X的分布列及数学期望.2.某新型智能家电在网上销售,由于安装和使用等原因,必须有售后服务人员上门安装和现场教学示范操作,所以每个销售地区需配备若干售后服务店.A地区通过几个月的网上销售,发现每月利润(万元)与该地区的售后服务店个数有相关性.下表中x表示该地区的售后服务店个数,y表示在有x个售后服务店情况下的月利润额.x(个)23456y(万元)1934465769(1)求y关于x的线性回归方程.(2)假设x个售后服务店每月需消耗资金23.80.5tx(单位:万元),请结合(1)中的线性回归方程,估算A地区开设多少个售后服务店时,才能使A地区每月所得利润平均到每个售后服务店最高.附:回归直线的斜率和截距的最小二乘法估计公式分别为:121ˆniiiniixxyybxx,ˆˆaybx.参考数据:511023iiixy.3.某校为引导学生学习党史,校党委宣传组织了党史知识竞赛,对前来参赛的150名学生(男生100人,女生50人),成绩不低于80分的学生为“党史达人”,成绩低于80分的学生为“非党史达人”,统计了他们的成绩情况,结果如下:男生中有60人被评为“党史达人”,女生中有40人被评为“党史达人”.(1)完善列联表,并判断:是否有99%的把握认为党史成绩优秀与否与性别有关?性别是否为党史达人党史达人非党史达人男生女生(2)如果用这150名学生中,男生和女生“党史达人”的频率分别代替该校男生和女生被评为“党史达人”的概率,且每位学生是否被评为“党史达人”相互独立,现从该校学生中随机抽取3人(2男1女),设随机变量X表示“3人中党史达人”的人数,试求X的分布列和数学期望.附:22(),nadbcKnabcdabcdacbd.2PKk0.100.050.0250.010.005k2.7063.8415.0246.6357.8794.某花圃为提高某品种花苗质量,开展技术创新活动,,AB在实验地分别用甲、乙方法培训该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a的值,并求综合评分的中位数.(2)填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.优质花苗非优质花苗合计甲培优法20乙培优法10合计附:下面的临界值表仅供参考.2PKk0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828(参考公式:
本文标题:第34节 统计(原卷版)
链接地址:https://www.777doc.com/doc-12797582 .html