您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 第02讲 成对数据的统计分析(练习)(原卷版)
第02讲成对数据的统计分析(模拟精练+真题演练)1.(2022·甘肃兰州·统考一模)下面是一个22列联表,其中a、b处填的值分别为()A.52、54B.54、52C.94、146D.146、942.(2023·海南海口·海南华侨中学校考模拟预测)为客观反映建设创新型国家进程中我国创新能力的发展情况,国家统计局社科文司《中国创新指数(CII)研究》课题组研究设计了评价我国创新能力的指标体系和指数编制方法.中国创新指数(ChinaInnovationIndex,CII)中有4个分指数(创新环境指数、创新投入指数、创新产出指数、创新成效指数),下面是2005—2021年中国创新指数及分领域指数图,由图可知指数与年份正相关,则对4个分领域指数,在建立年份值与指数值的回归模型中,相关系数最大的指数类型是()A.创新环境指数B.创新投入指数C.创新产出指数D.创新成效指数3.(2023·安徽六安·六安一中校考模拟预测)某学校一同学研究温差x(℃)与本校当天新增感冒人数y(人)的关系,该同学记录了5天的数据:x568912y17202528351y2y总计1xa21732x22527总计b46100经过拟合,发现基本符合经验回归方程ˆˆ2.6yxa,则下列结论错误的是()A.样本中心点为(8,25)B.ˆ4.2aC.5x时,残差为0.2D.若去掉样本点(8,25),则样本的相关系数r增大4.(2023·江西南昌·江西师大附中校考三模)下列说法:(1)分类变量A与B的随机变量2K越大,说明A与B相关的把握性越大;(2)以模型ekxyc去拟合一组数据时,为了求出回归方程,设lnzy,将其变换后得到线性方程0.75zx,则,ck的值分别是5e和0.7;(3)若随机变量1,4XN,且(3)0.16PX,则(11)0.34PX.以上正确的个数是()A.0B.1C.2D.35.(2023·重庆·统考二模)设两个相关变量x和y分别满足下表:x12345y128816若相关变量x和y可拟合为非线性回归方程ˆ2bxay,则当6x时,y的估计值为()(参考公式:对于一组数据11uv,,22uv,,,nnuv,,其回归直线ˆˆˆvu的斜率和截距的最小二乘估计公式分别为:1221ˆniiiniiuvnuvunu,ˆˆavu;51.152)A.33B.37C.65D.736.(2023·陕西商洛·校考三模)用模型ekxya拟合一组数,1,2,,10iixyi,若121010xxx,701210eyyy,设lnzy,得变换后的线性回归方程为4zbx,则ak()A.12B.43eC.34eD.77.(2022·四川成都·成都七中校考模拟预测)根据一组样本数据11,xy,22,xy,…,,nnxy,求得经验回归方程为ˆ1.50.5yx,且3x.现发现这组样本数据中有两个样本点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则()A.变量x与y具有正相关关系B.去除两个误差较大的样本点后,重新求得的经验回归方程为ˆ1.20.5yxC.去除两个误差较大的样本点后,y的估计值增加速度变快D.去除两个误差较大的样本点后,相应于样本点(2,3.75)的残差为0.058.(2021·江西南昌·南昌市八一中学校考三模)已知变量y关于x的回归方程为0.5bxye,其一组数据如表所示:若5x,则预测y值可能为()x1234ye3e4e6eA.5eB.112eC.7eD.152e9.(2021·山西·统考三模)某公交公司推出扫码支付乘车优惠活动,活动为期两周,活动的前五天数据如下表:第x天12345使用人数(y)151734578421333由表中数据可得y关于x的回归方程为255ˆyxm,则据此回归模型相应于点(2,173)的残差为()A.5B.6C.3D.210.(多选题)(2023·广东广州·统考模拟预测)总和生育率有时也简称生育率,是指一个人口群体的各年龄别妇女生育率的总和.它反映的是一名妇女在每年都按照该年龄别现有生育率生育的假设下,在育龄期间生育的子女总数.为了了解中国人均GDPx(单位:万元)和总和生育率y以及女性平均受教育年限z(单位:年)的关系,采用2012~2022近十年来的数据,,1,2,10iiixyzi绘制了散点图,并得到经验回归方程ˆ7.540.33zx,ˆ2.880.41yx,对应的决定系数分别为21R,22R,则()A.人均GDP和女性平均受教育年限正相关.B.女性平均受教育年限和总和生育率负相关C.2212RRD.未来三年总和生育率一定继续降低11.(多选题)(2023·江苏盐城·盐城市伍佑中学校考模拟预测)下列命题正确的是()A.对于事件A,B,若AB,且0.3PA,0.6PB,则1PBAB.若随机变量2~2,N,40.84P,则240.16PC.相关系数r的绝对值越接近1,两个随机变量的线性相关程度越强D.在做回归分析时,残差图中残差点分布的带状区域的宽度越宽表示回归效果越差12.(多选题)(2023·吉林长春·长春吉大附中实验学校校考模拟预测)2022年11月17日,工业和信息化部成功举办第十七届“中国芯”集成电路产业大会.此次大会以“强芯固基以质为本”为主题,旨在培育壮大我国集成电路产业,夯实产业基础、营造良好产业生态.某芯片研发单位用在“A芯片”上研发费用占本单位总研发费用的百分比y如表所示.已知40%y,于是分别用p=30%和p=40%得到了两条回归直线方程:11ˆˆybxa,22ˆˆybxa,对应的相关系数分别为1r、2r,百分比y对应的方差分别为21s、22s,则下列结论正确的是()(附:1221ˆniiiniixynxybxnx,ˆˆaybx)年份20182019202020212022年份代码x12345y20%p40%50%qA.12rrB.2212ssC.12ˆˆbbD.12ˆˆaa13.(多选题)(2023·福建厦门·统考模拟预测)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻的经常性有影响,随机抽取了300名学生,对他们是否经常锻炼的情况进行了调查,调查发现经常锻炼人数是不经常锻炼人数的2倍,绘制其等高堆积条形图,如图所示,则()A.参与调查的男生中经常锻炼的人数比不经常锻炼的人数多B.从参与调查的学生中任取一人,已知该生为女生,则该生经常锻炼的概率为57C.依据0.1的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.1D.假设调查人数为600人,经常锻炼人数与不经常锻炼人数的比例不变,统计得到的等高堆积条形图也不变,依据0.05的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.05附:22nadbcabcdacbd,230010060401002.6791401602001000.10.050.010.0050.001x2.7063.8416.6357.87910.82814.(2023·全国·镇海中学校联考模拟预测)害虫防控对于提高农作物产量具有重要意义.已知某种害虫产卵数y(单位:个)与温度x(单位:C)有关,测得一组数据,1,2,,20iixyiL,可用模型21ecxyc进行拟合,利用lnzy变换得到的线性回归方程为ˆˆ0.3zxa.若202011600,ln120iiiixy,则1c的值为.15.(2023·上海·统考模拟预测)某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的45,女生喜欢网络游戏的人数占女生人数的35.若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有人.(请将所有可能的结果都填在横线上)附表:22nadbcabcdacbd,其中nabcd.0.0500.010x3.8416.63516.(2023·广西桂林·校联考模拟预测)一只红铃虫产卵数y和温度x有关,现测得一组数据,1,2,,10iixyi,可用模型21ecxyc拟合,设lnzy,其变换后的线性回归方程为4zbx,若1210300xxx,501210eyyy,e为自然常数,则12cc.17.(2022·北京·人大附中校考模拟预测)某班在一次考试后分析学生在语文、数学、英语三个学科的表现,绘制了各科年级排名的散点图(如下图所示).关于该班级学生这三个学科本次考试的情况,给出下列四个结论:①三科中,数学年级排名的平均数及方差均最小;②语文、数学、英语年级排名均在150名以外的学生为1人;③本次考试该班语文第一名、数学第一名、英语第一名可能为三名不同的同学;④从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率为13.其中所有正确结论的序号是.18.(2022·安徽安庆·安庆一中校考三模)在工程技术和科学实验中,经常利用最小二乘法原理求曲线的函数关系式:设有一组实验数据(,)(0,1,2,,)kkxykn,它们大体分布在某条曲线上,通过偏差平方和最小求该曲线的方法称为最小二乘法,当该曲线为一条直线yaxb时,由方程组000200(1)kkkkkkknnnkkkknnxaxbxyxanby来确定a,b的值,此时偏差平方和表示为20()nkkkyaxb.为了测定某种刀具的磨损速度,每隔1小时测一次刀具的厚度,得到一组实验数据,如下表:顺序编号i01234567时间/ith01234567刀具厚度/mmiy27.026.826.526.326.125.725.324.8作出刀具厚度y关于时间t散点图,发现这些点分布在一条直线yatb(),abR附近.(1)求实数a,b的值,并估计9i时刀具厚度(所有结果均精确到0.1);(2)求偏差平方和.(参考数据:70717.0iiity,70208.5iiy)19.(2023·湖北武汉·华中师大一附中校考模拟预测)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:A区B区C区D区外来务工人数/x万3456就地过年人数/y万2.5344.5(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程ˆˆˆyabx和A区的残差(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.①若该市E区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E区就地过年的人员发放的补贴总金额;②若A区的外来务工人员中甲、乙选择就地过年的概率分别为,21pp,其中112p,该市政府对甲、乙两人的补贴总金额的期望不超过1400元,求p的取值范围.参考公式:相关系数1222211niiinniiiixynxyrxnxyny,回归方程ˆˆyabx中斜率和截距的最小二乘估计公式分别为1221ˆˆˆ,niiiniixynxybaybxxnx.20.(2023·江西南昌·南昌市八一中学校考三模)为了解某一地区电动汽车销售情况,某机构根据统计数据,用最小二乘法得到电动汽车销量(y单位:万台)关于(x年份)的线性回归方程为ˆ4.79495.2yx,且销量y的方差2
本文标题:第02讲 成对数据的统计分析(练习)(原卷版)
链接地址:https://www.777doc.com/doc-12823938 .html