您好,欢迎访问三七文档
第1页共4页◎第2页共4页选修1-2第一章线性回归和独立检验1.下表是某厂1—4月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由散点图可知,用水量与月份之间有较好的线性相关关系,其线性回归方程为()y=-0.7x+a,则a等于()A.10.5B.5.15C.5.2D.5.252.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日到3日的每天昼夜温差与实验室每天每100颗种子发芽数,得到如下资料:该农科所确定的研究方案是:先从这3组数据求出线性回归方程,再对12月4日的数据进行推测和检验.则根据以上3天的数据,求出y关于x的线性回归方程是()A.23yxB.39yxC.532yxD.743yx5.下列说法正确的有()个①在回归分析中,用指数系数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好.②在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,拟合效果越好.③在回归分析中,可用相关系数r的值判断模型的拟合效果,r越大,模型的拟合效果越好.④在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.A.1B.2C.3D.46.相关系数是度量()A.两个变量之间线性相关关系的强度B.散点图是否显示有意义的模型C.两个变量之间是否存在因果关系D.两个变量之间是否存在关系7.统计中有一个非常有用的统计量2k,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个平行班(甲班A老师教,乙班B老师教)进行某次数学考试,按学生考试及格与不及格统计成绩后的2×2列联表.不及格及格总计甲班(A教)43640乙班(B教)162440总计206080根据2k的值,你认为不及格人数的多少与不同老师执教有关系的把握大约为()A.99.5%B.99.9%C.95%D.无充分依据.8.给出如下列联表患心脏病患其它病合计高血压201030不高血压305080合计5060110001.0)828.10(2KP,010.0)635.6(2KP,参照公式,得到的正确结论是()A.有99%以上的把握认为“高血压与患心脏病无关”B.有99%以上的把握认为“高血压与患心脏病有关”C.在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病无关”D.在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病有关”10.已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程为axby必过点()A.(2,2)B.(1.5,4)C.(1.5,0)D.(1,2)11.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n次方个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线,以下结论正确的是()A.直线l过点B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同12.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度。如果3.841k,那么就有把握认为“X和Y有关系”的百分比为()2pKk0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.83A.25%B.95%C.5%D.97.5%13.下面关于卡方说法正确的是()A.K2在任何相互独立的问题中都可以用于检验有关还是无关B.K2的值越大,两个事件的相关性就越大C.K2是用来判断两个分类变量是否相关的随机变量,当K2的值很小时可以推定两类变量不相关D.K2的观测值的计算公式是))()()(()(2dbcadcbabcadnK15.吃零食是中学生中普遍存在的现象.吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表:试回答吃零食与性别有关系吗?(答有或没有)____________.16.若由一个2*2列联表中的数据计算得k2=4.013,那么有______把握认为两个变量有关系?日期12月1日12月2日12月3日温差x(0C)111312发芽数y(颗)253026男女总计喜欢吃零食51217不喜欢吃零食402868合计454085第3页共4页◎第4页共4页17.给出下列四个结论:①在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上;②线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越小;③用独立性检验(2Χ2列联表法)来考察两个分类变量是否有关系时,算出的随机变量k2的值越大,说明“x与y有关系”成立的可能性越大;④残差平方和越小的模型,拟合的效果越好;其中结论正确的序号为。18.某城市理论预测2000年到2004年人口总数与年份的关系如下表所示年份200x(年)01234人口数y(十万)5781119根据表格和线性回归方程,可预报在2005年,该城市人口总数是___________19.对于回归直线方程4.75257yx,当28x时,y的估计值为.20.对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.22.如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于_______________,解释变量和预报变量之间的相关系数等于_________________。23.下表是种产品销售收入与销售量之间的一组数据:销售量x(吨)2356销售收入y(千元)78912(1)画出散点图;(2)求出回归方程;(3)根据回归方程估计销售量为9吨时销售收入。24.甲乙两车间生产同一种产品,各生产40个后,按产品合格与不合格进行统计,甲车间生产的产品合格数为36个,乙车间生产的产品合格数为24个.(1)根据以上数据完成22列联表:(2)试判断是否产品合格与生产车间是否有关?25.某种产品的广告费用支出x与销售额y之间有如下的对应数据:(1)画出散点图;并说明销售额y与广告费用支出x之间是正相关还是负相关?(2)用最小二乘法求出y关于x的线性回归方程abxyˆ;(3)据此估计广告费用为10时,销售收入y的值.26.某学校为调查高三年学生的身高情况,按随机抽样的方法抽取80名学生,得到男生身高情况的频率分布直方图(图(1)和女生身高情况的频率分布直方图(图(2)).已知图(1)中身高在170~175cm的男生人数有16人。(I)试问在抽取的学生中,男、女生各有多少人?(II)根据频率分布直方图,完成下列的2×2列联表,并判断能有多大(百分几)的把握认为“身高与性别有关”?(Ⅲ)在上述80名学生中,从身高在170~175cm之间的学生按男、女性别分层抽样的方法,抽出5人,从这5人中选派3人当旗手,求3人中恰好有一名女生的概率。x24568y304060507080及80分以上80分以下合计试验班351550对照班20m50合计5545n本卷由系统自动生成,请仔细校对后使用,答案仅供参考。答案第1页,总9页参考答案1.D【解析】试题分析:因为回归直线方程过样本中心点,而此题的样本中心点为45.2345.4,44321即5.3,5.2,将样本中心点代入回归直线方程a5.27.05.3得25.5a考点:回归分析的基本思想及应用2.C【解析】122122222212,y=27.b=1023112513301226816512271011131285125252712325yx32niiiniixxynxyxnxaybxybxaxC由数据,求得所以关于的线性回归方程为所以选3.C【解析】732152,852860aba,故选C4.A【解析】2290(1236339)900.55945452169161,故选A。5.B【解析】用系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好,故(1)正确,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故(2)不正确可用相关系数r的值判断模型的拟合效果,|r|越大,模型的拟合效果越好,故(3)正确,一般不能用残差图判断模型的拟合效果,故(4)不正确,综上可知有2个命题正确,故选B.6.A【解析】解:相关系数是度量两个变量相关性关系强弱的一个量,当r的绝对值越接近于1,相关性越强。反之,相关性越弱。7.A本卷由系统自动生成,请仔细校对后使用,答案仅供参考。答案第2页,总9页【解析】解:k2=22()()()()()nadbckabcdacbd=80(4×24-16×36)2/20×60×40×40=9.6>7.879∴不及格人数的多少与不同老师执教有关系的把握大约为99.5%故选A.8.B【解析】因为22110(20501030)7.48630608050,所以010.0)635.6(2KP,因而有99%以上的把握认为“高血压与患心脏病有关”.9.B【解析】试题分析:33531x,931584y,故线性回归abxy所表示的直线必经过)9,3(,故选B.考点:线性回归方程点评:解决线性回归直线的方程,利用最小二乘法求出直线的截距和斜率,注意由公式判断出回归直线一定过样本中心点.10.B【解析】试题分析:由数据可知01231.54x,135744y,∴线性回归方程为axby必过点(1.5,4)考点:本题考查了线性回归直线方程的性质点评:解决此类问题常常用到线性回归直线方程恒过定点(,)xy这一结论,属基础题11.A【解析】试题分析:回归直线一定过这组数据的样本中心点,两个变量的相关系数不是直线的斜率,两个变量的相关系数的绝对值是小于1的,是在﹣1与1之间,所有的样本点集中在回归直线附近,没有特殊的限制.解:回归直线一定过这组数据的样本中心点,故A正确,两个变量的相关系数不是直线的斜率,而是需要用公式做出,故B不正确,两个变量的相关系数的绝对值是小于1的,故C不正确,所有的样本点集中在回归直线附近,不一定两侧一样多,故D不正确,故选A.点评:本题考查线性回归方程,考查样本中心点的性质,考查相关系数的做法,考查样本点的分布特点,是一个基础题.12.B【解析】本卷由系统自动生成,请仔细校对后使用,答案仅供参考。答案第3页,总9页试题分析:解:∵k>5、024,而在观测值表中对应于5.024的是0.025,∴有1-0.025=97.5%的把握认为“X和Y有关系”,故选D..考点:独立性检验的应用..13.B【解析】2K只适用于2×2型列联表问题,且2K只能推定两个分类变量相关的大小,所以A错;2K的值很小时,只能说两个变量的相关程度低,不能推定两个变量不相关.所以C错;选项D中22()()()()()nadbcKabcdacbd,所以D错。故选B14.24.68【解析】略15.有【解析】2285(5281240)4.72217684540,则吃零食和性别有关系的概率为95%,所以两者有关系16.95%【解析】解:∵一个2*2列联表中的数据计算得Χ2=4.013,4.013>3.841,∴有95%的把握说这两个变量有关系,答案为:95%17.③、④【解析】解:①中预报变量和解释变量位置反了,②线性相关系数|r|越大,相关性越强。③用独立性检验(2Χ2列联表法)来考察两个分类变量是否有关系时,算出的随机变量k2的值越大,说明“x与y有关系”成立的可能性越大;符合定义。④残差平方和越小的模型,拟合的效果越好,成立。1
本文标题:线性回归和独立检验
链接地址:https://www.777doc.com/doc-2057148 .html