您好,欢迎访问三七文档
[必备知识]1.线性回归模型(1)随机误差具有线性相关关系的两个变量的取值x,y,y的值不能由x完全确定,可将x,y之间的关系表示为y=a+bx+ε,其中_________是确定性函数,ε称为随机误差.a+bx(2)随机误差产生的主要原因①所用的_____________不恰当引起的误差;②忽略了__________________;③存在______误差.确定性函数某些因素的影响观测(3)线性回归模型中a,b值的求法y=____________称为线性回归模型.a,b的估计值为a^,b^,则a+bx+ε(4)回归直线和线性回归方程直线___________x称为回归直线,此直线方程即为线性回归方程,a^称为___________,b^称为___________,y^称为___________.[提醒](1)在线性回归方程中,b既表示回归直线的斜率,又表示自变量x的取值增加一个单位时,函数值y的改变量.(2)通过回归方程y^=a^+b^x可求出相应变量的估计值.y^=a^+b^回归截距回归系数回归值2.样本相关系数r及其性质(1)r=_____________________________.(2)r具有以下性质①|r|≤___.②|r|越接近于____,x,y的线性相关程度越强.③|r|越接近于____,x,y的线性相关程度越弱.i=1nxiyi-nxyi=1nx2i-nx2i=1ny2i-ny20113.对相关系数r进行显著性检验的基本步骤(1)_________________:变量x,y不具有线性相关关系.(2)如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n-2在教材附录2中查出一个r的临界值r0.05(其中1-0.95=0.05称为检验水平).(3)计算__________________.(4)作出统计推断:若|r|______,则否定H0,表明有______的把握认为x与y之间具有线性相关关系;若|r|≤r0.05,则__________________原来的假设H0,即就目前数据而言,没有充分理由认为y与x之间有线性相关关系.提出统计假设H0样本相关系数rr0.0595%没有理由拒绝[提醒]判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断.考点一线性回归分析[典例]假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:x23456y2.23.85.56.57.0若由数据可知,y对x呈现线性相关关系.(1)求线性回归方程;(2)估计使用年限为10年时,维修费用是多少?[解](1)列表如下:i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.0x2i49162536经计算得:x=4,y=5,i=15x2i=90,i=15xiyi=112.3,于是有b^=i=15xiyi-5x-y-i=15x2i-5x2=1.23,a^=y-b^·x=0.08,所以线性回归方程为y^=a^+b^x=0.08+1.23x.(2)当x=10时,y^=0.08+1.23×10=12.38(万元),即若估计使用年限为10年时,维修费用为12.38万元.[类题通法]线性回归分析的步骤(1)列出散点图,从直观上分析数据间是否存在线性相关关系;(2)计算x,y,i=1nx2i,i=1ny2i,i=1nxiyi;(3)代入公式求出y^=b^x+a^中参数b^,a^的值;(4)写出线性回归方程,并对实际问题作出估计.[针对训练]1.已知x与y之间的一组数据如下:x0123ym35.57已求得关于y与x的线性回归方程为y=2.1x+0.85,则m的值为()A.1B.0.85C.0.7D.0.5解析:选D由题中数据,得y=(0+1+2+3)=1.5,=(m+3+5.5+7)=,故样本点的中心为.由样本点的中心必在回归直线上可知,=2.1×1.5+0.85,解得m=0.5.2.某班5名学生的数学和物理成绩如表:学生学科ABCDE数学成绩(x)8876736663物理成绩(y)7865716461(1)画出散点图;(2)求物理成绩y对数学成绩x的线性回归方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.解:(1)散点图如图.(2)∵x=15×(88+76+73+66+63)=73.2.y=15×(78+65+71+64+61)=67.8.i=15xiyi=88×78+76×65+73×71+66×64+63×61=25054.又i=15x2i=882+762+732+662+632=27174.∴b^=i=15xiyi-5x·yi=15x2i-5x2≈0.625.∴a^=y-b^x=67.8-0.625×73.2=22.05.∴y对x的线性回归方程是y^=0.625x+22.05.(3)当x=96时,y^=0.625×96+22.05≈82.可以预测他的物理成绩是82.考点二相关性检验[典例]现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x)与入学后第一次考试的数学成绩(y)如下:学生号12345678910x12010811710410311010410599108y84648468696869465771请问:这10名学生的两次数学成绩是否具有线性关系?[解]x=110(120+108+…+99+108)=107.8,y=110(84+64+…+57+71)=68.i=110x2i=1202+1082+…+992+1082=116584.i=110y2i=842+642+…+572+712=47384.i=110xiyi=120×84+108×64+…+99×57+108×71=73796.所以相关系数为r=73796-10×107.8×68116584-10×107.8247384-10×682≈0.751.由检验水平0.05及n-2=8,在附录2中查得r0.05=0.632,因为0.7510.632,由此可看出这10名学生的两次数学成绩具有较强的线性相关关系.[类题通法]利用相关系数r进行判断相关关系,需要应用公式计算出r的值,由于数据较大,需要借助计算器,但计算时应该特别细心,避免出现计算错误.[针对训练]1.对于回归分析,有下列叙述错误的是()A.在回归分析中,变量间的关系若是非确定性关系,则因变量不能自由变量惟一确定.B.线性相关系数可以是正的或是负的.C.回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关.D.样本相关系数r∈(-∞,+∞).解析:选D由回归模型及其性质易知A,B,C是正确的.相关系数的取值范围应为|r|≤1,所以D是错误的.2.一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少,随机器运转的速度而变化,下表为抽样试验的结果:转速x(转/秒)1614128每小时生产有缺点的零件数y(件)11985对变量y与x进行线性相关性检验.解:由题中数据可得x=12.5,y=8.25,i=14xiyi=438,4xy=412.5,i=14x2i=660,i=14y2i=291,所以r=i=14xiyi-4xyi=14x2i-4x2i=14y2i-4y2=438-412.5660-625×291-272.25=25.5656.25≈0.995.由检验水平0.05及n-2=2在教材附录表2中查得r0.05=0.950,因为rr0.05,所以y与x具有线性相关关系.
本文标题:(江苏专用)2019-2020学年高中数学 第三章 统计案例 3.2 回归分析课件 苏教版选修2-3
链接地址:https://www.777doc.com/doc-8341357 .html