您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 医学试题/课件 > 人教A版数学选修23全册课件第三章31回归分析的基本思想及其初步应用
第三章3.1回归分析的基本思想及其初步应用2突破常考题型题型一1理解教材新知题型二题型三3跨越高分障碍4应用落实体验随堂即时演练课时达标检测知识点一知识点二3.1回归分析的基本思想及其初步应用[提出问题]《必修3》中,求出回归直线方程y^=b^x+a^.问题1:回归直线方程准确的反映了x,y之间的关系吗?回归直线方程提示:不是.问题2:所有的两个相关变量都可以求回归方程吗?提示:可以,但拟合程度很差.[导入新知]1.回归分析回归分析是对具有的两个变量进行统计分析的一种常用方法.2.回归直线方程方程y^=b^x+a^是两个具有线性相关关系的变量的一组数据(x1,y1)(x2,y2),…,(xn,yn)的回归方程,其中a^,b^是待定参数,其最小二乘估计分别为:相关关系b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x,其中x=1ni=1nxi,y=1ni=1nyi,称为样本点的中心.(x,y)[化解疑难]线性回归方程中系数b^的含义(1)b^是回归直线的斜率的估计值,表示x每增加一个单位,y的平均增加单位数,而不是增加单位数.(2)当b^>0时,变量y与x具有正的线性相关关系;当b^<0时,变量y与x具有负的线性相关关系.线性回归分析[提出问题]具有相关关系的两个变量的回归直线方程y^=b^x+a^.问题1:预报变量y^与真实值y一样吗?提示:不一定.问题2:预报值y^与真实值y之间误差大了好还是小了好?提示:越小越好.[导入新知]1.残差平方和法(1)e^i=yi-y^i=yi-b^xi-a^(i=1,2,…,n),称为相应于点(xi,yi)的残差.(2)残差平方和越小,模型拟合效果越好.2.残差图法残差点落在水平的带状区域内,说明选用的模型比较合适,其中这样的带状区域宽度,说明模型的精确度越高.i=1n(yi-y^i)2比较均匀地越窄3.利用相关指数R2刻画回归效果其计算公式为:R2=,其几何意义:,表示回归效果越好.1-i=1nyi-y^i2i=1nyi-y2R2越接近于1[化解疑难]1.在线性回归模型中,因为e是一个随机变量,所以可以通过其数字特征来刻画它的一些总体特征.2.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好.求线性回归方程[例1]某种产品的广告费用支出x与销售额y(单位:百万元)之间有如下的对应数据:x/百万元24568y/百万元3040605070(1)画出散点图;(2)求线性回归方程;(3)试预测广告费用支出为10百万元时,销售额多大?[解](1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:i12345合计xi2456825yi3040605070250xiyi601603003005601380x2i416253664145所以,x=255=5,y=2505=50,i=15x2i=145,i=15xiyi=1380.于是可得b^=i=15xiyi-5xyi=15x2i-5x2=1380-5×5×50145-52×5=6.5,a^=y-b^x=50-6.5×5=17.5.所以所求的线性回归方程为y^=6.5x+17.5.(3)根据上面求得的线性回归方程,当广告费用支出为10百万元时,y^=6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.[类题通法]求线性回归方程的步骤(1)列表表示xi,yi,xiyi,x2i;(2)计算x,y,i=1nx2i,i=1nxiyi;(3)代入公式计算a^,b^的值;(4)写出线性回归方程.[活学活用]为了估计山上积雪融化后对下游灌溉的影响,在山下建立了一个观测站,测量了最大积雪深度x(尺)与当年灌溉面积y(千亩),得到连续10年的数据于下表:年序最大积雪深度x/尺灌溉面积y/千亩115.228.6210.419.3321.240.5418.635.6526.448.9年序最大积雪深度x/尺灌溉面积y/千亩623.445.0713.529.2816.734.1924.046.71019.137.4(1)试根据散点图判断变量y与x是否相关?(2)若y与x相关,求出回归直线方程.解:为了研究这些数据中所蕴含的规律性,我们把各年最大积雪深度作为横坐标,相应的灌溉面积作为纵坐标,将这些数据点标在平面直角坐标系中,如下图所示.从上图可以看到,数据点大致落在一条直线附近,这告诉我们变量x与y之间的关系大致可看作是线性关系,从上图还可以看到,这些点又不都在一条直线上,这表明x与y的关系并没有确切到给定x就可以唯一地确定y的程度,事实上,还有许多其他因素对y产生影响,如当年的平均气温,当年的降雨量等等,这些都是影响y取什么值的随机因素,研究x与y的关系,利用公式得,x=110(15.2+10.4+…+19.1)=18.85,y=110(28.6+19.3+…+37.4)=36.53,i=110x2i-10x2=227.845,i=110xiyi-10xy=413.065,b^=∑ni=1xiyi-10x-y-∑ni=1x2i-10x-2≈1.813,a^=36.53-1.813×18.85≈2.355.从而回归直线方程为y^=1.813x+2.355.[例2]已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x(元)1416182022y(件)1210753求y对x的回归直线方程,并说明回归模型拟合效果的好坏.线性回归分析[解]x=15×(14+16+18+20+22)=18,y=15×(12+10+7+5+3)=7.4,i=15x2i=142+162+182+202+222=1660,i=15y2i=122+102+72+52+32=327,i=15xiyi=14×12+16×10+18×7+20×5+22×3=620,∴b^=i=15xiyi-5x-y-i=15x2i-5x2=620-5×18×7.41660-5×182=-1.15.a^=y-b^x=7.4+1.15×18=28.1,∴所求回归直线方程为y^=-1.15x+28.1.列出残差表:yi-y^i00.3-0.4-0.10.2yi-y4.62.6-0.4-2.4-4.4∴i=15(yi-y^i)2=0.3,i=15(yi-y-)2=53.2,R2=1-i=15yi-y^i2i=15yi-y-2≈0.994,故回归模型的拟合效果很好.[类题通法]在进行线性回归分析时,要按线性回归分析步骤进行.在求R2时,通常采用分步计算的方法,R2越大,模型的拟合效果越好.[活学活用]关于x与y有如下数据:x24568y3040605070有如下的两个线性模型:(1)y^=6.5x+17.5;(2)y^=7x+17.试比较哪一个拟合效果更好.解:由(1)可得yi-y^i与yi-y的关系如下表:yi-y^i-0.5-3.510-6.50.5yi-y--20-1010020∴i=15(yi-y^i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,i=15(yi-y-)2=(-20)2+(-10)2+102+02+202=1000.∴R21=1-i=15yi-y^i2i=15yi-y-2=1-1551000=0.845.由(2)可得yi-y^i与yi-y-的关系如下表:yi-y^i-1-58-9-3yi-y--20-1010020∴i=15(yi-y^i)2=(-1)2+(-5)2+82+(-9)2+(-3)2=180,i=15(yi-y-)2=(-20)2+(-10)2+02+102+202=1000.∴R22=1-i=15yi-y^i2i=15yi-y-2=1-1801000=0.82.由于R21=0.845,R22=0.82,0.845>0.82,∴R21>R22.∴(1)的拟合效果好于(2)的拟合效果.非线性回归分析[例3]在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124y1612521试建立y与x之间的回归方程.[解]作出变量y与x之间的散点图,如图所示.由图可知变量y与x近似地呈反比例函数关系.设y=kx,令t=1x,则y=kt.由y与x的数据表可得y与t的数据表:t4210.50.25y1612521作出y与t的散点图,如图所示:由图可知y与t近似地呈线性相关关系.又t=1.55,y=7.2,i=15tiyi=94.25,i=15t2i=21.3125,b^=i=15tiyi-5t-y-i=15t2i-5t-2=94.25-5×1.55×7.221.3125-5×1.552≈4.1344,a^=y--b^t-=7.2-4.1344×1.55≈0.8,∴y^=4.1344t+0.8.所以y与x的回归方程是y^=4.1344x+0.8.[类题通法]非线性回归分析的步骤非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:[活学活用]3.某电容器充电后,电压达到100V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:t/s012345678910U/V100755540302015101055试求:电压U对时间t的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)解:对U=Aebt两边取对数得lnU=lnA+bt,令y=lnU,a=lnA,x=t,则y=a+bx,y与x的数据如下表:x012345678910y4.64.34.03.73.43.02.72.32.31.61.6根据表中数据画出散点图,如图所示,从图中可以看出,y与x具有较好的线性相关关系,由表中数据求得x=5,y≈3.045,由公式计算得b^≈-0.313,a^=y-b^x=4.61,所以y对x的线性回归方程为y^=-0.313x+4.61.所以lnU^=-0.313t+4.61,即U^=e-0.313t+4.61=e-0.313t·e4.61,因此电压U对时间t的回归方程为U^=e-0.313t·e4.61.9.明辨相关系数的意义[典例]下列现象的线性相关程度最高的是()A.某商店的职工人数与商品销售额之间的相关系数为0.87B.流通费用率与商业利润率之间的相关系数为-0.94C.商品销售额与商业利润率之间的相关系数为0.51D.商品销售额与流通费用率之间的相关系数为0.81[解析]|r|越接近于1,相关程度越高.[答案]B[易错防范]1.解题误认为r越近于1,相关程度越高,从而误选A.2.|r|值越大,变量之间的线性相关程度越高;|r|值越接近0,变量之间的线性相关程度越低.[成功破障]变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2<r1<0B.0<r2<r1C.r2<0<r1D.r2=r1解析:对于变量X与Y而言,Y随X的增大而增大,故变量Y与X正相关,即r1>0;对于变量U与V而言,V随U的增大而减小,故变量V与U负相关,即r1<0.故r2<0<r1.答案:C[随堂即时演练]1.关于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是
本文标题:人教A版数学选修23全册课件第三章31回归分析的基本思想及其初步应用
链接地址:https://www.777doc.com/doc-5877875 .html