您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 高中数学-第三章3.2回归分析课件-新人教B版选修2-3
第三章3.2回归分析把握热点考向应用创新演练考点一考点二理解教材新知考点三1.线性模型在回归直线方程y^=b^x+a^中,b^=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx2,a^=.其中x-=,y-=,(x-,y-)称为样本点的中心.y-b^x-1ni=1nxi1ni=1nyi2.线性相关性检验(1)对于变量x与Y随机抽取到的n对数据(x1,y1),(x2,y2),…,(xn,yn),检验统计量是样本相关系数r=i=1nxi-xyi-yi=1nxi-x2i=1nyi-y2=i=1nxiyi-nxyi=1nx2i-nx2i=1ny2i-ny2r具有以下性质:|r|≤1,并且r越接近1,线性相关程度越;|r|越接近0,线性相关程度越.(2)检验步骤如下:①作统计假设:x与Y不具有线性相关关系.②根据小概率0.05与n-2在附表中查出r的一个临界值r0.05.③根据样本相关系数计算公式算出r的值.④作出统计推断.如果,表明有95%把握认为x与Y之间具有线性相关关系.如果,我们没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的.强弱|r|r0.05|r|≤r0.051.判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用样本相关系数来判断.2.|r|越接近1,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据的效果就越好.3.样本相关系数r只能描述两个变量之间的变化方向及密切程度,不能揭示二者之间的本质联系.4.样本相关系数r可以定量地反映出变量间的相关程度,明确的给出有无必要建立两变量间的回归方程.[例1]某种产品的广告费用支出x与销售额Y(单位:百万元)之间有如下的对应数据:(1)画出散点图;(2)求回归直线方程;(3)试预测广告费用支出为10百万元时,销售额多大?x/百万元24568Y/百万元3040605070[思路点拨](1)按表中的数据在平面直角坐标系中描点即得散点图;(2)由公式求出a^,b^,写出回归直线方程;(3)利用回归方程分析.[精解详析](1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:i12345合计xi2456825yi3040605070250xiyi601603003005601380x416253664145所以,x=255=5,y=2505=50,i=15x2i=145,i=15xiyi=1380.于是可得b^=i=15xiyi-5xyi=15x2i-5x2=1380-5×5×50145-52×5=6.5,a^=y-b^x=50-6.5×5=17.5.所以所求的线性回归方程为y^=6.5x+17.5.(3)根据上面求得的线性回归方程,当广告费用支出为10百万元时,y^=6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.[一点通]求线性回归方程的步骤:(1)列表表示xi,yi,xiyi;(2)计算x,y,i=1nx2i,i=1nxiyi;(3)代入公式计算a^,b^的值;(4)写出线性回归方程.1.已知线性回归方程为y^=2-2.5x,则x=25时,y的估计值为________.解析:当x=25时,y^=2-2.5×25=-60.5,即y的估计值为-60.5.答案:-60.52.在研究硝酸钠的可溶性程度时,对不同的温度观测它在水中的溶解度,得观测结果如下表:由此得到回归直线的斜率是0.8809,则线性回归方程为________.温度(x)010205070溶解度(y)66.776.085.0112.3128.0解析:因为线性回归方程y^=0.8809x+a^过样本点的中心(30,93.6),所以a^=67.173,y^=0.8809x+67.173.答案:y^=0.8809x+67.173[例2]炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间Y(从炉料熔化完毕到出钢的时间)的一组数据,如下表所示:x(0.01%)104180190177147134150191204121Y(min)100200210185155135170205235125(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?(2)求线性回归方程.(3)预测当钢水含碳量为160时,应冶炼多少分钟?[思路点拨]判断两变量之间是否具有相关关系,要计算出相关系数r,比较r与临界值的大小.依据线性回归直线方程,对冶炼时间进行预报.[精解详析](1)由已知数据列成下表.i12345678910xi104180190177147134150191204121yi100200210185155135170205235125xiyi10400360003990032745227851809025500391554794015125x-=159.8,y-=172,i=110x2i=265448,i=110y2i=312350,i=110xiyi=287640于是r=i=110xiyi-10xyi=110x2i-10x2i=110y2i-10y2≈0.9906.又查表知相应于显著性水平0.05和n-2的相关系数临界值r0.05=0.632.由rr0.05知,Y与x具有线性相关关系.(2)设所求的回归直线方程为y^=b^x+a^,∴b^=i=110xiyi-10xyi=110x2i-10x2≈1.267,a^=y-b^x≈-30.47,即所求的回归直线方程为y^=1.267x-30.47.(3)当x=160时,y^=1.267×160-30.47≈172(min),[一点通]已知x与Y呈线性相关关系,就无需进行相关性检验,否则要进行相关性检验.如果两个变量不具备相关关系,或者相关关系不显著,即使求出回归直线方程也是毫无意义的,用其估计和预测也是不可信的.如果通过散点图能发现线性相关关系,也可以避免求相关系数的麻烦.3.某厂的生产原料耗费x(单位:百万元)与销售额Y(单位:百万元)之间有如下的对应关系:(1)x与Y之间是否具有线性相关关系?若有,求其回归直线方程;(2)若实际销售额不少于50百万元,则原料耗费应该不少于多少?x2468Y30405070解:(1)画出(x,y)的散点图如图所示,由图可知x,Y有线性关系.x=5,y=47.5,i=14x2i=120,i=14y2i=9900,i=14xiyi=1080,r=i=14xiyi-4xyi=14x2i-4x2i=14y2i-4y2=1080-4×5×47.5120-4×529900-4×47.52≈0.9827.|r|=0.9827r0.05=0.950,从而有95%的把握认为x与Y之间具有线性相关关系,由公式得回归系数b^=i=14xiyi-4xyi=14x2i-4x2=1080-4×5×47.5120-4×52=6.5,a^=y-b^x=47.5-6.5×5=15.故Y对x的回归直线方程为y^=6.5x+15.(2)由回归直线方程知,当y^≥50,即6.5x+15≥50时,x≥356.5≈5.38.故原料耗费应不少于5.38百万元.[例3](12分)下表为收集到的一组数据:x21232527293235Y711212466115325试建立Y与x之间的回归方程.[思路点拨]画出散点图或进行相关性检验,确定两变量x,Y是否线性相关.由散点图得x,Y之间的回归模型,求回归方程.[精解详析]作出散点图,如图.从散点图中可以看出x与Y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.(5分)对两边取对数,把指数关系变为线性关系.令Z=lnY,则变换后的样本点分布在直线z=bx+a(a=lnc1,b=c2)的周围,这样就可以利用线性回归模型来建立非线性回归方程了,数据可以转化为:x21232527293235Z1.9462.3983.0453.1784.1904.7455.784求得线性回归方程为z^=0.272x-3.849,(10分)∴y^=e0.272x-3.849(12分)[一点通]非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与已经学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后像本例这样,采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.4.某地区不同身高的男性的体重平均值如下表:身高x/cm60708090100110体重Y/kg6.137.909.9912.1515.0217.50身高x/cm120130140150160170体重Y/kg20.9226.8631.1138.8547.2555.05(1)试建立Y与x之间的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高为175cm体重为82kg的在校男生体重是否正常?解:(1)根据上表中的数据画出散点图(如图所示).由图可看出,样本点分布在某条指数函数曲线y=c1ec2x的周围,于是令Z=lnY,得下表:x60708090100110Z1.812.072.302.502.712.86x120130140150160170Z3.043.293.443.663.864.01作出散点图如图所示.由表中数据可得Z与x之间的回归直线方程为z^=0.693+0.020x,则有y^=e0.693+0.020x.(2)当x=175时,预测平均体重为y^=e0.693+0.020×175≈66.22,由于66.22×1.2=79.464<82,所以这个男生偏胖.1.判断变量的相关性通常有两种方式:一是散点图,二是相关系数r,前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强弱.2.应用回归方程时应注意:(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围,一般不能超过这个适用范围,否则,将没有实用价值;(4)不能期望回归方程得到的预报值就是预报变量的准确值,事实上,它是预报变量的可能取值的平均值.3.建立回归模型的基本步骤如下:(1)确定研究对象.(2)画出散点图,观察它们之间的关系.(3)由经验确定好回归方程的类型.(4)按照一定的规则估计回归方程中的参数.
本文标题:高中数学-第三章3.2回归分析课件-新人教B版选修2-3
链接地址:https://www.777doc.com/doc-6033644 .html