您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 11.4回归分析与独立性检验
第十一章统计与概率人教A版数学11.4回归分析与独立性检验第十一章统计与概率人教A版数学1.变量间的相关关系(1)相关关系一个变量变化时,另一个变量也随之发生变化,但其取值带有一定的随机性,这样两个变量之间的关系叫做相关关系.第十一章统计与概率人教A版数学(2)相关关系与函数关系的异同点相同点:两者均是指两个变量的关系.不同点:函数关系是一种确定的因果关系,是两个非随机变量的关系.相关关系是一种非确定的关系,是非随机变量与随机变量的关系或两个随机变量之间的关系.2.两个变量的线性相关(1)散点图将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示两个变量关系的一组数据的图形叫做散点图.第十一章统计与概率人教A版数学(2)正相关、负相关散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.第十一章统计与概率人教A版数学3.回归分析(1)回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.通俗地讲,回归分析是寻找具有相关关系的两个变量的非确定性关系的某种确定性,其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报.(2)回归直线方程的求法①回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.第十一章统计与概率人教A版数学②回归直线方程的求法——最小二乘法.设具有线性相关关系的两个变量x、y的一组观察值为(xi,yi)(i=1,2,…,n),则回归直线方程y^=a^+b^x的系数为b^=i=1nxiyi-nx·yi=1nx2i-nx2=i=1n(xi-x)(yi-y)i=1n(xi-x)2a^=y-b^x其中x=1ni=1nxi,y=1ni=1nyi,(x,y)称作样本点的中心.第十一章统计与概率人教A版数学(2)利用回归直线可以对总体进行估计(3)线性相关强度的检验:r=i=1n(xi-x)(yi-y)i=1n(xi-x)2·i=1n(yi-y)2=i=1nxiyi-nx·y(i=1nx2i-nx2)(i=1ny2i-ny2)叫做y与x间的相关系数.简称相关系数.第十一章统计与概率人教A版数学r具有以下性质:|r|≤1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.r0表明两变量正相关,r0表明两变量负相关.在含有一个解释变量的线性回归模型中,R2恰好等于相关系数r的平方.(4)相关指数R2=1-i=1n(yi-y^i)2i=1n(yi-y)2,R2越接近于1,模型的拟合效果越好.第十一章统计与概率人教A版数学(5)建立回归模型的基本步骤:①确定研究对象,明确解释变量和预报变量.②画出散点图,观察它们是否存在相关关系.(如线性相关关系)④按一般规则估计回归方程中的参数.(如最小二乘法)⑤得出结果后分析残差图有否异常,若存在异常,则检查数据是否有误,模型是否恰当.③确定回归方程类型.(如线性回归方程y^=b^x+a^)第十一章统计与概率人教A版数学4.独立性检验(1)变量的不同“值”表示个体所属的不同类别,这些变量称为分类变量.(2)两个分类变量X与Y的频数表,称作2×2列联表.y1y2合计x1aba+bx2cdc+d合计a+cb+da+b+c+d第十一章统计与概率人教A版数学在2×2列联表中,随机变量k2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量,用k2的取值范围可以判断“X与Y有关系“的可信度,临界值如表.(其中频数a、b、c、d都不小于5)P(k2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828第十一章统计与概率人教A版数学①当k10.828时,有99.9%的把握认为“X与Y有关系”.②当k7.879时,有99.5%的把握认为“X与Y有关系”.③当k≤3.841时,认为没有充分的证据显示“X与Y有关系”.(3)利用随机变量k2来确定是否能以一定把握认为“两个分类变量有关系”的方法,称作对这两个分类变量的独立性检验.第十一章统计与概率人教A版数学(4)独立性检验的步骤:①据实际问题需要的可信度确定临界值k0.②利用公式,由观测数据,求出k2的观测值k.③作判断,如果k≥k0,就以(1-P(k2≥k0))×100%的把握认为“X与Y有关系”,否则就说样本数据没有提供充分证据说明“X与Y有关系”.误区警示1.线性回归方程中的系数a、b及相关指数k2公式复杂莫记混用错.第十一章统计与概率人教A版数学[例1]下面是水稻产量与施化肥量的一组观测数据:(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?分析:描点可画出散点图,观察散点图中的点大致分布在一条直线附近,则线性相关.施化肥量15202530354045水稻产量320330360410460470480第十一章统计与概率人教A版数学解析:(1)散点图如下:(2)从图中可以发现数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.第十一章统计与概率人教A版数学(09·宁夏、海南)对变量x,y的观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v的观测数据(u1,v1)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断.()第十一章统计与概率人教A版数学A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:由图(1)可知,各点整体呈递减趋势,x与y负相关,由图(2)可知,各点整体呈递增趋势,u与v正相关.答案:C第十一章统计与概率人教A版数学[例2]下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与对应的生产能耗y(吨标准煤)的几组对应数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;第十一章统计与概率人教A版数学(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解析:(1)由题设所给数据,可得散点图如下图.第十一章统计与概率人教A版数学(2)由表中数据,计算得:i=14x2i=86,x-=3+4+5+64=4.5,y-=2.5+3+4+4.54=3.5,已知i=14xiyi=66.5,所以,由最小二乘法确定的回归直线方程的系数为:b^=i=14xiyi-4x-·y-i=14x2i-4x2=66.5-4×4.5×3.586-4×4.52=0.7,第十一章统计与概率人教A版数学(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).a^=y--b^x-=3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y^=0.7x+0.35.第十一章统计与概率人教A版数学例3第十一章统计与概率人教A版数学第十一章统计与概率人教A版数学第十一章统计与概率人教A版数学第十一章统计与概率人教A版数学第十一章统计与概率人教A版数学(2019·山东枣庄模考)某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864由表中数据,得线性回归方程y^=-2x+a.当气温为-4℃时,预测用电量的度数约为________.第十一章统计与概率人教A版数学答案:68解析:x-=14(18+13+10-1)=10,y-=14(24+34+38+64)=40,∴a=y--(-2)×x-=60,∴线性回归方程为y^=-2x+60,令x=-4得,y^=68.第十一章统计与概率人教A版数学点评:线性回归方程的要求不高,要熟记回归方程y^=b^x+a^中的系数公式b^=i=1n(xi-x-)(yi-y-)i=1n(xi-x-)2=i=1nxiyi-nx-y-i=1nx2i-nx-2a^=y--b^x-第十一章统计与概率人教A版数学[例3]为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:药物效果试验列联表则有________%的把握认为药物有效?患病未患病总计服用药104555没有用药203050总计3075105第十一章统计与概率人教A版数学解析:首先判定表格中的数据是否都大于5这一点显然是满足的,可由公式直接求解,最后再与两个临界值相比较得出结论.答案:95点评:独立性检验是比较容易掌握的,高考不要求记忆公式,只要求会用公式进行计算,并依据计算结果作出判断.∵k2=105×(10×30-20×45)255×50×30×75≈6.1093.841,∴有95%的把握说药物有效.第十一章统计与概率人教A版数学第十一章统计与概率人教A版数学第十一章统计与概率人教A版数学第十一章统计与概率人教A版数学第十一章统计与概率人教A版数学第十一章统计与概率人教A版数学第十一章统计与概率人教A版数学(2019·辽宁文,18)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)频数30402010第十一章统计与概率人教A版数学表2:注射药物B后皮肤疱疹面积的频数分布表(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85)频数1025203015第十一章统计与概率人教A版数学第十一章统计与概率人教A版数学(2)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.第十一章统计与概率人教A版数学疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物Aa=b=注射药物Bc=d=合计n=第十一章统计与概率人教A版数学[解析](1)第十一章统计与概率人教A版数学可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.第十一章统计与概率人教A版数学(2)表3:由于k2>10.828,所以有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物Aa=70b=30100注射药物Bc=35d=65100合计10595n=200k2=200×(70×65-35×30)2100×100×105×95≈24.56
本文标题:11.4回归分析与独立性检验
链接地址:https://www.777doc.com/doc-5817186 .html