您好,欢迎访问三七文档
章末复习知识系统整合规律方法收藏1.两个基本思想(1)回归分析的基本思想回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析,因此,回归分析的思想主要是指线性回归分析的思想.注意理解以下几点:①确定线性相关关系线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关关系;二是具有线性相关关系.判断是否线性相关的依据是样本点的散点图.②引起预报误差的因素对于线性回归模型y=bx+a+e,引起预报变量y的误差的因素有两个:一个是解释变量x,另一个是随机误差e.③回归方程的预报精度判断回归方程的预报精度是通过计算残差平方和来进行的,残差平方和越小,方程的预报精度越高.简单来说,线性回归分析就是通过建立回归直线方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当x取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值.④回归模型的拟合效果判断回归模型的拟合效果的过程也叫残差分析,残差分析的方法有两种,一是通过残差图直观判断,二是通过计算相关指数R2的大小判断.(2)独立性检验的基本思想独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算随机变量K2的观测值,最后由K2的观测值很大在一定程度上说明两个分类变量有关系.进行独立性检验要注意理解以下三个问题:①独立性检验适用于两个分类变量.②两个分类变量是否有关系的直观判断:一是根据2×2列联表计算|ad-bc|,值越大关系越强;二是观察等高条形图,两个深色条的高度相差越大关系越强.③独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.2.两个重要参数(1)相关指数R2相关指数R2是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,模型的拟合效果越好.(2)随机变量K2随机变量K2是用来判断两个分类变量在多大程度上相关的变量.独立性检验就是通过计算K2的观测值,并与教材中所给表格中的数值进行比较,从而得到两个分类变量在多大程度上相关.3.两种重要图形(1)散点图散点图是进行线性回归分析的主要手段,其作用如下:一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,那么可以断定两个变量有较好的线性相关关系;二是判断样本中是否存在异常.(2)残差图残差图可以用来判断模型的拟合效果,其作用如下:一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高.二是确认样本点在采集过程中是否有人为的错误.学科思想培优一线性回归分析对所抽取的样本的数据进行分析,分析两个变量之间的关系——线性关系或非线性关系,并由一个变量的变化去推测另一个变量的变化,这就是对样本进行回归分析.回归分析的过程就是建立回归模型的过程.具体步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画出散点图,观察它们是线性相关的,还是符合哪一种函数模型;③由经验确定回归方程的类型(如线性回归方程,反比例函数模型,指数函数模型,对数函数模型等);④用最小二乘法求回归方程的参数;⑤检查回归模型的拟合程度,如分析残差图,求相关指数R2等.例1一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下表:零件数x/个102030405060708090100加工时间y/min627275818595103108112127(1)画出散点图,并初步判断是否线性相关;(2)若线性相关,求回归直线方程;(3)求出相关指数;(4)作出残差图;(5)进行残差分析.[解](1)散点图,如图所示.由图可知,x,y线性相关.(2)x与y的关系可以用线性回归模型来拟合,不妨设回归模型为y^=a^+b^x.将数据代入相应公式可得数据表:答案答案∴x-=55,y-=92,∴b^=∑10i=1xiyi-10x-y-∑10i=1x2i-10x-2=56130-10×55×9238500-10×552=553825≈0.670,a^=y--b^x-=92-553825×55=82715≈55.133,∴回归直线方程为y^=0.670x+55.133.答案(3)利用所求回归方程求出下列数据.∴R2=1-∑10i=1yi-y^i2∑10i=1yi-y-2≈0.983.答案(4)∵e^i=yi-y^i,利用上表中数据作出残差图,如图所示.(5)由散点图可以看出x与y有很强的线性相关性,由R2的值可以看出回归效果很好.由残差图也可观察到,第2,5,9,10个样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误.答案拓展提升作残差分析时,一般从以下几个方面予以说明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄.二独立性检验独立性检验的基本思想:独立性检验的基本思想类似于反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,与有关的临界值相比较,以确定可信程度.例2随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:常饮酒不常饮酒合计患肝病2不患肝病18合计30已知在全部30人中随机抽取1人,抽到肝病患者的概率为415.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828[解](1)设患肝病中常饮酒的人有x人,x+230=415,x=6.常饮酒不常饮酒合计患肝病628不患肝病41822合计102030由已知数据可求得K2=30×6×18-2×4210×20×8×22≈8.5237.879,因此有99.5%的把握认为患肝病与常饮酒有关.答案(2)设常饮酒且患肝病的男性为A,B,C,D,女性为E,F,则任取两人有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15种,且每种发生的概率是相等的.其中一男一女有(A,E),(A,F),(B,E),(B,F),(C,E),(C,F),(D,E),(D,F),共8种.故抽出一男一女的概率是P=815.答案拓展提升近几年高考中独立性检验与统计知识的综合考查已出现了多次,一般需要根据统计知识完成2×2列联表,然后考查利用独立性检验的方法解决问题,题目难度不大,但有一定的综合性.三数形结合思想在独立性检验中的应用例3某机构为了了解患色盲是否与性别有关,随机抽取了1000名成年人进行调查.在调查的480名男人中有38名患色盲,520名女人中有6名患色盲,分别利用图形和独立性检验的方法来判断患色盲与性别是否有关.[解]根据题目所给的数据作出如下的列联表:患色盲未患色盲总计男38442480女6514520总计449561000答案根据列联表作出相应的等高条形图,如图所示:图中两个深色条的高分别表示男人和女人中患色盲的频率.从图中可以看出,男人中患色盲的频率明显高于女人中患色盲的频率.因此我们可以认为患色盲与性别有关.根据列联表中所给的数据,答案得K2的观测值k=1000×38×514-6×4422480×520×44×956≈27.139.因为27.13910.828,所以我们有99.9%的把握认为患色盲与性别有关系.答案拓展提升“数缺形时少直观,形缺数时难入微”恰当地应用数形是提高解题速度、优化解题过程的一种重要方法.四化归与转化思想在非线性回归分析中的应用例4下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x=40时y的值.[解](1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.答案(2)对两边取对数把指数关系变为线性关系,令z=lny,则有变换后的样本点应分布在直线z=bx+a,a=lnc1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程,数据可以转化为:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为z^=0.272x-3.849,∴y^=e0.272x-3.849.答案残差列表如下:yi711212466115325y^i6.44311.10119.12532.95056.770128.381290.325e^i0.557-0.1011.875-8.9509.23-13.38134.675(3)当x=40时,y^=e0.272x-3.849≈1131.答案拓展提升通过取对数的方法把非线性回归问题转化成线性回归问题,起到化难为易的效果.本课结束
本文标题:2019-2020学年高中数学 第三章 统计案例章末复习课件 新人教A版选修2-3
链接地址:https://www.777doc.com/doc-8287813 .html