您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 人教版高中数学【选修2-3】[知识点整理及重点题型梳理]-《统计案例》单元复习巩固
精品文档用心整理资料来源于网络仅供免费交流使用人教版高中数学选修2-3知识点梳理重点题型(常考知识点)巩固练习《统计案例》单元复习巩固【学习目标】1.了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.2.通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用.3.通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤.4.能作出散点图,能求其回归直线方程。5.会用所学的知识对简单的实际问题进行回归分析。【知识网络】【要点梳理】要点一、分类变量有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。要点诠释:(1)对分类变量的理解。这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。(2)分类变量可以有多种类别。例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。要点二、2×2列联表1.列联表用表格列出的分类变量的频数表,叫做列联表。2.2×2列联表对于两个事件A,B,列出两个事件在两种状态下的数据,如下表所示:事件B事件B合计精品文档用心整理资料来源于网络仅供免费交流使用事件Aaba+b事件Acdc+d合计a+cb+da+b+c+d这样的表格称为2×2列联表。要点三:卡方统计量公式为了研究分类变量X与Y的关系,经调查得到一张2×2列联表,如下表所示Y1Y2合计X1aba+bX2cdc+d合计a+cb+dn=a+b+c+d统计中有一个有用的(读做“卡方”)统计量,它的表达式是:22()()()()()nadbcKabcdacbd(nabcd为样本容量)。要点四、独立性检验1.独立性检验通过2×2列联表,再通过卡方统计量公式计算2K的值,利用随机变量2K来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。2.变量独立性的判断通过对2K统计量分布的研究,已经得到两个临界值:3.841和6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:①如果2K≤3.841时,认为事件A与B是无关的。②如果2K>3.841时,有95%的把握说事件A与事件B有关;③如果2K>6.635时,有99%的把握说事件A与事件B有关;要点诠释:(1)独立性检验一般是指通过计算2K统计量的大小对两个事件是否有关进行判断;(2)独立性检验的基本思想类似于反证法。即在H0:事件A与B无关的统计假设下,利用2K统计量的大小来决定在多大程度上拒绝原来的统计假设H0,即拒绝“事件A与B无关”,从而认为事件A与B有关。独立性检验为假设检验的特例。(3)利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把握程度。3.独立性检验的基本步骤及简单应用独立性检验的步骤:精品文档用心整理资料来源于网络仅供免费交流使用要推断“A与B是否有关”,可按下面步骤进行:(1)提出统计假设H0:事件A与B无关(相互独立);(2)抽取样本(样本容量不要太小,每个数据都要大于5);(3)列出2×2列联表;(4)根据2×2列联表,利用公式:22()()()()()nadbcKacbdabcd,计算出2K的值;(5)统计推断:当2K>3.841时,有95%的把握说事件A与B有关;当2K>6.635时,有99%的把握说事件A与B有关;当2K>10.828时,有99.9%的把握说事件A与B有关;当2K≤3.841时,认为事件A与B是无关的.要点诠释:①使用2K统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5.②一定要弄清2K的表达式22()()()()()nadbcacbdabcd中各个量的含义.③独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量2K应该很小,如果由观测数据计算得到的2K的观测值很大,则在一定程度上说明假设不合理.根据随机变量2K的含义,由实际计算的2K>6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.当2K≤3.841时,认为两个分类变量是无关的.要点五、变量间的相关关系1.变量与变量间的两种关系:(1)函数关系:这是一种确定性的关系,即一个变量能被另一个变量按照某种对应法则唯一确定.例如圆的面积.S与半径r之间的关系S=πr2为函数关系.(2)相关关系:这是一种非确定性关系.当一个变量取值一定时,另一个变量的取值带有一定的随机性,这两个变量之间的关系叫做相关关系。例如人的身高不能确定体重,但一般来说“身高者,体重也重”,我们说身高与体重这两个变量具有相关关系.2.相关关系的分类:(1)在两个变量中,一个变量是可控制变量,另一个变量是随机变量,如施肥量与水稻产量;(2)两个变量均为随机变量,如某学生的语文成绩与化学成绩.3.散点图:精品文档用心整理资料来源于网络仅供免费交流使用将两个变量的各对数据在直角坐标系中描点而得到的图形叫做散点图.它直观地描述了两个变量之间有没有相关关系.这是我们判断的一种依据.4.回归分析:与函数关系不同,相关关系是一种非确定性关系,对具有相关关系的两个变量进行统计分析的方法叫做回归分析。要点六、线性回归方程:1.回归直线如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。2.回归直线方程ˆˆˆybxa对于一组具有线性相关关系的数据11(,)xy,22(,)xy,……,(,)nnxy,其回归直线ˆˆˆybxa的截距和斜率的最小二乘法估计公式分别为:121()()ˆ()niiiniixxyybxx,ˆˆaybx其中x表示数据xi(i=1,2,…,n)的均值,y表示数据yi(i=1,2,…,n)的均值,xy表示数据xiyi(i=1,2,…,n)的均值.a、b的意义是:以a为基数,x每增加一个单位,y相应地平均变化b个单位.要点诠释:①回归系数121()()ˆ()niiiniixxyybxx,也可以表示为1221ˆniiiniixynxybxnx,这样更便于实际计算。②12111()ninixxxxxnn;12111()niniyyyyynn。③(,)xy称为样本中心点,回归直线ˆˆˆyabx必经过样本中心点(,)xy。④回归直线方程ˆˆˆyabx中的ˆb表示x增加1个单位时ˆy的变化量,而ˆa表示ˆy不随x的变化而变化的量。3.求回归直线方程的一般步骤:①作出散点图由样本点是否呈条状分布来判断两个量是否具有线性相关关系,若存在线性相关关系,进行第二步。②求回归系数ˆb、ˆa精品文档用心整理资料来源于网络仅供免费交流使用计算121()nxxxxn,121()nyyyyn,11221niinnixyxyxyxy,2222121ninixxxx,利用公式1221ˆniiiniixynxybxnx求出ˆb,再由ˆˆaybx求出ˆa的值;③写出回归直线方程;④利用回归直线方程ˆˆˆyabx预报在x取某一个值时y的估计值。要点诠释:一般地,我们可以利用回归直线方程进行预测,但这里所得到的值是预报值,而不是精确值,它带有很大的随机性,可能对于某一次的实际值而言会有很大的出入,这是因为:(1)回归直线的截距ˆa和斜率ˆb都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差。(2)即使截距和斜率的估计没有误差,也不可能保证对应于x的预报值ˆy能够与实际值y很接近。我们不能保证点(x,y)落在回归直线上,甚至不能保证它落在回归直线的附近,事实上,ˆyxy,这里是随机变量,预报值ˆy与实际值y的接近程度由随机变量决定。尽管我们利用回归直线方程所得到的值仅是一个预报值,它具有随机性,但它是我们根据统计规律所得到的结论,因而结论正确的概率很大。故我们可以放心地利用回归直线方程进行预测。要点七、相关性检验(1)相关系数r的定义对于变量x与y随机抽取到的n对数据11(,)xy,22(,)xy,……,(,)nnxy,称112222221111()()()()()(()nniiiiiinnnniiiiiiiixxyyxynxyrxxyyxnxyny为x与y的样本相关系数。(2)相关系数r的作用样本相关系数r用于衡量两个变量之间是否具有线性相关关系,描述线性相关关系的强弱:①||1r||r越接近1,表明两个变量之间的线性相关程度越强;||r越接近0,表明两个变量之间的线性相关精品文档用心整理资料来源于网络仅供免费交流使用程度越弱。②当r>0时,表明两个变量正相关,即x增加,y随之相应地增加,若x减少,y随之相应地减少.当r<0时,表明两个变量负相关,即x增加,y随之相应地减少;若x减少,y随之相应地增加.若r=0,则称x与y不相关。③当||0.75r,认为x与y之间具有很强的线性相关关系。④当||r大于0.05r时,表明有95%的把握认为x与y之间具有线性相关关系,这时求回归直线方程有必要也有意义,当0.05||rr时,寻找回归直线方程就没有意义。(3)利用相关系数r检验的一般步骤:法一:①作统计假设:x与y不具有线性相关关系。②根据样本相关系数计算公式算出r的值。③比较||r与0.75的大小关系,得出统计结论。如果||0.75r,认为x与y之间具有很强的线性相关关系。法二:①作统计假设:x与y不具有线性相关关系。②根据样本相关系数计算公式算出r的值。③根据小概率0.05与n-2在相关性检验的临界值表中查出r的一个临界值0.05r(n未数据的对数)。④比较||r与0.05r,作统计推断,如果0.05||rr,表明有95%的把握认为x与y之间具有线性相关关系。如果0.05||rr,我们没有理由拒绝原来的假设,即不认为x与y之间具有线性相关关系。这时寻找回归直线方程是毫无意义的。要点八、线性回归分析与非线性回归分析1.线性回归分析对于回归分析问题,在解题时应首先利用散点图或相关性检验判断x与y是否具有线性相关关系,如果线性相关,才能求解后面的问题.否则求线性回归方程没有实际意义,它不能反映变量x与y,之间的变化规律.只有在x与y之间具有相关关系时,求线性回归方程才有实际意义.相关性检验的依据:主要利用检验统计量12211()()niiinnxyiiiixynxyxyxyrSSxxyy(其中化简式容易记也好用)求出检验统计量的样本相关系数,再利用r的性质确定x和y是否具有线性相关关系,r具有的性质为:|r|≤1且|r|越接近于1,线性相关程度越强;|r|越接近于0,线性相关程度越弱.精品文档用心整理资料来源于网络仅供免费交流使用2.线性回归分析的一般步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)判断两变量是否具有线性相关关系①作散点图由样本点是否呈条状分布来判断两个量是否具有线性相关关系。②求相关系数r当||0.75r,认为x与y之间具有很强的线性相关关系。(3)若两变量存在线性相关关系,设所求的线性回归方程为ˆˆˆybxa,求回归系数ˆb、ˆa。(4)写出回归直线方程;(5)利用回归直线方程ˆˆˆyabx预报在x取某一个值时y的估计值。3.非线性回归分析(1)对于非线性回归分析问题,如果给出了经验公式可直接利用换元,使新元与y具有线性相关关系,进一步求出,,对新元的线性回归方程,换回x即可得y对x的回归曲线方程.(2)非线性回归问题有时并不给出经验公式,这时按以下步骤求
本文标题:人教版高中数学【选修2-3】[知识点整理及重点题型梳理]-《统计案例》单元复习巩固
链接地址:https://www.777doc.com/doc-7371937 .html