您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 9-3第九章统计统计案例及算法初步
第九章统计、统计案例及算法初步第3讲变量间的相关关系与统计案例考纲展示三年高考总结1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.4.了解回归分析的基本思想、方法及其简单应用.从近三年高考情况来看,高考对变量间的相关关系和独立性检验考查越来越重视,尤其是2015年全国卷以解答题形式出现,在解题时要充分了解回归分析及独立性检验的基本思想,加深认识统计方法在决策中的作用.考点多维探究考点1回归分析回扣教材1.变量间的相关关系当自变量取值一定时,因变量的取值带有一定的,则这两个变量之间的关系叫做相关关系.即相关关系是一种非确定性关系.当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量;当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量随机性正相关负相关2.散点图将样本中的n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,所得图形叫做散点图.具有正相关关系的两个变量的散点图如图1,具有负相关关系的两个变量的散点图如图2.3.两个变量的线性相关如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫做回归直线.回归直线对应的方程叫做回归直线方程(简称回归方程).4.回归方程的求解求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小.若变量x与y具有线性相关关系,有n个样本数据(xi,yi)(i=1,2,…,n),则回归方程中b^=∑ni=1xi-x-yi-y-∑ni=1xi-x-2=∑ni=1xiyi-nx-y-∑ni=1x2i-nx-2,.其中x-=1n∑ni=1xi,y-=1n∑ni=1yi,.说明:回归直线y^=b^x+a^必过样本点的中心(x-,y-),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.y^=b^x+a^a^=y--b^x-(x-,y-)称为样本点的中心5.相关系数我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计算公式为r=∑ni=1xi-x-yi-y-∑ni=1xi-x-2∑ni=1yi-y-2,.当r0时,表明两个变量正相关;当r0时,表明两个变量负相关.|r|越接近于1,表明两个变量的线性相关性越强.|r|≤16.必记结论相关关系与函数关系的异同点共同点:二者都是指两个变量间的关系.不同点:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.小题快做1.思考辨析(1)相关关系的两个变量是非确定关系.()(2)散点图中的点越集中,两个变量的线性相关性越强.()√×2.已知变量x,y呈线性相关关系,回归方程为y^=0.5+2x,则变量x,y呈()A.线性正相关关系B.由回归方程无法判断其正负相关C.线性负相关关系D.非常强的相关关系解析y^=2x+0.5,b^=2,此相关关系为线性相关,且为正相关.3.[教材改编]若8名学生的身高和体重数据如下表:编号12345678身高/cm165165157170175165155170体重/kg48575464614359第3名学生的体重漏填,但线性回归方程是y^=0.849x-85.712,则第3名学生的体重估计为________.48kg解析x=157,y^=0.849×157-85.712≈48kg.线性回归问题是高考中的热点问题,主要考查求回归方程,利用回归方程进行预测及回归直线的特点,难度不大,考查主要以小题,解答题为主.命题角度1相关关系的判断典例1(1)[2015·西安模拟]在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为()A.-1B.0C.12D.1(2)[2015·济南模拟]某市居民2011~2015年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如表所示:年份20112012201320142015年平均收入x11.512.11313.315年平均支出y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是___________,家庭年平均收入与年平均支出有________线性相关关系.13正解析(1)所有样本点均在直线上,则样本相关系数最大即为1.(2)5个x值是按从小到大的顺序排列的,因此居民家庭年平均收入的中位数是13.以家庭年平均收入x作为x轴,年平均支出y作为y轴,描点得到散点图如图所示:观察散点图可知,这些点大致分布在一条直线的附近,且总体呈上升趋势,因此家庭年平均收入与年平均支出有正线性相关关系.命题角度2线性回归方程及应用典例2[2014·课标全国卷Ⅱ]某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;解(1)由所给数据计算得t=17×(1+2+3+4+5+6+7)=4,y=17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,i=17(ti-t)2=9+4+1+0+1+4+9=28,i=17(ti-t)(yi-y)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b^=i=17ti-tyi-yi=17ti-t2=1428=0.5,a^=y-b^t=4.3-0.5×4=2.3,所求回归方程为y^=0.5t+2.3.(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b^=i=1nti-tyi-yi=1nti-t2,a^=y-b^t.解(2)由(1)知,b^=0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t=9代入(1)中的回归方程,得y^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.1.判定两个变量正负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r0时,正相关;r0时,负相关.(3)线性回归方程中:b^0时,正相关;b^0时,负相关.2.最小二乘法估计的三个步骤(1)作出散点图,判断是否线性相关.(2)如果是,则用公式求a^,b^,写出回归方程.(3)根据方程进行估计.[提醒]回归直线方程恒过点(x-,y-).【跟踪训练】1.[2015·泰安模拟]变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2r10B.0r2r1C.r20r1D.r2=r1解析对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r10;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r20,所以有r20r1.2.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程y^=b^x+a^,其中b^=-20,a^=y--b^x-;解(1)由于x-=16×(8+8.2+8.4+8.6+8.8+9)=8.5,y-=16×(90+84+83+80+75+68)=80,所以a^=y--b^x-=80+20×8.5=250,从而回归直线方程为y^=-20x+250.(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解(2)设该产品的单价定为x元,工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25,当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.考点多维探究考点2独立性检验回扣教材1.2×2列联表设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d2.独立性检验利用随机变量K2(也可表示为χ2)=nad-bc2a+bc+da+cb+d(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.3.独立性检验的一般步骤(1)根据样本数据列出2×2列联表;(2)计算随机变量K2的观测值k,查下表确定临界值k0:P(K2≥k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”.4.必记结论(1)通常认为k≤2.706时,样本数据就没有充分的证据显示“X与Y有关系”.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.(3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.小题快做1.思考辨析(1)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.()(2)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.()××2.[教材改编]为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:喜爱打篮球不喜爱打篮球总计男生20525女生101525总计302050则在犯错误的概率不超过________的前提下认为喜爱打篮球与性别有关.附:K2=nad-bc2a+bc+da+cb+d.P(K2≥k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.8280.005解析根据独立性检验公式可得K2≈8.3337.879,所以在犯错误的概率不超过0.005的前提下认为喜爱篮球与性别有关.独立性检验是一种统计案例,是高考命题的一个热点,多以解答题的形式出现,试题难度不大,多为中档题,且主要有以下几个命题角度.命题角度1已知分类变量数据,判断两类变量的相关性典例3[2014·江西高考]某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量解析命题角度2独立性检验与
本文标题:9-3第九章统计统计案例及算法初步
链接地址:https://www.777doc.com/doc-2893417 .html