您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 学案48变量间的相关关系
学案48变量间的相关关系、统计案例自主梳理1.两个变量的线性相关(1)正相关在散点图中,点散布在从__________到________的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从________到________的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法求回归直线使得样本数据的点到它的________________________的方法叫做最小二乘法.(2)回归方程方程y^=b^x+a^是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a^,b^是待定参数.3.回归分析(1)回归直线一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的截距和斜率的最小二乘估计分别为a^=__________________________,b^=______________________________________,其中x=____________________,y=_____________________________________,________________称为样本点的中心.(2)相关系数r①r=∑ni=1xi-xyi-y∑ni=1xi-x2∑ni=1yi-y2;②当r0时,表明两个变量________;当r0时,表明两个变量________.r的绝对值越接近于1,表明两个变量的线性__________;r的绝对值越接近于0时,表明两个变量之间________________________________.通常,当r的绝对值大于________时认为两个变量有很强的线性相关关系.2.独立性检验(1)列联表:列出的两个分类变量的________,称为列联表.(2)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=________________________________,其中n=__________为样本容量.(3)独立性检验利用随机变量________来判断“两个分类变量________”的方法称为独立性检验.自我检测1.下列有关线性回归的说法,不正确的是()A.相关关系的两个变量不一定是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归直线方程2.(2009·海南,宁夏)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关3.(2011·银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其回归直线方程是y^=-0.7x+a^,则a^等于()A.10.5B.5.15C.5.2D.5.254.(2011·绍兴月考)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别非统计专业统计专业男2620女1440则可判断约有________的把握认为“主修统计专业与性别之间有关系”.5.[2014·湖北卷]根据如下样本数据x345678y4.02.5-0.50.5-2.0-3.0得到的回归方程为y^=bx+a,则()A.a>0,b<0B.a>0,b>0C.a<0,b<0D.a<0,b>0探究点一利用散点图判断两个变量的相关性例1有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出热饮杯数与当天气温的对比表:温度(℃)-504712151923273136热饮杯数15615013212813011610489937654(1)画出散点图;(2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗?变式迁移1某班5个学生的数学和物理成绩如表:学生学科ABCDE数学8075706560物理7066686462画出散点图,并判断它们是否有相关关系?探究点二求回归直线方程例2假设关于某设备的使用年限x和所支出的维修费用y(万元)有以下统计资料:使用年限x23456维修费用y2.23.85.56.57.0若由资料知y对x呈线性相关关系.试求回归方程y^=b^x+a^.变式迁移2已知变量x与变量y有下列对应数据:x1234y123223且y对x呈线性相关关系,求y对x的回归直线方程.探究点三独立性试验.[2014·江西卷]某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2成绩性别不及格及格总计男61420女102232总计163652视力性别好差总计男41620女122032总计163652表3表4智商性别偏高正常总计男81220女82432总计163652阅读量性别丰富不丰富总计男14620女23032总计163652A.成绩B.视力C.智商D.阅读量.变式迁移3(2011·湛江模拟)利用统计变量K2的观测值来判断两个分类变量之间的关系的可信程度.考察小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示种子灭菌种子未灭菌合计黑穗病26184210无黑穗病50200250合计76384460试按照原试验目的作统计分析推断.(满分:75分)一、选择题(每小题5分,共25分)1.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线y^=b^x+a^及回归系数b^,可以估计和预测变量的取值和变化趋势.其中正确的命题是()A.①②B.①③C.②③D.①②③2.设有一个回归直线方程为y^=2-1.5x,则变量x增加一个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位3.(2011·陕西)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()A.x和y的相关系数为直线l的斜率B.x和y的相关系数在0到1之间C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.直线l过点(x,y)4.(2011·山东)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得线性回归方程y^=b^x+a^中的b^为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元5.对于独立性检验,下列说法中错误的是()A.K2的值越大,说明两事件相关程度越大B.K2的值越小,说明两事件相关程度越小C.K2≤3.841时,有95%的把握说事件A与B无关D.K26.635时,有99%的把握说事件A与B有关6.为了判断高中三年级学生是否选修文科与性别有关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2=50×13×20-10×7223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为______.学案48变量间的相关关系自主梳理1.(1)左下角右上角(2)左上角右下角2.(1)距离的平方和最小(2)∑ni=1xi-xyi-y∑ni=1xi-x2∑ni=1xiyi-nxy∑ni=1x2i-nx2y-b^x3(1)y-b^x∑ni=1xi-xyi-y∑ni=1xi-x21n∑ni=1xi1n∑ni=1yi(x,y)(2)②正相关负相关相关性越强几乎不存在线性相关关系0.754.(1)频数表(2)nad-bc2a+bc+da+cb+da+b+c+d(3)K2有关系自我检测1.D2.C3.D4.99.5%解析因为K2=100×26×40-14×20240×60×46×54≈9.6897.879,所以有99.5%的把握认为“主修统计专业与性别之间有关系”.5.A[解析]作出散点图如下:课堂活动区例1解题导引判断变量间是否线性相关,一种常用的简便可行的方法就是作散点图.散点图是由大量数据点分布构成的,是定义在具有相关关系的两个变量基础之上的,对于性质不明确的两组数据可先作散点图,直观地分析它们有无关系及关系的密切程度.解(1)以x轴表示温度,以y轴表示热饮杯数,可作散点图,如图所示.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间是负相关关系,即气温越高,卖出去的热饮杯数越少.从散点图可以看出,这些点大致分布在一条直线附近.变式迁移1解以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如下图所示:由散点图可见,两者之间具有相关关系.例2解题导引根据题目给出的数据,利用公式求回归系数,然后获得回归方程.解制表如下:i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3x2i4916253690x=4;y=5;∑5i=1x2i=90;∑5i=1xiyi=112.3于是有b^=112.3-5×4×590-5×42=12.310=1.23;a^=y-b^x=5-1.23×4=0.08.∴回归直线方程为y^=1.23x+0.08.变式迁移2解x=1+2+3+44=52,y=12+32+2+34=74,∑ni=1x2i=12+22+32+42=30,∑ni=1xiyi=1×12+2×32+3×2+4×3=432,∴b^=∑ni=1xiyi-nxy∑ni=1x2i-nx2=432-4×52×7430-4×254=0.8,a^=y-b^x=74-0.8×52=-0.25,∴y^=0.8x-0.25.例3D[解析]通过计算可得,表1中的χ2≈0.009,表2中的χ2≈1.769,表3中的χ2=1.300,表4中的χ2≈23.481,故选D.变式迁移3解由列联表知:a=26,b=184,c=50,d=200.∴a+b=210,c+d=250,a+c=76,b+d=384,n=a+b+c+d=460.∴K2=nad-bc2a+bc+da+cb+d=460×26×200-184×502210×250×76×384≈4.804.∵K2≈4.8043.841.∴有95%的把握认为种子灭菌与否与小麦发生黑穗病是有关系的.变式迁移1解假设做过心脏搭桥手术与又发作心脏病没有关系.由于a=39,b=157,c=29,d=167,a+b=196,c+d=196,a+c=68,b+d=324,n=392,由公式可得K2的观测值为k=nad-bc2a+bc+da+cb+d=392×39×167-157×292196×196×68×324≈1.78,因为k≈1.782.706,所以我们没有理由说心脏搭桥手术与又发作心脏病有关系.课后练习区1.D[根据线性回归的含义、方法、作用分析这三个命题都是正确的.]2.C[设(x1,y1),(x2,y2)在直线上,若x
本文标题:学案48变量间的相关关系
链接地址:https://www.777doc.com/doc-2521583 .html