您好,欢迎访问三七文档
-1-第3章统计案例第3课统计案例回归分析【例1】为研究某种图书每册的成本费y(元)与印刷数x(千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.xyui=18(xi-x)2i=18(xi-x)(yi-y)i=18(ui-u)2i=18(ui-u)(yi-y)15.253.630.2692085.5-230.30.7877.049其中ui=1xi,u=18i=18ui.-2-(1)根据散点图判断:y=a+bx与y=c+dx哪一个更适宜作为每册成本费y(元)与印刷数x(千册)的回归方程类型?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(回归系数的结果精确到0.01);(3)若每册书定价为10元,则至少应该印刷多少千册才使销售利润不低于78840元?(假设能够全部售出,结果精确到1)(附:对于一组数据(ω1,v1)(ω2,v2),…,(ωn,vn),其回归直线v^=a^+β^ω的斜率和截距的最小二乘估计分别为β^=i=1nωi-ωvi-vi=1nωi-ω2,α^=v-β^ω.)[思路点拨](1)借助散点图求解;(2)令u=1x―→建立y关于u的回归方程―→建立y关于x的回归方程;(3)建立利润函数f(x),解f(x)≥78.840得x的范围.[解](1)由散点图判断,y=c+dx适宜作为每册成本费y(元)与印刷册数x(千册)的回归方程.(2)令u=1x,先建立y关于u的线性回归方程,由于d^=i=18ui-uyi-yi=18ui-u2=7.0490.787≈8.96,∴c^=y-d^·u=3.63-8.96×0.269≈1.22,∴y关于u的线性回归方程为y^=1.22+8.96u,从而y关于x的回归方程为y^=1.22+8.96x.(3)假设印刷x千册,依题意:10x-1.22+8.96x·x≥78.840.即8.78x≥87.8,解得x≥10,∴至少印刷10千册才能使销售利润不低于78840元.-3-求线性回归方程的基本步骤提醒:对非线性回归问题应利用变量代换,把问题化为线性回归分析问题,使之得到解决.1.在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:x(元)1416182022y(件)1210753且知x与y具有线性相关关系,求出y关于x的线性回归方程,并说明拟合效果的好坏.[解]x=15×(14+16+18+20+22)=18,y=15×(12+10+7+5+3)=7.4,i=15x2i=142+162+182+202+222=1660,i=15y2i=122+102+72+52+32=327,i=15xiyi=14×12+16×10+18×7+20×5+22×3=620,所以b^=i=15xiyi-5xyi=15x2i-5x2=620-5×18×7.41660-5×182=-1.15,-4-所以a^=7.4+1.15×18=28.1,所以y对x的线性回归方程为y^=-1.15x+28.1,列出残差表为yi-y^i00.3-0.4-0.10.2yi-y4.62.6-0.4-2.4-4.4所以i=15(yi-y^i)2=0.3,i=15(yi-y)2=53.2,R2=1-i=15yi-y^i2i=15yi-y2≈0.994.所以R2≈0.994,拟合效果较好.独立性检验【例2】户外运动已经成为一种时尚运动,某单位为了了解员工喜欢户外运动是否与性别有关,决定从本单位全体650人中采用分层抽样的办法抽取50人进行问卷调查,得到了如下列联表:喜欢户外运动不喜欢户外运动总计男性5女性10总计50已知在这50人中随机抽取1人抽到喜欢户外运动的员工的概率是35.(1)请将上面的列联表补充完整;(2)求该公司男、女员工各多少人;(3)在犯错误的概率不超过0.005的前提下能否认为喜欢户外运动与性别有关?并说明你的理由.-5-下面的临界值表仅供参考:P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828(参考公式:K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d)[解](1)因为在全部50人中随机抽取1人抽到喜欢户外运动的员工的概率是35,所以喜欢户外运动的男女员工共30人,其中男员工20人,列联表补充如下:喜欢户外运动不喜欢户外运动总计男性20525女性101525总计302050(2)该公司男员工人数为25÷50×650=325(人),则女员工有325人.(3)K2的观测值k=50×20×15-10×5230×20×25×25≈8.3337.879,所以在犯错误的概率不超过0.005的前提下认为喜欢户外运动与性别有关.独立性检验的一般步骤1.提出假设H0:Ⅰ和Ⅱ没有关系;2.根据2×2列联表计算K2的观测值;3.根据K2的观测值与临界值的大小关系作统计推断.2.研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用条形图和独立性检验的方法判断.[解]建立性别与态度的2×2列联表如下:肯定否定总计男生2288110女生223860总计44126170-6-根据列联表中所给的数据,可求出男生中作肯定态度的频率为22110=0.2,女生中作肯定态度的频率为2260≈0.37.作等高条形图如图,其中两个深色条形的高分别表示男生和女生中作肯定态度的频率,比较图中深色条形的高可以发现,女生中作肯定态度的频率明显高于男生中作肯定态度的频率,因此可以认为性别与态度有关系.根据列联表中的数据得到K2的观测值k=170×22×38-22×882110×60×44×126≈5.6225.024.因此,在犯错误的概率不超过0.025的前提下认为性别和态度有关系.独立性检验与统计的综合应用【例3】为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.(1)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;(2)下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80]频数30402010表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85]频数1025203015完成下面2×2列联表疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物Aa=b=注射药物Bc=d=合计n=[解](1)甲、乙两只家兔分在不同组的概率为p=C12C99198C100200=100199.(2)2×2列联表如下.-7-疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物Aa=70b=30100注射药物Bc=35d=65100合计10595n=2001.(改变问法)本例条件不变,改变问法:是否有99%的把握认为注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异?[解]根据列联表中的数据得到K2的观测值k=200×70×65-35×302100×100×105×95≈24.56.由于K2>6.635,所以有99%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.2.(改变问法)在本例(2)中完成如图所示的频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小.图Ⅰ注射药物A后皮肤疱疹面积的频率分布直方图图Ⅱ注射药物B后皮肤疱疹面积的频率分布直方图[解]如图所示图Ⅰ注射药物A后皮肤疱疹面积的频率分布直方图图Ⅱ注射药物B后皮肤疱疹面积的频率分布直方图-8-可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.1.独立性检验在实际中有着广泛的应用,是对实际生活中数据进行分析的一种方法,通过这种分析得出的结论对实际生活或者生产都有一定的指导作用.2.近几年高考中较少单独考查独立性检验,经常与统计、概率等知识综合,频率分布表、频率分布直方图与独立性检验融合在一起是常见的考查形式,一般需要根据条件列出2×2列联表,计算K2的观测值,从而解决问题.3.某学生对其亲属30人的饮食进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列2×2列联表:主食蔬菜主食肉类总计50岁以下50岁以上总计(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?并写出简要分析.[解](1)2×2列联表如下:主食蔬菜主食肉类总计50岁以下481250岁以上16218总计201030-9-(2)根据列联表中的数据得到K2的观测值k=30×8-128212×18×20×10=106.635,P(K26.635)=0.01,所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.
本文标题:2019-2020学年高中数学 第3章 统计案例 阶段复习课 第3课 统计案例学案 新人教A版选修2
链接地址:https://www.777doc.com/doc-8476534 .html