您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 2015届高三数学北师大版(通用,理)总复习学案学案59统计案例
第1页共10页学案59统计案例导学目标:1.了解回归分析的基本思想、方法及其简单应用.2.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.自主梳理1.回归分析(1)回归直线一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的截距和斜率的最小二乘估计分别为a^=__________________________,b^=______________________________________,其中x=____________________,y=_____________________________________,________________称为样本点的中心.(2)相关系数r①r=∑ni=1xi-xyi-y∑ni=1xi-x2∑ni=1yi-y2;②当r0时,表明两个变量________;当r0时,表明两个变量________.r的绝对值越接近于1,表明两个变量的线性__________;r的绝对值越接近于0时,表明两个变量之间________________________________.通常,当r的绝对值大于________时认为两个变量有很强的线性相关关系.2.独立性检验(1)列联表:列出的两个分类变量的________,称为列联表.(2)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=________________________________,其中n=__________为样本容量.(3)独立性检验利用随机变量________来判断“两个分类变量________”的方法称为独立性检验.自我检测1.对有线性相关关系的两个变量建立的回归直线方程y^=a^+b^x中,回归系数b^()A.可以小于0B.小于0C.能等于0D.只能等于02.(2011·天津模拟)下面是2×2列联表:y1y2合计x1a2173x2222547合计b46120第2页共10页则表中a,b的值分别为()A.94,72B.52,50C.52,74D.74,523.如果有95%的把握说事件A和B有关系,那么具体计算出的数据()A.K23.841B.K23.841C.K26.635D.K26.6354.(2011·绍兴月考)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别非统计专业统计专业男2620女1440则可判断约有________的把握认为“主修统计专业与性别之间有关系”.探究点一独立性检验例1(2011·湛江模拟)利用统计变量K2的观测值来判断两个分类变量之间的关系的可信程度.考察小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示种子灭菌种子未灭菌合计黑穗病26184210无黑穗病50200250合计76384460试按照原试验目的作统计分析推断.变式迁移1对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别.探究点二线性回归分析第3页共10页例2一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:零件数x(个)102030405060708090100加工时间y(分)626875818995102108115122(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求回归直线方程;(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?变式迁移2一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:转速x(转/秒)1614128每小时生产有缺点的零件数y(件)11985(1)对变量y与x进行相关性检验;(2)如果y与x有线性相关关系,求回归直线方程.探究点三综合应用例3(2010·辽宁)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)频数30402010表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85)频数1025203015完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物Aa=b=注射药物Bc=d=第4页共10页合计n=附:K2=nad-bc2a+bc+da+cb+d.变式迁移3某市对该市一重点中学2010年高考上线情况进行统计,随机抽查244名学生,得到如下表格:语文数学英语综合科目上线不上线上线不上线上线不上线上线不上线总分上线201人17427178231762517526总分不上线43人3013232024192617总计20440201432004420143试求各科上线与总分上线之间的关系,并求出哪一科目与总分上线关系最大?1.回归方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归方程的适用范围,否则没有实用价值.2.利用图形来判断两个变量之间是否有关系,可以画出二维条形图,但从图形上只可以粗略地估计两个分类变量的关系,还要结合所求的数值来进行比较.作图应注意单位统一、图形准确,但它不能给出我们两个分类变量有关或无关的精确的可信程度,若要作出精确的判断,可以作独立性检验的有关计算.(满分:75分)一、选择题(每小题5分,共25分)1.对于独立性检验,下列说法中错误的是()A.K2的值越大,说明两事件相关程度越大B.K2的值越小,说明两事件相关程度越小C.K2≤3.841时,有95%的把握说事件A与B无关D.K26.635时,有99%的把握说事件A与B有关2.下列说法中正确的有:①若r0,则x增大时,y也相应增大;②若r0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个点均在一条直线上()A.①②B.②③C.①③D.①②③3.(2011·天津汉沽一中月考)甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690.85m115106124103第5页共10页则哪位同学的试验结果体现A、B两变量更强的线性相关性?()A.甲B.乙C.丙D.丁4.下列命题中正确的个数为()①线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱;②残差平方和越小的模型,模型拟合的效果越好;③用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好.A.1B.2C.3D.05.(2010·济南模拟)有两个分类变量x,y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表如下:y1y2总计x113218150x211436150总计24654300则两个分类变量x和y有关系的可信度为()A.95%B.97.5%C.99%D.99.5%二、填空题(每小题4分,共12分)6.为了判断高中三年级学生是否选修文科与性别有关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2=50×13×20-10×7223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为______.7.(2011·银川模拟)下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y^=3-5x,变量x增加一个单位时,y平均增加5个单位;③线性回归方程y^=b^x+a^必过点(x,y);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是90%.其中错误..的命题是________.8.若两个分类变量x和y的列联表为:y1y2x1515x24010则x与y之间有关系的概率约为________.三、解答题(共38分)9.(12分)在一次飞机航程中调查男女乘客的晕机情况,其2×2列联表如下,试判断晕机与性别是否有关?晕机不晕机合计男107080女102030合计2090110第6页共10页10.(12分)(2011·武汉模拟)为了考察某种药物预防疾病的效果,进行动物实验,得到如下的列联表患病未患病总计服用药104555没服用药203050总计3075105请问能有多大把握认为药物有效?11.(14分)(2010·全国)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:K2=nad-bc2a+bc+da+cb+d学案59统计案例自主梳理第7页共10页1.(1)y-b^x∑ni=1xi-xyi-y∑ni=1xi-x21n∑ni=1xi1n∑ni=1yi(x,y)(2)②正相关负相关相关性越强几乎不存在线性相关关系0.752.(1)频数表(2)nad-bc2a+bc+da+cb+da+b+c+d(3)K2有关系自我检测1.A[b^=0时,得r=0,这时不具有线性相关关系,但b^能大于0,也能小于0.]2.C[∵a+21=73,∴a=52.又a+22=b,∴b=74.]3.A[比较K2的值和临界值的大小,有95%的把握则K23.841,K26.635约有99%的把握.]4.99.5%解析因为K2=100×26×40-14×20240×60×46×54≈9.6897.879,所以有99.5%的把握认为“主修统计专业与性别之间有关系”.课堂活动区例1解题导引利用已知条件来判断两个分类变量是否具有关系,可以先假设两个变量之间有关系,再计算K2的值,K2的值越大说明两个变量间有关系的可能性越大,再参考临界值,从而判断两个变量有关系的可信程度.解由列联表知:a=26,b=184,c=50,d=200.∴a+b=210,c+d=250,a+c=76,b+d=384,n=a+b+c+d=460.∴K2=nad-bc2a+bc+da+cb+d=460×26×200-184×502210×250×76×384≈4.804.∵K2≈4.8043.841.∴有95%的把握认为种子灭菌与否与小麦发生黑穗病是有关系的.变式迁移1解假设做过心脏搭桥手术与又发作心脏病没有关系.由于a=39,b=157,c=29,d=167,a+b=196,c+d=196,a+c=68,b+d=324,n=392,由公式可得K2的观测值为k=nad-bc2a+bc+da+cb+d=3
本文标题:2015届高三数学北师大版(通用,理)总复习学案学案59统计案例
链接地址:https://www.777doc.com/doc-2946168 .html