您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 《第三章—统计案例》单元设计
高二理科数学第三章统计案例1《第三章—统计案例》单元设计注:本单元设计分为单元学前设计、单元教学设计和单元巩固设计【单元学前设计】一、知识体系梳理(旧知识)本章共2节,大约4课时,知识框架如下:独立性检验的基本原理精确检验两个分类变量等高条形图列联表只管判定两个变量有关分类变量独立性检验直观相关系数残差平方和残差图回归分析非线性回归模型线性回归模型观察相关关系:利用散点图回归分析统计案例---二、本单元地位本章内容是《选修数学2-3》第三章统计案例。在必修3中学生已经学习了抽样、用样本估计总体、线性回归等基本知识,本章中,我们将在此基础上,通过对典型案例的讨论,进一步讨论线性回归分析方法及其应用,并初步了解独立性检验的基本思想,认识统计方法在决策中的作用。学习本单元新知识应具备基础知识测试:【单元教学设计】一、单元知识点:1、线性回归模型(1)回归方程的相关计算:①函数关系是一种确定性关系,而相关关系是一种非确定性关系②回归分析是对具有相关关系的两个变量进行统计分析的一种常用手法.③对于一组具有线性相关关系的数据)()()(2211nnyxyxyx,,,,,,,回归直线的斜率和截高二理科数学第三章统计案例2距的最小二乘估计公式分别为niiniiiniiniiixxyxnyxxxyyxxb1221121)())((ˆ,xbyaˆˆ(其中niixnx11,niiyny11,),(yx称为样本点中心)④回归直线必过样本点的中心,即点),(yx(2)线性回归模型:①在线性回归模型:ybxae中,a和b为模型的未知参数,e是y与ybxa之间的误差,通常e为随机变量,称为随机误差,它的均值E(e)=0,方差2()De0>②线性回归模型的完整表达式为2()0,()ybxaeEeDe随机误差e的方差2越小,通过回归直线ybxa预报真实值y的精确度越高.③在回归模型中,y的值由x和随机因素e共同确定,即x只能解释部分y的变化,因此把x称为解释变量,y称为预报变量.2、残差分析①残差对于样本点112233(,),(,),(,),,(,).nnxyxyxyxy而言,相应于它们的随机误差为ie=(i=1,2,3,…,n)其估算值为ieaxbyyyiiiiˆˆˆ,(i=1,2,3,…,n).ie称为相应于点(,)iixy的残差。②残差图:利用图形来分析残差特性,作图时纵坐标残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.3、回归模型拟合效果的判断方法:(1)残差图法:残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,这样的带状区域越窄,说明模型拟合精度越高,回归方程的预报精度越高.(2)残差平方和法:高二理科数学第三章统计案例321()niiyy称为残差平方和,残差平方和越小,模型的拟合效果越好.(3)2R:可以用21Rniiniiiyyyy1212)()ˆ(来刻画回归的效果,2R越大,模型的拟合效果越好,2R越小,模型的拟合效果越差.★在线性回归模型中,2R表示解释变量对于预报变量变化的贡献率,2R越接近于1,表示回归的效果越好.★在含有一个解释变量的线性模型中,2R恰好等于相关系数r.4、数据的表示方法(1)变量的不同值表示个体所属的不同类别,像这种变量称为分类变量(2)用图表列出两个分类变量的频数表,称为列联表;与表格相比,图形更能直观地反映出两个分类变量间是否相互影响;常用等高条形图展示列联表数据的频率特征.5、2×2列联表:假设有两个分类变量X和Y,它们的取值分别为21,xx和21,yy,其样本频数列联表(称为2×2列联表)为:2K=))()()(()(2dbcadcbabcadn,其中dcban为样本容量.6、独立性检验定义利用随机变量2K来判断“两个分类变量有关系”的方法称为独立性检验.1y2y总计1xabba2xcddc总计cadbdcba高二理科数学第三章统计案例47、独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量X与Y有关系”犯错误概率的上界a,然后查表确定临界值0k(2)由2×2列联表计算2K=的观测值k))()()(())((2dcdbcababcaddcba(3)把k的值与临界值比较确定X与Y有关的程度或无关。如果0kk,则推断“在犯错误的概率不超过a的前提下认为X与Y有关系”(或有a1的把握认为X与Y有关系);如果0kk<,则推断“不能在犯错误的概率不超过a的前提下认为X与Y有关系”(或没有a1的把握认为X与Y有关系).二、高考考点:1.相关关系的判断(基础送分题型))2.回归分析(题点多变型考点)(1)线性回归方程及应用(2)相关系数及应用3.独立性检验(重点保分型考点)三、教学内容设计、教学学时安排§3.1回归分析的基本思想及其初步应用(2课时)§3.2独立性检验的基本思想及其初步应用(2课时)四、高考真题:1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是().A.抽签法B.随机数法)(02kKP0.500.400.250.150.100k0.4550.7081.3232.0722.706)(02kKP0.050.0250.0100.0050.0010k3.8415.0246.6357.87910.828高二理科数学第三章统计案例5C.系统抽样法D.分层抽样法2.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是().A.45B.50C.55D.603.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y^=2.347x-6.423;②y与x负相关且y^=-3.476x+5.648;③y与x正相关且y^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578.其中一定不正确的结论的序号是().A.①②B.②③C.③④D.①④4.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到k=50×13×20-10×7223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.5.(本小题满分12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量高二理科数学第三章统计案例6yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.错误!未找到引用源。(xi-错误!未找到引用源。)2错误!未找到引用源。(wi-错误!未找到引用源。)2错误!未找到引用源。(xi-错误!未找到引用源。)(yi-错误!未找到引用源。)错误!未找到引用源。(wi-错误!未找到引用源。)(yi-错误!未找到引用源。)46.65636.8289.81.61469108.8表中wi=错误!未找到引用源。,错误!未找到引用源。=错误!未找到引用源。wi.(1)根据散点图判断,y=a+bx与y=c+d错误!未找到引用源。哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:=错误!未找到引用源。,=错误!未找到引用源。-错误!未找到引用源。.【单元巩固设计】【单元基础训练题】一、选择题(本大题共12小题,每小题5分,共60分.每小题中只有一项符合题目要求)高二理科数学第三章统计案例71.在对两个变量x,y进行线性回归分析时有下列步骤:①对所求出的回归直线方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.若根据可靠性要求能够作出变量x,y具有线性相关结论,则下列操作顺序正确的是()A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①2.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是()A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合3.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.y∧=x+1B.y∧=x+2C.y∧=2x+1D.y∧=x-14.今有一组实验数据如下:t1.993.04.05.16.12v1.54.047.51218.01现准备用下列函数中的一个近似地表示这些数据满足的规律,其中最接近的一个是()A.v=log2tB.v=log12tC.v=t2-12D.v=2t-25.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程中的截距为()A.a=y-bxB.a=y-b∧xC.a∧=y-bxD.a∧=y-b∧x6.下面是一个2×2列联表y1y2总计x1a2173x222527总计b46100其中a、b处填的值分别为()A.5254B.5452C.94146D.14694高二理科数学第三章统计案例87.设有一个回归方程为y∧=3-5x,则变量x增加一个单位时()A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位8.在一个2×2列联表中,由其数据计算得K2=13.097,则其两个变量间有关系的可能性为()A.99%B.95%C.90%D.无关系9.两个相关变量满足如下关系:x1015202530y10031005101010111014两变量的回归直线方程为()A.y∧=0.56x+997.4B.y∧=0.63x-231.2B.y∧=50.2x+501.4D.y∧=60.4x+400.710.线性回归方程y∧=b∧x+a∧必过()A.(0,0)B.(x,0)C.(0,y)D.(x,y)11.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是()A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R212.如果根据性别与是否爱好运动的列联表得到K2≈3.8523.841,所以判断性别与运动有关,那么这种判断犯错的可能性不超过()A.2.5%B.0.5%C.1%D.5%二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上)13.在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算得K2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关).14.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:温度(x)010205070溶解度(y)66.776.085.0112.3128.0由此得到
本文标题:《第三章—统计案例》单元设计
链接地址:https://www.777doc.com/doc-7903257 .html