您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 高考数学二轮复习统计与统计案例张
1.随机抽样(1)理解随机抽样的必要性和重要性.(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样的方法.2.总体估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.3.变量的相关性(1)会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.4.了解独立检验的基本思想,认识统计方法在决策中的作用.5.了解回归的基本思想、方法及其简单应用.1.本部分内容在高考中所占分数大约在5%左右.2.本部分考查的主要内容是抽样方法,用样本估计总体等,一般在每份试卷中有1~2题,多为容易题和中档题.在抽样方法的试题中主要考查各种抽样方法的定义和特点,以及有关数据的计算,在用样本估计总体中考查频率分布直方图等的识别和计算.1.抽样方法三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等从总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成注意:不论用哪种抽样方法,从容量为N的总体中抽取容量为n的样本时,每一个个体被抽取的概率P=nN,这是随机抽样的一个重要特点(随机抽样的等概率性),但必须注意的是等概率性是指“在整个抽样过程”中.2.统计图表(1)频率分布直方图①绘制频率分布直方图的步骤a.求极差;b.决定组距与组数;c.将数据分组;d.列频率分布表;e.画频率分布直方图.②频率分布直方图的特征:a.从频率分布直方图可以清楚地看出数据分布的总体趋势;b.从频率分布直方图中得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.注意:在频率分布直方图中:(1)小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率,这样频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小;(2)各小矩形的面积之和等于1.(2)茎叶图①茎叶图:当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.②用茎叶图表示数据有两个优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.3.样本的数字特征(1)众数在样本数据中,频率分布最大值所对应的样本数据(或出现次数最多的那个数据).(2)中位数样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数.(3)平均数样本数据的算术平均数,即x-=1n(x1+x2+…+xn).(4)方差与标准差方差s2=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2].标准差s=1n[x1-x-2+x2-x-2+…+xn-x-2]注意:(1)现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差.来估计总体的平均数与标准差、方差.(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.4.变量间的相关关系(1)散点图直观反映了两变量的成对观察值之间存在的某种关系,利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中点的分布从整体上看大致在一条直线的附近,我们说变量x和y具有线性相关关系.(2)最小二乘法求回归直线的方程设线性回归方程为y^=b^x+a^.其中,b^是回归直线的斜率,a^是截距.b^=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2a^=y--b^x-注意:回归直线一定经过样本的中心点(x-,y-),据此性质可以解决有关的计算问题.5.回归分析(1)相关系数①r=i=1nxi-x-yi-y-i=1nxi-x-2i=1nyi-y-2,叫做相关系数.②样本相关系数r的性质a.相关系数用来衡量变量x与y之间的线性相关程度;b.|r|≤1,且|r|越接近于1,相关程度越高,且|r|越接近于0,相关程度越低.(2)相关性检验的步骤①作统计假设.假设x与y不具有线性相关关系.②根据小概率0.05与n-2在附表中查出r的一个临界值r0.05;③根据样本相关系数计算公式算出r的值;④作统计推断.如果|r|r0.05,表明有95%的把握认为x与y之间具有线性相关关系;如果|r|≤r0.05,则没有理由拒绝原来的假设.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d则χ2=a+b+c+dad-bc2a+bc+da+cb+d,若χ23.841,则有95%的把握说两个事件有关;若χ26.635,则有99%的把握说两个事件有关;若χ22.706,则没有充分理由认为两个事件有关.[例1](2011·福建文,4)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为()A.6B.8C.10D.12[答案]B[解析]“每一层都按hN的比例抽取”.高一年级学生的抽取比例为630,则高二年级抽取的学生数为40×630=8人.[评析](1)解决此类题目首先要深刻理解各种抽样方法的特点和适用范围,如分层抽样,适用于数目较多且各部分之间具有明显差异的总体.(2)系统抽样中编号的抽取和分层抽样中各层人数的确定是高考重点考查的内容.(2010·安徽文,14)某地有居民100000户,其中普通家庭99000户,高收入家庭1000户.从普遍家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是____________.[答案]5.7%[解析]普通家庭3套或3套以上住房比例为50990,而高收入家庭为70100.∴该地拥有3套或3套以上住房的家庭所占比例为99000×50990+1000×70100100000=571000=5.7%.[例2]随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高176cm的同学被抽中的概率.[解析](1)由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间,因此乙班平均身高高于甲班.(3)设身高为176cm的同学被抽中的事件为A,从乙班10名同学中抽中两名身高不低于173cm的同学有:(181,173),(181,176),(181,178),(181,179),(179,173),(179,176),(179,178),(178,173),(178,176),(176,173)共10个基本事件,而事件A含有4个基本事件:(181,176),(179,176),(178,176),(176,173),∴P(A)=410=25.[评析](1)本题考查了茎叶图的识图问题和平均数的计算,其中从茎叶图中读出数据是关键,为此,首先要弄清“茎”和“叶”分别代表什么.(2)要熟练掌握众数、中位数、平均数、方差、标准差的计算方法.(2010·山东理,6)样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为()A.65B.65C.2D.2[答案]D[解析]∵a+0+1+2+35=1,∴a=-1,故s2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.[例3]在育民中学举行的电脑知识竞赛中,将高一两个班参赛学生的成绩(得分的整数)进行整理后分成五组,绘制出如下的频率分布直方图(如图),已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别为0.30,0.15,0.10,0.05第二小组的频数为40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数.[分析]根据频率分布直方图及有关性质、概念求解.[解析](1)因为各小组的频率之和为1.00.第一、三、四、五组的频率分别是0.30,0.15,0.10,0.05,所以第二小组的频率为1.00-(0.30+0.15+0.10+0.05)=0.40.因为第二小组的频率为0.40,所以落在59.5~69.5的第二小组的小长方形的高=频率组距=0.410=0.04,由此可补全直方图.(如原图阴影部分所示)(2)设高一两个班参赛的学生人数为x人,因为第二小组的频数为40,频率为0.40,所以40x=0.40,所以x=100(人).[评析](1)在频率分布直方图中,组距是一个固定值,各矩形面积和为1;(2)通过频率分布直方图传递信息,识图获取信息是解决这一问题的关键.(2011·湖北文,5)有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为()A.18B.36C.54D.72[答案]B[解析]由0.02+0.05+0.15+0.19=0.41,∴落在区间[2,10]内的频率为0.41×2=0.82.∴落在区间[10,12)内的频率为1-0.82=0.18.∴样本数据落在区间[10,12)内的频数为0.18×200=36.[例4]某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.[分析]由画频率分布表的步骤:计算极差、分组、列表、画图.[解析](1)①计算极差,最小值为45,最大值为103,极差为103-45=58.②决定组数和组距,取组距为10,组数为5810=5.8,∴分成6组.③将第一组起点定为44.5,组距为10,分成6组,画频率分布表.分组频数频率44.5-54.5223054.5-64.5333064.5-74.5333074.5-84.511113084.5-94.5883094.5-104.53330(2)绘频率分布直方图(3)该市一月中空气污染指数在0~50
本文标题:高考数学二轮复习统计与统计案例张
链接地址:https://www.777doc.com/doc-3712453 .html