您好,欢迎访问三七文档
概率与统计重点知识回顾第一讲随机抽样第二讲概率计算——古典与几何概型第三讲统计——用样本估计总体第四讲统计案例——回归分析与独立性检验第五讲新课标高考真题选讲 一、统计1.抽样方法包括:简单随机抽样、系统抽样、分层抽样三种方法.2.频率分布直方图中,纵轴表示频率/组距,数据落在各个小组内的频率用小矩形的面积表示,各小矩形的面积和等于1.3.众数、平均数、中位数是描述数据的集中趋势的量,方差、标准差则是描述数据的波动大小.其中,方差的计算公式为s2=[(x1- )2+(x2- )2+…+(xn- )2].1nxxx为茎,个位数字作为叶,如数据为三位数,则把十位和百位数字合在一起作为茎,个位数字作为叶.二、概率1.在古典概型中,事件A的概率公式P(A)= .2.在几何概型中,事件A的概率公式P(A)= ,其中μΩ表示区域Ω的几何度量,μA表示区域A的几何度量.A包含的基本事件的个数基本事件的总数AΩμμ4.茎叶图通常用来记录两位数的数据,把两位数的十位数字作3.不可能同时发生的事件叫做互斥事件,若事件A和B为互斥事件,则P(A∪B)=P(A)+P(B),这个公式推广到n个互斥事件时也成立.(P(A∪B)也可记为P(A+B))11.相关关系与回归方程(1)相关关系的分类①正相关:从散点图上看,点散布在从到的区域内;②负相关:从散点图上看,点散布在从到的区域内.(2)线性相关关系从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫.左下角右上角左上角右下角回归直线(3)回归方程①最小二乘法:使得样本数据的点到回归直线的最小的方法叫最小二乘法.②回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程为y^=b^x+a^,则b^=,a^=y-b^x,其中b^是回归方程的,a^是在y轴上的.距离的平方和斜率截距(4)样本相关系数,用它来衡量两个变量间的线性相关关系的强弱.①当r0时,表明两个变量;②当r0时,表明两个变量;③r的绝对值越接近1,表明两个变量的线性相关性;r的绝对值越接近0,表明两个变量的线性相关性.通常当|r|0.75时,认为两个变量有很强的线性相关关系.正相关负相关越强越弱12.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dK2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)(其中n=为样本容量),则利用独立性检验判断表来判断“X与Y的关系”.a+b+c+d考点一简单随机抽样(基础送分型考点——自主练透)[必备知识](1)抽取方式:逐个不放回抽取;(2)每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数法.[提醒]简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等.第一讲随机抽样1.(2015·广东七校联考)假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是______.(下面摘取了随机数表第7行至第9行)87421753315724550688770474476721763350258392120676,63016378591695566719981050717512867358074439523879,33211234297864560782524207443815510013429966027954解析:由随机数表,可以看出前4个样本的个体的编号是331,572,455,068.于是,第4个样本个体的编号是068.0682.(2013·江西高考)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01解析:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的数字为08,02,14,07,01,…,故选出的第5个个体的编号为01.答案:D考点二系统抽样(重点保分型考点——师生共研)[必备知识]系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体编号;(2)确定分段间隔k,对编号进行分段.当Nn(n是样本容量)是整数时,取k=Nn;(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.[提醒]系统抽样中,易忽视抽取的样本数也就是分段的段数,当Nn不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列.[典题例析](2014·广东高考)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20解析:由100040=25,可得分段的间隔为25.故选C.2.(人教B版教材习题改编)某工厂平均每天生产某种机器零件大约10000件,要求产品检验员每天抽取50件零件,检查其质量状况,采用系统抽样方法抽取,若抽取的第一组中的号码为0010,则第三组抽取的号码为________.0410考点三分层抽样的交汇命题(常考常新型考点——多角探明)[必备知识](1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.[提醒]分层抽样中,易忽视每层抽取的个体的比例是相同的,即样本容量n总体个数N.角度一:与频率分布相结合问题1.(2014·广东高考)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.100,10B.200,10C.100,20D.200,20D2.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历35岁以下35~50岁50岁以上本科803020研究生x20y角度二:与概率相结合问题(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;解:(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,设抽取学历为本科的人数为m,∴3050=m5,解得m=3.(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取1人,此人的年龄为50岁以上的概率为539,求x,y的值.抽取的样本中有研究生2人,本科生3人,分别记作S1,S2;B1,B2,B3.从中任取2人的所有等可能基本事件共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3),其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2).∴从中任取2人,至少有1人学历为研究生的概率为710.(2)由题意,得10N=539,解得N=78.∴35~50岁中被抽取的人数为78-48-10=20,∴4880+x=2050=1020+y,解得x=40,y=5.即x,y的值分别为40,5.(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取1人,此人的年龄为50岁以上的概率为539,求x,y的值.2.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历35岁以下35~50岁50岁以上本科803020研究生x20y 概率知识的考查是近几年新课改后高考命题的一大热点,高考每年在选择、填空或解答题中都有所体现,由于文科数学后续课程不再学习概率,文科数学将重点考查概率的意义、古典概型与几何概型的掌握和运用.在处理概率问题时主要有两种思路:正向思路和逆向思路.正向思考可对复杂问题进行分解;逆向思考常使一些复杂问题得到简化.要学会将实际问题转化为古典概型和几何概型来解决.第二讲概率——古典概型与几何概型古典概型基础梳理试验结果互斥的基本事件只有有限个可能性相等1.基本事件(1)基本事件的定义:一次试验中可能出现的称为一个基本事件.所有的基本事件都有有限个,而且是试验中不能再分的最简单的随机事件.(2)基本事件的特点:①任何两个基本事件是;②任何事件都可以表示成的和.2.古典概型如果某类概率模型具有以下两个特点:(1)试验中所有可能出现的基本事件.(2)每个基本事件出现的.3.古典概型的概率公式对于任何事件A,基本事件的总数包含的基本事件的个数A)(AP=1.(2012年安徽)袋中共有6个除了颜色外完全相同的球,其中有1个红球、2个白球和3个黑球.从袋中任取两球,两球颜色为一白一黑的概率等于()A.15B.25C.35D.45古典概型解析:将同色小球编号.从袋中任取两球,所有基本事件为:(红,白1),(红,白2),(红,黑1),(红,黑2),(红,黑3),(白1,白2),(白1,黑1),(白1,黑2),(白1,黑3),(白2,黑1),(白2,黑2),(白2,黑3),(黑1,黑2),(黑1,黑3),(黑2,黑3),共有15个基本事件,而一白一黑的共有6个基本事件,P=615=25.故选B.2.(2012年杭州一检)从1,2,3,4,5,6这6个数字中,任取2个数字相加,其和为偶数的概率是________.解析:从6个数中任取2个数的可能情况有:(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6),共15种,其中和为偶数的情况有:(1,3),(1,5),(2,4),(2,6),(3,5),(4,6),共6种,所以所求的概率是25.答案:25第6课时几何概型基础梳理构成该事件区域的长度(面积或体积)成比例概率模型无限多相等1.几何概型的定义如果每个事件发生的概率只与,则称这样的为几何概率模型,简称几何概型.2.几何概型的特点(1)试验中所有可能出现的结果(基本事件总数)有个.(2)(2)每个基本事件出现的可能性.3.几何概型的概率公式P(A)=)区域长度(面积或体积试验的全部结果构成的积)的区域长度(面积或体构成事件A1、若不等式组 所表示的平面区域为M,x2+y2≤1所表示的平面区域为N,现随机向区域M内抛一粒豆子,则豆子落在区域N内的概率为.,,240yxyxxy几何概型1、如图,△OAB即为可行域M.图中的阴影区域即所求豆子要落的区域.阴影区域的面积为 π,且S△OAB= ,故所求概率为P= = .14163141633641.在区间[0,
本文标题:概率与统计(文科)
链接地址:https://www.777doc.com/doc-1354244 .html