您好,欢迎访问三七文档
1概率统计【重点知识回顾】概率(1)事件与基本事件::SSS随机事件在条件下,可能发生也可能不发生的事件事件不可能事件:在条件下,一定不会发生的事件确定事件必然事件:在条件下,一定会发生的事件基本事件:试验中不能再分的最简单的“单位”随机事件;一次试验等可能的产生一个基本事件;任意两个基本事件都是互斥的;试验中的任意事件都可以用基本事件或其和的形式来表示.(2)频率与概率:随机事件的频率是指此事件发生的次数与试验总次数的比值.频率往往在概率附近摆动,且随着试验次数的不断增加而变化,摆动幅度会越来越小.随机事件的概率是一个常数,不随具体的实验次数的变化而变化.2(3)互斥事件与对立事件:(4)古典概型与几何概型:古典概型:具有“等可能发生的有限个基本事件”的概率模型.几何概型:每个事件发生的概率只与构成事件区域的长度(面积或体积)成比例.两种概型中每个基本事件出现的可能性都是相等的,但古典概型问题中所有可能出现的基本事件只有有限个,而几何概型问题中所有可能出现的基本事件有无限个.(5)古典概型与几何概型的概率计算公式:古典概型的概率计算公式:()APA包含的基本事件的个数基本事件的总数.几何概型的概率计算公式:()APA构成事件的区域长度(面积或体积)试验全部结果构成的区域长度(面积或体积).两种概型概率的求法都是“求比例”,但具体公式中的分子、分母不同.(6)概率基本性质与公式①事件A的概率()PA的范围为:0()1PA≤≤.②互斥事件A与B的概率加法公式:()()()PABPAPB.③对立事件A与B的概率加法公式:()()1PAPB.(7)如果事件A在一次试验中发生的概率是p,则它在n次独立重复试验中恰好发生k次的概率是pn(k)=Cpk(1―p)n―k.实际上,它就是二项式[(1―p)+p]n的展开式的第k+1项.(8)独立重复试验与二项分布①.一般地,在相同条件下重复做的n次试验称为n次独立重复试验.注意这里强调了三点:(1)相同条件;(2)多次重复;(3)各次之间相互独立;②.二项分布的概念:一般地,在n次独立重复试验中,设事件A发生的次数为X,在每次试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概率为()(1)(012)kknknPXkCppkn,,,,,.此时称随机变量X服从二项分布,记作~()XBnp,,并称p为成功概率.统计(1)三种抽样方法①简单随机抽样简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取.简单随机抽样的特点:被抽取样本的总体个数有限.从总体中逐个进行抽取,使抽样便于在实践中操作.它是不放回抽取,这使其具有广泛应用性.每一次抽样时,每个个体等可事件定义集合角度理解关系互斥事件事件A与B不可能同时发生两事件交集为空事件A与B对立,则A与B必为互斥事件;事件A与B互斥,但不一是对立事件对立事件事件A与B不可能同时发生,且必有一个发生两事件互补3能的被抽到,保证了抽样方法的公平性.实施抽样的方法:抽签法:方法简单,易于理解.随机数表法:要理解好随机数表,即表中每个位置上等可能出现0,1,2,…,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性.②系统抽样系统抽样适用于总体中的个体数较多的情况.系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.系统抽样的操作步骤:第一步,利用随机的方式将总体中的个体编号;第二步,将总体的编号分段,要确定分段间隔k,当Nn(N为总体中的个体数,n为样本容量)是整数时,Nkn;当Nn不是整数时,通过从总体中剔除一些个体使剩下的个体个数N能被n整除,这时Nkn;第三步,在第一段用简单随机抽样确定起始个体编号,再按事先确定的规则抽取样本.通常是将加上间隔k得到第2个编号()lk,将()lk加上k,得到第3个编号(2)lk,这样继续下去,直到获取整个样本.③分层抽样当总体由明显差别的几部分组成时,为了使抽样更好地反映总体情况,将总体中各个个体按某种特征分成若干个互不重叠的部分,每一部分叫层;在各层中按层在总体中所占比例进行简单随机抽样.分层抽样的过程可分为四步:第一步,确定样本容量与总体个数的比;第二步,计算出各层需抽取的个体数;第三步,采用简单随机抽样或系统抽样在各层中抽取个体;第四步,将各层中抽取的个体合在一起,就是所要抽取的样本.(2)用样本估计总体样本分布反映了样本在各个范围内取值的概率,我们常常使用频率分布直方图来表示相应样本的频率分布,有时也利用茎叶图来描述其分布,然后用样本的频率分布去估计总体分布,总体一定时,样本容量越大,这种估计也就越精确.①用样本频率分布估计总体频率分布时,通常要对给定一组数据进行列表、作图处理.作频率分布表与频率分布直方图时要注意方法步骤.画样本频率分布直方图的步骤:求全距→决定组距与组数→分组→列频率分布表→画频率分布直方图.②茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到;二是茎叶图便于记录和表示,但数据位数较多时不够方便.③平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程度,其计算公式为211()niisxxn.有时也用标准差的平方———方差来代替标准差,两者实质上是一样的.(3)两个变量之间的关系变量与变量之间的关系,除了确定性的函数关系外,还存在大量因变量的取值带有一定随机性的相关关系.在本章中,我们学习了一元线性相关关系,通过建立回归直线方程就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解.分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘估4计求出回归直线方程.通常我们使用散点图,首先把样本数据表示的点在直角坐标系中作出,形成散点图.然后从散点图上,我们可以分析出两个变量是否存在相关关系:如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,其对应的方程叫做回归直线方程.在本节要经常与数据打交道,计算量大,因此同学们要学会应用科学计算器.(4)求回归直线方程的步骤:第一步:先把数据制成表,从表中计算出211nniiiiixyxyx,,,;第二步:计算回归系数的a,b,公式为1112211()()()nnniiiiiiinniiiinxyxybnxxaybx,;第三步:写出回归直线方程ybxa.(4)独立性检验①22列联表:列出的两个分类变量X和Y,它们的取值分别为12{,}xx和12{,}yy的样本频数表称为22列联表1分类y1y2总计x1ababx2cdcd总计acbdabcd构造随机变量22()()()())nadbcKabcdacbd(其中nabcd)得到2K的观察值k常与以下几个临界值加以比较:如果2.706k,就有0090的把握因为两分类变量X和Y是有关系;如果3.841k就有0095的把握因为两分类变量X和Y是有关系;如果6.635k就有0099的把握因为两分类变量X和Y是有关系;如果低于2.706k,就认为没有充分的证据说明变量X和Y是有关系.5常用的统计图表(1)频率分布直方图①小长方形的面积=组距×频率组距=频率;②各小长方形的面积之和等于1;③小长方形的高=频率组距,所有小长方形的高的和为1组距.(2)茎叶图在样本数据较少时,用茎叶图表示数据的效果较好.3.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小长方形底边中点的横坐标中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之和(2)方差:s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].标准差:s=1n[x1-x2+x2-x2+…+xn-x2].【典型例题】考点:概率【内容解读】概率试题主要考查基本概念和基本公式,对等可能性事件的概率、互斥事件的概率、独立事件的概率、事件在n次独立重复试验中恰发生k次的概率、离散型随机变量分布列和数学期望等内容都进行了考查。掌握古典概型和几何概型的概率求法。例1、在平面直角坐标系xoy中,设D是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E是到原点的距离不大于1的点构成的区域,向D中随意投一点,则落入E中的概率为。例2某公交公司对某线路客源情况统计显示,公交车从每个停靠点出发后,6车上的乘客人数及频率如下表:人数0~67~1213~1819~2425~3031人以上频率0.10.150.250.200.200.1(I)从每个停靠点出发后,乘客人数不超过24人的概率约是多少?(II)全线途经10个停靠点,若有2个以上(含2个)停靠点出发后,车上乘客人数超过18人的概率大于0.9,公交公司就要考虑在该线路增加一个班次,请问该线路需要增加班次吗?考点:统计【内容解读】理解简单随机抽样、系统抽样、分层抽样的概念,了解它们各自的特点及步骤.会用三种抽样方法从总体中抽取样本.会用样本频率分布估计总体分布.会用样本数字特征估计总体数字特征.会利用散点图和线性回归方程,分析变量间的相关关系;掌握独立性检验的步骤与方法。例3(1)一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B层中每个个体被抽到的概率都为112,则总体中的个体数为.(2)设矩形的长为a,宽为b,其比满足b∶a=618.0215,这种矩形给人以美感,称为黄金矩形。黄金矩形常应用于工艺品设计中。下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定例4下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨标准煤)的几组对照数据3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,崩最小二乘法求出Y关于x的线性回归方程Y=bx+a;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?7视力4.34.44.54.64.74.84.95.05.15.20.10.3组距频率(参考数值:32.5+43+54+64.5=66.5)例5、为了研究某高校大学新生学生的视力情况,随机地抽查了该校100名进校学生的视力情况,得到频率分布直方图,如图.已知前4组的频数从左到右依次是等比数列na的前四项,后6组的频数从左到右依次是等差数列nb的前六项.(Ⅰ)求等比数列na的通项公式;(Ⅱ)求等差数列nb的通项公式;(Ⅲ)若规定视力低于5.0的学生属于近视学生,试估计该校新生的近视率的大小.例6、某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x(°C)1011131286就诊人数y(个)222529261612该兴趣小组确定的研究方案
本文标题:概率统计复习专题
链接地址:https://www.777doc.com/doc-4650637 .html