您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 文科概率与统计基础知识
概率与统计一、统计1.三种抽样方法的比较类别共同点特点相互联系适用范围简单随机抽样①抽样过程中每个个体被抽到的可能性相等;②每次抽出个体后不再放回,即不放回抽样.从总体中逐个抽取.总体个数较少.系统抽样将总体平均分成几部分,按预先制定的规则在各部分中抽取1个个体.系统:在起始部分取样时,采用简单随机抽样,其余部分等距抽。分层:各层抽样时,采用简单随机抽样或系统抽样(层的容量大时可用系统抽样).总体个数较多.分层抽样将总体分成几层,按各层个体数之比抽取.总体由差异明显的几部分组成.2.常用的统计图表:一“表”(频率分布表);两“图”(频率分布直方图和茎叶图)(1)频率分布直方图①小长方形的面积=组距×频率组距=频率;②各小长方形的面积之和等于1;③小长方形的高=频率组距,所有小长方形的高的和为1组距.【注意】直方图的纵轴(小长方形的高)一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,小长方形的面积表示频率.(2)茎叶图在样本数据较少时,用茎叶图表示数据的效果较好.3.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小长方形底边中点的横坐标中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分成左右两个面积相等的分界线与x轴交点的横坐标平均数样本数据的算术平均数每个小长方形的面积乘以小长方形底边中点的横坐标之和(2)平均数121()nxxxxn.方差2222121[()()()]nsxxxxxxn.标准差222121[()()()]nsxxxxxxn.【提醒】标准差、方差越大,数据的离散程度越大,越不稳定.4.变量间的相关关系知识点分析1、线性回归方程:axbyˆˆˆ(x叫做解释变量,y叫做预报变量)线性回归方程系数公式:(公式说明:回归直线过样本的中心点)(yx,,也就是平均值点.)2、相关系数公式3、几个结论:(1)回归直线过样本的中心点)(yx,.(2)b0时,y与x正相关,散点图呈上升趋势;b0时,y与x负相关,散点图呈下降趋势.(3)斜率b的含义(举例):如果回归方程为y=2.5x+2,说明x增加1个单位时,y平均增加2.5个单位;如果回归方程为y=-2.5x+2,说明x增加1个单位时,y平均减少2.5个单位.(4)相关系数r表示变量的相关程度。范围:1r,即11rr越大.,相关性越强.。0r时,y与x正相关;0r时,y与x负相关.(5)相关指数2R表示模型的拟合效果。范围:]10[2,R2R越大.,拟合效果越好.,(这时:残差平方和越小,残差点在带状区域内的分布比较均匀,带状区域宽度越窄,拟合精度越高).2R表示解释变量x对于预报变量y变化的贡献率。例如:64.02R,表明“x解释了64%的y变化”,或者说“y的差异有64%是由x引起的”。(6)线性回归模型eabxy,其中e叫做随机误差。(y是由x和e共同确定的)二、概率1.概率的五个基本性质(1)随机事件A的概率:0≤()PA≤1.(2)必然事件的概率为1.(3)不可能事件的概率为0.(4)如果事件A与事件B互斥(不可能同时发生),则()()()PABPAPB.(5)如果事件A与事件B互为对立事件(不会同时发生,但一定有一个发生),那么()()()1PABPAPB,即()1()PAPB.对立必互斥,互斥未必对立.2.古典概型(1)特点:①有限性,②等可能性.(2)概率公式:()APA事件中所含的基本事件数试验的基本事件总数.3.几何概型(1)特点:①无限性,②等可能性.(2)概率公式:()()()APA构成事件的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积.三、独立性检验(一)知识点分析1、2×2列联表:统计被调查者的两种状态,每种状态又分两种情况的调查结果表.对于性别变量,其取值为男和女两种,这种变量的不同值表示个体所属的不同类别,像这类变量称为分类变量。2、卡方统计量:为了研究事件X与Y的关系,经调查得到一张2×2列联表,如下表所示:Y1Y2合计X1aba+bX2cdc+d合计a+cb+dn=a+b+c+d独立性检验原理:也叫假设性检验(类似反证法原理),一般情况下,假设分类变量X和Y之间没有关系,通过计算2K值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1-P),也就是“X和Y有关系”.(表中的k就是2K的观测值,即2Kk)统计量2K(读做“卡方”),它的表达式是:))()()(()(22dbcadcbabcadnK独立性检验临界值表P(k2k)0.500.400.250.150.100.050.0250.010k0.4550.7081.3232.0722.7063.8415.0246.635(表中的K是理论值,2K是实际观测值,2K越大.,说明变量间越有关系...)(二)独立性检验举例例1、某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:非统计专业统计专业男1310女720为了检验主修统计专业是否与性别有关系,根据表中的数据,查对临界值P(k2k)0.100.050.0250.010k2.7063.8415.0246.635根据表中数据,得到。所以有的把握认为主修统计专业与性别有关系。例2、某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如表所示:(1)由表中数据分析,收看新闻节目的观众是否与年龄有关?(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率。参考公式与数据:))()()(()(22dbcadcbabcadnK独立性检验临界值表P(k2k)0.100.050.0250.010k2.7063.8415.0246.635
本文标题:文科概率与统计基础知识
链接地址:https://www.777doc.com/doc-2723797 .html