您好,欢迎访问三七文档
第四章抽样和抽样分布第一节随机事件及其概率第二节随机变量的概率分布第三节抽样分布第四节正态分布和正态逼近一.抽样二.试验三.样本空间四.事件及其概率第一节随机事件及其概率一、抽样1.概念从总体中抽取部分单位,并进行实际调查,以推断总体。2.抽样的两种方法:重置抽样和不重置抽样两种抽样方法重置抽样1.概念:也称有放回的抽样,从总体中抽取一个单位,登记后再放回总体参加下一次的抽取,连续试验n次。2.重置抽样排列数:从总体N个单位,抽取样本容量为n个单位的重置试验,可能抽取的样本点个数:nnNAN=不重置抽样1.概念:也称无放回的抽样,每次总体中抽取一个单位,登记后不再放回原总体,不参加下一次抽选,下一次继续从总体余下的单位抽取样本单位,这样继续进行n次试验。有n个单位的样本是由n次连续试验构成的,但因每次抽出不重置,所以实质上等同于同时从总体中抽取n个样本单位。不重置抽样排列数:不重置抽样又分为考虑顺序和不考虑顺序的情况(排列与组合)。从10个同学中抽三个担任不同职务,有:从10个同学中抽三个考察其平均成绩,则:(1)(2)(1)nNPNNNNn=---+(1)(2)(1)!!()!!nNNNNNnNCnNnn---+==-二、试验1.概念:在相同条件下,对事物或现象所进行的观察。例如:掷一枚骰子,观察其出现的点数;产品质量检验,考察其是否是合格品等。2.试验具有以下特点:可以在相同的条件下重复进行;每次试验的可能结果不止一个,但试验的所有可能结果在试验之前是确切知道的;在试验结束之前,不能确定该次试验的确切结果;1.基本事件如果一个事件不能分解成两个或更多个事件,则这个事件称为基本事件,也称为样本点。通常样本点不止一个单位,而是由许多单位构成,这时就要连续n次试验的结果构成一个样本点。2.样本空间以全部样本点为元素的集合,称为样本空间。三、样本空间试验样本空间抛一枚硬币抛掷一颗骰子抽出一件产品检测一场足球比赛{正面向上,反面向上}{1,2,3,4,5,6}点{合格,不合格}{获胜,失利,平局}抛掷两枚硬币抽两件产品检测{(正,正),(反,正),(反,反)}………练习题写出随机试验的样本空间1.记录某班一次统计学测试的平均分数2.某人骑自行车在公路上行驶,观察该骑车人在遇到第一个红灯停下来以前已经遇到的绿灯个数。3.生产产品,直到有10件正品为止,记录生产产品的总件数。1.事件:随机试验的每一个可能结果(任何样本点集合)例如:掷一枚骰子出现的点数为32.随机事件:每次试验可能出现也可能不出现的事件例如:掷一枚骰子可能出现的点数3.必然事件:每次试验一定出现的事件,用表示。例如:掷一枚骰子出现的点数小于74.不可能事件:每次试验一定不出现的事件,用表示。例如:掷一枚骰子出现的点数大于6四、事件及其概率5.事件的概率(1)事件A的概率是对事件A在试验中出现的可能性大小的一种度量(2)表示事件A出现可能性大小的数值,事件A的概率表示为P(A)(3)概率的定义有:古典定义、统计定义和主观概率定义6.概率的统计定义在相同条件下进行n次随机试验,事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件A的概率,记为pnmAP)(例如,投掷一枚硬币,出现正面和反面的频率,随着投掷次数n的增大,出现正面和反面的频率稳定在1/2左右试验的次数正面/试验次数1.000.000.250.500.750255075100125第二节随机变量及其分布一、随机变量的概念二、离散型随机变量的概率分布三、连续型随机变量的概率分布一、随机变量的概念1.概念随机事件的数量表现就称为随机变量。例如:投掷两枚硬币出现正面的数量;从班级同学中抽10个,抽中女生的人数…。2.分类根据取值情况的不同分为离散型随机变量和连续型随机变量(1)离散型随机变量如果随机变量X的取值都可以逐个列举出来X1,X2,…,则X称为离散型随机变量离散型随机变量的一些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2,…,1000,1,2,…0,1,2,…男性为0,女性为1(2)连续型随机变量如果X的所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点,则称该随机变量为连续型随机变量连续型随机变量的一些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后工程完成的百分比测量误差(cm)X00X100X0二、离散型随机变量的概率分布1.离散型随机变量X的所有可能取值及其取这些值的概率按顺序排列起来就形成概率分布。2.通常用下面的表格来表示X=xix1,x2,…,xnP(X=xi)=pip1,p2,…,pn3.概率分布的性质:随机变量取值的概率是非负的,即pi0;随机变量所有取值的概率总和等于1,即11niip(i=1,2,…,n)4.离散型随机变量的概率分布(实例)【例】如规定打靶中域Ⅰ得3分,中域Ⅱ得2分,中域Ⅲ得1分,中域外得0分。今某射手每100次射击,平均有30次中域Ⅰ,55次中域Ⅱ,10次中Ⅲ,5次中域外。则考察每次射击得分为0,1,2,3这一离散型随机变量,其概率分布为X=xi0123P(X=xi)pi0.050.100.550.305.离散型随机变量的数学特征离散型随机变量的数学期望离散型随机变量的方差离散型随机变量的数学期望(1)在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其相对应的概率pi乘积之和。(2)计算公式为取无穷个值)取有限个值)XpxXEXpxXEiiiniii()(()(11(3)性质第三章所讲的平均数的性质也完全适合于数学期望。对于抽样分布通常要考虑多个变量的情况,所以还要补充两条性质。①n个随机变量代数和的数学期望等于它们的数学期望之和。②n个独立随机变量连乘积的数学期望等于它们数学期望的乘积离散型随机变量的方差(1)随机变量X的每一个取值与期望值的离差平方的数学期望,记为D(X),或Var(X),或它用来描述离散型随机变量取值的分散程度(2)计算公式为iP2N2ii=1D(X)=E[X-E(X)]若X是离散型随机变量,则D(X)=x-E(X)2()X离散型随机变量的方差(实例)【例】投掷一枚骰子,出现的点数是个离散型随机变量,其概率分布为如下。计算数学期望和方差X=xi123456P(X=xi)=pi1/61/61/61/61/61/6解:数学期望为:5.3616611)(61iiipxXE方差为:9167.261)5.36(61)5.31()()(22612iiipXExXD三、连续型随机变量的概率分布※连续型随机变量可以取某一区间或整个实数轴上的任意一个值。※它取任何一个特定的值的概率都等于0,所以不能列出每一个值及其相应的概率,通常研究它取某一区间值的概率(一)密度函数f(x)1.f(x)表示随机变量X在点x上的概率密度,所以称为密度函数。2.f(x)不是概率。3.通常把密度函数的图形称为分布曲线。在平面直角坐标系中画出f(x)的图形,则对于任何实数ab,P(aXb)是该曲线下从a到b的面积()()dbaPaXbfxxf(x)xab概率是曲线下的面积(二)密度函数具有以下性质:1.密度函数是非负函数,即2.随机变量X落在区间内的概率等于它的密度函数在该区间上的定积分。即:其几何意义就是概率等于区间上分布曲线和X轴围成的面积。3.由于是必然事件,所以()fx()0fx³12(,)xx2112()()xxxPxXxfxd?=ò12()PxXx?12(,)xxX-??()1xfxd¥-?=ò(三)分布函数1.连续型随机变量的概率也可以用分布函数F(x)来表示2.分布函数定义为)(d)()()(xxttfxXPxF3.根据分布函数,P(aXb)可以写为)()(d)()(aFbFxxfbXaPba分布函数与密度函数的图示1.密度函数曲线下的面积等于12.分布函数是曲线下小于x0的面积f(x)xx0F(x0)(四)连续型随机变量的期望和方差1.连续型随机变量的数学期望为2.方差为xxxfXEd)()(22d)()()(xxfXExXD第三节抽样分布基本概念重置抽样分布及其数值特征不重置抽样分布及其数值特征一、基本概念1.抽样分布:从一个总体中抽取样本容量相同的所有可能样本之后,计算样本统计量的值及取该值的相应概率,就组成了样本统计量的概率分布,简称抽样分布。样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量抽样分布样本统计量所有可能值的概率分布主要样本统计量平均数比率(成数)方差xp2S2.参数和统计量(总体指标和抽样指标)总体参数(总体指标)(parameter)根据全及总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指标称为全及指标。全及指标值具有唯一性。常用的全及指标有总体平均数()(或总体成数P)、总体标准差σ(或总体方差σ2)。●统计量(抽样指标)由抽样总体各单位标志值计算出来反映样本特征,用来估计总体的综合指标称为统计量(抽样指标)。它是一个随机变量。3.统计量的特点统计量(抽样指标)是随机变量,随着抽到的样本单位不同其取值也会有变化。统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应。要了解本班男同学的身高,从总共30名男同学中抽取5名同学测量他们的身高,用这5名同学的平均身高来估计本班男同学的身高。样本点:样本空间:样本统计量:4.统计量的计算样本平均数:样本方差:样本成数:;xxfxnf222()();11xxxxfsnf1npn二、重置抽样分布(一)样本平均数的分布样本平均数的分布是总体中全部样本平均数的可能取值和与之相应的概率组成。下面用一个例子来说明该问题某班组5个工人的日工资为34、38、42、46、50元。)(42元NXX)2(32)()(22元NXXX现用重置抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。样本样本平均数x样本样本平均数x34,3434,3834,4234,4634,5038,3438,3838,4238,4638,5042,3442,3842,4242,4642,5034363840423638404244384042444646,3446,3846,4246,4646,5050,3450,3850,4250,4650,5040424446484244464850样本平均数频数343638404244464850123454321合计25)(42元ffxx)(16)()(222元ffxxx)(4)()(2元ffxxx样本平均数的均值、方差及标准差:抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差,又称为抽样平均误差,用表示。()xXExX,2()()xxfxf2()xXffx()Xnx(二)两个重要结论:1.重置抽样的样本平均数的平均数等于总体平均数,即2.重置抽样的抽样平均数的标准差等于总体标准差除以样本单位数的平方根。即X510样本抽样分布原总体分布xX以上两个结论具有普遍意义,其一般推导见课本p113。这一等式可以看出两项重要事实(1)抽样平均误差比总体标准差小的多,仅为其。例如一个县的粮食亩产高低悬殊,亩产标准差为80公斤,如果随机抽取100亩求平均亩产,那么样本平均亩产量的差异就显著减小,平均误差只及总体亩产标准差的,即所以用样本平均亩产来代表总体平均亩产
本文标题:抽样和抽样分布
链接地址:https://www.777doc.com/doc-418211 .html