您好,欢迎访问三七文档
第六章数理统计的基本概念一、基本教学要求与主要内容(一)教学要求1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。2.了解分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。3.掌握正态总体的某些常用统计量的分布。4.了解最大次序统计量和最小次序统计量的分布。本章重点:统计量的概念及其分布。(二)主要内容1.总体、个体我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。设x为总体的某个数值指标,常称这个总体为总体X。X的分布函数称为总体分布函数。当X为离散型随机变量时,称X的概率函数为总体概率函数。当X为连续型随机变量时,称X的密度函数为总体密度函数。当X服从正态分布时,称总体X为正态总体。正态总体有以下三种类型:(1)未知,但已知;(2)未知,但已知;(3)和均未知。2.简单随机样本数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据,这一过程称为抽样。由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为,n维随机向量()称为样本。n称为样本容量。()称为样本观测值。如果样本()满足(1)相互独立;(2)服从相同的分布,即总体分布;则称()为简单随机样本。简称样本。设总体X的概率函数(密度函数)为,则样本()的联合概率函数(联合密度函数为)3.统计量完全由样本确定的量,是样本的函数。即:设是来自总体X的一个样本,是一个n元函数,如果中不含任何总体的未知参数,则称为一个统计量,经过抽样后得到一组样本观测值,则称为统计量观测值或统计量值。4.常用统计量(1)样本均值:(2)样本方差:(3)样本标准差:它们的观察值分别为:这些观察值仍分别称为样本均值、样本方差和样本标准差。(4)样本中位数:当n为奇数med=当n为偶数其中:是数据由小到大的重排。(5)样本的极差:(6)样本的四分位间距:其中分别为数据的上、下四分位数。样本相关系数:5.三个重要分布(1)分布设为独立标准正态变量,称随机变量的分布为自由度为n的分布,记为。称满足:的点为分布的分位点。(2)t分布设随机变量X与Y独立,,则称的分布为自由度n的t分布,记为。称满足:的点为t分布的分位点。(3)F分布设随机变量U与V相互独立,,则称的分布为自由度的F分布,记为。称满足:的点为F分布的分位点,且有6.正态总体的抽样分布统计量的分布称为抽样分布,设是来自正态总体的一个简单随机样本,与分别为样本的均值和样本方差,则有(1);(2)与相互独立;(3)。学习要点统计学的核心问题是由样本推断总体,因此理解统计量的概念非常重要。它是样本的函数,统计量的选择和运用在统计推断中占据核心地位。样本均值、样本方差以及其他样本矩都是一些常用的统计量,必须熟悉它们的计算方法及其有关性质。统计量的分布称为抽样分布,其中分布、t分布、F分布即是本章的重点,必须熟悉它们的定义、性质及其上分位点的查表方法;正态总体抽样分布是统计学中最重要的一个理论结果,必须弄清它的条件及结论,并能运用判断一些常用统计量的分布。习题解答1.设是来自服从参数为的泊松分布的样本,试写出样本的联合分布律。解2.设是来自上的均匀分布的样本,未知(1)写出样本的联合密度函数;(2)指出下列样本函数中哪些是统计量,哪些不是?为什么?(3)设样本的一组观察是:0.5,1,0.7,0.6,1,1,写出样本均值、样本方差和标准差。解(1)0其他(2)和是,和不是。因为和中不含总体中的唯一未知参数,而和中含有未知参数。(3)样本均值样本方差样本标准差。3.查表求,,,。解,,,。4.设,求常数,使。解由t分布关于纵轴对称,所以即为。由附表5.6可查得,所以。5.设是来自正态总体的样本,试证:(1);(2)。证明:(1)独立同分布于,由分布的定义,,即。(2)易见,,即,由分布的定义,,即。6.设是独立且服从相同分布的随机变量,且每一个都服从。(1)试给出常数,使得服从分布,并指出它的自由度;(2)试给出常数,使得服从t分布,并指出它的自由度。解(1)易见,即为二个独立的服从的随机变量平方和,服从分布,即;自由度为2。(2)由于,则。又,与相互独立,则即即,自由度为3。7.设是取自总体的一个样本,在下列三种情况下,分别求:(1);(2);(3),其中。解(1)(2)(3),其中8.某市有100000个年满18岁的居民,他们中10%年收入超过1万,20%受过高等教育。今从中抽取1600人的随机样本,求:(1)样本中不少于11%的人年收入超过1万的概率;(2)样本中19%和21%之间的人受过高等教育的概率。解(1)引入新变量:1,第个样本居民年收入超过1万0,第个样本居民年收入没超过1万其中易见:又因,故可以近似看成有放回抽样,相互独立。样本中年收入超过1万的比例即为,由于较大,可以使用渐近分布求解,即,所求概率即为(2)同(1)解法引入新变量:1,第个样本居民受过高等教育0,第个样本居民未受过高等教育其中答:(1)样本中不少于11%的人年收入超过1万的概率为0.0918;(2)样本中19%和21%之间的人受过高等教育的概率为0.6826。课外练习1设总体,(1)抽取容量为36的样本,求;(2)抽取容量为64的样本,求;(3)取样本容量n多大时,才能使。2设总体,皆未知,已知样本容量,样本均值,修正样本方差,求。3设是来自正态总体,容量为的样本,求下列统计量的抽样分布:(1);(2);(3)。4若,则服从什么分布?5设是来自泊松分布的一个样本,与分别为样本均值与样本方差,试求。6某区有25000户家庭,10%的家庭没有汽车,今有1600户家庭的随机样本,试求:9%~11%之间的样本家庭没有汽车的概率。答案和提示9.10.9916,0.8904,96。9.20.5。9.3(1);(2);(3)。9.4。9.5,,。9.60.8164。第七章参数估计一、教学基本要求与主要内容(一)教学基本要求1.理解点估计的概念。2.掌握矩估计法(一阶、二阶)和极大似然估计法。3.了解估计量的评选标准(无偏性、有效性、一致性)。4.理解区间估计的概念。5.会求单个正态总体的均值和方差的置信区间。6.会求两个正态总体的均值差和方差比的置信区间。本章重点:未知参数的矩估计,极大似然估计及正态总体未知参数的区间估计。(二)主要内容1.点估计方法设是来自总体X的样本,是总体的未知参数,若用一个统计量来估计,则称为参数的估计量,在抽样后,称为参数的估计值。这种估计称为点估计。矩估计和最大似然估计是两种常用的点估计法。(1)矩估计法用样本的各阶原点矩去估计对应的各阶总体的原点矩,这就是矩估计的基本方法。记样本的阶原点矩为:;记总体的阶原点矩为:,则。若总体的未知参数,其中为个多元的已知函数,则的矩估计量为。其中用样本均值估计总体均值,用样本方差估计总体方差最为常用。(2)最大似然估计法设总体X的密度函数(其中为未知参数),已知为总体X的样本的观察值,则求的最大似然估计值的步骤如下:①写出似然函数②称满足关系式的解为的最大似然估计值,而为的最大似然估计量。如果是的可微函数,则将似然函数取对数建立并求似然方程组一般来说,最大似然估计值可以由解对数似然方程得到。当似然函数不可微时,可以直接寻求使得达到最大的解来求得最大似然估计值。如果总体X为离散型,其分布律为,则似然函数为计算方法同连续型一致。2.点估计的优良性评判准则(1)无偏性设是的一个估计量,若,对每一成立则称是的一个无偏估计。(2)有效性设是的两个无偏估计,如对每一,有且至少对某个使之成立严格不等式,则称比有效。称在所有的无偏估计中,方差最小的那一个为一致最小方差无偏估计。(3)相合性对,则称估计量具有相合性。3.区间估计(1)定义设是来自总体的样本,未知,对于,若统计量,使得,则称为的双侧置信区间,为置信水平,一旦样本有观察值,则称相应的为置信区间的观察值。若有统计量,使得则称为的单侧置信区间,为的单侧置信上限。若有统计量,使得则称为的单侧置信区间,为的单侧置信上限。(2)求置信区间的一般步骤(i)先求出的一个点估计(通常为最大似然估计);(ii)构造和的一个枢轴函数,其中除包含未知参数以外,不再有其他的未知参数,且的分布完全已知或完全可以确定的。(iii)确定,使得:当的分布为连续型时,只须考虑等号的情形;(iv)将等价变形为,其中和仅是样本函数,则就是的置信区间。2.单正态总体下的置信区间设是取自正态总体的一个样本,置信水平为,样本均值,样本方差,修正样本方差。(1)均值的置信区间若已知,取,故的双侧置信区间为:若未知,取,故的双侧置信区间为:(2)方差的置信区间若已知,取,故的双侧置信区间为:若未知,取,故的双侧置信区间为:3.二正态总体下均值差的置信区间设是取自正态总体的一个样本,是取自正态总体的一个样本,且与相互独立,置信水平为,记(1)若已知时,取,故的双侧置信区间为(2)若未知,取,故的双侧置信区间为学习要点本章的要点是理解参数点估计的概念,掌握参数点估计的三个评判标准,会能实际应用。特别是要掌握矩估计法和最大似然估计法这二种点估计的常用方法,并能熟练地运用这二种点估计的常用方法去求参数的估计量.本章的另一要点是理解参数区间估计的概念和置信水平、置信区间的概念及其意义,熟悉对单正态总体的均值与方差和两正态总体的均值差进行区间估计的方法及步骤,并能熟练地运用以上方法求各种置信区间。习题解答1.设是取自总体X的一个样本,在下列情形下,试求总体参数的矩估计与最大似然估计:(1),其中未知,;(2),其中未知,。解(1),故的矩估计量有。另,X的分布律为,故似然函数为对数似然函数为:令解得的最大似然估计量。可以看出的矩估计量与最大似然估计量是相同的。(2),令,故的矩估计量。另,X的密度函数为故似然函数为对数似然函数为解得的最大似然估计量。可以看出的矩估计量与最大似然估计量是相同的。2.设是取自总体X的一个样本,其中X服从参数为的泊松分布,其中未知,,求的矩估计与最大似然估计,如得到一组样本观测值X01234频数17201021求的矩估计值与最大似然估计值。解,故的矩估计量。由样本观测值可算得另,X的分布律为故似然函数为对数似然函数为解得的最大似然估计量,故的最大似然估计值。3.设是取自总体X的一个样本,其中X服从区间的均匀分布,其中未知,求的矩估计。解,令,故的矩估计量。4.设是取自总体X的一个样本,X的密度函数为其中未知,求的矩估计。解,令,故的矩估计量为。5.设是取自总体X的一个样本,X的密度函数为其中未知,求的矩估计和最大似然估计。解,令,故的矩估计量为,另,似然函数对数似然函数为解得的最大似然估计量为。6.设是取自总体X的一个样本,总体X服从参数为的几何分布,即,其中未知,,求的最大似然估计。解似然函数对数似然函数解得的最大似然估计量为。7.已知某路口车辆经过的时间间隔服从指数分布,其中未知,现在观测到六个时间间隔数据(单位:s):1.8,3.2,4,8,4.5,2.5,试求该路口车辆经过的平均时间间隔的矩估计值与最大似然估计值。解根据习题1的结果,的矩估计和最大似然估计量都为,故平均时间间隔的矩估计和最大似然估计都为,即为。由样本观测值可算得。8.设总体X的密度函数为,其中未知,设是取自这个总体的一个样本,试求的最大似然估计。解似然函数,对数似然函数为得的最大似然估计量为。9.在第3题中的矩估计是否是的无偏估计?解故的矩估计量是的无偏估计。10.试证第8题中的最大似然估计是的无偏估计。证明:故的最大似然估计是的无偏估计。11.设为总体的样本,证明都是总体均值的无偏估计,并进一步判断哪一个估计有效。证明所以都是总体均值的无偏估计。又可见,所以二个估计量中更有效。12.设是取自总体的一个样本,其中未知,令,试证
本文标题:概率论
链接地址:https://www.777doc.com/doc-5977511 .html