您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第一章计量经济学的数理统计学基础
计量经济学的数理统计学基础一、随机变量的概率分布1.随机变量随机变量是指取值具有随机性的变量。随机变量有两种:离散随机变量和连续随机变量。2.离散随机变量的概率分布(1)概率函数通常用一个二维表格直观描述离散随机变量X的概率分布:其中11niip,10ip(2)分布函数累计分布概率:xxiipxXPxF}{)(X1x2x…nxP1p2p…np3.连续随机变量的概率分布(1)概率函数用概率密度函数)(xf描述,它满足以下性质:xxf,0)(;1)(dxxf;badxxfbXaP)()((2)分布函数累计分布函数xdxxfxXPxF)(}{)(;另有:)()()()(bxaPaFbFdxxfba二、随机变量的数字特征(分布参数)1.数学期望数学期望记为EX或X对于离散变量,niiixpEX1;对于连续变量,xdxxfEX)(性质:互相独立和XX)()()()()(2121212121EXEXXXEEXEXXXEXECXCECCE2.方差方差记为DX或2X222)()()(EXXEEXXEDX性质:0)(CD;.DXCCXD2)(互相独立和212121)(XXDXDXXXD3.标准差(均方差)标准差DXX4.矩矩)(nXE称为变量X的n阶矩,1n时就是X的期望。5.协方差协方差用于度量两个变量的线性相关程度,记为xy或),cov(YX;)])([(),cov(EYYEXXEYX)()()(YEXEXYE.0xy意味着两个变量同方向变动,称之为正相关;0xy称之为负相关;0xy称之为不相关。相关系数yxxy;1||.如果YX,独立,那么0,0xy,三、样本统计量1.总体和样本所谓总体就是一个随机变量X,X的分布函数通常记为);(xF,其中就是待估计的参数。在进行n次重复独立实验后,得到总体X的n个观察值nxxx,...,,21,而在实验之前,nxxx,...,,21实际上是相互独立均与总体X同分布的n个随机变量nXXX,...,,21。称nXXX,...,,21为总体X的容量为n的简单随机样本,简称样本;称nxxx,...,,21为样本的一个观察值,简称样本值。2.常见的样本统计量统计量的概念设nXXX,...,,21是来自总体X的一个样本,若随机变量nXXX,...,,21的函数),...,,(21nXXXg中不含有任何未知参数,则称),...,,(21nXXXg为一个统计量。注意:统计量本身是一个随机变量;其值可由样本值计算出来。最常见的统计量有:样本均值niiXnX11;样本方差212)(11niiXXnS;样本标准差21)(11niiXXnS;样本k阶原点矩nikikXnM11;样本k阶中心矩kniikXXnM)(11'。假设),(iiYX,ni,...,1,是某个X和Y联合分布的样本,那么样本协方差))((111YYXXnSiniiXY样本相关系数YXXYXYSSS四、抽样分布1.几个常用分布正态分布定义:如果随机变量X的密度函数为])(21exp[21)(22xxf则称X服从参数为μ、σ的正态分布,通常记为X(,2)。令/)(xz,那么z服从标准正态分布(0,1),]21exp[21)(2zzf卡方分布假设n维向量XN(0,nI),那么)(~)...(222221'nXXXXXn;t-分布假设两个独立的随机变量ZN(0,1),Y)(2n,那么)(~ntnYZF-分布假设1Y)(~12n和2Y)(~22n是两个独立的卡方分布,那么),(~//212211nnFnYnY2.样本均值的分布总体X(,2)样本nXXX,...,,21(,2)则:X(,2/n)3.样本方差的分布22)1(Sn)1(2n4.样本均方差的分布nSX)1(nt四、区间估计临界值的概念设X的分布函数为F,x满足1(){},01FxPXx,则称x为F的临界值。对称分布~(0,1)UN的临界值非对称分布22~(1)n的临界值区间估计对于参数,如果有两个统计量),,,(ˆˆ2111nXXX,),,,(ˆˆ2122nXXX,满足对给定的)1,0(,有1}ˆˆ{21P则称区间[1ˆ,2ˆ]是的一个区间估计或置信区间,1ˆ、2ˆ分别称作置信下限、置信上限,1称为置信水平。置信水平为1-,在实际上可以这样理解:如取%951,就是说若对某一参数取100个容量为n的样本,用相同方法做100个置信区间。[)(1ˆk,)(2ˆk],k=1,2,…,100,那么其中有95个区间包含了真参数.因此,当实际上只做一次区间估计时,我们有理由认为它包含了真参数。这样判断当然也可能犯错误,但犯错误的概率只有5%。寻找置信区间的通常方法是从已知抽样分布的统计量,如上文提到的U,X和T入手,由于分布和概率已知,只要确定临界值就可以了。单个正态总体参数的区间估计设nXXX,,,21为),(2N的样本,对给定的置信水平1,10,求参数和方差2的区间估计。情况1(2已知)由于)1,0(~/NnXU,所以容易找到临界值2/U,使得1}/{2/2/UnXUP,那么的区间估计是:],[2/2/nUXnUX。情况2(2未知)情况3(2的区间估计)五、假设检验假设检验的基本思想在数理统计中,假设检验是这样一个过程:对未知总体,先作出某种假设,然后利用样本提供的信息,对这一假设的合理性进行检验,从而确定接受或拒绝这一假设。在进行假设检验时,有两点值得注意:①反证法思想。②“小概率事件”在一次实验中不会发生。假设检验的步骤第一步,建立假设00:H;01:H这里0H称为原假设,1H称为备择假设。注意:在假设检验中,原假设0H与备选假设1H的地位是不对等的。一般来说是较小的,因而检验推断是“偏向”原假设,而“歧视”备选假设的。既然0H是受保护的,则对于0H的肯定相对来说是较缺乏说服力的,充其量不过是原假设与试验结果没有明显矛盾;反之,对于0H的否定则是有力的,且越小,小概率事件越难于发生,一旦发生了,这种否定就越有力,也就越能说明问题。在应用中,如果要用假设检验说明某个结论成立,那么最好设0H为该结论不成立。第二步,构造统计量,求出统计量的样本分布以及由样本观察值算出其具体值。统计量nSXt)1(~nt在0H成立的条件下,对应的具体值记为tˆ。第三步,根据备择假设构造出对0H不利的小概率事件——在给定显著性水平下,确定临界值,构造出拒绝域。在一个问题中,通常指定一个正数(01),认为概率不超过的事件是在一次试验中几乎不会发生的事件,称为显著性水平。=0.05,算出临界值(1)tn。{(1)}Vttn,这里V是拒绝域,它是使得这一小概率事件发生的样本空间的点的全体。第四步,得出结论方法1:根据计算出来的t值,看样本是否落在V内,若落在V内,则拒绝0H,否则,不能拒绝0H。如果tˆ)1(nt,则称能以的显著性水平拒绝零假设;否则,不能拒绝零假设;方法2:比较p值和。p值定义为拒绝零假设的最大的显著性水平;}ˆ{ttP,也就是在t-分布中大于统计量tˆ的概率。比较p值和预先设定的显著性水平。如果p值,则称能以的显著性水平拒绝零假设;否则,不能拒绝零假设。
本文标题:第一章计量经济学的数理统计学基础
链接地址:https://www.777doc.com/doc-2205059 .html