您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 计量经济学统计基础讲义
计量经济学的统计学基础——简要复习数理统计学为什么要复习数理统计学数理统计学是计量经济学的基础,它为计量经济学提供了唯一而有效的方法。数理统计较难,而且许多同学对于数学公式与数学符号的健忘,提醒我们有必要在展开计量经济学讨论之前,对本课程中经常使用到的数理统计学基本内容事先进行一些温习和回顾。主要内容第一节基本概念第二节对总体的描述——随机变量的数字特征第三节对样本的描述——样本分布的数字特征第四节随机变量的分布——总体和样本的连接点第五节通过样本,估计总体(一)——估计量的特征第六节通过样本,估计总体(二)——估计方法第七节通过样本,估计总体(三)——假设检验第一节基本概念总体和个体样本和样本容量随机变量统计量随机变量的分布函数和分布密度函数1.1总体、个体、样本和样本容量研究对象的全体称为总体或母体,组成总体的每个基本单位称为个体。总体中抽出若干个个体组成的集体称为样本。样本中包含的个体的个数称为样本的容量,又称为样本的大小。注意:抽样是按随机原则选取的,即总体中每个个体有同样的机会被选入样本。1.2随机变量随机而变的量随机变量是指变量的值无法预先确定仅以一定的可能性(概率)取值的量(RandomVariable)。一个随机变量具有下列特性:可以取许多不同的数值,取这些数值的概率为p,10p总体、随机变量、样本间的联系样本是随机的,所谓“样本容量为n的样本”就是n个相互独立且与总体有相同分布的随机变量X1,……,Xn。每一次具体抽样所得的数据,就是n元随机变量的一次观察,记为(x1,……,xn)。样本是总体的一部分。总体一般是未知的,一般要通过样本才能部分地推知总体的情况。1.3统计量设(x1,x2,……,xn)为一组样本观察值,函数y=f(x1,x2,……,xn)若不含有未知参数,则称为统计量。统计量一般是连续函数。由于样本是随机抽取,因而它的函数y也是随机变量,所以,统计量是随机变量。一般用统计量来提取由样本带来的总体信息。就是一个统计量。样本方差1122ninixxs1.4随机变量的分布函数定义若X为一随机变量,对任意实数x,称为随机变量X的概率分布函数。)()(xXPxF概率分布是关于总体的概念。有了概率分布就等于知道了总体。连续变量的分布取连续值的变量,如高度、长度、重量、时间、距离等等;它们被称为连续变量。换言之,一个随机变量如果能够在一区间(无论这个区间多么小)内取任何值,则该变量称为在此区间内是连续的,其分布称为连续型概率分布。想象连续变量观测值的直方图;如果其纵坐标为相对频数,那么所有这些矩形条的高度和为1;完全可以重新设置量纲,使得这些矩形条的面积和为1。不断增加观测值及直方图的矩形条的数目,直方图就会越来越像一条光滑曲线,其下面的面积和为1。该曲线即所谓概率密度函数。(1)(2)(3)(4)-2020.00.10.20.30.4逐渐增加矩形条数目的直方图和一个形状类似的密度曲线。连续变量的分布连续变量落入某个区间的概率就是概率密度函数的曲线在这个区间上所覆盖的面积;因此,理论上,这个概率就是密度函数在这个区间上的积分。对于连续变量,取某个特定值的概率都是零,而只有变量取值于某个(或若干个)区间的概率才可能大于0。连续变量密度函数曲线(这里用f表示)下面覆盖的总面积为1,即()1fxdx连续型随机变量的分布密度定义:对于任何实数x,如果随机变量X的分布函数F(x)可以写成。也常写成的概率分布密度函数,为为连续型随机变量,称,则称其中xXXxXxdttxFx~0分布密度函数的性质:概率密度函数的大小能够反映X在x附近取值的概率的大小,从而比分布函数更直观。。有的连续点上,,并且在显然轴所夹面积为与)()(xxFxdxxbXaPxxdxxxba)1(1201举例:正态分布xuxdxfef-)()=(分布函数:)(分布密度:xxF21x222)(),(~2NXx2x2f(x)F(x)x1x1XX第二节对总体的描述——随机变量的数字特征2.1、数学期望2.2、方差2.3、数学期望与方差的图示2.1.1数学期望:一个加权平均值数学期望描述随机变量(总体)的一般水平。定义2.1离散型随机变量数学期望的定义:定义2.2连续型随机变量数学期望的定义的数学期望。称为绝对收敛,则,若积分有分布密度函数若连续型随机变量XdxxxxEdxxxxXniiinnxppxpxpxxE12211变量X的取值x1x2……xn相应概率Pp1p2……pn2.1.2数学期望的性质(1)如果a、b为常数,则E(aX+b)=aE(X)+b(2)如果X、Y为两个随机变量,则E(X+Y)=E(X)+E(Y)(3)如果g(x)和f(x)分别为X的两个函数,则E[g(X)+f(X)]=E[g(X)]+E[f(X)](4)如果X、Y是两个独立的随机变量,则E(X.Y)=E(X).E(Y)2.2.1方差的定义定义离差如果随机变量X的数学期望E(X)存在,称[X-E(X)]为随机变量X的离差。显然,随机变量离差的数学期望是0,即E[X-E(X)]=0定义方差、标准差随机变量离差平方的数学期望叫随机变量的方差,记作Var(x)或D(x)。方差的算术平方根叫标准差。2)(EXXE2.2.2方差的意义(1)离差和方差都是用来描述离散程度的,即描述X对于它的期望的偏离程度,这种偏差越大,表明变量的取值越分散。(2)一般情况下,我们采用方差来描述离散程度。因为离差的和为0,无法体现随机变量的总离散程度。方差中由于有平方,从而消除了正负号的影响,并易于加总。2.2.3方差的性质(1)Var(c)=0(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y为相互独立的随机变量,则Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(x)=E(x2)-(E(x))2数学期望与方差的图示数学期望描述随机变量的集中程度,方差描述随机变量的分散程度。1.方差同、期望变大2.期望同、方差变小51055第三节对样本的描述——样本分布的数字特征一、样本均值:二、样本方差、样本标准差ixnx1散程度。它们用来描述样本的离差。分别为样本方差和标准以及,称对于样本niniininxxxxxxsxxxinsnnin1221212221111111,,第四节随机变量的分布——总体和样本的连接点4.1几种重要的分布4.2分布:总体和样本之间的连接点学习的重点应放在确定X服从什么分布,和各种分布的联系上。4.1几种重要的分布4.1.1正态分布4.1.2卡方分布4.1.3t分布4.1.4F分布4.1.5临界值点4.1.1正态分布定义正态分布的定义定理正态分布的数学期望和方差。服从正态分布,简记为则称为常数,、的概率密度为若连续型随机变量2,μ~0σμσ22122NXXxxXe2)(,XVarEX方差,正态分布的数学期望正态分布在市场上的精制盐很多是一公斤袋装,上面标有“净含量1kg”的字样。但当你用稍微精确一些的天平称那些袋装盐的重量时,会发现有些可能会重些,有些可能会轻些;但都是在1kg左右。多数离1kg不远,离1kg越近就越可能出现,离1kg越远就越不可能。一般认为这种重量分布近似地服从最常用的正态分布,又叫高斯分布近似地服从正态分布的变量很常见,象测量误差、商品的重量或尺寸、某年龄人群的身高和体重等等。在一定条件下,许多不是正态分布的样本均值在样本量很大时,也可用正态分布来近似。正态分布正态分布的密度曲线是一个对称的钟型曲线(最高点在均值处)。正态分布也是一族分布,各种正态分布根据它们的均值和标准差不同而有区别。-4-20240.00.20.40.60.8N(0,1)N(-2,0.5)两条正态分布的密度曲线。左边是N(-2,0.5)分布,右边是N(0,1)分布正态分布当然,和所有连续变量一样,正态变量落在某个区间的概率就等于在这个区间上,密度曲线下面的面积。比如,标准正态分布变量落在区间(0.51,1.57)中的概率,就是在标准正态密度曲线下面在0.51和1.57之间的面积。很容易得到这个面积等于0.24682;也就是说,标准正态变量在区间(0.51,1.57)中的概率等于0.24682。如果密度函数为f(x),那么这个面积为积分1.570.51()0.24682xdx-4-3-2-10123400.050.10.150.20.250.30.350.4ProbabilityBetweenLimitsis0.24682DensityCriticalValue标准正态变量在区间(0.51,1.57)中的概率正态分布的标准化定义标准正态分布定理正态分布标准化标准化。标准正态分布,即将其为任何一个正态分布,化根据以上定理,可以将。,那么令如果1,0~,,~2NXNXexxNX222211,0~10。密度函数为记作正态分布,的正态分布,称为标准,当关于正态分布的和。,也服从正态分布,且不全为,则它们的线性函数服从正态分布相互独立,设定理2121121,0,,,iniiniiiiniiiiiinaaaxaxxxVarEN4.1.22分布2分布的定义)(记为:的卡方分布。分布为自由度为服从的则称若nZXniNXii2n1i2~nZZ,,......2,1),1,0(~N=7N=11概率xN为自由度定理2分布的和仍然服从2分布)(~......,......,2,1),(~,......,,1221221niiniinkXXXnikXXXX+++。则相互独立,且若4.1.3t分布t分布的定义。分布,记作的服从自由度=则称相互独立,与若连续型随机变量)(/),(~),1,0(~2nttnnYXTYXnYNX概率密度x标准正态分布t-分布04.1.4F分布F分布的定义。分布,简记为的第二自由度为,服从第一自由度为则称若nFFnnYmXnYX,mm//F),(~),m(~22x概率密度4.1.5临界值点:(1)标准正态分布和t分布临界值点(双侧)1)(2/2/uUuP1)(2/2/tTtP2/2//2/21-02/t2/t类似:临界值点:(2)卡方分布(双侧)和F分布(单侧)临界值点x概率密度1-/2/21)(22/222/1P1-1)(FFPF22/122/x4.2分布:总体和样本之间的连接点1,0~/;,~,,,1221NnxnNxNxxn样本,则有:的是取自正态总体设定理。则标准差,分别是样本的平均数和、的样本,是取自正态总体设定理1~/,,,221ntnsxTsxNxxn第五节通过样本,估计总体(一)——估计量的特征无偏性有效性一致性大样本下,具一致性的估计量具“无偏”和“有效”特性。5.1无偏性定义。的有偏估计,其偏差为我们称,具有无偏性。如果无偏估计,亦称的为参数成立,我们称如果定义θ-θˆBiasθθˆθθˆθˆθθˆθθˆEEE)(θˆf的真值的真值有偏无偏)(θˆf5.2有效性定义具有有效性。的有效估计量,亦称称为的方差达到最小,则的一切无偏估计量中,如果在有效的估计量。是比的方差,则称的方差小于,总有意的样本容量的无偏估计量
本文标题:计量经济学统计基础讲义
链接地址:https://www.777doc.com/doc-3187604 .html