您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 2第二章计量经济学的统计学基础知识
第二章统计学基础知识第一节常用的统计量——平均数、方差第二节常用的概率分布复习:什么是计量经济学?计量经济学与其他学科有什么关系?计量经济学研究现实问题的程序是什么?第一节常用的统计量——平均数、方差一、算术平均算术平均(arithmeticmean)就是我们日常生活中使用的普通的平均数,其定义如下式:nXnXXXXn21二、加权算术平均加权平均(weightedarithmeticmean)是将各数据先乘以反映其重要性的权数(w),再求平均的方法。其定义如下式:wX212211三、变化率变化率的定义如下式:),3,2(11ntXXXttt四、几何平均几何平均(geometricmean)是n个数据连乘积的n次方根,其定义如下式:nnXXXG21五、移动平均所谓移动平均(movingaverage),就是对时间序列数据的前后数据求平均,将不必要的变动(循环变动、季节变动和不规则变动)平滑(smoothing),也即剔除这些变动,从而发现长期变化方向的一种方法。通常,移动平均大多用简单的奇数项来计算,下面是3项移动平均和5项移动平均的定义。3项移动平均:311ttttXXXX5项移动平均:52112ttttttXXXXXXEXCEL演示三项移动平均五项移动平均六、方差与标准差为了了解数据的结构,有必要考察数据的集中趋势和分散的程度。对于集中的趋势,我们从前面学习过的算术平均中已经大体有所了解,而对于分散的程度,通过对方差(variance)与标准差(standarddeviation),以及下一节将要介绍的变动系数的计算,能够得到很多信息。方差的计算方法是,先将每个数据与算术平均数之差(即离差)的平方相加求和,再除于样本数减一。而标准差是方差的正的平方根。由于方差是通过平方计算的,它与原数据的次数有所不同,而标准差由于是方差的平方根,因而又与原数据的次数相同。因此,标准差与原数据的单位相同,而方差则不附加单位。方差S2的定义分别如下式(样本):1)()()(222212nXXXXXXsn2)(11XXni标准差S的的定义分别如下式:2SS方差七、变动系数变动系数(coefficientofvariation)又称变异系数,它用标准差S除于算术平均数的商来表示。变动系数CV的定义如下式:XSCV算术平均数标准差八、标准化变量标准差变量(standardizedvariable),又称基准化变量,它是用来测量某个数据的数值与算术平均数的偏离程度,是标准差s的多少倍。借此可以看出该数据在全体数据所处的位置。标准化变量z的定义如下式:sXXXz标准差算术平均数九、相关系数所谓相关系数(correlationcoefficient)是用来测量诸如收入与消费、气温和啤酒的消费量、汇率与牛肉的进口价格等两个变量X、Y之间的相互关系的大小和方向(正或负)的系数。通过计算相关系数,可以知道X与Y之间具有多大程度的线性(linear)关系。相关系数R的定义如下式:22)()())((YYXXYYXXR2222)()(YYnXXnYXXYn相关系数的R的取值范围为,R的取值具有以下的不同含义:(1)R=1完全正相关(perfectpositivecorrelation)(2)R0正相关(positivecorrelation)(3)R=0不相关(nocorrelation)(4)R0负相关(negativecorrelation)(5)R=-1完全负相关(perfectnegativecorrelation)为什么会有上述结果?请结合公式思考。第二节常用的概率分布经济计量模型研究具有随机性特征的经济变量关系。本节将对数理统计中常用的随机变量分布及一些概念作一简单回顾。一、概率分布二、总体与样本三、正态分布四、抽样分布一、概率分布随机变量在各个可能值上出现的概率的大小的情况,叫概率分布。概率分布可用概率函数描述。离散性随机变量X的可能取值为xi,P为概率,则概率函数为P(X=xi)i=1,2,3,…n概率函数满足P(X=xi)≥0;1)(1niixXP一、概率分布连续性的随机变量概率函数1)(0)()()(dxxfxfxfxdxxfbXaPbaba;函数满足条件为概率密度函数。密度其中)(dxxfxXPxFxXPxFxFxxXxixxii)()()()()(.连续性随机变量,离散性随机变量,)(的函数,记为值的累积概率是取小于某个随机变量率的累积,即数表示。分布函数是概概率分布还可用分布函二、总体与样本数理统计中把所研究对象的全部单位所组成的集合,叫做总体。从总体中抽出的部分单位所组成的集合,叫做样本。三、正态分布当连续的随机变量的概率密度函数形式为时,称X的分布为正态分布,记为X~,密度函数中和是X的数学期望和方差。222)(21)(xexf),(2N2三、正态分布(总体分布)当和时,称X服从标准正态分布,记为X~。对于非标准正态分布的X,总可以作如下变换,,使Z服从标准正态分布。012),(10NXZ-4-3-2-101234四、抽样分布1、分布2、t分布3、F分布注:正态母体子样分布性质:2iiiiiaUDaUEXaUX22)()(子样是来自正态母体的随机1、分布22niiX122)(统计量定义为Xi符从正态分布。xi服从标准正态分布,服从自由度为n的卡方分布,卡方分布其实就是残差平方和。niix12222000)()2(21)(2212222222当当nnnneng分布的密度函数为:nnE22)(nnD22)(22其数学期望其方差为,2S2统计量的条件,所以服从自由度为n-1的分布。2S2样本方差符合N=4N=15如果随机变量X服从标准正态分布N(0,1);随机变量服从自由度为n、方差为2n的分布。并且X和相互独立,则统计量:222nXt2服从t分布(注:可以将分子理解为符合正态分布的参数,分母看作其标准差。2、t分布t分布的密度函数为212)1()2()21()(nnntnnntf其数学期望E(t)=0,方差22nnt分布的特点是:左右对称;当n很大时,非常接近正态分布。对于从标准正态分布中的总体中抽的容量为n的简单随机样本,其样本均值与样本标准差S构成如下统计量。x1/nSxt服从自由度为n-1的t分布,记为t~t(n-1)。注意:这里的分母是子样标准差除以自由度,实际上是子样均值的标准差!只有这样才与分子保持一致性。分子被平均了,分母当然也要平均!t分布在小样本(n30)统计推断中占有重要的地位。T分布图形:正态分布相当于标准差为1的t分布。而t分布的标准差多小于1。因而出现这种尾部肥大的现象。正态分布T分布如果随机变量Xi(i=1,2,3,…n),Yi(i=1,2,3,…n)是相互独立的,而且服从相同的正态分布。令3、F分布),(2N222212213,2,1,)(3,2,1,)(niYYSniXXSii)1/()1/(222121nSnSF11n12n11n12n则统计量服从第一自由度、第二自由度的F分布。记为F~F(,)3、F分布注:F分布在方差分析中有着重要的作用。例如判断两个正态分布总体的方差是否有显著差异,需要利用F分布。其分子与分母其实是两个方差,在进行回归检验时正是利用F函数这个特点。F分布图形例1:正态分布检验设甲、乙两台机床生产同类型产品,其产品重量分别服从方差为70克()与90克()的正态分布。从甲机床中随机地取出35件,其平均重量是137克,独立地从乙机床随机取出45件,其平均重量130克,问在显著性为0.01时,两台机床的产品就重量而言有无显著差异?2122解:理论:1222221102211212211212221112112102211222111}{)1,0(~,)1,0(~)(),(~),(~),,(~:;:,),(~),(~H,uU,uuUPNnnYXUrightHifNnnYXUnnNYXnYnNXHHifNYNX则接受如果查附表知已知0005.0222211,58.25.358.2,01.05.34590357013013790,130,4570,137,35Huuynxn拒绝例2:比较两种安眠药A、B的疗效,以10个患者为实验对象,数据如下:患者12345678910X1.90.81.10.1-0.14.45.51.64.63.4Y0.7-1.6-0.2-1.2-0.13.43.70.802z=x-y1.22.41.31.3011.80.84.61.4问:在显著性水平为0.01时,两种药的疗效是否相同?(T分布)解:由于患者相同,可以建立z变量,然后假设z的均值是0,对其进行t单侧检验即两种药效不同接受拒绝,062.425.3)9(062.439.058.11/,01.00:0:),(~1001.0102H,HtnsztHHNzYXz25.3)9(001.0t062.41/2nszt例3(卡方分布):设已知维尼纶纤度在正常生产条件下服从正态分布N(1.405,0.002304)。在生产某段时间,抽取了5根纤维,测得其纤度为1.32,1.55,1.36,1.4,1.44.问该段时间母体方差是否正常?(显著性水平是0.1)解:纤度方差有变化拒绝,HxxnsxnHi22020295.02295.0205.02202202222020048.0:)4(488.9)4(,711.0)4(5.13048.00312.0)(414.1,5048.0:9.4913.5例4(F):甲乙两台机床加工同一种轴。从这两台机床加工的轴中随机抽取若干根,没得直径(单位为毫米)为:假定各台机床加工轴的直径分别服从正态分布,试比较甲乙两台机床加工的精度有无显著差异。显著性取0.05(拒绝原假设水平)。如果是单侧检验呢?机床甲20.519.719.820.420.1201919.9机床乙`9.720.820.519.819.420.619.2解:0025.0025.012*22*1212*22*22*2212*1122210),7,6(17.5)7,6(84.1216.0397.01,)1,1(~397.0,20,7216.0,93.19,8:HFFFssFFbecausennFssFsxnsxnH接受F分布图形17.5)7,6(025.0F84.1216.0397.012*22*ssF作业:例2:显著性改为0.02时,问两种药的疗效是否相同;例4:显著性取0.01时,两种机床的加工精度有无区别?重点理解什么是显著性?显著性解释数理统计中的显著性是划分原假设与备择假设界线,一般是原假设成立是1-;在软件中给出的显著性可以看作是原假设成立的概率。显著性越小,即原假设正确的错误的概率越小。
本文标题:2第二章计量经济学的统计学基础知识
链接地址:https://www.777doc.com/doc-2926140 .html