您好,欢迎访问三七文档
1第一章计量经济学及统计学基础2参考书目•1,刘振亚编著:《计量经济学教程》,中国人民大学出版社。•2,赵国庆主编:《计量经济学》,中国人民大学出版社。•3,古扎拉蒂:《计量经济学》,林少宫译,中国人民大学出版社。•4,G.S.Maddla,IntroductiontoEconometrics,MacmillanPublishingCompany,1992.3第一节导论•一,什么是计量经济学•计量经济学,从字面上看,就是“经济测量”(econometrics),它使用统计学和数学方法,对经济数据进行处理分析,对经济理论给予经验上的论证,从而来证实或驳倒这些理论。它把经济理论、统计学、数学作为工具,应用于经济现象的分析。因此,从这个意义上讲,它既不同于统计学又不同于数理经济学。数理经济学只是数学的应用,并不一定需要经验的支持。统计学则主要是收集、加工并通过图表的形式来展现数据,如中国统计年鉴,所包括的栏目,但也就到此为止。统计学家并不需要考虑如何利用这些数据去检验经济理论。而这恰恰是计量经济学所关注的范畴。4•数学应用到经济数据上已经有很长的历史。在对经济数据进行统计处理之前,需要先建立一个相关经济理论的数学表达式。例如,知道需求曲线是向下倾斜的是不够的,还必须用数学的形式阐述出来。这可以用很多不同的方式来描述。例如,定义q是需求量,而p是价格,则表达式为:•q=α+βpβ0•或者写成q=APβ5二经济和计量经济模型:计量经济学方法论•一般来讲,传统的计量经济学方法论大体有以下几个步骤:•1,理论或假说的描述;•2,关于理论的数学模型的设定;•3,理论的计量经济学模型的假定;•4,获取数据;•5,计量经济学模型参数的估计;•6,假设检验;•7,进行预测;•8,利用模型进行控制或制定政策。6•下面,就上述步骤举一个具体的例子来详细解释。•1,理论或假说的陈述。•凯恩斯说:•基本的心理定律……...是,通常或平均而言,人们倾向于随着他们收入的增加而增加其消费,但比不上收入增加的那么多。•凯恩斯设想,边际消费倾向(MPC),即收入每变化一个单位的消费变化率,大于零而小于1。7•2,消费的数学模型的设定。虽然凯恩斯假设了收入和消费之间存在着正的关系,但他并没有给出两者之间的明确的函数关系。为简单期间,使用下面的表达式:Y=ß1+ß2X0ß21(1.1)8其中Y=消费支出,X=收入,模型参数ß1和ß2分别代表截距和斜率。斜率ß2就是MPC凯恩斯消费函数见图93,消费的计量经济学模型的设定。方程1.1给出的是纯数学模型,它假定消费和收入之间的一个准确或确定的关系。但是现实生活中,经济变量之间的关系是不确定的,例如,我们具有500个家庭的消费指出和收入的一个样本数据,但是,不可能所有的观测值都会落在上述图中的直线上。因为,影响人们消费的因素除了收入之外,还有家庭规模、年量、宗教信仰、风俗习惯等。因此,鉴于经济变量之间的非准确性关系,计量经济学家将上述函数式修改如下:Y=ß1+ß2X+µ其中µ为干扰项或误差项,是一个随机变量。用它来代表所有未经指明的对消费的影响因素。104,获得数据。为了对参数进行估计,需要数据。5,计量经济学模型的参数估计。利用数据,对参数进行估计,一般使用回归分析,我们在后面将详细讲解回归分析。利用数据,得出的参数ß1和ß2估计值分别是–231.8和0.7194。11•于是所获得的数据而估计的消费函数为:Y=-231.8+0.7194X6,假设检验。根据凯恩斯的假设MPC是正的,而且小于1。通过样本数据估计得出MPC为0.7194,这时还需证明得出的数值并不是偶然得到,或是由于数据特殊而偶然满足假设。这时就需要进行假设检验,即0.7194是不是在统计意义上小于1?相关的假设检验将在讲述的相关章节中介绍。12•7,进行预测用X的已知值预测或推知Y的值。例如,当X为60亿元时,Y=-231.8+0.7194*60=40.846亿元,即预期的消费支出是40.85亿元。•8,利用模型进行控制或制定政策。假定政府认为4000亿元的消费支出水平可以维持一定的就业水平,换句话说,使失业率维持在0.5%左右。那么收入水平达到什么水平方可实现目标?这是就变成了利用既定Y来计算X13•4000=-231.8+0.7194XX=5882亿(近似值)。即收入应达到约5880亿元,就可以实现既定目标。14三关于数据和随机干扰项的介绍•一般来讲,数据有三种类型:一类是截面数据(Cross-SectionData);一类是时间序列数据(Time–SeriesData);一类是平行数据(PanelData)。截面数据研究的是某个时间点上的变化情况。例如,下面的数据是2002年2月某单位员工工龄和收入之间的情况:15•收入工龄•280015•15007•120010•210013....16•时间序列数据是研究在一定时间范围内的变化情况以及数据之间可能存在的某中关系。例如,下面的数据是1990-1995某市GDP和消费总量(单位:亿元人民币):17时间GDP消费总量19902218199124201992212019932522199426231995252418•平行数据是时间序列数据和截面数据的结合体。既研究某段时间内又研究每个时点上的数据。在计量经济学中,时间序列数据占据了很大的比重。19添加随机干扰项的意义计量经济学模型和数学模型的重大区别是前者比后者多了一个随即干扰项或误差项。之所以在计量经济学模型中加进干扰项,原因在于:1,理论的含糊性。2,数据的欠缺。3,核心变量和周边变量。4,人类行为的内在随机性。5,不适宜的替代变量。6,节省原则。7,错误的函数形式20第二节计量经济学所需要的数理统计学基本知识•一,总体,样本和随机函数•研究对象的全体称为总体或母体(population),从总体中抽出若干个体而组成的集体,称(sample),样本中个体的数量称为样本容量。如果一个变量X,的取值存在不确定性,对于任何a,存在P(X≤a),X取值为a或小于a的概率为P,则称X为随机变量。21•对总体的描述数学期望E(X)描述总体的一般水平。方差Var(X),描述总体的离散程度。对样本的描述样本平均数,描述样本的一般水平X样本方差,描述样本的离散程度S•总体和样本的连接点是随机变量的分布,研究如何通过样本分布的数字特征来估计总体的的数字特征。22二估计的方法•(一)点估计法(pointestimation)•1,矩估计法(TheMethodofMoment•2,最大似然估计(MethodofLikelihoodEstimation)3,最小二乘估计(MethodofLeastSquares)后面的章节里我们将重点介绍最小二乘法。23•区间估计,将只涉及单个总体的置信区间的估计。24三估计值的特征•1,无偏性定义,如果g是θ的估计值,当E(g)=θ时,就称g是θ的无偏估计。•2,有效性一般来讲,总体的无偏估计不只一个,为了保证估计值的取值能集中在原值附近,要求它的方差越小越好,3,一致性适用于大样本,一致性要求估计值的概率极限随着样本数量的增大而收敛于原值,样本数量趋于无穷大时,plimg=θ25四,几种重要的分布及如何利用这些分布来进行估计和检验•1,正态分布:记作X~(μ,σ2)即期望为μ,方差为σ2•2,χ2分布,定义,如果X1、X2、X3…….Xn是独立的正态变量,均值是0,方差是1,记作Xi~(0,1),Y=∑Xi2具有χ2分布,记作Y~χ2n263,t分布,如果X服从与N(0,1),Y服从于χ2n,X和Y是独立的,则XZ=----------------√Y∕n•4,F分布,,Y1服从于χ2n1,Y2服从于χ2n2,•Y1/n1•Z=—————为自由度是n1,n2的F分布•Y2/n2•27五假设检验•我们称任何一个有关随机变量分布的假设为统计假设。这里所说的假设只是一个设想,它是否成立,我们在建立假设时并不知道。需要我们通过对样本进行考察,利用样本所提供的信息,来确定我们对总体参数的假设是否成立,这样的过程被称为假设检验。28•通常,我们把被检验是否正确的假设称作待检假设或零假设(NullHypothesis),用H0表示,与之相对应的称为对立假设,记作H1,例如,某种理论使我们认为系数β等于1,通过样本信息估计了参数,需要进行检验,这里H0:β=1,H1:β≠129两类错误•第一类错误:弃真错误。即待检假设是真实的,但是检验结果否定了它。设α是犯这类错误的概率,那么α=p(否定H0/H0实际正确)。•第二类错误:取伪错误。原假设不符合实际情况,但是检验结果却把它肯定下来。设β是犯这类错误的概率。30•自然我们希望这两类错误发生的概率越小越好,但是,对于一定的样本容量来说,不可能同时使这两个概率都很小。因此,所采取的做法是先固定犯第一类错误的概率,然后再考虑使第二类错误的概率尽可能地小。•我们总是事先选取一个小正数1%或5%作为α的确定值,即犯的一类错误的概率小于这个小正数。α被称为假设检验的显著性水平或检验水平。当α固定下来之后,就是使β尽可能小,β越小,1-β就越大,说明检验越可靠。1-β被称为假设检验的检验能力(PowerofTest)31假设检验的两种方法•置信区间法(参见刘书51页)•显著性检验法(参见刘书56页)32习题1,从一个服从正态分布,方差σ2为225元的总体随机抽出的20名学生的周平均支出是64.3元,请以95%的置信度估计总体的均值μ。2,政府希望了解平均消费倾向,它调查了12个人,得到平均消费倾向是66.3%,标准差是8.4%,,请以95%的置信度估计总体的平均消费倾向。333,16年来,人民币汇率变化的标准差是2.2,以99%的置信度估计方差σ。假设所观察的数据来自于一个正态分布的随机样本。4,一个银行了解到它资助项目的回报率的标准差是0.16%,这家银行希望证实实际的回报率是8%,它选择25个项目的随机样本,发现平均的回报率是8.112%,检验总体均值µ=8%,置信度为1%345,据说,一个城市的平均周工资是185元,随机选择的25个人的平均工资是183.1,元,标准差是8.2元,检验是否µ=185,置信度为5%。6,解释什么是假设检验的第一类错误,什么是第二类错误。35习题解答1,解答:α=0.05,因为是双侧,Z0.025=1.96P(-1.96≤ξ≤1.96)=0.95X-µP(-1.96————1.96)=0.05σ/√n所以,95%的置信度估计µ的区间是64.3-1.96*15/√20µ64.3+1.96*15/√2057.7µ70.7362,X=66.3,S=8.4t0.025,11=2.201因为总体方差未知,使用t分布来估计。66.3-2.201*8.4/√12µ66.3+2.201*8.4/√1261.0µ71.6373,估计方差,使用χ2分布χ20.005,15=32.8χ20.995,15=4.6,查表可以得到。P(χ20.005,15σ2χ20.995,15)=0.994.6(n-1)*S2/σ232.815*(2.2)2/32.8σ215*(2.2)2/4.62.21σ215.781.49σ3.97384,H0:µ=8X-µZ=————=8.112-8/0.16/√25=3.52.33σ/√n(查表得到Uα=2.33)所以否定假设,即µ≠8395,:H0:µ=185X拔=183.1,S=8.2,n=5t=(183.1-185)/8.2/√5=-0.49t0.025,4=2.776因为0.492.776,所以不能拒绝假设,即以95%的概率认为,总体µ=185。
本文标题:第一章计量
链接地址:https://www.777doc.com/doc-3825515 .html