您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > PPT-第1章-导论-计量经济学及Stata应用
©陈强,2015年,《计量经济学及Stata应用》,高等教育出版社。第1章导论1.1什么是计量经济学“计量经济学”(econometrics),是运用概率统计方法对经济变量之间的(因果)关系进行定量分析的科学。由于实验数据的缺乏,计量经济学常常不足以确定经济变量之间的因果关系。但大多数实证分析的目的恰恰正是要确定变量之间的因果关系(即X是否导致Y),而非相关关系。2例(相关关系)你看到街上的人们带雨伞,于是预测今天要下雨。这只是相关关系,“人们带伞”并不导致“下雨”。例(相关关系)根据与流感相关的海量词条搜索记录,谷歌公司通过分析大数据(bigdata),可以很快地预测流行病的地域传播。这也只是相关关系,上网搜索流感信息并不导致流感传播。如果只对预测感兴趣,则相关关系就足够了。如果要推断变量之间的因果关系,则计量分析必须建立在经济理论的基础之上,即在理论上存在X导致Y的作用机制。但即使有理论基础,因果关系常常依然不好分辨。3首先,可能存在“逆向因果关系”(reversecausality)或“双向因果关系”。例(逆向因果)FDI(外商直接投资)促进经济增长,但FDI也被吸引到快速增长的地区。例(逆向因果)收入增加引起消费增长,而消费增长也拉动收入增加。例(逆向因果)经济萧条可能引起内战,但内战也会导致经济停滞。其次,被遗漏的第三个变量(Z)也可能对这两个变量(,)XY同时起作用,参见图1.1。4图1.1可能的因果关系5例(遗漏变量)某外星人来到地球,发现人类会死亡,十分不解。于是开始在全球广泛观察死亡现象,并收集了大量的数据。结果发现,许多人类躺在医院病床(X)之后死去(Y),故推断医院病床是死亡的原因。外星人认为,由于躺在医院病床上,总是发生于死亡之前,故不可能存在逆向因果关系。外星人于是将研究报告投稿发表于某顶尖经济学期刊,并在文末给出政策建议“珍爱生命,远离病床”。6例(遗漏变量)考虑决定教育投资回报率(returnstoschooling)的因素:lniiiws(1.1)lniw(工资对数):被解释变量(dependentvariable)is(schooling,教育年限):解释变量(explanatoryvariable,regressor)或自变量(independentvariable)。i:不可观测(unobservable)的“误差项”(errorterm)或“随机扰动项”(stochasticdisturbance),包括所有除is以外对lniw有影响的因素,以及人类行为的随机性。下标i:表示第i个观测值(即个体i)。7截距项与斜率为待估参数。的经济含义为教育投资的回报率,即多上一年学,未来工资能增加百分之几。如果用数据估计此回归方程,其结果一般会显示,对数工资与教育年限显著正相关,且教育投资回报率还挺高。然而,工资收入也与能力有关,但能力一般不能直接观测,而能力高的人通常选择接受更多教育。在此简单回归中,教育的高回报其实包含了对能力的回报。8影响工资收入的因素还可能包括工作经验、毕业学校、人种、性别、外貌等。需尽可能多地引入“控制变量”(controlvariables),也就是多元回归的方法,才能较准确地估计我们“感兴趣的参数”(parametersofinterest),即本例的教育投资回报率。现实中总有某些相关的变量无法观测,即存在“遗漏变量”(omittedvariables),而遗漏变量统统被纳入到随机扰动项i中。随机扰动项i中还可能包含哪些其他因素呢?如果真实模型(truemodel)为2lniiiiwss(1.2)那么2is也被纳入到扰动项中了(可以视为广义的遗漏变量)。9如果变量测量得不准确,则测量误差也被放入扰动项中了。扰动项就像是一个“垃圾桶”,所有你不想要、无法把握的东西都往里面扔。但我们又希望扰动项拥有很好的性质。在很多情况下,这是自相矛盾的。计量经济学的很多玄妙之处就在于扰动项。如果真正理解扰动项,就加深了对计量经济学的理解。101.2经济数据的特点与类型由于经济学通常无法做“控制实验”(controlledexperiment),故经济数据一般不是“实验数据”(experimentaldata),而是自然发生的“观测数据”(observationaldata);比如,统计局收集的数据。由于个人行为的随机性,所有经济变量原则上都是随机变量。在有些本科计量教材中,为了简单起见,有时假设解释变量是非随机的、固定的(fixedregressors)。这只是教学法上的权宜之计,给深入的理论探讨带来不便。如果解释变量为非随机,则无法考虑其与扰动项的相关性。11在本教程中,所有变量都是随机的(即使非随机的常数,也可视为退化的随机变量)。经济数据按照其性质,可大致分成以下三种类型。(1)横截面数据(cross-sectionaldata,简称截面数据):指的是多个经济个体的变量在同一时点上的取值。比如,2013年中国各省的GDP,参见表1.1。12表1.12013年中国分省GDP(亿元)省份GDP北京19500.56天津14370.16河北28301.41山西12602.24内蒙古16832.38辽宁27077.65吉林12981.46黑龙江14382.93上海21602.12江苏59161.75浙江37568.49安徽19038.87福建21759.64江西14338.50山东54684.33河南32155.8613湖北24668.49湖南24501.67广东62163.97广西14378.00海南3146.46重庆12656.69四川26260.77贵州8006.79云南11720.91西藏807.67陕西16045.21甘肃6268.01青海2101.05宁夏2565.06新疆8360.24数据来源:国家统计局网站=fsnd14(2)时间序列数据(timeseriesdata):指的是某个经济个体的变量在不同时点上的取值。比如,1994—2013年山东省每年的GDP,参见表1.2。表1.21994-2013年山东省GDP(亿元)年份GDP19943844.519954953.3519965883.819976537.0719987021.3519997493.8420008337.471520019195.04200210275.5200312078.2200415021.8200518366.9200621900.2200725776.9200830933.3200933896.6201039169.9201145361.9201250013.2201354684.3数据来源:国家统计局网站=fsnd16(3)面板数据(paneldata):指的是多个经济个体的变量在不同时点上的取值。比如,1994—2013年中国各省每年的GDP,参见表1.3。表1.31994-2013年中国分省GDP(亿元)省份年份GDP北京19941145.31北京19951507.69北京201217879.4北京201319500.5617天津1994732.89天津1995931.97天津201212893.88天津201314370.16新疆1994662.32新疆1995814.85新疆20127505.31新疆20138360.24数据来源:国家统计局网站=fsnd18本书介绍的计量经济理论包括以上三种数据类型。还将使用国际上最为流行的Stata计量软件进行数据处理(Stata13版本,2013年发布)。第2章介绍Stata软件。第3章回顾相关数学知识,并引入一些新概念(比如,均值独立、迭代期望定律)。第4章将正式进入计量经济学的理论部分。
本文标题:PPT-第1章-导论-计量经济学及Stata应用
链接地址:https://www.777doc.com/doc-6474678 .html