您好,欢迎访问三七文档
1•课程名称:计量经济学•主讲教师:赵坚毅•联系地址:中国青年政治学院经济系北京,100089•联系电话:(010)-68712337•电子邮件:proteus@vip.sina.com•网址:http:\\第一部分绪论•什么叫计量经济学(Econometrics)?19世纪20年代挪威经济学家R.Frish将它定义为“经济理论”、“统计学”、“数学”三者的结合。(计算机科学)3计量经济学家的荣耀•1969年首届诺贝尔经济学奖获得者弗里斯(Frisch)•1980年诺贝尔经济学奖获得者克莱因(Klein)-计量经济学鼻祖•2000年诺贝尔经济学奖获得者:在微观计量经济学作出杰出贡献的赫克曼(Heckman)和麦克法登(McFadden)4计量经济学家的荣耀•最近一届(2003)诺贝尔经济学奖获得者:计量经济学家格兰杰(Granger)和恩格尔(Engle)•半数以上的诺贝尔经济学奖授予了在计量模型上颇有建树的经济学家,诺贝尔经济学奖引领经济学发展潮流5计量经济学的内容体系•广义计量经济学和狭义计量经济学广义…是利用经济理论、数学以及统计学定量研究经济现象的方法统称。(回归分析、投入产出分析、时间序列分析等)狭义…以揭示经济变量间的关系为目的,主要应用回归分析方法。•单方程模型和联立方程模型对股票市场的研究VS对金融市场的研究6计量经济学的内容体系•线性模型、内在线性模型与非线性模型(均从参数进入模型的角度来定义)•参数模型、半参数模型和非参数模型(均从模型的函数形式是否确定来定义)7计量经济学的内容体系•因数据类型差异而导致模型的差异:a.横截面数据集(cross-sectionaldataset):即给定时点对个人、家庭、企业、城市、国家或一系列其他单位采集的样本所构成的数据集(应该忽略细小的时间差别)8计量经济学的内容体系•b.时间序列数据集(timeseriesdataset):是由一个或几个变量在不同时间的观测值所构成的。•c.混合横截面数据(pooledcrosssection):有些数据既有横截面数据的特点又有时间序列的特点,但每一时点的样本不同,通常是分析政府政策效果的有力数据9计量经济学的内容体系•d.综列数据(paneldata):由横截面数据集中每个数据的一个时间序列组成。(定点长期调查)•其他专门数据类型:1、离散数据(discretedata):通常在考察个人或家庭或企业的决策行为时,通过问卷调查获得,由此发展出“离散选择模型”10计量经济学的内容体系2、持续数据(survivaldata):用于考察变量从开始到结束或调查终止前所经过的时间长度,如失业持续时间、罢工持续时间、甚至怀孕间隔3、cohort(一代人)data--为持续收集特定社会群体在一段时间内的变化的数据。如:调查七十年代出生的样本在10年间的汽车持有率数据或就业率数据等。11计量经济学的内容体系•理论计量经济学和应用计量经济学:方法的证明VS方法的应用12怎样应用计量经济学《企业竞争力评估的一个例子》•一、理论模型的设计1。确定模型所包含的变量2。确定模型的数学形式或解决方法13怎样应用计量经济学《企业竞争力评估的一个例子》•二、样本数据的收集1。几类常用的样本数据2。样本数据的质量:(研究结果不能比数据的质量更好)•三、模型参数的估计和检验14计量经济学模型成功的三要素•理论•方法•数据15计量经济学模型的应用•一、结构分析当一个变量或几个变量发生变化时对其他变量或经济系统的影响(弹性和乘数)•二、经济预测如通过回归分析总收入和总消费之间的关系,从而在知道一变量数据的情况下可以预测另一变量的走势。16计量经济学模型的应用•三、政策评价建立模型对政策效果进行评估•四、实证检验对经济理论的检验;对某一行业如医药卫生、农业新方法效果的检验。17课堂小测试•对“回归”的认识•你所应用过的计量经济学内容18回归•“回归”一词的历史渊源加尔顿-回归到中等(或平均)•回归分析是关于研究一个叫做应变量的变量对另一个或多个叫做自变量的变量的依赖关系,其用意在于通过后者的已知或给定值,去估计和预测前者的(总体)均值19几个例子•XY•父亲身高与儿子平均身高•年龄与平均身高•个人可支配收入与平均消费支出•垄断商的定价与产品平均需求20几个关系•统计关系和确定性(函数)关系计量经济学主要处理的是随机(random或stochastic)的应变量,也就是有着概率分布的变量,这是一种统计关系。也可以从有无随机干扰项的角度来区分。•回归与因果关系从逻辑上来说,回归关系式本身并不意味着任何因果关系,因果关系应该来自统计学之外。•回归与相关关系变量是否是确定的;变量之间是否对称;相关系数度量VS估计或预测应变量的平均值21术语•应变量(Dependent)与自变量(Independent)•被解释变量(Explained)与解释变量(Explanatory)•预测子(Predictand)与预测元(Predictor)•回归子(Regressand)与回归元(Regressor)•响应(Response)与刺激或控制变量(Stimulusorcontrolvariable)•内生(Endogenous)与外生(Exogenous)22线性回归模型•消费函数的一个例子•随机干扰项的意义:1。理论的含糊性(其他因素)2。数据的欠缺(如财富)3。核心变量与周边变量(或上或下的随机影响)4。人类行为的内在随机性5。糟糕的替代变量(永久消费和永久收入)6。节省原则(多重共线性的影响)7。错误的函数形式23线性回归模型的假定•1。函数形式:•2。干扰项的零均值:•3。同方差性:•4。无自相关:•5。回归量与干扰项的非相关:•6。正态性:,1,...,iiiyxin[]0iE2[]iVar[,]0ijCov2[0,]iN[,]0iiCovx24各种假定的含义•干扰项的零均值的意思是凡是模型不显著含有的并因而归属u的因素,对y的均值都没有系统的影响;正的u值抵销了负的u值,以至于他们对y的平均值的影响为零。25各种假定的含义•u的同方差性同时也意味着y的同方差性,即随着x的变动,y的取值的分布是一定的,是分布不变的。26各种假定的含义•干扰项之间的无自相关意味着y的决定与其他期的u值无关,即不存在u(t-1)决定u(t)从而决定y的情况•干扰项与自变量之间的非相关,干扰项本身是独立于自变量之外的,且如果干扰项与自变量存在相关,则不能独自说明其作用27普通最小二乘法•总体回归函数(PRF)与样本回归函数(SRF)之差的平方和最小为最小二乘法的准则。28估计参数的特性•最小二乘估计量的线性和无偏性质•所谓线性即估计量是y的一个线性函数•所谓无偏即系数估计量的期望等于系数原值•估计参数的方差、标准差,协方差(注意到x的变差越大,则估计参数的方差越小)(如果协方差为负,那么的过高估计意味着的过低估计。2129高斯马尔科夫定理•在给定经典线性回归模型的假定下,最小二乘估计量,在无偏线性估计量一类中,有最小方差,也即BLUE(bestlinearunbiasestimator)•最小方差的证明30估计参数的特性•干扰项方差的一个无偏估计量31回归拟合的评价•Y的总变差是离差的平方和:•方差分解:总平方和=回归平方和+误差平方和SST=SSR+SSE•决定系数=SSR/SST•对单个估计系数的t检验2()iiSSTyy2R32相关系数r•相关系数•相关系数是两个变量间的线性关联的一个度量•相关系数落在[-1,1]间,如果两变量独立,则它们之间的相关系数为零,反之不成立2rR33蒙特卡罗实验•1。给定25个X值,给定,的真值,给定零均值的正态分布随机数25个,计算y的25个值•2。利用上述X值和y值做回归,得出,的估计值•3。给定同一分布的不同随机数取值,重复上述实验100次,求得100个估计值•4。比较100个估计值的均值,看是否与,的真值接近,以此来求证估计值的无偏性12121234正态性假定•我们不仅要用ols法做点估计,我们还要进行假设检验(hypothesistesting),即对系数的真值做出推断,而这需要干扰项的概率分布。•从干扰项的概率分布------估计量的概率分布----------系数真值的统计推断35为何是正态分布而不是其他?•原因1:中心极限定理证明,如果存在大量独立且相同分布的随机变量,那么,除了少数例外情形,随着这些变量的个数无限的增大,它们的总和将趋向于正态分布•原因2:中心极限定理的另一解说是,即使变量个数并不是很大或这些变量还不是严格独立的,它们的总和仍可视为正态分布•检验数据是否为正态分布:KolmogorovD检验,零假设为数据是均值和方差未知的正态分布36由于正态性假定而新增的性质•1。系数估计量也是服从正态分布的(根据系数估计量是y的线性函数,而y又是干扰项的线性函数)•2。Ols的系数估计量在整个无偏估计量中,无论是线性的还是非线性的估计,都有最小方差(参见Rao的证明),所以我们说最小二乘估计量是最优无偏估计量(BUE)37由于正态性假定而新增的性质•3。遵循n-2个自由度的卡方分布•4。随着样本容量无限地增大,系数估计量将收敛于它们的真值(一致性)22ˆ(2)/n38其他分布•卡方分布•F分布•t分布39最大似然法(ML)•原则:当从总体随机抽取n组样本观测值后,参数估计量应当使得从模型中抽取该n组样本观测值(y)的概率最大•将样本观测值联合概率密度函数称为变量的或然函数(LF)。•在已经取得样本观测值的情况下,使或然函数取极大值的总体分布参数所代表的总体具有最大的概率取得这些样本观测值(y),该总体参数即是所要求的参数,即ML估计量。40一个回归实例•用SPSS作体重与肺活量的回归(corr.sav注意预测值与残差)41课堂作业•推导一般线性回归方程的系数的方差及协方差•证明高斯马尔科夫定理•推导干扰项的方差的一个无偏估计量42区间估计与假设检验•估计与假设检验构成统计学的两个主要分支,估计理论又主要由点估计与区间估计组成。•回顾一些概念:置信区间、置信系数、显著性水平、置信限、置信下限、置信上限43回归系数的置信区间•回归估计量的置信区间•置信区间的宽度与估计量的标准误成正比,即标准误越大,对未知参数的真值进行估计的不确定性愈大。44假设检验•什么是假设检验:问某一给定的观测是否与某声称的假设相符,这个声称的假设叫做虚拟假设(nullhypothesis),即,与之相对的为对立假设(maintainedhypothesis),即•假设检验就是要设计一个程序用来决定拒绝或不拒绝虚拟假设,通常采用两种互为补充的方法:置信区间和显著性检验0H1H45置信区间的方法•检验方法:构造一个参数的的置信区间。如果参数在假设下落入此区间,就不拒绝零假设。但如果它落在此区间之外,则拒绝零假设。•第一类错误(拒真):原假设正确,却拒绝了第二类错误(纳假):原假设不正确,却接受•“统计上高度显著”指:当拒绝原假设时,犯第一类错误的概率是一个很小的数,通常小于1%100(1)%0H46显著性检验方法•构造一个检验统计量,利用该统计量的分布特征,来决定是否接受零假设。•通常一个大的t绝对值,便是与虚拟假设相抵触的迹象•单尾检验47一些实际操作问题•“接受”和“拒绝”假设的含义:正如一个法庭宣告某一判决为“无罪”(notguilty)而不为“清白”(innocent)统计检验的结论也应为“不拒绝”而不为接受。•2-t屈指一算法则:如果自由度=20且显著水平定为0.05,则只要t统计量大于2,就可拒绝“零”假设(单尾)48一些实际操作问题•在进行调查研究之前建立假设而不是相反,以免犯循环推理(circularreasoning)的错误•P值被定义为一个虚拟假设可被拒绝的最低显著水平,或犯第一类错误的精确概率。由于选择显著性水平的
本文标题:初级计量经济学课件
链接地址:https://www.777doc.com/doc-3840912 .html