您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 商业计划书 > 第三章回归分析基本方法:最小二乘法
假设检验的基本思想•基于小概率原理的反证法二、假设检验的步骤1、提出假设,包括原假设和备择假设2、构造相应的检验统计量,确定其分布形式;根据样本数据计算统计量的值;3、确定显著性水平和临界值;4、作出结论。(根据所计算的统计量的值与临界值比较确定是否拒绝原假设)原假设TheNullHypothesis1.陈述需要检验的假设例如:H0:=452.原假设用H0表示3.总是包含等号“=”(比如=,,)4.检验以“假定原假设为真”开始平均每天上网玩游戏时间不是5小时。如何设定假设检验?H0:=5H1:5例题1•据报导,美国全职教授年薪的数学期望值为68000美元,标准差为5000美元。一个由36名大学全职教授组成的样本表明,平均薪水为72000美元,检验报导的可信性。(显著性水平为0.02)H0临界值临界值/2/2样本统计量拒绝域拒绝域非拒绝域接受域与拒绝域抽样分布1-置信度(1)H0:μ=68000H1;μ≠68000(2)检验统计量服从Z分布检验统计量:xxZ=0(3)α=0.02,查正态分布表得:Z=2.04,接受域为(-2.04,2.04)结论:拒绝假定。8.436/50006800072000==质检员认为在整个工作流程中平均装盒量符合标准:没有超过368克。随机抽取25盒为样本,均值X=372.5克,标准差s=15克。试在=0.05的条件下进行检验。给出你的结论。368克.例题2t0拒绝H0t0拒绝H0接受域与拒绝域H0:0H1:0H0:0H1:0必须显著低于才会拒绝小的数值与H0不矛盾.,因此不会拒绝H0左侧检验右侧检验(1)H0:μ≤368H1;μ368(2)检验统计量服从t分布检验统计量:xsxt=0(3)α=0.05,查t分布表得:t=2.064,接受域为(-∞,2.064)结论:接受原假定。5.125/153685.372==假设检验中的两类错误检验决策错误第一类错误弃真错误,后果往往较为严重出现第一类错误的概率为,等于显著性水平第二类错误存伪错误,出现第二类错误的概率为检验决策结果实际情况实际情况H0为真H0为假决策H0为真H0为假不拒绝正确错误不拒绝H0置信水平1-α第二类错误拒绝错误正确拒绝H0第一类错误检验能力1-第三章回归分析的基本方法:最小二乘法本章重点•经济学理论模型•最小二乘法•实例应用2020/3/414中山大学南方学院经济系本章分析思路•建立经济学的理论模型•运用最小二乘法进行参数估计•实例运用2020/3/4中山大学南方学院经济系15回归分析•研究步骤:•首先,要确定所研究的问题(因变量),并根据经济理论,找出与该问题相关的、有影响力的经济因素(自变量),并建立因变量与自变量的关系式(经济模型)。2020/3/4中山大学南方学院经济系16•其次,按照科学的方法收集相应变量的实际数据。•最后,对所研究的问题作出结论。2020/3/4中山大学南方学院经济系17第一节理论模型的建立•简单回归模型•是指两个变量的线性模型,其中一个是因变量,一个是自变量。也称为“二元线性方程”。•用数学公式表示就是:2020/3/4中山大学南方学院经济系18XY=•建立x解释y的模型时,面临三个问题:(1)既然两个变量之间没有一个确切的关系,应该如何考虑其他影响Y的因素?(2)Y和X的函数关系是怎样的?(3)怎样知道是否准确测定出了y和x之间的关系(因果性效应)?2020/3/4中山大学南方学院经济系1920•计量经济学分析的应用:oy和x:某一个总体的两个变量o感兴趣:用x来解释y,或者说是研究y如何随x而变化•如:•(Y)大豆的产出与(X)化肥的用量;•(Y)工资收入与(X)受教育的年数;•(Y)社区的犯罪率与(X)警察的数量。•在自己建立经济模型的过程中,如何取舍解释变量,一定要问个为什么。计量经济学家首先就是要摆事实、讲道理,这是作为计量经济学家必备的素质。•1、消费与收入之间的关系;•2、产品的销量与产品价格的关系;•3、GDP与投资、经济运行的关系。2020/3/4中山大学南方学院经济系2122一元回归的术语自变量(independentvariable)解释变量(explanatoryvariable)控制变量(controlvariable)预测变量(predictorvariable)回归元(regressor)因变量(dependentvariable)被解释变量(explainedvariable)响应变量(responsevariable)被预测变量(predictedvariable)回归子(regressand)XY23一元回归模型的定义•变量ε:随机误差项或随机扰动项•表示:除X之外其他影响Y的因素=XY24随机误差项ε的产生一、理论的不确定性•(现象的内在随机性)二、模型的简化•核心变量与非核心变量•忽略影响较小的因素三、数据测量、收集的误差四、模型函数形式设定错误25•模型表述了Y和X之间的线性关系。•简单线性回归模型(Simplelinearregressionmodel)•又称做两变量或双变量线性回归模型(Thetwovariableregressionmodel)•β:y和x关系式中的斜率参数(slopeparameter)•α:截距参数(interceptparameter)=XY26例1大豆产出和施肥量•农业研究者对(其他因素不变时)化肥用量如何影响大豆产出量感兴趣。•随机误差项ε包括了:土壤质量、降雨量等因素•影响的效果由β给出•系数β度量了在其他条件不变的情况下,施肥量对产出量的影响:Δyield=βΔfertilizer假使大豆的产出由以下模型所决定:=fertilizeryield27例2简单的工资方程•表示一个人的工资水平与他的受教育程度及其他非观测因素的关系:Wage:工资水平Educ:受教育的年数β:(在其他条件不变的情况下)每增加一年教育所获得的工资增长。其他非观测因素ε线性性显示,不管X的初始值为多少,它的任何一单位变化对Y的影响都是相同的。=educwage28计量经济分析中的因果性效应与其他条件不变•其他条件不变:包含在随机误差项中的其他所有相关因素均保持固定不变。•因果性效应:其他条件不变情况下,一个变量对另一个变量产生的影响。第二节实际数据的收集•当我们建立了经济理论上的关系式后,接下来就要从实际中收集数据。•Y和X是两个变量,我们要收集有关Y和X的数据,就要对N个研究对象进行观察,从而收集到N组数据,这每一组数据叫做一个“样本”,每个样本有一个对应的Y与X的值。2020/3/4中山大学南方学院经济系29•于是,我们的回归模型就可以表示为:•我们用所得到的数据,采用回归分析的方法来对模型中的参数进行估计。这样我们就可以得到参数的估计值。被普遍采用的方法是“最小二乘法”。2020/3/4中山大学南方学院经济系30iiX=iYiiX=iYiiX=iY第三节最小二乘法普通最小二乘估计量•(ordinaryleastsquares)OLS估计量2020/3/4中山大学南方学院经济系3122xxyXXYYXXXY===)())((ˆˆˆ32(1)OLS残差的平方和最小。•数学表述为:OLS估计量的代数性质iiiYYˆˆ:=残差定义OLS估计值是以使残差和为零的参数估计值来选择的。即OLS的一阶条件==21)ˆ(mininiiYY0)ˆˆ(2:1==iniiXY即21)ˆˆ(mininiiXY=•我们试图找到这样一条直线,它到每一实际落点的距离的总和为最小。•由于实际落点到直线的距离有正也有负值,即误差有正值和负值,我们用误差项的平方值来测定其绝对距离。•所以我们可以通过全微分来求极值。2020/3/4中山大学南方学院经济系33•我们得出:•设一阶导数为零,可得:2020/3/4中山大学南方学院经济系34==niiiiiininiiniXYXYXYXY)222()(22222222020/3/4中山大学南方学院经济系350)222()(0)222()(222====niiiininiiniXYXXXYXYxyxXXYYXXniniininii===2)())((•然后我们再求二阶偏导:•由于二阶偏导大于零,所以我们确信这种所求的结果是最小值。这就是最小二乘法。2020/3/4中山大学南方学院经济系36020222222==nix一元线性回归模型的假设条件2020/3/4中山大学南方学院经济系37iiiXY=1.X与Y之间的关系是线性的。2.X是非随机的变量,它的值是确定的。3.误差项的期望为0:E(εi)=0。4.对于所有观测值,误差项具有相同的方差,即E(ε2)=σ2——同方差假定5.随机变量εi之间统计上是独立的,因此对所有的i≠j,E(εiεj)=0—无序列相关假定6.误差项服从正态分布。假设1—5:古典线性回归模型的定义第四节最小二乘法实用实例•计量经济的回归分析主要是根据经济理论的数学模型和实际的经济数据来计算出符合实际的、可应用经济分析的参数方程。•例如:我们估算某个地区的消费函数。根据经济理论,人们的消费额取决于他们的收入,也就是说消费与收入有线性关系,消费是因变量,收入是自变量。收入越多消费也越多,收入越少消费也越少。2020/3/4中山大学南方学院经济系38•用数学模型表示如下:这里,C表示因变量消费额,Y表示可支配收入。按照经济理论,参数系数应该大于零,或者说消费额与可支配收入的正相关的关系。2020/3/4中山大学南方学院经济系39=dYC•我们把收集到的数据做成一个散点图。并用回归方法估计出来的回归结果如下(表3-2):•C=131.8368+0.8663*Y•这个分析的结果告诉我们,当收入等于零时,此人应该靠借大约132元来度日;人均的消费是收入的86.6%,也就是说,平均每挣一百元,应该花掉八十六元六角三分钱。2020/3/4中山大学南方学院经济系40•这样,我们先从理论上的经济模型入手,再有采集的实际经济数据,然后用计量经济学的回归分析方法估计出适合于实际数据的数学模型。当然,我们还要对这个估计出来的数学模型进行统计测试,检验其估计参数的合理性和有效性。•当其估计参数被测试为合理并且有效时,我们就可以说我们的经济理论被实践证明是正确的。这样,我们也就可以用这个模型来进行经济预测。2020/3/4中山大学南方学院经济系41•以上的例题,我们用的是一个横截面的数据来进行回归分析的,同时我们也可以用时间序列数据来进行分析,分析的方法和步骤也是一样的。•如我们分析不同年份的消费与可支配收入的关系。2020/3/4中山大学南方学院经济系42第五节最小二乘法•在实际经济研究过程中,我们所面对的理论模型往往有几个或者很多自变量。那么,简单的模型就不够用了。下面我们来简单讨论一下多变量的通用模型。•当数据中有一个因变量和K个自变量时,那么我们的回归分析模型就应该是:2020/3/4中山大学南方学院经济系43iikjiiiexxxy=22110•这里,i=1,2,…,n.β是估计参数,也就是模型的系数。E是模型的误差项。如果我们用矩阵的方式来表示就是:•Y=Xβ+e如果我们用实际数据来估计一个线性模型Y=Xβ+e,β是这个模型中的真实的参数值。2020/3/4中山大学南方学院经济系44最佳估计值•当估计值满足以下三个条件的时候,我们求出的估计值是最佳的估计值。•(1)“线性的”是指Y=Xβ+e这个线性模型;•(2)“无偏的”是指E(β)=β。•(3)“最好的”是指估计参数的方差会是最小的。•只有当这
本文标题:第三章回归分析基本方法:最小二乘法
链接地址:https://www.777doc.com/doc-4117920 .html