您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 3.1双变量线性回归分析的基本概念
Two-VariableLinearRegressionModel第3章双变量线性回归模型§3.1双变量线性回归分析的基本概念§3.2参数的估计§3.3参数的最小二乘估计量的统计性质及分布§3.4双变量线性回归模型的统计检验§3.5双变量线性回归模型的预测§3.6回归分析结果的报告§3.1双变量线性回归分析的基本概念一、总体回归直线与总体回归函数(PRF)二、线性的含义三、PRF的随机设定以及随机误差项的性质和意义四、样本回归直线与样本回归函数(SRF)一、总体回归直线与总体回归函数(PRF)1、条件分布(Conditionaldistribution):以X取给定值为条件的Y的分布。2、条件概率(Conditionalprobability):给定X的Y的概率,记为P(Y|Xi)。3、条件期望(ConditionalExpectation)给定X的Y的期望值,记为E(Y|X=Xi)概念(一)数据相对应的条件概率P(Y|Xi)800110014001700200023002600290032003500条件概率P(Y|Xi)1/41/61/111/131/131/141/131/101/91/61/41/61/111/131/131/141/131/101/91/61/41/61/111/131/131/141/131/101/91/61/41/61/111/131/131/141/131/101/91/61/61/111/131/131/141/131/101/91/61/61/111/131/131/141/131/101/91/61/111/131/131/141/131/101/91/111/131/131/141/131/101/91/111/131/131/141/131/101/91/111/131/131/141/131/101/111/131/131/141/131/131/131/141/131/131/131/141/131/14Y的条件期望60582510451265148517051925214523652585由上图发现:随着收入的增加,消费支出Y“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归直线。05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消费支出Y(元)概念(二)当解释变量Xi取给定值时因变量Yi的条件期望值或条件均值的轨迹称为总体回归曲线(populationregressioncurve)。总体回归直线(Populationregressionline,PRL)概念(三)与总体回归曲线相对应,称为条件期望函数(conditionalexpectationfunction,CEF)或总体回归函数(populationregressionfunction,PRF)。含义:PRF说明了因变量Y的总体条件期望随解释变量X变化的规律。)()|(iiXfXYE在引例中,条件期望值E(Y|Xi)是Xi的一个线性函数,可以记为:E(Y|Xi)=1+2Xi1和2为未知而固定的参数,称为回归系数(regressioncoefficients)。1和2也分别称为截距(intercept)和斜率系数(slopecoefficient)。线性总体回归函数二、线性的含义线性回归模型有两种解释:(1)对变量为线性(2)对参数为线性三、PRF的随机设定以及随机误差项的性质和意义PRF说明了在给定的收入水平下,该社区家庭的平均消费支出随收入变化的规律。但对某一个别的家庭,其消费支出可能与该平均水平有偏差。称ui为个别观测值Yi围绕它的条件期望值E(Y|Xi)的离差(deviation),是一个不可观测的随机变量,又称为随机干扰项(stochasticdisturbance)或随机误差项(stochasticerror)。)|(iiiXYEYuiiiuXYEY)|(线性总体回归函数的随机设定形式可写为:给定收入水平Xi,个别家庭的消费支出Yi可表示为两部分之和:(1)相同收入水平Xi下,所有家庭的平均消费支出E(Y|Xi),称为系统性(systematic)或确定性(deterministic)部分。(2)随机(stochastic)或非确定性(nonsystematic)部分ui。总体回归函数PRF的随机设定形式含义:它表明因变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。由于函数中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。随机误差项的性质随机误差项是所有可能影响因变量,但又未能包括到回归模型中来的被忽略变量的替代(surrogate)或代理(proxy)变量。E(ui|Xi)=0随机误差项的意义(引入原因)(1)理论的含糊性;(2)数据的欠缺;(3)众多细小因素对因变量的综合影响;(4)变量的观测误差的影响;(5)模型设定误差的影响;(6)变量内在随机性的影响;(7)省略原则。回归模型存在两个特点:建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。四、样本回归直线与样本回归函数(SRF)总体(population):符合指定条件的研究对象全体样本(sample):从总体中抽取部分个体组成的集合总体样本样本样本问题:能从样本中获得总体的近似的信息吗?如果可以,如何从样本中获得总体的近似信息?回到前面的引例,假设从总体中得到如下一个随机样本,问:能否从该样本估计和推断总体回归函数PRF?该样本的散点图(scatterdiagram):该线称为样本回归(直)线(sampleregressionlines,SRL)样本回归线的函数形式为:称为样本回归函数(sampleregressionfunction,SRF)。将样本回归线看成总体回归线的近似替代则注意:iiXXYE21)|(样本回归函数的随机设定形式由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型(sampleregressionmodel)。iiiuXYˆˆˆ21总体回归线与样本回归线的关系区分四个式子的关系总体回归模型总体回归直线(函数)样本回归模型样本回归直线(函数)▼回归分析的主要目的:根据样本数据提供的信息估计样本回归函数SRF,并利用SRF来推断总体回归函数PRF。即估计推断iiXY21ˆˆˆiiXXYE21)|(
本文标题:3.1双变量线性回归分析的基本概念
链接地址:https://www.777doc.com/doc-3935431 .html