您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 计量分位数回归-eviews
分位数回归(QRM)方法及其应用夏先锋管理与经济学院主要内容:分位数回归的基本介绍系数协方差的估计方法模型评价与检验基于Eviews的分位数回归传统的回归分析主要关注均值,即采用因变量条件均值的函数来描述自变量每一特定数值下的因变量均值,从而揭示自变量与因变量的关系。这类回归模型实际上是研究被解释变量的条件期望,描述了因变量条件均值的变化。人们当然也关心解释变量与被解释变量分布的中位数,分位数呈何种关系。这就是分位数回归,它最早由凯恩克(KoenkerRoger)和巴西特(BassettGilbertJr)于1978年提出,是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模方法,强调条件分位数的变化。一、分位数回归的提出分位数回归(QuantileRegression)最早由科恩克和巴塞特(Koenker和Bassett,1978)于1978年提出,它提供了回归变量X和因变量Y的分位数之间线性关系的估计方法。绝大多数的回归模型都关注因变量的条件均值,但是人们对于因变量条件分布的其他方面的模拟方法也越来越有兴趣,尤其是能够更加全面地描述因变量的条件分布的分位数回归。利用分位数回归解决经济学问题的文献越来越多,尤其是在劳动经济学中取得了广泛应用。如在教育回报和劳动市场歧视等方面都出现了很好的研究成果。在经济学中的应用研究还包括诸如财富分配不均问题、失业持续时间问题、食品支出的恩格尔曲线问题、酒精需求问题和日间用电需求问题等。在金融学领域也涌现出大量使用分位数回归的应用研究成果,主要应用领域包括风险价值(ValueatRisk,VaR)研究和刻画共同基金投资类型的指数模型。正如普通最小二乘OLS回归估计量的计算是基于最小化残差平方和一样,分位数回归估计量的计算也是基于一种非对称形式的绝对值残差最小化,其中,中位数回归运用的是最小绝对值离差估计(LAD,leastabsolutedeviationsestimator)。它和OLS主要区别在于回归系数的估计方法和其渐近分布的估计。分位数回归参数估计的思想分位数回归参数估计的思想与LR估计量明显不同的QR估计量的特点在于,在QR中数据点到回归线距离的测量通过垂直距离的加权总和(没有平方)而求得,这里赋予拟合线之下的数据点的权重是1-τ,而赋予拟合线之上的数据点的权重则是τ.对于τ的每一个选择,都会产生各自不同的条件分位数的拟合函数,这一任务是为每一个可能的寻找适合的估计量。中位数是一个特殊的分位数,它表示一种分布的中心位置。中位数回归是分位数回归的一种特殊情况,其他分位数则可以用来描述一种分布的非中心位置。第p个百分位数表示因变量的数值低于这一百分位数的个数占总体的p%.因此,分位数可以指定分布中的任何一个位置。4.7.1分位数回归的基本思想和系数估计假设随机变量Y的概率分布为:(4.7.1)Y的分位数定义为满足F(y)的最小y值,即:,(4.7.2))Prob()(yYyF})(:inf{)(yFyq10图4.7.1cs变量的累积分布函数F(y)图4.7.2cs变量的分位数分布函数q()F(y)的分位数可以由最小化关于的目标函数得到,即:(4.7.3)其中,argmin{}函数表示取函数最小值时的取值,(u)u(I(u0))称为检查函数(checkfunction),依据u取值符号进行非对称的加权,这里uy。)()(minarg)()1()(minarg)(ydFyydFyydFyqyy0,00,1)0(uuuI0uuIu一般的分位数回归的检查函数为:其中,为示性函数,Z是指示关系式。当分位数为0.5时,就是最小一乘回归,即中位数回归。IZ考察此最小化问题的一阶条件为:(4.7.4)即F()=,也就是说F(Y)的第个分位数是上述优化问题的解。F(y)可以由如下的经验分布函数替代:(4.7.5)其中y1,y2,…,yn为Y的N个样本观测值;I(z)是指示函数,z是条件关系式,当z为真时,I(z)=1;当z为假时,I(z)=0。式(4.7.3)中条件关系式z为yiy,当yiy时,I(yiy)=1,否则取值为0。)()()1())(1()()1()(0FFFydFydFyyNiiNyyINyF1)(1)(相应地,经验分位数为:,(4.7.6)式(4.7.3)可以等价地表示为下面的形式:(4.7.7)})(:inf{)(yFyqNN10iiyiiyiiNyyyqii)(minarg)1(minarg)(::现假设Y的条件分位数由k个解释变量组成的矩阵X线性表示:(4.7.8)其中,xi=(x1i,x2i,…,xki)为解释变量向量,()=(1,2,…,k)是分位数下的系数向量。当在(0,1)上变动时,求解下面的最小化问题就可以得到分位数回归不同的参数估计:(4.7.9))()(,|βxβxiiqNiiiNy1)()(minarg)(ˆβxββ类似OLS方法,可以通过最小化(4.7.3)式的目标函数(V)获得的第个分位点回归估计量。例如,用作为正误差项的权重,用(1−)作为负误差项的权重的非对称绝对值误差加权平均:(4.7.10)当=0.5时称为最小绝对值离差法(LeastAbsoluteDeviations,LAD),(4.7.10)式的2倍就是LAD估计的精确的目标函数:针对LAD方法的回归估计是条件分位点回归的一种特殊情况,通常被人们称为“中位数回归”。分位数回归的系数估计需要求解线性规划问题,很多种方法可以对此问题进行求解。βxβxβxβxiiiiyiiiyiiiyyV::)1(NiiiyV1βx1、条件均值(conditionalmean)•例2.1.1:一个假想的社区有99户家庭组成,欲研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。•为达到此目的,将该99户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。表2.1.1某社区家庭每月收入与消费支出统计表每月家庭可支配收入X(元)800110014001700200023002600290032003500561638869102312541408165019692090229959474891311001309145217381991213423216278149241144136415511749204621782530638847979115513971595180420682266262993510121210140816501848210123542860968104512431474167218812189248628711078125414961683192522332552112212981496171619692244258511551331156217492013229926401188136415731771203523101210140816061804210114301650187021121485171619472200每月家庭消费支出Y(元)2002共计242049501149516445193052387025025214502128515510•由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同;•但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布(Conditionaldistribution)是已知的,例如:P(Y=561|X=800)=1/4。•因此,给定收入X的值Xi,可得消费支出Y的条件均值(conditionalmean)或条件期望(conditionalexpectation):E(Y|X=Xi)。•该例中:E(Y|X=800)=605•描出散点图发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消费支出Y(元)2、总体回归函数•在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线(populationregressionline),或更一般地称为总体回归曲线(populationregressioncurve)。•相应的函数称为(双变量)总体回归函数(populationregressionfunction,PRF)。)()|(iiXfXYE•含义:回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。•函数形式:可以是线性或非线性的。•例2.1.1中,将居民消费支出看成是其可支配收入的线性函数时:iiXXYE10)|(为线性函数。其中,0,1是未知参数,称为回归系数(regressioncoefficients)。1、样本回归函数•问题:能否从一次抽样中获得总体的近似信息?如果可以,如何从抽样中获得总体的近似信息?•在例2.1.1的总体中有如下一个样本,能否从该样本估计总体回归函数?回答:能表2.1.3家庭消费支出与可支配收入的一个随机样本X800110014001700200023002600290032003500Y59463811221155140815951969207825852530•该样本的散点图(scatterdiagram):•画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该直线近似地代表总体回归线。该直线称为样本回归线(sampleregressionlines)。•样本回归线的函数形式为:iiiXXfY10ˆˆ)(ˆ称为样本回归函数(sampleregressionfunction,SRF)。•注意:这里将样本回归线看成总体回归线的近似替代则相对于最小二乘估计,分位数回归模型具有四个方面的优势:(1)分位数模型特别适合具有异方差性的模型。(2)对条件分布的刻画更加的细致,能给出条件分布的大体特征。每个分位点上的回归都赋予条件分布上某个特殊点(中央或尾部)一些特征;把不同的分位点上的分位数回归集中起来就能提供一个关于条件分布的更完整的统计特征描述。并且不同分位点下所给出的参数估计本身也可能有值得进一步探讨的意义。(3)分位数回归并不要求很强的分布假设,在扰动项非正态的情形下,分位数估计量可能比最小二乘估计量更为有效。(4)与最小二乘法通过使误差平方和最小得到参数的估计不同,分位数回归是通过使加权误差绝对值之和最小得到参数的估计,因此估计量不容易受到异常值的影响,从而估计更加稳健。普通最小二乘估计分位数回归估计基本思想设法使所构建的方程和样本之间的距离最短同普通最小二乘估计方法目的借助数学模型对客观世界所存在的事物间的不确定关系进行数量化描写同普通最小二乘估计方法原理以平均数为基准,求解最短距离以不同的分位数为基准,求解最短距离算法最小二乘法加权最小一乘法前提假设独立、正态、同方差独立假设要求强假设弱假设检验类型参数检验非参数检验承载信息描述平均的总体信息充分体现整个分布的各部分信息极端值无法考虑极端值的影响可以充分考虑极端值的影响异方差影响大影响小拟合曲线只能拟合一条曲线可以拟合一簇曲线计算方法求偏导解行列式,算法完备自助方法估计标准误差,多种算法求解目标函数4.7.2系数协方差的估计一般地,分位数回归的系数估计量渐近服从正态分布,其渐近协方差依据模型的不同假定而具有不同形式。渐近系数协方差的
本文标题:计量分位数回归-eviews
链接地址:https://www.777doc.com/doc-4018344 .html