您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第三章-非线性回归分析
一、非线性模型的线性化⑴指数函数模型yt=ttubxae(3.1)b0和b0两种情形的图形分别见图3.1和3.2。显然xt和yt的关系是非线性的。对上式等号两侧同取自然对数,得Lnyt=Lna+bxt+ut(3.2)令Lnyt=yt*,Lna=a*,则yt*=a*+bxt+ut(3.3)变量yt*和xt已变换成为线性关系。其中ut表示随机误差项。图3.1yt=ttubxae,(b0)图3.2yt=ttubxae,(b0)⑵对数函数模型yt=a+bLnxt+ut(3.4)b0和b0两种情形的图形分别见图3.3和3.4。xt和yt的关系是非线性的。令xt*=Lnxt,则yt=a+bxt*+ut(3.5)变量yt和xt*已变换成为线性关系。图3.3yt=a+bLnxt+ut,(b0)图3.4yt=a+bLnxt+ut,(b0)⑶幂函数模型yt=axtbtue(3.6)b取不同值的图形分别见图3.5和3.6。xt和yt的关系是非线性的。对上式等号两侧同取对数,得Lnyt=Lna+bLnxt+ut(3.7)令yt*=Lnyt,a*=Lna,xt*=Lnxt,则上式表示为yt*=a*+bxt*+ut(3.8)变量yt*和xt*之间已成线性关系。其中ut表示随机误差项。(3.7)式也称作全对数模型。图3.5yt=axtbtue图3.6yt=axtbtue⑷双曲线函数模型1/yt=a+b/xt+ut(3.9)也可写成,yt=1/(a+b/xt+ut)(3.10)b0情形的图形见图3.7。xt和yt的关系是非线性的。令yt*=1/yt,xt*=1/xt,得yt*=a+bxt*+ut已变换为线性回归模型。其中ut表示随机误差项。图3.7yt=1/(a+b/xt),(b0)图3.8yt=a+b/xt,(b0)⑸多项式方程模型一种多项式方程的表达形式是yt=b0+b1xt+b2xt2+b3xt3+ut(3.12)其中b10,b20,b30和b10,b20,b30情形的图形分别见图3.9和3.10。令xt1=xt,xt2=xt2,xt3=xt3,上式变为yt=b0+b1xt1+b2xt2+b3xt3+ut(3.13)这是一个三元线性回归模型。如经济学中的总成本曲线与图3.9相似。图3.9yt=b0+b1xt+b2xt2+b3xt3+ut图3.10yt=b0+b1xt+b2xt2+b3xt3+ut另一种多项式方程的表达形式是yt=b0+b1xt+b2xt2+ut(3.14)其中b10,b20和b10,b20情形的图形分别见图3.11和3.12。令xt1=xt,xt2=xt2,上式线性化为,yt=b0+b1xt1+b2xt2+ut(3.15)如经济学中的边际成本曲线、平均成本曲线与图3.11相似。图3.11yt=b0+b1xt+b2xt2+ut图3.12yt=b0+b1xt+b2xt2+ut⑹生长曲线(logistic)模型yt=tutfek)(1(3.16)一般f(t)=a0+a1t+a2t2+…+antn,常见形式为f(t)=a0-atyt=uuataek)(01=tuatbek1(3.17)其中b=0ae。a0情形的图形分别见图3.13和3.14。美国人口统计学家Pearl和Reed广泛研究了有机体的生长,得到了上述数学模型。生长模型(或逻辑斯谛曲线,Pearl-Reed曲线)常用于描述有机体生长发育过程。其中k和0分别为yt的生长上限和下限。ttLimy=k,ttLimy=0。a,b为待估参数。曲线有拐点,坐标为(aLnb,2k),曲线的上下两部分对称于拐点。图3.13yt=k/(1+tuatbe)图3.14yt=k/(1+tuatbe)为能运用最小二乘法估计参数a,b,必须事先估计出生长上极限值k。线性化过程如下。当k给出时,作如下变换,k/yt=1+tuatbe移项,k/yt-1=tuatbe取自然对数,Ln(k/yt-1)=Lnb-at+ut(3.18)令yt*=Ln(k/yt-1),b*=Lnb,则yt*=b*-at+ut(3.19)此时可用最小二乘法估计b*和a。⑺龚伯斯(Gompertz)曲线英国统计学家和数学家最初提出把该曲线作为控制人口增长的一种数学模型,此模型可用来描述一项新技术,一种新产品的发展过程。曲线的数学形式是,yt=atbeke曲线的上限和下限分别为k和0,ttLimy=k,ttLimy=0。a,b为待估参数。曲线有拐点,坐标为(aLnb,ek),但曲线不对称于拐点。一般情形,上限值k可事先估计,有了k值,龚伯斯曲线才可以用最小二乘法估计参数。线性化过程如下:当k给定时,yt/k=atbee,k/yt=atbeeLn(k/yt)=atbe,Ln[Ln(k/yt)]=Lnb-at令y*=Ln[Ln(k/yt)],b*=Lnb,则y*=b*-at上式可用最小二乘法估计b*和a。图3.15yt=atbekeCobb-Douglas生产函数下面介绍柯布-道格拉斯(Cobb-Douglas)生产函数。其形式是Q=kLC1-(3.24)其中Q表示产量;L表示劳动力投入量;C表示资本投入量;k是常数;01。这种生产函数是美国经济学家柯布和道格拉斯根据1899-1922年美国关于生产方面的数据研究得出的。更习惯的表达形式是yt=tuttexx21210(3.25)这是一个非线性模型,无法用OLS法直接估计,但可先作线性化处理。上式两边同取对数,得:Lnyt=Ln0+1Lnxt1+2Lnxt2+ut(3.26)取yt*=Lnyt,0*=Ln0,xt1*=Lnxt1,xt2*=Lnxt2,有yt*=0*+1xt1*+2xt2*+ut(3.27)上式为线性模型。用OLS法估计后,再返回到原模型。若回归参数1+2=1,称模型为规模报酬不变型;1+21,称模型为规模报酬递增型;1+21,称模型为规模报酬递减型。对于对数线性模型,Lny=Ln0+1Lnxt1+2Lnxt2+ut,1和2称作弹性系数。以1为例,1=1ttLnxLny=1111ttttxxyy=11//ttttxxyy=11ttttxyyx(3.28)可见弹性系数是两个变量的变化率的比。注意,弹性系数是一个无量纲参数,所以便于在不同变量之间比较相应弹性系数的大小。对于线性模型,yt=0+1xt1+2xt2+ut,1和2称作边际系数。以1为例,1=1ttxy(3.29)通过比较(3.28)和(3.29)式,可知线性模型中的回归系数(边际系数)是对数线性回归模型中弹性系数的一个分量。例1:此模型用来评价台湾农业生产效率。用台湾1958-1972年农业生产总值(yt),劳动力(xt1),资本投入(xt2)数据为样本得估计模型,tLny=-3.4+1.50Lnxt1+0.49Lnxt2(3.30)(2.78)(4.80)R2=0.89,F=48.45还原后得,tyˆ=0.713xt11.50xt20.49(3.31)因为1.50+0.49=1.99,所以,此生产函数属规模报酬递增函数。当劳动力和资本投入都增加1%时,产出增加近2%。例2:用天津市工业生产总值(Yt),职工人数(Lt),固定资产净值与流动资产平均余额(Kt)数据(1949-1997)为样本得估计模型如下:LnYt=0.7272+0.2587LnLt+0.6986LnKt(3.12)(3.08)(18.75)R2=0.98,s.e.=0.17,DW=0.42,F=1381.4因为0.2587+0.6986=0.9573,所以此生产函数基本属于规模报酬不变函数。例3:硫酸透明度与铁杂质含量的关系(摘自《数理统计与管理》1988.4,p.16)某硫酸厂生产的硫酸的透明度一直达不到优质指标。经分析透明度低与硫酸中金属杂质的含量太高有关。影响透明度的主要金属杂质是铁、钙、铅、镁等。通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。测量了47个样本,得硫酸透明度(y)与铁杂质含量(x)的散点图如下050100150200050100150200250XY0.000.020.040.060.080.000.010.020.030.041/X1/Y(1)y=121.59-0.91x(10.1)(-5.7)R2=0.42,s.e.=36.6,F=32(2)1/y=0.069-2.37(1/x)(18.6)(-11.9)R2=0.76,s.e.=0.009,F=1420501001502000.000.010.020.030.041/XY234560.000.010.020.030.041/XLOG(Y)(3)y=-54.40+6524.83(1/x)(-7.2)(16.3)R2=0.86,s.e.=18.2,F=266(4)Lny=1.99+104.5(1/x)(22.0)(21.6)R2=0.91,s.e.=0.22,F=468还原,Lny=Ln(7.33)+104.5(1/x)y=7.33)1(5.104xe(5)非线性估计结果是y=8.2965)1(1.100xeR2=0.96,EViews命令Y=C(1)*EXP(C(2)*(1/X))例4中国铅笔需求预测模型中国从上个世纪30年代开始生产铅笔。1985年全国有22个厂家生产铅笔。产量居世界首位(33.9亿支),占世界总产量的1/3。改革开放以后,铅笔生产增长极为迅速。1979-1983年平均年增长率为8.5%。铅笔销售量时间序列见图4.21。1961-1964年的销售量平稳状态是受到了经济收缩的影响。文革期间销售量出现两次下降,是受到了当时政治因素的影响。1969-1972年的增长是由于一度中断了的中小学教育逐步恢复的结果。1977-1978年的增长是由于高考正式恢复的结果。1981年中国开始生产自动铅笔,对传统铅笔市场冲击很大。1979-1985年的缓慢增长是受到了自动铅笔上市的影响。50100150200250300350626466687072747678808284Y铅笔销售量时间序列(1961-1985)初始确定的影响铅笔销量的因素有全国人口、各类在校人数、设计人员数、居民消费水平、社会总产值、自动铅笔产量、价格因素、原材料供给量、政策因素等。经过多次筛选、组合和逐步回归分析,最后确定的被解释变量是yt(铅笔年销售量,千万支);解释变量分别是xt1(自动铅笔年产量,百万支);xt2(全国人口数,百万人);xt3(居民年均消费水平,元);xt4(政策变量)。因政策因素影响铅笔销量出现大幅下降时,政策变量取负值。例如1967、1968年的xt4值取-2,1966、1969-1971、1974-1977年的xt4值取-1)。0100200300400010203040YX1Y,X1散点图下图表示中国自生产自动铅笔起,自动铅笔产量与铅笔销量存在线性关系010020030040060070080090010001100YX2Y,X2散点图下图表示全国人口与铅笔销量存在线性关系。说明人口越多,对铅笔的需求就越大0100200300400100200300400500YX3Y,X3散点图下图表示居民年均消费水平与铅笔销量存在近似对数的关系。散点图说明居民年均消费水平越高,则铅笔销量就越大。但这种增加随着居民消费水平的增加变得越来越缓慢。0100200300400-2.5-2.0-1.5-1.0-0.50.00.5YX4下图表示政策变量与铅笔销量也呈线性关系。Y,X4散点图基于上述分析建立的模型形式是yt=0+1xt1+2xt2+3Ln(xt3)+4xt4+utyt与xt3呈非线性关系。估计结果如下。tyˆ=-907.94-2.95xt1+0.31xt2+170.19Lnxt3+45.51xt4(-6.4)(-3.7)(4.8)(4.4)(12.6
本文标题:第三章-非线性回归分析
链接地址:https://www.777doc.com/doc-4477448 .html