您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 第四章多重共线性思考题
第四章多重共线性思考题4.1多重共线性的实质是什么?为什么会出现多重共线性?4.2多重共线性对回归参数的估计有何影响?4.3多重共线性的典型表现是什么?判断是否存在多重共线性的方法有哪些?4.4针对出现多重共线性的不同情形,能采取的补救措施有哪些?4.5在涉及相关的宏观经济总量指标如GDP、货币供应量、物价总水平、国民总收入、就业人数等时间序列的数据中一般都会怀疑有多重共线性,为什么?4.6多重共线性的产生与样本容量的个数n、解释变量的个数k是有无关系?4.7具有严重多重共线性的回归方程能否用来进行预测?4.8岭回归法的基本思想是什么,它对降低共线性有何作用?4.9以下陈述是否正确?请判断并说明理由。1)在高度多重共线性的情形中,要评价一个或多个偏回归系数的单个显著性是不可能的。2)尽管有完全的多重共线性,OLS估计量仍然是BLUE。3)如果有某一辅助回归显示出高的2jR值,则高度共线性的存在是肯定无疑的。4)变量的两两高度相关并不表示高度多重共线性。5)如果其他条件不变,VIF越高,OLS估计量的方差越大。6)如果在多元回归中,根据通常的t检验,全部偏回归系数分别都是统计上不显著的,你就不会得到一个高的2R值。7)在Y对2X和3X的回归中,假如3X的值很少变化,这就会使Var(3ˆ)增大,在极端的情形下,如果全部3X值都相同,Var(3ˆ)将是无穷大。8)如果分析的目的仅仅是预测,则多重共线性是无害的。练习题4.1假设在模型12233iiiiYXXu中,2X与3X之间的相关系数为零,于是有人建议你进行以下回归。1221iiiYXu1332iiiYXu是否存在2ˆ=2ˆ且3ˆ=3ˆ?为什么?2)1ˆ会等于1ˆ或1ˆ或两者的某个线性组合吗?3)是否有Var(2ˆ)且Var(2ˆ)且Var(3ˆ)=Var(3ˆ)?4.2在决定一个回归模型的最优解释变量集时人们常用逐步回归的方法,在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据F检验看其对ESS的贡献而做出决定的。根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗?为什么?4.3表4.11给出了中国商品进口额Y、国内生产总值GDP、消费价格指数CPI。表4.11中国商品进口额、国内生产总值、消费价格指数年份商品进口额/亿元国内生产总值/亿元居民消费价格指数(1985年为100)/%19851257.88964.410019861498.310202.2106.519871614.211962.5114.319882055.114928.3135.819892199.916909.2160.219902574.318547.9165.219913398.721617.8170.819924443.326638.1181.719935986.234634.4208.419949960.146759.4258.6199511048.158478.1302.8199611557.467884.6327.9199711806.574462.6337.1199811626.178345.2334.4199913736.482067.5329.7200018638.889468.1331200120159.297314.8333.3200224430.3105172.3330.6200334195.6117251.9334.6资料来源:中国统计年鉴.2004.中国统计出版社,2004请考虑下列模型123lnlnlntttiYGDPCPIu1)利用表中数据估计此模型的参数。2)你认为数据中有多重共线性吗?3)进行以下回归121lnlnttiYAAGDPv122lnlnttiYBBCPIv123lnlnttiGDPCCCPIv根据这些回归你能对数据中多重共线性的性质说些什么?4)假设数据有多重共线性,但2ˆ和3ˆ在5%水平上个别的显著,并且总的F检验也是显著的。对这样的情形,我们是否应考虑共线性的问题?4.4自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X才可能避免多重共线性的出现?4.5克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入1X、非工资一非农业收入2X、农业收入3X的时间序列资料,利用OISE估计得出了下列回归方程:ˆY=8.133+1.0591X+0.4522X+0.1213X(8.92)(0.17)(0.66)(1.09)2R=0.95F=107.37括号中的数据为相应参数估计量的标准误差。试对上述模型进行评析,指出其中存在的问题。4.6理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量Y(万t)、国民总收入1X(代表收入水平)(亿元)、国内生产总值GDP2X(代表经济发展水平)(亿元)、工业增加值3X(亿元)、建筑业增加值4X(亿元)、交通运输邮电业增加值5X(代表产业发展水平及产业结构)(亿元)、人均生活电力消费6X(kW·h)(代表人民生活水平提高)、能源加工转换效率7X(代表能源转换技术)(%)等1985-2002年统计数据,具体见表4.12。表4.121985-2002年统计数据年份能源消费国民总收入GDP工业建筑业交通运输邮电人均生活电力消费能源加工转换效率yX1X2X3X4X5X6X71985766828989.18964.43448.7417.9406.921.368.2919868085010201.410202.23967525.7475.623.268.3219878663211954.511962.54585.8665.8544.926.467.4819889299714922.314928.35777.281066131.266.5419899693416917.816909.2648479478635.366.5119909870318598.418547.96858859.41147.542.467.2199110378321662.521617.88087.11015.11409.746.965.9199210917026651.926638.110284.514151681.854.666199311599334560.534634.414143.82284.72123.261.267.3219941227374667046759.419359.63012.62685.972.765.2199513117657494.958478.124718.33819.63054.783.571.05199613894866850.567884.629082.64530.5349493.171.5199713779873142.774462.632412.14810.63797.2101.869.23199813221476967.278345.233387.95231.44121.3106.669.44199913011980579.482067.535087.25470.64460.3118.170.4520001302978825489468.139047.358885408.6132.470.96200113491495727.997314.842374.66375.45968.3144.670.412002148222103935.3105172.345975.270056420.3156.369.78资料来源:中国统计年鉴.2004.中国统计出版社,2004要求:1)建立对数线性多元回归模型。2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。4.7本章引子提出“农业和建筑业的发展会减少财政收入吗?”所采用的数据如表4.13所示。表4.131978-2003年财政收人及其影响因素数据年份财政收入(亿元)CS农业增加值(亿元)NZ工业增加值(亿元)GZ建筑业增加值(亿元)JZZ总人口(万人)TPOP最终消费(亿元)CUM受灾面积(万公顷)SZM19781132.31018.41607138.2962592239.15076019791146.41258.91769.7143.8975422619.43937019801159.91359.41996.5195.5987052976.14453019811175.81545.62048.4207.11000723309.13979019821212.31761.62162.3220.71016543637.933130198313671960.82375.6270.61030084020.53471019841642.92295.52789316.71043574694.53189019852004.82541.63448.7417.9105851577344370198621222763.93967525.710750765424714019872199.43204.34585.8665.81093007451.24209019882357.238315777.28101110269360.15087019892664.94228648479411270410556.54699119902937.150176858859.411433311365.23847419913149.485288.68087.11015.111582313145.95547219923483.37580010284.5141511717115952.15133319934348.956882.114143.82284.711851720182.14882919945218.19457.219359.63012.6119850267965504319956242.21199324718.33819.6121121336354582119967407.9913844.229082.64530.512238940003.94698919978651.1414211.232412.14810.612362643579.45342919989875.9514552.433387.95231.412476146405.950145199911444.081447235087.25470.612578649722.749981200013395.2314628.239047.3588812674354600.954688200116386.0415411.842374.66375.412762758927.452215200218903.6416117.345975.2700512845362798.547119200321715.2517092.153092.98181.312922767442.554506资料来源:中国统计年鉴2004.中国统计出版社,2004试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题?第四章思考与练习1.什么是多重共线性?产生多重共线性的经济背景是什么?答:Page76~772.简述检验多重共线性的方法思路。Page813.多重共线性的主要影响是什么?Page78~794.答:(1)不完全共线性时,仍然是的无偏估计,但是其方差会随着共线性程度的增大而增大,其t—检验可能失效。(2)可以用简单相关系数矩阵法、变量显著性与方程显著性的综合判断、辅助回归等方法检验。。。。(简述检验步骤)5.答:(1)回归式1中存在有多重共线性。logK的先验符号应该是正号,因为
本文标题:第四章多重共线性思考题
链接地址:https://www.777doc.com/doc-2168872 .html