您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 第二讲 stata画图和线性回归基础
Stata画图和回归基础Stata作图stata提供各种曲线类型,包括点(scatter)、线(line)、面(area),直方图(histogram)、条形图(bar)、饼图(pie)、函数曲线(function)以及矩阵图(matrix)等。同时,对时间序列数据有以ts开头的一系列特殊命令,如tsline。还有一类是对双变量的回归拟合图(lfit、qfit、lowess)等。作图时命令方式比较复杂,建议多用菜单方式。一起来做下列图形:简单图形打开wage1.dta1。男性和女性工资均值的条形图2。白人和其他人的工资的饼状图3。wage的直方图,并检验是否服从正态分布。4。wage的核密度分布图。组合图形画出price与weight的散点图,并画出其拟合线。图形界面设计:图形标题,X轴标志,Y轴标志,样式选择,图例,分组标志。两个练习:1。完成下列汽车拟合图。2。查阅数据,并按照要求完成图形。改上面五个标注,用twowaygraph里面的legend(overridedefaultkeys):1国产车2进口车3国产车拟合4进口车拟合5整体拟合2、中国的GDP(以购买力平价计)何时能超过美国?从PennWorldTable(最权威的跨国宏观数据集)下载两国1978-2010年“Population”与“RealGDPpercapita”数据,导入Stata中,将两国log(GDP)的时间趋势画在一张图上,并做简单外推预测(假设未来的增长率与1978-2010年间相同)。下载地址为:。下载时选csv格式,按网站说明存储数据。19202122232419801990200020102020yearlngdp_ChinaFittedvalueslngdp_usaFittedvalues小样本OLS1234567891011220240260280300320消费250300350400年收入垂直线拟合线消费OLS原理01122kkYXXXuOLS假设条件:1.E[u|X]=02.条件同方差、没有序列自相关3.X与u不相关4.Y和X之间存在线性关系。5.解释变量X是非随机变量,被解释变量Y是随机变量。6.X是满秩的,rank(X)=kμXβY我们得到:习惯上我们用y_hat=X*b(被解释变量的拟合值)e=Y-y_hat=Y-Xb(残差)1ˆ(')'βXXXy建立回归方程打开系统文件auto,建立如下方程:regress命令详解:regressdepvar[indepvars][if][in][weight][,options]sysuseauto,clearregresspricempgweightforeign1。要求方程省略常数项2。稳健性估计(一般用于大样本OLS)3。重新设置置信区间(默认95%)4。标准化系数(回归系数对被解释变量的重要性)5。回归中使用部分数据(ifin)回归后预测值的获得Predict1。拟合值的获得:predictyhat,xb或者predictyhat2。残差的获得predicte,residuals或者predicte,res3。残差分布图rvfplotyline(0)回归结果的存放:e()e(N)numberofobservationse(mss)modelsumofsquarese(df_m)modeldegreesoffreedome(rss)residualsumofsquarese(df_r)residualdegreesoffreedome(r2)R-squarede(r2_a)adjustedR-squarede(F)Fstatistice(rmse)rootmeansquarederror可以使用命令eretlist查看。回归结果解读MSS:回归平方和df1自由度MMS=MSS/df1RSS:残差平方和df2RMS=RSS/df2TSS:总平方和df3TMS=TSS/df3F值:系数的联合检验R2=MSS/TSS调整的R2RootMSE=sqrt(RMS)Coef:回归系数Std.Err:系数的标准误差t统计量t的临界值p值95%置信区间模型常用的其他形式:对数半对数平方项n次方指数交乘项虽然对函数形式和自变量的选取有选择和检验的方法,但最好还是从“经济意义”角度确定。例如:考察消费受收入影响的方程,即使参数项不显著,也不能把它删除掉。例题例一:利用wage2的数据检验明瑟(mincer)工资方程的简单形式:Ln(wage)=b0+b1*educ+b2*exper+b3*exper^2+u例二:利用phillips的数据拟合预期增强的菲利普斯曲线为其中,unemt表示第t期的失业率(%),inft表示第t期的通货膨胀率(%),infte表示预期通货膨胀率,μ0表示自然失业率(%)。按照适应性预期理论,infte=inft-1。令Δinft=inft-inft-1,上述模型可以简化为:10()ettttinfinfunemu01tttinfunemu例三:我国某地区1955---1984农产品收购量sg、库存量kc存放在文件warehouse.dta中估计如下方程:Sgt=a+b0kct+b1kct-1+u存在滞后一期的变量
本文标题:第二讲 stata画图和线性回归基础
链接地址:https://www.777doc.com/doc-4125982 .html