您好,欢迎访问三七文档
第一讲:use打开数据文件,一般加clear选型清空内存中现有数据。sysuse打开系统数据文件。describe描述数据edit利用数据编辑器进行数据编辑list类似于edit,但只能显示不能修改数据。display显示计算结果。经常写为:disummarize求某个变量的观察值个数、平均值、标准差、最小值和最大值。经常写为:sumscatter生成两个变量的散点图。setobs定义样本个数(使用前一定要用drop或者clear命令清空当前样本)generate建立新变量并赋值。经常写为gen(**********************)stata命令格式(**********************)[byvarlist:]command[varlist][=exp][ifexp][inrange][weight][,options]1。Command命令动词,经常用缩写。2。varlist表示一个变量或者多个变量,多个变量之间用空格隔开。如sumpriceweight3。byvarlist分类信息按照某一变量的不同特性分类4。=exp赋值及运算5。ifexp挑选满足条件的数据6。inrange对数据进行范围筛选7。Weight给数据赋一个权重8。,options命令增加一些可选信息Labeldefinemarry1”married”0”unmarried”第二讲:(**********************)建立回归方程(**********************)Regress命令详解:Regressdepvar[indepvars][if][in][weight][,options]打开系统文件auto,建立如下方程:sysuseauto,clearregresspricempgweightforeign1。要求方程省略常数项(自己设置常数项)Regpricempgweightforeign,nocons(hascons)2。稳健性估计(一般用于大样本OLS)Regpricempgweightforeign,vce(robust)或者:regpricempgweightforeign,r(常用的)3。设置置信区间(默认95%)regpricempgweightforeign,level(99)(数字可以变)4。标准化系数Stataregpricempgweightforeign,beta5。部分数据回归regpricempgweightlengthforeignin1/30regpricempgweightlengthifforeign==0(**********************)回归后预测值的获得(**********************)Predict1。拟合值的获得:predictyhat,xb或者predictyhat获取拟合值并将拟合值y定义为yhat2。残差的获得predicte,residuals或者predicte,res获得残差并把残差定义为e(**********************)回归的假设检验(**********************)(**********************)test命令(**********************)例二:usewage2,clearreglnwageeductenureexperexpersq1。教育(educ)和工作时间(tenure)对工资的影响相同。testeduc=tenure(两个变量的系数是否相等)2。工龄(exper)对工资没有影响testexper(检验exper的系数是否为0)或者testexper=03。检验educ和tenure的联合显著性testeductenure(检验两个变量的系数是否同时为0)或者test(educ=0)(tenure=0)(**********************)非线性检验:testnl(**********************)例一.sysuseautogenweight2=weight^2regpricempgtrunklengthweightweight2foreigntestnl_b[mpg]=1/_b[weight](非线性关系下,在需要写成_b[变量名]的形式)testnl(_b[mpg]=1/_b[weight])(_b[trunk]=1/_b[length])(**********************)约束回归(**********************)定义约束条件constraintdefinen条件约束回归语句cnsreg被解释变量解释变量,constraints(条件编号)例二:usenerlove,clearconsdef1lnpl+lnpk+lnpf=1.consdef2lnq=1.cnsreglntclnqlnpllnpklnpf,c(1-2)第三讲:(**********************)异方差(**********************)(**********************)异方差的检验(**********************)1。残差图:rvfplot(residual-versus-fittedplot)(残差与拟合值的散点图)rvpplot变量名(residual-versus-predictorplot)(残差与解释变量的散点图)作图命令一定要在回归完成之后进行Regyx1x2x3RvpplotRvpplotx1(残差与x1的散点图)2。怀特检验命令:做完回归后,使用命令:estatimtest,white(imtest指的是:informationmatrixtest信息矩阵检验)3。BP检验:做完回归后,使用命令:estathettest,normal(使用拟合值yˆ)estathettest,rhs(使用方程右边的解释变量,而不是yˆ)estathettest[varlist](指定使用某些解释变量)最初的BP检验假设扰动项服从正态分布,有一定局限性。Koenker(1981)将此假定放松为iid,在实际中较多采用,其命令为:estathettest,iidestathettest,rhsiidestathettest[varlist],iid(**********************)异方差的处理(**********************)异方差的处理如果考得话我感觉考到使用“异方差稳健标准差”的可能性比较高。但是只有记住参数,,r就一切OK了。1。使用“异方差稳健标准差”(robuststandarderror):这是最简单,也是目前比较流行的方法。只要样本容量较大,即使在异方差的情况下,只要使用稳健标准差,则所有参数估计、假设检验均可照常进行。sysusenlsw88,clearregwagettl_expraceageindustryhoursregwagettl_expraceageindustryhours,r使用稳健标准差2。广义最小二乘法(GLS)、加权最小二乘法(WLS)以及可行广义最小二乘法(FGLS)。其含义为Var(b)=(X'X)-1*(X'ΩX)*(X'X)-1通过加权使得Ω=I因此,GLS和WLS要求Ω已知。例如:假设我们知道异方差是由变量weight引起。sysuseauto,cleargenwei2=weight^2regpricempgweightturnforeign[aw=1/wei2]设置权重aw为weight的平方的倒数rvpplotweight(去年王永画的范围内明确指明FGLS不考!!!)FGLS的步骤(1)对原方程用OLS进行估计,得到残差项的估计ûi,(2)计算ln(ûi2)(3)用ln(û2)对所有独立的解释变量进行回归,然后得到拟合值ĝi(4)计算ĥi=exp(ĝi)(5)用1/ĥi作为权重,做WLS回归。Regyx1x2x3„„predictu,resgenlnu2=ln(u^2)reglnu2x1x2…predictg,xbgenh=exp(g)geninvvar=1/hregyx1x2…*aweight=invvar+(**********************)自相关(**********************)考察英国政府如何根据长期利率(r20)的变化来调整短期利率(rs),数据集为ukrates.dta(1)做如下回归:,其中:回归方程为:useukrates,cleartssetmonthregD.rsLD.r20“L.”滞后算子“L2.”滞后两阶“D.”一阶差分算子“D2.”D2.X=Xt-Xt-2“LD.”表示一阶差分的滞后值或者滞后值的一阶差分1。图形法:自相关系数和偏自相关系数predicte1,resace1(e1的自相关系数)pace1(e1的偏自相关系数)corrgrame1,lag(10)2。t检验和F检验(wooldridge)思想:t检验,如果存在一阶自相关,残差项与其一阶滞后项回归后系数显著,如果解释变量非严格外生,回归时可加入解释变量。rege1L.e1rege1L.e1LD.r20同理,可以用F检验检验是否存在高阶自相关rege1L(1/2).e13。DW检验:只能检验一阶自相关的序列相关形式,并且要求解释变量严格外生。regD.rsLD.r20dwstat4。Q检验和Bartlett检验regD.rsLD.r20predicte2,res(得到回归残差命名为e2)wntestqe2(使用stata提供的默认的滞后期)wntestqe2,lag(2)(使用指定数字的滞后期此处为滞后2期)wntestbe2(对e2进行bartlett检验注意这里是wntestb上面的是wntestq)5。D-W’sh检验estatdurbinaltestatdurbinalt,lag(2)指定两期6。B-G检验bgodfreybgodfrey,lag(2)tttrrs1201tttrsrsrs211202020tttrrr(**********************)自相关的处理(**********************)1。Newey稳健性估计或者聚类稳健性估计。regD.rsLD.r20neweyD.rsLD.r20,lag(1)(HAC标准差,必须指定滞后阶数p)neweyD.rsLD.r20,lag(2)2.某些模型中可以通过取对数或者取差分消除自相关。(伟大的FGLS在时间紧迫的情况下依然可能或许保不齐说不定有可能又不需要看了)3.FGLS估计(一阶自相关)假设干扰项服从AR(1)过程:一阶准差分。Cochrane-Orcutt(1949)估计(舍弃第一期观察值)praisD.rsLD.r20,corcpraisD.rsLD.r20,rho(dw)corcPrais-Winsten(1954)估计(对第一期观察值进行处理sqrt(1-rho^2)*y1)praisD.rsLD.r20praisD.rsLD.r20,rho(dw)时间序列一般样本不会太大,因此不要轻易舍弃。(**********************)模型的设定和筛选问题(**********************)1。Link检验。基本思想:如果模型的设定是正确的,那么y的拟合值的平方项将不应具有解释能力。usewage1,cleargenlnwage=ln(wage)reglnwageeducexpertenurelinktest(或许是遗漏了重要的解释变量)geneduc2=educ^2genexper2=exper^2regln
本文标题:stata常用命令
链接地址:https://www.777doc.com/doc-5646153 .html