您好,欢迎访问三七文档
缩尾1.captprogdrop_all//如果内存中存在do文件,请清除;没有,请继续2.progvw//将此do文件命名为vw3.setmoreoff//自动翻屏到最后一页4.cdd:\data//变化目录到d,(把文件默认目录存到d盘)5.importexcelwstock.xls,sheet(BS)firstclear//输入wstock.xlsexcel表格,表单BS(分析表格中的表单BS行变量)6.globalvDivrecvOthrecvInvtr//global全局宏,v指变量Divrecv,Othrecv,Invtr(这三个变量为数值型变量)7.foreachxofvarlist$v{//foreach指循环,x泛指变量中的每一个,$用来限定v变量里的winsor`x',gen(w`x')p(0.05)//winsor变量名,前空两格。对x按5%进行缩尾,并生成以w开头的x。}8.gd=(Divrecv!=wDivrecv)//g指generate:生成一个新的虚拟变量d,如果D不等于缩尾后的D,则d产生数值1,否则产生数值0.9.lComcdH_stkcdDivrecvwDivrecvifd==1//l指list列示表格中的其他变量10.savewyn.dta,replace//保存数据集replace:覆盖以前的数据集(如果以前有的话)11.exportexcelwyn.xls,sheet(sheet1)first(var)replace//再把数据集输出,制成新表格,以wyn.xls命名,并在表格中的sheet1表单中列示。12.end1.****************回归分析************************2./********吴良海,2014/09/25*********/3.captprogdrop_all//如果内存中存在do文件,请清除;没有,请继续4.progREG//将此do文件命名为REG5.setmoreoff//自动翻屏到最后一页6.sysuseauto,clear//调入数据集,并清除7.tabstatprice-forei,stats(nminmeanmediansdmax)///columns(statistics)format(%6.0g)//统计(sabstat)变量Noterecw到Advpay,需以下要数据(观测值、最小值、平均值、终值、标准差、最大值)列出数据,数据显示的格式按6.0g8.corrprice-forei//计算之间的相关系数,corr指皮尔逊乘积距相关系数9.pwcorrprice-forei,sigstar(0.10)//pwcorr指配对相关系数,sig指显著性。配对相关系数(price到forei),相关系数P值如果小于0.10请加星。10.spearmanprice-forei,stats(rhop)star(0.10)sidakmat//descriptionsidak指可选项,mat即matrix指报告方式为举证方式。斯皮尔曼相关系数(定序变量)11.globalvweightlength//global全局宏,v指变量weight、length为变量12.foreachxofvarlist$v{//foreach指循环,x泛指变量中的每一个,$用来限定v变量里的winsor`x',gen(W`x')p(0.1)//winsor变量名,前空两格。产生新变量,在0.1%的位置上缩尾}13./*regression*/14.regpriceWweightWlengthforeign,noconsbeta//nocons指无截距,beta指标准化值的大小,抽掉量差的差异,将三个变量对price的影响进行比较。reg指回归,price为被解释变量,Wweight指对变量weight进行缩尾。15.eststoreOLS//est指估计,把回归的结果OLS保存起来。16.esttabOLS,stats(r2r2_aNF)star(0.10.050.01)b(%9.2f)//tab指表格,star指把回归的数居加星,%9.2f为系数格式。请以表格形式来报告OLS,把(r2,调整的r2,观测值,统计量)几项数据报告出来。17.regpriceWweightWlengthforeign,beta18.vif//方差膨胀因子,经验值不超过10,解决多元共线性。19.globalcWweightWlength20.foreachyofvarlist$c{sum`y',detailgC`y'=`y'-r(mean)//对中处理,新变量=原始变量-均值gC`y'2=C`y'^2//新变量2次方=对中后的值的乘方,`y’变量,是一个宏(经常变化)}21.regpriceCWweightCWweight2CWlengthCWlength2foreign,beta22.vif23.end分组回归1.captprogdropREGG2.progREGG3.setmoreoff4.sysuseauto,clear//调入数据集,并清除5.byforeign,sort:regpriceweightlength,robust//sort指排序,把分组变量排序,robust指稳健回归,请你区分国产、进口车,并分别进行回归。6.quisumprice,detail//qui静默执行,在结果窗口处不显示,sum描述性统计。取得均值和中位数,根据价格把车分为高价位和低价位。7.returnlist//r类命名有哪些宏8.ggroup1=pricer(mean)//如果price变量的每个值和均值比较,产生分组变量,命名为group1.9.ggroup2=pricer(p50)//产生分组变量,命名为group2.10.bygroup1,sort:regpriceweightlengthforeign,robustbetalevel(90)//做分组回归(第一组回归),执行区间设置为90,(不设置系统默认为95)11.bygroup2,sort:regpriceweightlengthforeign,robust//第二组回归12.labelvaluesgroup2group2lbl//给变量取值做标签(标签名为group2lbl),即对group2lbl作标签13.labeldefinegroup2lbl0低于价格中位数1高于价格中位数//对group2lbl定义作标签14.bygroup2,sort:regpriceweightlengthforeign,robust15.pctilepct_price=price,nq(3)genp(pctx)//pctile指产生百分位数,nq(3)指分位数的数量(请提供3分位数),genp(pctx)指产生新的变量(请保存分为数值)。把price变量用(1,2,3)这样的标识进行标识,以显示price在那个位置16.xtilepriceq=price,nq(3)//xtile指列联表17.tableforeignpriceq,c(meanmpg)format(%5.2f)//c指内容,请报告mpg这个变量的均值18.bypriceq,sort:regpriceweightlengthforeign,robust19.bypriceq,sort:regpriceweightlengthforeign,robustnocons20.gprice_low=mpgifgroup2==0//产生两个新变量检验,每加仑汽油所跑里程数是否有显著差异。低价车的mpg做变量21.gprice_high=mpgifgroup2==1//高价车的mpg做变量22.ttestprice_low=price_high,unpune//unp指unpair非配对,unp指不相等。这两个新产生的变量是否相等(两组是否存在异方差)。23.gprice_domestic=priceifforeign==024.gprice_foreign=priceifforeign==125.ttestprice_domestic=price_foreign,unpune26.byforeign,sort:ttestprice_low=price_high,unpune27.anovampggroup2//anova做方差分析,va指variety28.anovampgforeign19.anovampgpriceq30.end/**********异方差:多元线性回归模型的FGLS回归************//******吴良海,安徽工业大学商学院会计系******//******************2014/10/11****************/capprogdropfglsprogfglsnote:当误差结构未知时,可行的FGLS回归setmoreoff#delimit;sysuseauto,clear;regpriceweightlengthforeign,noc/*OLS回归*/;imtest,white/*怀特检验,零假设为同方差*/;predictr,res;glnr2=ln(r^2);reglnr2weightlength;predictplnr2;gw=exp(plnr2);regpriceweightlengthforeign[aw=1/w],noc/*FWLS回归*/;regpriceweightlengthforeign,robustnoc/*稳健回归*/;wls0priceweightlengthforeign,wvar(weightlength)type(loge2)noconsgraph;#delimitcrendfgls//回归步骤://1.对原方程用OLS进行估计,得到残差项的估计r;//2.计算ln(r^2);//3.用ln(r^2)对所有独立的解释变量进行回归,然后得到拟合值plnr2;//4.计算权数w=exp(plnr2);//5.用1/w作为权重,做WLS回归。1.****干扰项序列相关(自相关)的GLS估计********/2.***吴良海,安徽工业大学商学院会计系,2014/10/16***3.capprogdropar//如果内存中存在do文件,请清除,如果没有,请继4.progar//命名一个以ar为名的do文件5.version13.06.setmoreoff//自动翻屏到最后一页7.useD:\data\10.17\friedman2,clear//请调入系统中自带的数据集8.dropifm1==.//如果m1这个变量等于缺失值,请删除。9.tssettime//time为时间变量,tsset时间序列设置。10.foreachvarofvarlistconsm1m2{//对三个变量consm1m2做循环。11.gln_`var'=ln(`var')//对上述三个变量产生它的对数值,var是宏的名字。12.gdln_`var'=D.ln_`var'//D1表示一阶差分。先有上述变量,才能进行差分。计算三个变量对数的一阶拆分。13.}//一阶拆分表示为D,二阶拆分表示为D2.....14.quiregconsumpm1m2//consump被解释变量和货币突发量m1m2之间的关系。m1m2是否影响consump?程度?qui静静的,结果窗口不显示运行结果。15.dwstat//DurbinWatson检验,2为标准值,如果得到很小的数,说明存在序列相关。DW为人。检验一阶自相关,不能检验高阶自相关。16.returnlist//列示内存中保存的那些值。17.disrho=`=1-r(dw)/2'//计算一阶自相关系数,dw~=2(1-rho)dw代表dis为display显示,rho为相关系数表达式。18.regln_consumpln_m*//原始数据对数形式的序列相关检验19.dwst
本文标题:Stata缩尾
链接地址:https://www.777doc.com/doc-1788176 .html