您好,欢迎访问三七文档
1/12数量分析方法复习材料第一部分:安装stata13.0以及界面优化设置的步骤,该步骤是为达到理想工作的友好界面。一、Stata13.0MP32位/64位破解版安装安装步骤:1.解压缩,压缩包内有三个文件,分别是“Stata13_setup.msi”——安装程序,“Crack”——破解补丁目录,“破解说明”。2.点击Stata13_setup.msi,根据windows操作系统,自行选择32/64位MP版,静静等待安装完成。3.把“Crack”文件夹中的Stata.lic和StataMP.exe(或StataMP-64.exe)复制粘贴到安装目录。运行程序,关键的一步是去掉自动在线注册的勾选项。注意:1.Stata13应当安装在D盘或E盘的根目录下,绝不能安装在C盘。2.安装好的Stata13文件夹下只能有12个文件以及一个名为profile的do文件(在第三2/12步设置中出现)。3.要创建一个Stata13的快捷方式在桌面,便于操作。二、界面优化1.改变stata13界面排版Edit---Preferences---LoadPreferenceSet---Presentation(1024*768)2.设置结果窗口界面颜色Edit---Preferences---Generalpreferences---Resultcolors---classic3.改变结果窗口界面字体大小在结果窗口右键---Font---大小4.保存设置,使得再次打开stata13时显示为该设置,保存名自行设置Edit---Preferences---SavePreferences---NewPreferencesSet---自行命名5.文件关联,关联“.dta”,“.do”,“.gph”,“.smcl”。Edit---Preferences---ResetFileAssociations---是6.编辑do文件时,改变其窗口字体大小在命令窗口输入doedit,打开do文件编辑器Edit---Preferences---EditorFont---Size三、基本文件及工作日志设置1.在Stata13文件夹下的ado文件夹内,创建名为personal、plus的文件夹方法一:手动右键新建文件夹方法二:在stata13command命令窗口内输入如下命令:mkdird:\stata13\ado\plus3/12mkdird:\stata13\ado\personal2.在personal文件下创建command.log和stata.log两个日志文件,使得运行的命令及结果都存在这两个text文件内。方法:在stata13目录下创建profile.do文件。(1)在命令窗口内输入doedit,打开do文件编辑器。(2)输入代码并保存,保存位置为d:\stata13,文件名为profile,文件类型为DoFiles(*.do)。代码如下:capprogdropprofileprogprofilecaplogclosecapcmdlogcloselogusingd:\stata13\ado\personal\stata.log,textreplacecmdlogusingd:\stata13\ado\personal\command.log,appendsysdirsetPERSONALd:\stata13\ado\personalsysdirsetPLUSd:\stata13\ado\plussysdirsetOLDPLACEd:\stata13\dataendprofile说明:1.replace,替换,指每一次打开都用新文件覆盖上一次的文件,即stata.log的内容如果4/12需要保存,应当在工作完成后将其移至其他文件夹。2.append,叠加,指在旧文件的基础上继续添加新文件,即command.log的内容包含了全部已输入的命令。3.设置完成后,打开Stata,在结果窗口的下方应当显示logon(text)及cmdlogon。第二部分:结合“Stata特性”、“本课程的学习体会”谈一谈MPAcc/MV学生如何应用Stata13.0成就一篇较高水平的硕士学位论文。Stata的八个特性:1.互动性——2.高效性——数据处理3.直观性——画图4.便捷性——制表5.先进性——统计分析6.一体性——统计程序、数据管理与制图浑然一体7.创造性——编程8.开放性——参与开发do文件、ado文件ols.ado;ols.hlp;ols.sthlp学习体会:学会stata,就拥有了全世界。5/12第三部分:Do文件英汉互译——sunnycapprogdropsunny//捕获内存中的sunny程序,有则清除(_all是系统宏,指全部程序,如果输入“capprogdrop_all”,会将全部程序从内存中清除)。progsunny//sunny程序的起始语句,与end对应setmoreoff//result窗口翻屏至最后一页capmkdirf:\haihan//在F盘的根目录下产生名为haihan的文件夹,前面加cap,可选择性执行——没有就创建,有则忽略cdf:\haihan//设定当前工作路径为f:\haihansysuseauto,clear//调用系统自带的数据集audo.dta,如果是外部数据,例如mv.dta,则应当输入“usemv.dta”;“clear”是清除已经被占用的内存。tabstatprice-foreign,stats(Nminmeanmedianmax)column(statistics)format(%9.2g)//以简表的形式描述auto.dta中从price到foreign的所有数值型变量的统计结果,同时要求变量名在第一列。tabstat只能报告数值型,字符型会报错;stats(Nminmeanmedianmax):N-样本量,min-最小值,mean-均值,median-中位数(与p50相同),max-最大值;column(statistics):变量名在第一列显示;format是对统计结果的格式进行设置,%9.2g代表最长9位,小数点后保留2位。6/12spearmanpriceweightlengthforeign,stats(rhop)star(0.05)sidakpw//显示变量“priceweightlengthforeign”的spearman等级相关系数与显著性水平。stats(rhop)是spearman的语法,表示提供相关系数与对应的显著性水平P值;star(0.05)是对相关系数显著性水平在5%及以下的结果加星号;Sidak是使用Sidak调整方法计算显著性水平;pw使用所有可用数据计算配对相关系数。winsor2priceweightlength,suffix(_win)cuts(199)//对“priceweightlength”三个变量使用winsor2进行缩尾,缩尾后产生新变量,变量名为原变量加后缀“_win”,缩尾区间为1%——99%。winsorize:缩尾;suffix:后缀;cuts(199)缩尾区间1%——99%,默认值同样为1%——99%。regprice_winweight_winlength_winforeign,noconsbetarobust//对缩尾后的数据使用无截距模型进行稳健回归分析,并报告标准化回归系数。noncons:使用无截距模型;beta:提供标准化回归系数;robust:稳健估计,消除残差影响。estimatesstoreols//存储ols回归结果estimatestableols,stats(r2r2_aNF)b(%7.2f)star(0.100.050.01)title(汽车价格模型的ols回归结果)//列表报告ols回归结果,标题为“汽车价格模型的ols回归结果”,报告指包括r²,调整后的r²,样本量以及F指。stats(r2r2_aNF):报告r²,调整后的r²,样本量,F值(F值的意义是用来检验样本的结果能够代表总体的真实程度);b(%7.2f):报告结果格式,最长7位,小数点后保留2位;star(0.100.050.01):0.10——0.05之间加1星,0.05——0.01之间加2星,0.01以下加3星;title(汽车价格模型的ols回归结果):设置标题。vif,uncentered//vif检验,方差膨胀系数,去中心化,因为14条nocons是无截距模型,vif不能超过8.07/12end//程序结束,与之前的“progsunny”对应。sunny//执行sunny.do。第四部分:Do文件英汉互译——groupcapprogdropgroup//捕获内存中的group程序,有则清除。proggroup//group程序的起始语句,与end对应setmoreoff//翻屏至最后一页sysuseauto,clear//调用系统自带的数据集audo.dta并清除已被占用的内存。bysforeign:regpriceweightlength,robust//按照变量foreign分组排序,进行稳健回归分析,被解释变量为price(价格),解释变量为weight(重量)length(长度)。quietlysumprice,detail//后台运行,对变量price进行详细的描述统计returnlist//显示统计结果ggroup1=pricer(mean)8/12//产生虚拟变量,变量名为group1,当价格大于均值时,变量值为1;否则为0。ggroup2=pricer(p50)//产生虚拟变量,变量名为group2,当价格大于中位数时,变量值为1;否则为0。bysgroup1:regpriceweightlengthforeign,robustbetalevel(90)//按照变量group1分组排序,进行稳健回归分析,被解释变量为price,解释变量为weightlengthforeign,并显示标准化回归系数,置信区间为90,默认值为95。bysgroup2:regpriceweightlengthforeign,robust//按照变量group2分组排序,进行稳健回归分析,被解释变量为price,解释变量为weightlengthforeign。labelvaluesgroup2group2lbl//对group2做标签,命名为group2lbllabeldefinegroup2lbl0低于价格中位数1高于价格中位数//定义group2lbl并赋值,当其为0时,赋值“低于价格中位数”,当其为1时,赋值“高于价格中位数”。bysgroup2:regpriceweightlengthforeign//按照变量group2分组排序,进行回归分析,被解释变量为price,解释变量为weightlengthforeign。注:此条命令没有robust,未消除残差影响。pctilepct_price=price,nq(3)genp(pctx)//依据变量price生成三分位变量pct_price,并将pct_price中的值对应的百分比保存在新变量pctx中。pctile:生成百分位变量;nq(3):该变量为三分位数;genp(pctx):在新变量pctx中显示产生的分位数的百分比。xtilepriceq=price,nq(3)//将变量price按照分位数分成三组,生成新变量priceq。9/12tableforeignpriceq,c(meanmpg)format(%5.2f)//以变量foreign为行、变量priceq为列生成交互式列联表,在单元格中显示均值、mpg的统计结果,数据格式为浮点型,最长五位,小数点后保留两位。byspriceq:regpriceweightlengthforeign,robust//按照变量priceq分组排序,进行稳健回归分析,被解释变量为price,解释变量为weightlengthforeign。b
本文标题:数量分析方法复习
链接地址:https://www.777doc.com/doc-2335972 .html