您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > STATA与面板数据回归
LOGOSTATA在实证研究中的应用刘永东中国科学院农业政策研究中心数据分析基础软件名称最新版本安装文件大小SAS9.1.33GSPSS15.01CDStata10.094MGAUSS8.025M计量经济学专用Limdep/Nlogit9.0/4.03MShazam10.090MEviews6.0100MWinrat6.021MTSP5.0Rfree30M中国科学院农业政策研究中心数据分析基础Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,由美国计算机资源中心(ComputerResourceCenter)研制。从1985到现在,已连续推出1.1,1.2,1.3,1.4,1.5,……及2.0,2.1,3.0,3.1,4.0,5.0,6.0,7.0.,8.0,9.0.,10.0等多个版本。Stata里不要修改原始数据,不可恢复中国科学院农业政策研究中心数据分析基础Stata主要功能数据管理功能统计分析功能•统计分析:描述统计、交叉表格•回归分析:OLS,2SLS,Logit,Probit,Tobit,Heckman,GMM,Paneldata,Timeseries,Surveydata•多变量分析:multivariateregression,clusteranalysis,•抽样和模拟:绘图功能编程和矩阵运算功能中国科学院农业政策研究中心数据分析基础Stata软件的特点Stata功能强大Stata软件小巧Stata操作灵活、简单,易学易用Stata编程语言简单,容易上手Stata功能更新快中国科学院农业政策研究中心数据分析基础三类文件数据文件:*.dta程序文件:*.do结果文件:*.log四个窗口和1个程序编辑器中国科学院农业政策研究中心数据分析基础STATA的界面中国科学院农业政策研究中心ResultWindowCommandWindowReviewWindowVariableWindowButtons中国科学院农业政策研究中心数据分析基础中国科学院农业政策研究中心STATA的界面Buttons:open,save,print,openlogfile,openviewer,bringresultswindowtofront,bringgraphwindowtofront,opendo-file,editwindow,browsewindow,continue,break中国科学院农业政策研究中心数据分析基础Stata的运行方式菜单操作:•执行菜单操作后,在结果窗口能够显示命令行和命令的结果命令行操作:•在命令窗口中直接写入命令,一次只能写一行命令程序操作:•利用doedit编辑do文件,执行批量的命令中国科学院农业政策研究中心数据分析基础如何导入数据直接输入(通过edit窗口)粘贴数据(通过edit窗口)容易出错用命令从外部文件导入(insheet命令)•insheet命令:•Insheetusingfilename,options•通过option指定外部文件类型Excel的sls文件不能直接读取如何导出数据粘贴使用outsheet命令中国科学院农业政策研究中心数据分析基础如何保存数据Save命令如何调用数据Use命令•Usefilename,options查看内存中的数据Browse命令List命令order命令中国科学院农业政策研究中心数据分析基础练习数据导入中国科学院农业政策研究中心数据分析基础do-file什么是do-file?•通俗来说,do-file就是STATA命令和程序的记事本。使用do-file的理由?•可追溯过往操作•可以整合庞杂的命令,减少命令输入•便于发现错误怎么打开do-file?•ButtonDo-file中做注释•程序前打*号,换行///中国科学院农业政策研究中心数据分析基础do-file如何写do-file?规范的do-file应该包括哪些内容•第一步:清理内存,clear•第二步:设定内存,setmemory•第三步:指定路径–cd:f/research/stata/….Use打开文件(比Globallibname方便)–Globallibname“文件夹路径”,用$libname代替该路径•第四部:打开log:–Caplogclose–Logusingfilename–Log的暂停和开启,logon/logoff–查看log:viewd:\stata\data\auto.log中国科学院农业政策研究中心clearsetmemory50mcdF:\stataseminar\practisedatacaplogcloselogusingzheda.loglogonuse2006.datauseruralincome.dta,clearsumruralincomeviewzheda.log数据分析基础数据的初步处理If语句,in语句和by语句生成新变量•generate和egen(egen后面可以跟函数,比generate功能强大)改名字•Rename替换•ReplaceSTATA中的逻辑运算符•And/or:&/|•等于“==”,不等于“!=”(负值=)中国科学院农业政策研究中心数据分析基础代数运算逻辑运算比较关系+加!不大于-减~不小于*乘|或=不小于/除&和=不大于^指数==等于sqrt()开方!=不等于~=不等于~=不等于+字符相加中国科学院农业政策研究中心数据分析基础数据的初步处理删除/保留变量或者观测•Drop/keep排序•Sort与gsort的区别(gsort可以设置排序,多个变量排序)•gsortvariable,option(降序在变量前加-)•gsort-yearcode,generate(order)合并数据•Merge(两个或多个文件必须有一个唯一对应的默认值建立链接关系)save2004_2006.dtasortyearcodesave,replacefile2004_2006.dtasaveduseruralincome.dta,clearsortyearcodemergeyearcodeusing2004_2006.dta需要检查variables窗口是不是有1,2的情况存在,如果存在需要重新检查续接数据•Appenduse2004_2005.dta,clearappendusing2006.dta中国科学院农业政策研究中心数据分析基础数据的初步处理贴标签•Label–Labeldata–Labelvar–des(显示命令)labelvarcode省代码“labeldata农村收入“des面板数据与截面数据转换•Reshapelongreshapewideruralincome,i(code)j(year)面板到截面•Reshapewidereshapelongruralincome,i(code)j(year)截面到面板“压缩”数据(如取平均值)•Collapsecollapse(mean)ruralincome,by(code)中国科学院农业政策研究中心数据分析基础数据的初步处理STATA中常用的operator•生成dummy–Xi:i.year•_n与_N的区别(_N默认最大值)•面板数据tssetcodeyear告诉stata是面板数据,然后使用下面功能–滞后算子l.–差分算子d.•截面数据–滞后与滞前[_n+1][_n-1]bysortcode:gentry1=ruralincome[_n-1]bysort是通过code相同的变量才进行命令中国科学院农业政策研究中心数据分析基础练习数据处理中国科学院农业政策研究中心数据分析基础STATA的描述统计功能Summarize—最常用的描述统计命令•均值、方差、百分位数、最大值、最小值……usefinal.dta,clearsumTable—功能强大的表格统计命令(常用)•多变量表、多变量表……Tabulate—简写为tab,是table的简化版Count—数数命令Correlate—相关系数Pwcorr—correlate姊妹版•Corr可以报告协方差,pwcorr可以报告p值(p值表示两变量在多大的显著程度上是相关的)•Corr删除所有缺失值,pwcorr仅删除pairwise中的缺失值中国科学院农业政策研究中心数据分析基础STATA的描述统计功能—画图直方图•Histogram,options(kden,normal)分布检验的图形•QQ图—qnorm,pnorm•对称分布—symplot•均匀分布—quantile•数学变换后的分布检验—qladder中国科学院农业政策研究中心数据分析基础STATA的描述统计功能—画图Graph命令•Graphbar/box/dot/pie•Graphtwoway(双变量图)–Graphtwowayline/scatter/connected(连线图)……•Graphmatrix(多个变量矩阵图)中国科学院农业政策研究中心数据分析基础练习数据的描述性统计中国科学院农业政策研究中心应用OLS的五个经典假设1线形模型假设Y=Xβ+u2样本随机3E(u|x)=04不存在完全共线性5同方差假设其中前四个假设保证OLS估计量无偏,加上第五个假设,使得OLS成为BLUE(BestLinearUnbiasedEs
本文标题:STATA与面板数据回归
链接地址:https://www.777doc.com/doc-3362191 .html