您好,欢迎访问三七文档
StataStata1212操作实例操作实例华南师范大学经济与管理学院主讲教师:林可全电话:020-39310352robert_washington@126.com先思考两个问题先思考两个问题1、计量经济学能做什么?◦例子:◦收入与幸福的关系;◦夫妻共同生活与各自生活的效用比较与关系研究;◦企业捐款与避税行为之间的关系;◦企业捐款与避税行为之间的关系;◦汽车销售与环境保护的关系;◦GDP增长与人民生活水平提高的关系。2、Stata能做什么?◦软件的用处◦论文的写作11、揭示社会现象背后的规则、揭示社会现象背后的规则这是计量经济学走得最远的能力。例如:关于研究生复试的规则:有四项成绩,英语笔试、英语口试、专业笔试和专绩,英语笔试、英语口试、专业笔试和专业面试,学生不知道面试的分数,老师制定规则计算综合分,然后分班,但是学生是不知道老师怎么加权的。判断这个问题需要什么数据和方法?22、刻画经济运行的特征、刻画经济运行的特征例如:Kuznets曲线:收入不平等是经济水平的倒U形曲线;拉弗曲线:税收与税率的关系;菲普斯曲线:失业与通胀的关系等胀的关系等从模型的设定到估计的结果都不一定是真实经济规律的反映,但这些统计特征可以给我们提供一些判断的依据。33、解释经济变量之间的关系、解释经济变量之间的关系通常的方法:回归分析例如:房价的推动因素(政府支出、建筑成本、收入、市场结构等);女性外貌与收入高低的关系。貌与收入高低的关系。1、依据现有经济理论指导2、回归结果通常不能提供真实的因果关系。(既然如此,我们的研究价值在哪?预测!)44、验证经济理论的适用性、验证经济理论的适用性实证分析的基本形式例如:购买力平价理论;格雷欣法则;恩格尔定律;模块化理论等恩格尔定律;模块化理论等实证文章切入点(西方理论在中国的适用性)方法准确性数据类型:时间、截面、面板计量模型选择StataStata能做什么?能做什么?计量分析的便利——软件适用性工具主义——“黄金与垃圾”——做论文的良好帮手;文的良好帮手;工具只是工具,用得是否得当取决于人◦同学们计量经济学的作业量与美国人吃汉堡的关系◦高速公路假日通行免费与月饼销售的关系◦高富帅与30万一平米StataStata1212基本界面基本界面Stata12Stata12新版Stata12Stata12菜单命令Stata12功能窗口Stata12历史命令Stata12内存中的变量信息新版Stata12变量与数据属性信息Stata12执行命令后的输出结果Stata12输入想要执行的命令StataStata基本介绍基本介绍Stata统计软件包是目前世界上最著名的统计软件之一,国外将Stata与SAS、SPSS一起被并称为三大权威软件。它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,几乎可以完成全部复杂的统计分析工作。作。目前最新版本为12,主流版本有SE(特殊版)和MP(多处理器版),功能完全相同,但MP版的运算速度比SE版的要快很多,适用于庞大数据。命令栏输入about可查看Stata安装信息。Stata的命令语句极为简洁明快,易学易记。强大的计量统计功能。强大的帮助信息。◦本地帮助help命令名◦在线帮助findit命令名始终处于计量经济学和统计学的最前沿。StataStata优势优势始终处于计量经济学和统计学的最前沿。◦许多Stata程序员会针对计量经济学发展编写一些最新的程序(ado文件),Stata提供了严谨、简练而灵活的程序语句,用户可以编写自己的命令和函数,同时可随时到Stata网站寻找并下载最新的升级文件。下载后可以直接使用,也可以自行修改、添加功能。(例如当前流行的随机前沿模型、DID、分位回归、面板门限数据等,均可以安装下载使用)Data菜单Graphic菜单Statistics菜单◦每执行一个菜单性会自动产生相应的命令。◦我们的讲述以命令方式为主。StataStata重要菜单项重要菜单项StataStata的文件的文件文件名.dta数据文件文件名.do命令文件文件名.ado程序文件文件名.smcl记录文件Stata的命令严格区分大小写。大部分命令可以缩写,用下划线标注缩写。use打开数据文件,一般加clear清空内存中现有数据sysuse打开系统数据文件。describe描述数据edit利用数据编辑器进行数据编辑本本StataStata实例主要用到的统计分析命令实例主要用到的统计分析命令edit利用数据编辑器进行数据编辑list类似于edit,但只能显示不能修改数据display显示计算结果。简写为disummarize求某变量观察值个数、均值、标准差、最小和最大值scatter生成两个变量的散点图setobs定义样本个数(用前一定要用drop或clear命令清空)generate建立新变量并赋值,与egen区别。[byvarlist:]command[varlist][=exp][ifexp][inrange][weight][,options]Command命令动词,经常用缩写。varlist表示一个变量或者多个变量,多个变量之间用空格隔开。如sumpriceweightStataStata计量分析的命令格式计量分析的命令格式用空格隔开。如sumpriceweightbyvarlist分类信息按照某一变量的不同特性分类=exp赋值及运算ifexp挑选满足条件的数据inrange对数据进行范围筛选Weight给数据赋一个权重,options命令增加一些可选信息StataStata数据类型数据类型数值型:用0、1、2…9及+、–(正负号)与小数点和()来表示。字符型:字符串变量由字母数字或一些特殊的符号组成(如地名、住址,职业等等)。注意:数字不表示大小信息,如电话、身份证注意:数字不表示大小信息,如电话、身份证号等。字符型数据必须要加“”。日期型:在Stata中,1960年1月1日被认为是第0天,因此1959年12月31日为第-1天,表示形式为:jan/10/2001或者10jan2001。案例数据情况案例数据情况文件:nerlove.xls/nerlove.dta来源:Nerlove-1963-Original.pdf,主要包括1955年美国145家电力企业的横截面数据数据格式:excel格式/stata格式参考文献:陈强:《高级计量经济学及STATA运用》,高等教育出版社,2010注:(陈老师主要采用Stata10,本课程采用Stata12,部分内容输出可能会有所不同)smcl是Stata日smcl是Stata日志文件,使用Stata打开;log则用记事本打开请跟随着上述要求操作nerlove.dta,下同注意要点解锁,方能输入内容形如summarize是Stata命令全称,而下划线部分su是实现该功能的最简短可识别命令,且Stata命令一般为小写,下同。相关系数命令是考察变量间关系的主要方式之一。散点图(scatter)是回归前考察变量之间关系的重要图形方法之一。StataStata简单作图简单作图STATA提供各种曲线类型,包括点(scatter)、线(line)、面(area),直方图(histogram)、条形图(bar)、饼图(pie)、函数曲线(function)以及矩阵图(matrix)等。同时,对时间序列数据有以ts开头的一系列特殊命令,如tsline。还有一类是对双变量的回归拟合图(lfit、qfit、lowess)等。lfit、qfit、lowess)等。Stata简单作图我们一般采用菜单形式。组合作图由于难度较大,一般采用命令不同类型图形用()或||隔开可查阅helpgraph或helptwowayStataStata组合作图组合作图重要实例*散点图+线性拟合直线twoway(scatterlogyh)(lfitlogyh)*散点图+二次拟合曲线twoway(scatterlogyh)(qfitlogyh)*散点图+线性拟合直线+置信区间twoway(scatterlogyh)(lfitlogyh)(lfitcilogyh)*按不同个体画出散点图和拟合线,可以以做出fevsre的初判断*(graph)twoway(scatterlogyhifid4)(lfitlogyhifid4)(lfitlogyhifid==1)(lfitlogyhifid==2)(lfitlogyhifid==3)*按不同个体画散点图*graphtwowayscatterlogyhifid==1||scatterlogyhifid==2,msymbol(Sh)||scatterlogyhifid==3,msymbol(T)||scatterlogyhifid==4,msymbol(d)||,legend(position(11)ring(0)label(1北京)label(2天津)label(3河北)label(4山西))label(3河北)label(4山西))**每个省份logy与h的散点图,并将各个图形合并twowayscatterlogyh,by(id)ylabel(,format(%3.0f))xlabel(,format(%3.0f))*每个个体的时间趋势图*xtlinehifid11,overlaylegend(on)实例实例twoway(scatteryx)(lfityx),title(不同可支配收入水平组家庭消费支出的条件分布图)xtitle(每月可支配收入(元))ytitle(每月消费支出(元))xtick(500(500)4000)ytick(0(500)3500)注意:Scatter表示散点图选项,lfit表示回归线,title表示题目,xtick表示刻度,(500(500)4000)分别表示起始刻度,中间数表示以单位刻度,4000表示最后的刻度,4000表示最后的刻度。要注意的是命令中的符号都要用英文字符,否则命令无效。generate命令也可写成g或者gen,如果是复杂函数则用egen命令生成变量。如果只是计算采用di,如果计算后生成变量则用gen或egen。下面比较display与predict命令Stata使用_b[varname]where表示某个变量的系数估计值,而常数项的估计表示为_cons◦display_b[_cons]+_b[x]*0.7209如果我们要计算出所有x对应的y的预测值,display_b[varname]命令命令如果我们要计算出所有x对应的y的预测值,可以使用刚才记住的系数计算完成◦geny_hat=_b[_cons]+_b[x]*x估计的残差项表示y的真实值与预测值之间的差异◦genres=y-y_hat◦listxy_hatyrespredictpredict命令命令一个更快的方法是在使用regress命令之后使用predict命令◦predictyhat◦predictres,resid◦predictres,resid检查一下答案是否一致:◦list◦listyyhatresStataStata简单数学运算简单数学运算主要命令:display或di,涉及变量的用gen或egen注意:display只输出结果并不保存结果,如要保存则可采用gen或egen1.1.代数运算代数运算包括加(+)、减(-)、乘(*)、除(/),幂(^)和负数(-),当遇到缺失值或者运算不可行时(比如除数为零)均会得到缺失值。例:di8/2/*计算8/2,结果为4*/di3^2、diln(2)、diexp(0)、disqrt(4)2.2.关系运算关系运算关系运算包括大于、小于、等于;不等于、不小于、不大于等多种比较关系。特别要注意到STATA中的等于符号为“==”,是两个等号连写在一起,不同于赋值时用的
本文标题:Stata操作实例
链接地址:https://www.777doc.com/doc-4693777 .html