您好,欢迎访问三七文档
STATA操作方法概述引言STATA简介STATA的发展历史STATA的界面结构STATA的主要特点与功能STATA的语法结构1《STATA应用高级培训教程》南开大学数量经济研究所王群勇引言规范性的研究包括两个核心的要素:理论模型和经验分析(统计分析、计量分析)。面临的问题:研究者经常地希望利用多种方法从不同角度对数据进行分析,但拥有绝对优势的软件是不存在的,不存在哪个软件能解决所有的问题。计量经济学发展迅速,新的方法层出不穷,而软件公司将这些新方法嵌入到软件中是存在滞后的。2《STATA应用高级培训教程》南开大学数量经济研究所王群勇引言解决方案:不同的软件各有所长,各有所短。学习、掌握多种软件。但是不同的软件在数据格式、操作方法、语法结构有很大区别,因此熟练掌握一种软件需要花费较长的时间。我们希望能够有一个相对较为综合的分析软件=Stata在统计、计量分析方面都非常出色。是否已有相应的程序供我们直接运行=Stata具有丰富的网络资源掌握软件的编程方法,自己编写程序=Stata具有简练、强大、快捷的编程和运算功能。Stata以其操作简单、运行快速而精确,全面的数据管理功能,精致的作图,强大的统计与计量分析功能,简练标准的程序与矩阵运算功能、丰富的网络资源,在统计学、经济学、金融学、心理学、计算机科学、物理、化学等多个学科领域得到广泛使用()。3《STATA应用高级培训教程》南开大学数量经济研究所王群勇STATA简介:发展历史Stata是一个用于数据管理和分析的统计软件,由Stata公司(StataCorp)研制开发。从1985开始,先后开发了1.1,1.2,…,等多个版本。目前Stata的最新版本为2009年7月份推出的Stata11.0。4《STATA应用高级培训教程》南开大学数量经济研究所王群勇STATA简介:发展历史Stata11包括四种版本:Small(小型版)、IC(标准版)、SE(特别版)和MP(多处理器版)。其中属MP版本最为强大。MP版与SE版的功能完全相同,但MP版的运算速度比SE版的要快很多。用户可以在命令栏输入about查看所安装的Stata所属的版本。不同版本对样本容量、变量个数、矩阵阶数、宏的字符长度等有着不同的限制。以SE版为例,其最大变量个数为32767,最大字符长度为244字节,最大矩阵阶数为11000(即1100011000)。Stata默认值为:最大变量个数为5000,最大矩阵阶数为400,最大内存为50兆(在Stata10中为10m)。如果用户需要更多的内存或者更多的变量,可以在命令栏输入如下命令进行扩展。.setmaxvar#(.setmaxvar5000最大变量个数5000个。).setmaxsize#(.setmaxsize1000最大矩阵阶数10001000。).setmemory#m(.setmemory50m分配内存50兆。)5《STATA应用高级培训教程》南开大学数量经济研究所王群勇STATA简介:界面结构6《STATA应用高级培训教程》南开大学数量经济研究所王群勇STATA简介:界面风格设置风格设置:Edit-Preference(右键-Preference)字体设置:(右键-Font)《STATA应用高级培训教程》南开大学数量经济研究所王群勇STATA简介:主要特点与功能统计分析与计量分析的结合单元统计:描述统计、假设检验(参数、非参数)、ANOVA、质量控制、统计作图多元统计:MANOVA、主成分、因子分析、典型相关、聚类、判别分析、对应分析、多维标度线性回归、非线性回归、工具变量回归、广义线性回归、分位数回归(稳健回归)、系统方程模型(SUR、联立方程)、离散选择模型(二项选择、排序选择、多项选择、条件Logit、嵌套Logit模型、二元选择模型等)、计数模型(泊松回归、负二项回归)、截断与归并模型、海克曼选择模型、逐步回归(stepwise)等。时间序列分析:时间序列的平滑、相关图、ARIMAX、GARCH、单位根检验、Johansen协整检验、VAR、VEC、滚动回归等。面板数据(线性模型、工具变量回归、动态面板、分层混合效应、广义估计方程(GEE)、随机边界模型等)。调查数据分析生存分析蒙特卡洛模拟、自举法(bootstrap)、刀切法(jackknife)Capability8《STATA应用高级培训教程》南开大学数量经济研究所王群勇STATA简介:主要特点与功能丰富的网络资源。://严谨、简练、灵活的程序语言。Stata提供了严谨、简练而灵活的程序语句,用户可以编写自己的命令和函数,也可以制作自己的对话框和窗口菜单。强大的矩阵运算功能:MataMata是Stata的矩阵运算语言,实现各种运算兼容性。在Stata中可以直接运行其它程序;其他语言编写的程序可以作为插件(Plugin)直接嵌入到Stata中。AddNewFeaturesExamplesUtilities9《STATA应用高级培训教程》南开大学数量经济研究所王群勇STATA简介:主要特点与功能Stata与EViews的比较(1)RegressonmethodOLSGLSNLS2SLSGMM(N)SUR3SLSMLEviewsyesyesyesyesyesyesyesyesStatayesyesyesyesyesyesyesyesQuantileStepwiseGLMHeckmanEviewsyes(6)yes(6)Statayesyesyesyes10《STATA应用高级培训教程》南开大学数量经济研究所王群勇STATA简介:主要特点与功能(2)StatisticalMethodANOVAParame-trictestNonpara-metrctestQuantitycontrolRandomSamplingSurveySurvivalEViewsyesyesyesyesyes(U)Statayesyesyesyesyes(U,M)yesyesMANOVAPCAFactorDiscrimi-nantClusterCorres-pondenceMDSCanonicalEViewsyesyes(6)Statayesyesyesyesyesyesyesyes11《STATA应用高级培训教程》南开大学数量经济研究所王群勇STATA简介:主要特点与功能(3)LimitedDependentBinaryMutino-minalOrderedNestedlogitCondi-tionallogitCountmodelZero-inflatedcountZero-truncatedcountEViewsyesyesyesyesStatayesyesyesyesyesyesyesyesCensoredTruncatedEViewsyesyesStatayesyes12《STATA应用高级培训教程》南开大学数量经济研究所王群勇STATA简介:主要特点与功能(4)TimeseriesSeasonaladjust-mentSmooth-ingARIMAUnitroottestCointe-grationVECMARCHFilterEviewsyesyesyesyesyesyesyesyesStatayesyesyesyesyesyesYes(11)M-GARCHStateSpaceEviewsyesyesStataYes(11)Yes(11)13《STATA应用高级培训教程》南开大学数量经济研究所王群勇STATA简介:主要特点与功能(5)PaneldataLinearLinearwithARIVLSDPDBinaryCountMultilevelmixedeffectGEEEviewsyesyesyesyesStatayesyesyesyesyesyesyesyesGLSRandomCoefficientStochasticFrontierTobitUnitroottestCointe-grationQuantileEviewsyesyesStatayesyesyesyesnetnet14《STATA应用高级培训教程》南开大学数量经济研究所王群勇语法结构基本格式:[byvarlist:]command[varlist][=exp][ifexp][inrange][weight][usingfilename][,options]其中,符号[]表示可选项。command为Stata的命令函数,varlist为变量,[ifexp]、[inrange]用于设定变量或观测值,[weight]用于设定观测值的权重,[usingfilename]表示使用的数据文件,options表示命令的选项,不同命令的选项也不同。[byvarlist:]表示对varlist(分类变量)中的每一类分别执行命令(command)。比如,线性回归模型的命令regress的格式为:.regressdepvar[indepvars][if][in][weight][,options]用户可以输入如下命令:.regressdeprdcpidrgdpifdepr2015《STATA应用高级培训教程》南开大学数量经济研究所王群勇语法结构(varlist)已存在的变量varlist表示若干变量。对于数据中存在的变量,允许的表达形式包括*、?和。其中,*表示任意字符,?表示一个字符,表示两个变量之间的所有变量(根据数据中变量的存放位置)。比如,数据文件中共有20个变量,依次为var1、var2、…、var20,则var*表示所有变量var1-var20,var?表示变量var1、var2、…、var9,var1-var6表示变量var1、var2、…、var6。新变量生成新变量时,变量名称不能简化。如果变量具有相同的前缀并且都以数字结尾,可以用-表示。比如,生成新变量V1、V2、V3、V4inputv1v2v3v4或者.inputv1-v4。16《STATA应用高级培训教程》南开大学数量经济研究所王群勇语法结构(varlist)上述运算符不区分大小写,可以重复,也可以进行各种组合。比如,L3.x也可以等价地表述为LLL.x、LL2.x、L2L.x。#可以为单个数,也可以为数列(numlist),表示对同一变量的多次运算。比如,L(1/3).GDP表示L.GDP、L2.GDP、L3.GDP。x可以为单个变量,也可以为多个变量,表示对不同变量的同一运算。比如L2.(GDPCS)表示L2.GDP、L2.CS。L(1/3).(GDPCS)表示L.GDP、L2.GDP、L3.GDP、L.CS、L2.CS、L3.CS。运算符含义例子备注L#.xx的#阶滞后。L3.x=xt-3一阶滞后可写为L.xF#.xx的#阶超前。F3.x=xt+3一阶超前可写为F.xD#.xx的#次差分。D2.x=(xt-xt-1)-(xt-1-xt-2)一次差分可写为D.xS#.xx的#阶季节差分S12.x=(xt-xt-12)一阶季节差分可写为S.x17《STATA应用高级培训教程》南开大学数量经济研究所王群勇语法结构(range)注:-#表示倒数第#个数。表达式含义例子#第#个观测值。第10个观测值:in10#1/#2第#1到第#2的观测值。前10个观测值:in1/10或inf/10#/l第#个观测值到最后一个观测值(last)。后10个观测值:in-10/-1或in-10/lf/#第1个观测值(first)到第#个观测值。从第21至第50个观测值:in21/5018《STATA应用高级培训教程》南开大学数量经济研究所王群勇语法结构(weight)命令格
本文标题:Stata入门手册
链接地址:https://www.777doc.com/doc-5591384 .html