您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 电子设计/PCB > Stata简介及基本操作.ppt
Stata简介及基本操作一、为什么使用Stata?Stata是目前在欧美最为流行的计量软件,具有操作简单、功能强大的特点。由于使用Stata的用户很多,对于最新的计量方法,常常可以下载由用户写的Stata命令程序,十分方便。而官方的Stata版本也经常更新,以适应计量经济学迅猛发展的需要。Stata11已于2009年出版,但由于在中国普遍使用的仍是Stata10,我们主要介绍Stata10。1.面临的问题研究者经常地希望利用多种方法从不同角度对数据进行分析,但拥有绝对优势的软件是不存在的,不存在哪个软件能解决所有的问题。计量经济学发展迅速,新的方法层出不穷,而软件公司将这些新方法嵌入到软件中是存在滞后的。2.解决方案Stata以其操作简单、运行快速而精确,全面的数据管理功能,精致的作图,强大的统计与计量分析功能,简练标准的程序与矩阵运算功能、丰富的网络资源,在统计学、经济学、金融学、心理学、计算机科学、物理、化学等多个学科领域得到广泛使用。请浏览:简介:发展历史(1)Stata是一个用于数据管理和分析的统计软件,由Stata公司(StataCorp)研制开发。从1985开始,先后开发了1.1,1.2,…,等多个版本。目前Stata的最新版本为2009年7月份推出的Stata11.0。(2)Stata11包括四种版本:Small(小型版)、IC(标准版)、SE(特别版)和MP(多处理器版)。其中属MP版本最为强大。MP版与SE版的功能完全相同,但MP版的运算速度比SE版的要快很多。用户可以在命令栏输入about查看所安装的Stata所属的版本。(3)不同版本对样本容量、变量个数、矩阵阶数、宏的字符长度等有着不同的限制。以SE版为例,其最大变量个数为32767,最大字符长度为244字节,最大矩阵阶数为11000(即11000×11000)。Stata默认值为:最大变量个数为5000,最大矩阵阶数为400,最大内存为50兆(在Stata10中为10m)。如果用户需要更多的内存或者更多的变量,可以在命令栏输入如下命令进行扩展。.setmaxvar#(.setmaxvar5000最大变量个数5000个。).setmaxsize#(.setmaxsize1000最大矩阵阶数1000×1000。).setmemory#m(.setmemory50m分配内存50兆。)4.STATA简介:主要特点与功能统计分析与计量分析的结合:(1)单元统计:描述统计、假设检验(参数、非参数)、ANOVA、质量控制、统计作图。(2)多元统计:MANOVA、主成分、因子分析、典型相关、聚类、判别分析、对应分析、多维标度。(3)线性回归、非线性回归、工具变量回归、广义线性回归、分位数回归(稳健回归)、系统方程模型(SUR、联立方程)、离散选择模型(二项选择、排序选择、多项选择、条件Logit、嵌套Logit模型、二元选择模型等)、计数模型(泊松回归、负二项回归)、截断与归并模型、海克曼选择模型、逐步回归(stepwise)等。(4)时间序列分析:时间序列的平滑、相关图、ARIMAX、GARCH、单位根检验、Johansen协整检验、VAR、VEC、滚动回归等。(5)面板数据(线性模型、工具变量回归、动态面板、分层混合效应、广义估计方程(GMM)、随机边界模型等)。(6)调查数据分析(7)生存分析(8)蒙特卡洛模拟、自举法(bootstrap)、刀切法(jackknife)丰富的网络资源:://严谨、简练、灵活的程序语言:Stata提供了严谨、简练而灵活的程序语句,用户可以编写自己的命令和函数,也可以制作自己的对话框和窗口菜单。强大的矩阵运算功能:MataMata是Stata的矩阵运算语言,实现各种运算。兼容性:在Stata中可以直接运行其它程序;其他语言编写的程序可以作为插件(Plugin)直接嵌入到Stata中。二、Stata的窗口安装好Stata后,点击电脑桌面上的Stata图标,即可打开Stata。此时可以看到,在最上方有一排菜单,即“FileEditDataGraphicsStatisticsUserWindowHelp”。在此之下,有四个窗口,分别为:左上“Review”(历史窗口):此窗口记录着自启动Stata以来执行过的命令。左下“Variables”(变量窗口):此窗口记录着目前Stata内存中的所有变量。右上“Results”(结果窗口):此窗口显示执行Stata命令后的输出结果。右下“Command”(命令窗口):在此窗口输入想要执行的Stata命令。为了使屏幕分割更美观实用,可以用鼠标将以上窗口拉到任意大小与位置。然后点击菜单Edit”→“Preferences”→“GeneralPreferences”→“Windowing”→“Locksplitter”,就可以锁定当前画面,而在以后重启Stata时自动显示这个画面设置。Stata的主界面三、Stata操作1.将数据导入Stata打开Stata软件后,点击Data→DataEditor图标,即可打开一个类似Excel的空白表格。然后,用Excel打开文件“实验数据.xls”,复制文件中的相关数据,并粘贴到DataEditor中。导入数据的另一方法是,点击菜单“File”→“Import”,然后导入各种格式的数据。但这种方法有时不如直接从Excel表中粘贴数据来得方便直观。关闭DataEditor后,即会看到左下方的“Variables”窗口出现了8个变量,分别为year、gdp、index、index1978、gov、pop、deflator、gcons。此时,可以点击Save图标(也可以点击菜单“File”→“Save”),将数据存为Stata格式的文件(扩展名为dta),比如wanger_law.dta。这样,以后就可以用Stata直接打开这个数据集了(不需要再从Excel表中粘贴过来)。打开的方式有两种。可以点击Open图标(也可以点击菜单“File”→“Open”),然后寻找要打开的dta文件的位置。另外一种方法是在命令窗口输入以下命令(假设文件在E盘的根目录)并回车(按Enter键),useE:\wagner_law.dta,clear其中,选择项“clear”表示可以替代内存中的已有数据。如果要关闭一个数据集(如果对数据集进行了改动,别忘了先存盘Save),以便使用另外一个数据集,可以在命令窗口输入:.clear这样,内存中所有的当前数据都被清空,然后可以再打开另外一个数据集。2.变量的标签在变量窗口,每个变量的“名字”(Name)旁边显示了其“标签”(label)。但目前的标签过于简略,缺乏变量的解释信息。如果想将变量“gov”的标签改为“governmentexpenditures”,可进行如下操作。以鼠标的右键点击变量名“gov”,然后选择“Editvariablelabel”,输入“governmentexpenditures”即可。此时,再去看变量“gov”的标签,就已经改为“governmentexpenditures”。另外,在右上角的结果窗口出现了以下一行命令:.labelvariabletc`governmentexpenditures'这表明,直接在命令窗口输入上面这行命令,也能达到一样的效果,但不如直接在变量上点击右键操作方便。注意:Stata中字母的大小写是严格区分的,因此Stata建议对于变量名一律使用小写字母。3.审视数据一个数据集可能很大,而我们常希望看到数据的概貌。想看数据集中的变量名单、标签等,可以在命令窗口输入:.describe如果想给整个数据集加上一个标签,以说明这个数据集来自“WagnerLaw1978-2009”,可输入命令:.labeldataWagnerLaw1978-2009如果再次使用命令“describe”,就会看到数据集的标签“WagnerLaw1978-2009”。如果想看变量gov、gcons与gdp的具体数据,可使用命令:.listgovgconsgdp注意:如果数据较长,可用Ctrl+Break终止显示。有时我们想对数据集的一部分执行命令,比如只想看变量gov与gdp的前5个数据,则可输入命令:.listgovgdpin1/5也可以通过逻辑关系来定义数据集的子集。如果要列出所有满足条件“year≥1995”的变量gov与gdp的数据,则可以使用以下命令:.listyeargovgdpifyear=1995其中,“=”表示“大于等于”。其他表示关系的逻辑符号为“==”(等于),“”(大于),“”(小于),“=”(小于等于),“~=”或“!=”(不等于)。查看具体数据的一个直接方法是,点击DataEditor图标。如果想删除满足“year≥2001”条件的观测值,则可使用命令:.dropifyear=2001反之,如果只想保留满足“year≥2001”条件的观测值,而删去所有其他观测值:.keepifyear=20015.考察变量的统计特征如果想看变量gov、gcons和gdp的统计特征,可输入命令:.summarizegovgconsgdpVariableObsMeanStd.Dev.MinMaxgov3214454.1319217.21122.0976299.93gcons3211441.7612730.4148044396.9gdp3280670.9194125.313645.218340506.9满足条件的统计:.summarizegovgconsgdpifyear2000如果不指明变量,则将显示数据集中所有变量的统计指标。summarize如果要显示内存中某些变量之间的相关系数,可输入命令:.correlategovgconspopgdp5.画图Stata具有很强的画图功能。如果想看变量q的直方图(假定组宽为1000),可输入以下命令:.histogramq,width(8000)frequency05101520Frequency020000400006000080000governmentexpenditures0.00001.00002.00003.00004Density020000400006000080000governmentexpenditureskernel=epanechnikov,bandwidth=6128.97Kerneldensityestimate由于直方图不连续,如果想看连续的经验分布图,可使用以下命令:.kdensitygov如果要画gov与gdp之间的散点图,则可输入以下命令:scattergovgdp020000400006000080000governmentexpenditures0100000200000300000400000gdp如果想在散点图上同时画出回归直线,可以使用如下命令:.twoway(scattergovgdp)(lfitgovgdp)0200004000060000800000100000200000300000400000gdpgovernmentexpendituresFittedvalues其中,“lfit”表示“linearfit”(线性拟合)。6.生成新变量如果要估计以下方程:tttgdpgov)ln()ln(10为了估计这个方程,需要在Stata中对原变量取对数,可使用命令“generate”。.generatelngov=log(gov).generatelngdp=log(gdp).reglngovlngdp如果要生成“虚拟变量”,定义为:1995119950ttdumtStata命令为:generatedum=(ifyear=
本文标题:Stata简介及基本操作.ppt
链接地址:https://www.777doc.com/doc-7207237 .html