您好,欢迎访问三七文档
高级统计分析软件StataStata统计软件包是目前世界上最著名的统计软件之一,国外将Stata与SAS、SPSS一起被并称为三大权威软件。它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,几乎可以完成全部复杂的统计分析工作。Stata有什么优势?1。Stata的命令语句极为简洁明快,易学易记。2。强大的帮助信息。本地帮助Help命令名在线帮助Findit命令名3。始终处于计量经济学和统计学的最前沿。许多Stata程序员会针对计量经济学发展编写一些最新的程序(ADO文件),Stata提供了严谨、简练而灵活的程序语句,用户可以编写自己的命令和函数,同时可随时到Stata网站寻找并下载最新的升级文件。下载后可以直接使用,也可以自行修改、添加功能。(例如当前流行的面板单位根和面板门限数据,均可以安装下载使用)学习有什么困难?1。不同于以往的软件较多的运用菜单,Stata较多运用命令操作。(菜单很难记住和找到)。2。目前国内相关教材较少。3。有些计量方法需要编程(如极大似然估计),编程需要一定的计算机基础(不是我们学习的重点)。Stata的窗口介绍结果窗口:位于界面右上部,软件运行中的所有信息,如所执行的命令、执行结果和出错信息等均在这里列出。窗口中会使用不同的颜色区分不同的文本,如白色表示命令,红色表示错误信息。命令窗口:位于结果窗口下方,相当于DOS软件中的命令行,此处用于键入需要执行的命令,回车后即开始执行,相应的结果则会在结果窗口中显示出来。命令回顾窗口:即review窗口,位于界面左上方,所有执行过的命令会依次在该窗口中列出,选中某一行单击后命令即被自动拷贝到命令窗口中;如果需要重复执行,用鼠标双击相应的命令行即可。变量名窗口:位于界面左下方,列出当前数据集中的所有变量名称。其他窗口一般使用时会自动跳出。我们以auto数据源为例使用上述窗口。Stata的菜单介绍最重要的菜单项:Data菜单Graphic菜单Statistics菜单每执行一个菜单性会自动产生相应的命令。(我们以summarize和regress为例加以阐述)。我们的讲述以命令方式为主。Stata的文件最重要的有三类文件1。文件名.dta数据文件2。文件名.do命令文件3。文件名.ado程序文件文件的打开1。所有的系统示例数据可以利用sysuse命令打开。2。用户自己的统计数据需要用use命令打开。use命令默认打开C:\data或者D:\data中的数据。3。如果需要打开其他文件夹的数据,必须改变目录(例如,将自己的数据放入D:\abc)cdD:\abc”或者直接file------openStata命令的规定1。Stata的命令一定要区分大小写,除了极个别的情况下,stata命令全部用小写。2。大部分命令可以缩写。使用缩写可以使stata的命令书写大为简化:例如:display-------disummarize---sumdescribe------des得到正确命令缩写的简单方法:看help。几条最简单的命令use打开数据文件,一般加clear选型清空内存中现有数据。sysuse打开系统数据文件。describe描述数据edit利用数据编辑器进行数据编辑list类似于edit,但只能显示不能修改数据。display显示计算结果。经常写为:disummarize求某个变量的观察值个数、平均值、标准差、最小值和最大值。经常写为:sumscatter生成两个变量的散点图。setobs定义样本个数(使用前一定要用drop或者clear命令清空当前样本)generate建立新变量并赋值。经常写为gen简单的例子Summarize(sum)计算数据均数,标准差,最大值、最小值等Tab计算数据中频数和比例Stata数据处理1。Stata的数据格式为文件名.dta2。对于系统自带数据文件,任何情况下可以用sysuse命令打开。3。对于C:\data(或者D:\data)下的文件,可以使用use命令打开。4。放在其他目录的文件可以利用设置目录或者“打开”菜单打开。Stata数据类型数值型:用0、1、2…9及+、–(正负号)与小数点和()来表示。字符型:字符串变量由字母数字或一些特殊的符号组成(如地名、住址,职业等等)。注意:数字不表示大小信息,如电话、身份证号等。字符型数据必须要加“”。日期型:在Stata中,1960年1月1日被认为是第0天,因此1959年12月31日为第-1天,表示形式为:jan/10/2001或者10jan2001。Stata数据的录入1。直接录入。2。在Excel或者记事本文件编辑好后导入。numberenglishmathfinance100190769010028772801003768085Stata作图STATA提供各种曲线类型,包括点(scatter)、线(line)、面(area),直方图(histogram)、条形图(bar)、饼图(pie)、函数曲线(function)以及矩阵图(matrix)等。同时,对时间序列数据有以ts开头的一系列特殊命令,如tsline。还有一类是对双变量的回归拟合图(lfit、qfit、lowess)等。回归分析打开系统文件auto,建立如下方程:sysuseauto,clearregresspricempgweightforeign打开文件score,建立如下方程:usescore,clearregtestscrstr_cons698.9339.46749173.820.000680.3231717.5428str-2.279808.4798256-4.750.000-3.22298-1.336637testscrCoef.Std.Err.tP|t|[95%Conf.Interval]Total152109.594419363.030056RootMSE=18.581AdjR-squared=0.0490Residual144315.484418345.252353R-squared=0.0512Model7794.1100417794.11004ProbF=0.0000F(1,418)=22.58SourceSSdfMSNumberofobs=420结果分析回归后预测值的获得Predict1。拟合值的获得:predictyhat,xb或者predictyhat2。残差的获得predicte,residuals或者predicte,res谢谢
本文标题:stata简明教程
链接地址:https://www.777doc.com/doc-1832585 .html