您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > PPT-第2章-Stata入门-计量经济学及Stata应用
1© 陈强,2015年,《计量经济学及Stata应用》,高等教育出版社。第2章Stata入门2.1为什么使用StataStata软件因操作简单且功能强大,为目前在欧美昀流行的统计与计量软件,拥有众多用户。Stata公司定期升级软件,以适应计量经济学的迅猛发展。Stata软件还留有“用户接口”,允许用户自己编写命令与函数,并上传到网上实现共享。一些昀新计量方法,可在线查找和下载由用户编写的Stata命令程序(user-writtenStatacommands)。这些“非官方命令”(也称“外部命令”)的使用方法与官方命令完全相同,使得Stata的功能如虎添翼。2本教材使用Stata13版本(2013年6月发布)。对于绝大多数命令与功能,即使用更低的Stata版本(如Stata11或Stata12),也几乎没有差别。2.2Stata的窗口安装Stata13后,在安装的文件夹中将出现如下Stata13图标(Stata11或Stata12的图标大同小异),参见图2.1:图2.1Stata13的图标双击此Stata图标,即可打开Stata。3如想在电脑桌面创建开启Stata软件的快捷方式,可右键点击Stata13的图标,然后选择“发送到”→“桌面快捷方式”,参见图2.2。图2.2发送Stata13到桌面快捷方式4打开Stata后可看到,在昀上方有一排“下拉式菜单”(pull-downmenu),参见图2.3:图2.3Stata的下拉式菜单在Stata中运行单个命令主要有两种方式,其一为点击菜单,其二为在“命令窗口”输入命令。通过菜单执行命令(menu-driven)可能要点击多重菜单,通常还要填写对话框(dialog),以明确命令参数,不如在命令窗口直接输入命令方便。在菜单之下,为一系列图标,起着快捷键的作用,参见图2.4。5图2.4Stata的快捷键在快捷键图标之下,有五个窗口,参见图2.5。图2.5Stata13的主要窗口62.3Stata操作实例以数据集grilic_small.xls(Excel文件)为例,该文件包含30名美国年轻男子的教育投资回报率数据。1.导入数据首先,打开Stata软件,点击快捷键DataEditor(Edit)图标(参见图2.6),即可打开Stata的数据编辑器,参见图2.7。图2.6DataEditor(Edit)图标7图2.7Stata的数据编辑器其次,用Excel打开文件“grilic_small.xls”,会看到如下Excel格式的数据文件:8图2.8Excel表中的数据共有3列变量,分别为s(schooling,教育年限),expr(experience,工龄)与lnw(lnwage,工资对数)。9复制此Excel表中所有数据(Ctrl+C),粘贴到DataEditor中(Ctrl+V)。在DataEditor中会出现对话框,参见图2.9:图2.9DataEditor的对话框此对话框问你“第一行为数据还是变量名”,点击相应选择即可。10导入数据的另一方法是(特别在数据量很大的情况下),点击菜单“File”→“Import”,然后导入各种格式的数据,参见图2.10;但不如直接从Excel表中粘贴数据更为方便。图2.10使用Import导入数据11关闭DataEditor(Edit)后,会看到右上方的变量窗口出现了3个变量,分别为s,expr与lnw。点击快捷键Save图标(参见图2.11中鼠标位置,也可点击菜单“File”→“Save”),将数据存为Stata格式的数据文件(扩展名dta,为data的缩写),比如grilic_small.dta。图2.11Save图标此后可用Stata直接打开grilic_small.dta,无须再从Excel中导入数据。12打开Stata数据集的方式有两种。方法之一,点击快捷键Open图标(参见图2.12),寻找要打开的dta文件位置。图2.12Open图标方法之二,在命令窗口输入以下命令(假设文件grilic_small.dta在E盘的根目录),然后回车(按Enter键):.useE:\grilic_small.dta,clear逗号“,”之后的“clear”为“选择项”(option),表示可替代内存中的已有数据。13使用命令use打开dta数据文件,需输入此文件的路径;一般不如使用快捷键Open寻找此文件更为方便。如要关闭一个数据集,以便使用另外一个数据集,可输入命令.clear内存中数据将被清空,然后可再打开另一数据集。2.变量的标签在变量窗口,变量的“名字”(Name)旁边会显示其“标签”(label)。点击VariablesManager图标(参见图2.13),即可打开变量管理器,然后编辑变量名、标签等。14图2.13VariablesManager图标比如,将变量s的标签改为“schooling”,然后点击“Apply”(应用),参见图2.14。图2.14变量管理器的对话框15Stata严格区分大小写字母(casesensitive)。建议变量名使用小写字母,便于阅读。3.审视数据如想看数据集中的变量名称、标签等,可输入命令.describe其中,“describe”的下划线表示,可将该命令简写为“d”。Note:datasethaschangedsincelastsavedSortedby:lnwagefloat%8.0gexprfloat%8.0gsbyte%8.0gschoolingvariablenametypeformatlabelvariablelabelstoragedisplayvaluesize:270vars:3obs:30Containsdata16如想看变量s与lnw的具体数据,可使用命令.listslnwmore25.155.65224.115.77823.165.50122.125.14221.145.65220.166.13619.125.48118.155.84917.126.08216.166.17615.126.1214.126.35613.165.97912.125.49311.115.70410.125.4169.166.0688.165.8417.125.8236.125.4815.125.9644.166.1093.166.3152.114.8681.186.215slnw17在屏幕底端出现带下划线的英文字“more”,用鼠标单击“more”,可翻看下页的结果。如想连续滚屏显示命令运行结果,可输入命令.setmoreoff如又想恢复分页显示运行结果,可输入命令.setmoreon如只想对数据集的一部分子集执行命令,比如只看s与lnw的前5个数据,可使用命令.listslnwin1/55.125.9644.166.1093.166.3152.114.8681.186.215slnw18如要罗列从第11-15个观测值,可输入命令.listslnwin11/1515.126.1214.126.35613.165.97912.125.49311.115.704slnw也可通过逻辑关系来定义数据集的子集。比如,要列出所有满足条件“16s”(教育年限为16年及以上)的数据,可使用命令.listslnwifs=161930.166.07127.166.07123.165.50120.166.13616.166.17613.165.9799.166.0688.165.8414.166.1093.166.3151.186.215slnw“=”表示“大于等于”。其他表示关系的逻辑符号为“==”(等于),“”(大于),“”(小于),“=”(小于等于),“~=”(不等于,也可用“!=”表示)。一个等号“=”表示“赋值”,而两个等号“==”表示“等于”。20查看具体数据的直接方法是,点击DataEditor(Edit)图标,或右边的DataEditor(Browse)图标,参见图2.15。二者的区别在于,Browse只能看,不能改;而Edit还可改数据。图2.15DataEditor(Browse)图标如要删除满足“16s”条件的观测值,可输入命令.dropifs=16反之,如只想保留满足“16s”条件的观测值,可使用命令.keepifs=1621删除观测值之后,Stata不提供类似于MicrosoftWord的撤销(undo)命令。一般建议慎重删除数据,昀好先将原始数据备份。如想将数据按照变量s的升序排列,可输入命令.sorts.list2230.18.3846.21529.16.5565.97928.16.7986.31527.161.8725.84126.164.3636.13625.16.2776.07124.16.4786.17623.1606.06822.161.5116.07121.166.3635.50120.1606.10919.151.3745.84918.15.8465.75917.15.2555.65216.141.3785.65215.121.1915.96414.1205.14213.12.6925.48112.124.3335.48111.12.9165.41610.1210.0776.129.1205.1658.1205.4937.127.1286.3566.1205.8235.1205.5294.1206.0823.112.9625.7042.111.0065.7781.1114.868sexprlnw23命令sort无法按照变量的降序排列。如想按降序排列,可使用命令gsort:.gsort-s.list2430.1114.86829.111.0065.77828.112.9625.70427.1206.08226.1205.52925.1205.82324.127.1286.35623.1205.49322.1205.16521.1210.0776.1220.12.9165.41619.124.3335.48118.12.6925.48117.1205.14216.121.1915.96415.141.3785.65214.15.2555.65213.15.8465.75912.151.3745.84911.1606.10910.166.3635.5019.161.5116.0718.1606.0687.16.4786.1766.16.2776.0715.164.3636.1364.161.8725.8413.16.7986.3152.16.5565.9791.18.3846.215sexprlnw254.画图看数据的昀直观方法是画图。想看变量s的分布情况,可输入以下命令画直方图(参见图2.16):.histograms,width(1)frequency“histogram”表示直方图。选择项“width(1)”表示将组宽设为1(否则将使用Stata根据样本容量计算的默认分组数),选择项“frequency”表示将纵坐标定为频数(默认使用密度)。26051015Frequency1012141618schooling图2.16教育年限的直方图教育年限的分布呈双峰状,受12年教育的人数昀多(高中毕业),其次为受16年教育者(大学毕业)。27如想知道更多有关命令histogram选项与用法,可输入命令.helphistogram对于任何Stata命令,只要输入“helpcommand_name”即可查看该命令的“帮助文件”(helpfile)。如想考察教育年限与工资对数之间的关系,昀直观方法是画s与lnw之间的散点图,可输入命令(参见图2.17):.scatterlnws284.555.566.5lnw1012141618schooling图2.17教育年限与工资对数的散点图工资对数与教育年限似乎存在正相关关系。29如想在散点图上标注出每个点对应于哪个观测值,可先定义变量n,表示第n个观测值:.genn=_n“_n”表示第n个观测值。然后以变量n作为每个点的标签
本文标题:PPT-第2章-Stata入门-计量经济学及Stata应用
链接地址:https://www.777doc.com/doc-4096964 .html