您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > Stata-自学笔记
Stata笔记1.clear2.input3.save4.use5.sysuse6.d/des/desc/describe7.sum&returnlist&ereturnlist8.reg9.clearresults10.matrix11.type12.insheet13.rename14.infile15.browse16.xmluse17.compress18.xpose19.tsset20.outfile21.outsheet22.xmlsave23.变量清除内存数据。数据都是存入内存来计算的,所以在输入大量数据之前,要先清除内存中的数据来释放空间。删除的不光包括数据,还有变量,以及DataEditor中的数据。(就是删除所有数据,什么都不留)不影响已经存在硬盘上的数据。(只删除内存中的所有数据)Stata笔记1.clear具体使用方法在下文中有具体例子。手动输入数据。可以分五次输入,也可以直接复制到Command。inputxyx503020203050205260end保存数据。此项如果保存在C盘可能因为权限不够而报错。换到其他盘符即可。savedata_name[,replace]save名称[,如果之前已经有这个名称,则替换(覆盖)。]使用、导入(.dta)数据。usedata_name[,clear]use“file_path”[,clear]useurl[,clear]use名称[,清除。]2.input3.save4.use导入软件安装时自带的数据时用。sysuseauto,clear导入汽车数据。显示数据变量信息。(名称、类型等等)describe[,detail]sumpriceweightturn(以刚刚导入的汽车价格数据为例,priceweightturn为变量名称)显示一些相关信息。(观察值个数、平均数、最大最小值等等)5.sysuse6.d/des/desc/describe7.sum&returnlist&ereturnlistreturnlistreturn可以简写为ret返回更多信息(包括sum没有显示的)ereturnlistereturn可以简写为eret返回更详细的信息。e:estimate,估计回归分析。regpriceweightturnforeignreg变量名8.reg清除计算结果。就是刚才的return/ereturnlist的结果。但是变量并没有被清除。再次输入return/ereturnlist会发现已经没有任何输出。clearresults创建矩阵。matrixA=I(5)创建名称为A的5*5的矩阵。matlistA显示A矩阵。9.clearresults10.matrixmatdir显示有多少矩阵。clearmatrix清除矩阵。再次查看矩阵,一经发现没有了。以下是tab键为分隔符的数据。查看文件原始内容形式(.txt)。导入文件内容。一定要说明后缀名。insheetusingdata.txt,clear11.type12.insheet修改变量名称。renameold_var_namenew_var_name在导入的时候直接修改变量名称,同时也是批量(一定要对应)。不用一条条的修改。insheetapwtusingdata.txt,clear以下是space键(空格)为分隔符的数据。直接使用insheet导入无法识别所有变量,将其视为一个变量。13.rename14.infile如果非要用insheet导入,在最后加上delimiter选项。就可以正常导入了。insheetusingdatas.txt,cleardelimiter(”“)使用infile可以直接导入以空格为分隔符的数据。而不用指定delimiter。同时可以指定变量名。infilepwtusingdatas.txt,clear包含字符串的情况下:直接导入会出现错误。指定变量名的情况下,也会出现数据遗漏,文字都变成“·”。infilestr20v1intv2intv3intv4str10v5usingstrdata.txt,clearstr:字符串类型(文字)int:数值类型(数字)指定变量类型后,可以顺利导入。以逗号为分隔符的数据和上面一样。原始数据:导入:infilestr20v1intv2intv3intv4str10v5usingddata.txt,clear查看数据表内容。browse导入excel文件数据。旧版方式xmlusedata.xlsxdoctype(excel)clearfirstrow-本条命令是错误的提示无法识别这种文件类型。xmlusedata.xmldoctype(excel)clearfirstrow需要将excel另存为xml格式。然后再导入,就可以了。doctype:指定文件类型,firstrow:第一行作为变量。新版方式(StataMP15.0)importexcelusingdata.xlsx,clear直接导入excel,不用更改格式。15.browse16.xmluse精简优化资料的存储结构。(自动检测变量大小)(自适应)compress可以看到优化结果。同时browse可以发现name变量的宽度变小。对调数据(转置)。原始数据是横向的。insheetusingxpose.txt,clear导入数据。数据是横向的。17.compress18.xposexpose,clear要附加clear选项。设定变量。tssetdata设定时间变量。如图,使用系统数据,然后设定date为时间变量。结果显示:导出数据。空格为分隔符。outfileusingdata_auto,widereplacewide:解除每行80字符的限制,使每个观察值占一行。19.tsset20.outfile导出部分变量。outfilemake-priceforeignusingdata_auto,widereplace导出数据。Tab键为分隔符。outsheetmake-mpgusingdata_outsheet,replace导出数据。XML格式。21.outsheet22.xmlsavexmlsavedata_xmlsave,doctype(excel)replace1.命名规则:(1)英文字母,数字,下划线组成,长度不超过32。(2)不能以数字开头。(3)区分大小写。(4)尽量不要以_开头(虽然允许)。2.查看变量ds[,has(typeint)]显示所有变量中类型为int的。ds[,not(typebyte)]显示所有变量中类型不是byte的。ds[,detail]作用同des。23.变量3.查看/更改类型listgear_ratioin1/5显示gear_ratio变量前五个。dgear_ratio显示gear_ratio变量信息。下图中,%6.2f:%是定义格式前缀,6是整个变量最长占到6位,2是保留两位小数,f是fix简写,固定的格式。recastintgear_ratio,force更改gear_ratio变量类型为int。force强制更改。小数信息会丢失。仍然显示小数是因为显示格式没有改变。3.listlistprice[,sep(int)]显示price变量和值。sep:separate每隔多少行划一道分割线。默认为5。0就是没有分割线。listpricein1/30,sep(0)显示price前30个值。sep(0)没有分割线。sortrep78以rep78进行排序。listmakepricerep78in1/20,sepby(rep78)显示makepricerep78前20个,并以rep78的数据划分割线。listpriceweightlength,noobsnoobs,不显示结果前面的序号。方便复制。listpriceweightlength,noobscleanclean,去除边框。仅显示数据。
本文标题:Stata-自学笔记
链接地址:https://www.777doc.com/doc-1857643 .html