stata命令总结

stata11常用命令注：JB统计量对应的p大于0.05，则表明非正态，这点跟sktest和swilk检验刚好相反；dta为数据文件；gph为图文件；do为程序文件；注意stata要区别大小写；不得用作用户变量名：_all_n_N_skip_b_coef_cons_pi_pred_rc_weightdoublefloatlongintinifusingwith命令：读入数据一种方式inputxy1425.536.247.758.5endsu/summarise/sumx或su/summarise/sumx,d对分组的描述：sortgroupbygroup:sux%%%%%tabstateconomy,stats(max)%返回变量economy的最大值%%stats括号里可以是：mean，count(非缺失观测值个数)，sum(总和)，max，min，range，%%sd，var，cv(变易系数＝标准差/均值)，skewness，kurtosis，median，p1(1％分位%%数，类似地有p10,p25,p50,p75,p95,p99)，iqr(interquantilerange=p75–p25)_all%描述全部_N数据库中观察值的总个数。_n当前观察值的位置。_pi圆周率π的数值。listgen/generate%产生数列egenwagemax=max(wage)clearuseby(分组变量)setmore1/0count%计数gsort+x(升序)gsort-x(降序)sortx升序；并且其它变量顺序会跟着改变labelvary消费%添加标签describe%描述数据文件的整体，包括观测总数，变量总数，生成日期，每个变量的存储类型(storagetype)，标签(label)replacex5=2*yifx!=3%替换变量值replaceage=25in107%令第107个观测中age为25renamey2u%改变变量名dropin2%删除全部变量的第2行dropifx==.删去x为缺失值的所有记录keepifx2%保留小于2的数据，其余变量跟随x改变keepin2/10%保留第2-10个数keepx1-x5%保留数据库中介于x1和x5间的所有变量(包括x1和x5)，其余变量删除cix1x2,by(group)%算出置信区间,不过先前对group要先排序，即sortgroup；%by的意思逐个进行cii123.8166670.2710343,level(90)%已知均值，方差，计算90%的置信区间cii102%obs=10,mean=2,以二项分布形式，计算置信区间centilex,centile(2.525507597.5)%取分位数correlate/corrxyz%相关系数pwcorrxy,sig%给出原假设r=0的命令%如果变量非服从正态分布，则spearmanxyregress/regmeanyear%回归方程建立regyx,noconstant%无常数项predictmeanhat%预测拟合值predicte,residual%得到残差estathettest%异方差检验dwstat%Durbin-Watson自相关检验vif%方差膨胀因子logityx1x2x3(y取0或1，是被解释变量，x1-x3是被解释变量)%logit回归probityx1x2x3(y取0或1，是被解释变量，x1-x3是被解释变量)%probit回归tobityx1x2x3(y取值在0和1之间，是被解释变量，x1-x3是被解释变量)%tobit回归skteste%残差正态性检验p0.05则接受原假设，即服从正态分布；%%sktest是基于变量的偏度和斜度(正态分布的偏度为0，斜度为3)swilkx%基于Shapiro-Wilk检验%%p值越小，越倾向于拒绝零假设，也就是变量越有可能不服从正态分布xi%生成虚拟变量tabulatgender,summ(math)%用gender指标对math进行分类，返回两类math的mean、std、freqtabulate=tab%genf=int((shengao-164)/3)*3+164组距为3tabulate变量名[,generate(新变量)missingnofreqnolabelplot]%%%%%generate(新变量)//按分组变量产生哑变量nofreq//不显示频数nolabel//不显示数值标记plot//显示各组频数图示missing//包含缺失值cell//显示各小组的构成比(小组之和为1)column//按栏显示各组之构成(各栏总计为1)row//按行显示各组之构成(各行总计为1)%%%%%求和，求最小？mod(x,y)%求余数means%返回三种平均值dinormprob(1.96)diinvnorm(0.05)dibinomial(20,5,0.5)diinvbinomial(20,5,0.5)ditprob(10,2)diinvt(10.0.05)difprob(3,27,1)diinvfprob(3,27,0.05)dichi2(3,5)diinvchi2(3,0.05)stackxyz,into(e)%把三列合成一列xpose,clear%矩阵转置appendusingd:\0917.dta%把已打开的文件（xyz）跟0917里的（xyz）合并，是竖向合并，即观察值合并；mergeusingD:\0917.dta%把已打开的文件（xyz）跟0917里的（ab）合并，是横向合并，即变量合并；formatx%9.2e%科学记数formatx%9.2f%2位小数%产生随机数%1产生20个在(0，1)区间上均匀分布的随机数uniform()setseed100setobs20genr=uniform()list%clear清除内存setseed200设置种子数为200setobs20设置样本量为20rangeno120建立编号1至20genr=uniform()产生在(0,1)均匀分布的随机数gengroup=1设置分组变量group的初始值为1sortr对随机数从小到大排序replacegroup=2in11/20设置最大的10个随机数所对应的记录为第2组，即：最小的10个随机数所对应的记录为第1组sortno按照编号排序list显示随机分组的结果也可以listifgroup==1和listnoifgroup==1%2产生10个服从正态分布N（100，6^2）的随机数invnorm(uniform())*sigma+uclear清除内存setseed200设置种子数为200setobs10设置样本量为10genx=invnorm(uniform())*6+100产生服从N(100，6^2)的随机数list画图注意有些图前面要加histogram直方图line折线图scatter散点图scatteryx,c(l)s(d)b2((a))graphtwowayconnectedyx连点图graphbar(sum)var2,over(var1)blabel(total)%条形图.graphbarp52p72,by(d).graphbarp52p72,over(d).graphbarp52p72,by(d)stack.graphbarp52p72,over(d)stack////////////数据如下%dp52p72%1163.227.4%272.583.6%357.2178.2histogramx,bin(8)norm%画直方图，加正态分数线graphpieaboabifarea==1,plabel(_allpercent)%画饼图graphpievar2,over(var1)plabel(_allpercent)%饼图graphpiep52p72,by(d)%饼图graphboxy1%箱体图qnormx%qq图lfityx%回归直线graphmatrixgendereconomymath多变量散点图lineyhatx||scatteryx,c(.l)s(O.)xline(12)yline(5.4)%线形图&散点图有一些通用的选项可以给图形“润色”：标题title(“string”)（string可为任意的字符串，下同）脚注note(“string”)横座标标题xtitle(“string”)纵座标标题ytitle(“sting”)横座标范围xaxis(a,b)（ab为两个数字，下同）纵座标范围yaxis(a,b)插入文字text（该命令既要指定插入文字的内容，也要指定插入的位置）插入图例legend（该命令既要指定图例的内容，也要指定其位置）绘制散点图和线条的两个主要的选择项为：connect(c...c)//连接各散点的方式，c表示：或简写为c(c...c).不连接(缺省值)l用直线连接L沿x方向只向前不向后直线连接m计算中位数并用直线连接s用三次平滑曲线连接J以阶梯式直线条连接||用直线连接在同一纵向上的两点II同||,只是线的顶部和底部有一个短横Symbol(s...s)//表示各散点的图形，s表示：或简写为s(s...s)O大圆圈(缺省值)S大方块T大三角形o小圆圈d小菱形p小加号.小点i无符号[varname]用变量的取值代码表示[_n]用点的记录号表示数学函数等都要与generate、replace、display一起使用，不能单独使用程序文件doused:\0917.dtaregyxcorryxlineyx,saving(d:\d4)按ctrl+D执行字符串操作函数：length(s)%长度函数，计算s的长度,如，displength(ab)的结果是2substr(s,n1,n2)%子串函数，获得从s的n1个字符开始的n2个字符组成的字符串,dispsubstr(abcdef,2,3)的结果是bcdstring(n)%将数值n转换成字符串函数，如，dispstring(41)+f的结果是41freal(s)%将字符串s转换成数值函数，如，dispreal(5.2)+1的结果是6.2upper(s)%转换成大写字母函数，如，dispupper(this)的结果是THISlower(s)%转换成小写字母函数，如displower(THIS)的结果是thisindex(s1,s2)%子串位置函数，计算s2在s1中第一次出现的起始位置,如果s2不在s1中,则结果为0。如，dispindex(this,is)的结果是3,而index(this,it)的结果是0trim(s)%去除字符串前面和后面的空格ltrim(s)%去除字符串前面的空格rtrim(s)%去除字符串后面的空格disign(x)%x0时取1,x0时取-1,x=0时取0；符号函数diint(x)%去掉x的小数部分,得到整数(取整函数)sum(x)%获得包括当前记录及以前的所有记录的x的和。缺失值(missingvalue)当0处理;求和函数max(x1,x2,...,Xn)忽略缺失值;最大值函数min(x1,x2,...,Xn)忽略缺失值;最小值函数float(x)%将x转换成浮点表示法。genyy=cond(x2,10,11)%条件函数cond(x,a,b)x可以是一个条件,x非0(条件成立)时取a,x为0(条件不成立)时取b。geny1=recode(x,2,5)%归组函数recode(x,x1,x2,...xn)geny2=autocode(x,3,-2,9)%autocode(x,ng,xmin,xmax)自动将区间（xmin,xmax）分成ng个等长的小区间，其结果是包含x值那个小区间的上界值t检验：gend=x-yttestd=0ttestx=y如果不配对ttestx1=x2,unpairedttestx1=x2,unequalunpaired已知样本均数、标准差和样本数进行t检验：ttesti211.280.920.2%检验均值是否等于0.2检验两组均数是

stata命令总结

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

以终为始的产品设计理念以及电子商务社区产品

(开盘一波流操盘)-三限下的房地产项目营销N

第五章金融中介市场

大同市南郊区西韩岭乡土地整理项目监理工作总结1

上海奔腾企业（集团）有限公司计划模块操作手册--xflou2004

翰威特项目建议书

某工程B展厅屋面电动天窗工程设计施工招标文件

工作分析和岗位说明书培训（精美模板值得下载！）（PPT45页）

相人有道_如何面试中高层管理人才讲师讲义(DOC 39页)

仪器生产企业材料会计职位说明书

相关文档

相关搜索