您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 商业计划书 > Stata-A-dofiles中山大学连玉君教授stata初级讲义
Net_Course_A_contents-Printedon2010-4-1314:44:32Page1123*===================================4*计量分析与STATA应用5*===================================67*主讲人:连玉君博士89*单位:中山大学岭南学院金融系10*电邮:arlionn@163.com11*主页:*::第一部分::14*Stata操作15161718*=====================19*+课程目录+20*=====================21222324*=====================25*第一讲STATA简介26*=====================2728*1.1本课程简介29*1.1.1课程纲要30*1.1.2课程特点31*1.1.3课程配套资料32*1.1.4讨论和建议3334*1.2STATA概貌35*1.2.1stata界面36*1.2.2首次使用STATA的一些基本设定3738*1.3输入和导入数据39*1.3.1手动输入40*1.3.2从.txt,excel表格中粘贴41*1.3.3使用stata命令:infile,insheet,infix42*1.3.3.1以-tab-分隔的数据:-insheet-命令43*1.3.3.2以空格分隔的数据:-infile-命令44*1.3.3.3调入STATA格式的数据:-use-命令45*1.3.3.4调入Excel格式的数据:-xmluse-命令46*1.3.3.5行列对调的数据47*1.3.4时间序列资料48*1.3.5面板资料49*1.3.6STATA官方提供的资料50*1.3.7其它软件中的数据5152*1.4存储和导出数据53*1.4.1存储数据54*1.4.2导出和转换55*1.4.2.1-outfile-命令:导出为.raw文本格式56*1.4.2.2-outsheet-命令:导出为-Tab-分隔的文本文件57*1.4.2.3-xmlsave-命令:导出为XML格式58*1.4.2.4-dataout-命令:导出为Word,Excel,Tex59*1.4.2.5-outdat-命令:导出为.spss,.rats,.limdep格式6061*1.5浏览资料62*1.5.1变量的名称63*1.5.2查看资料的结构64*1.5.2.1更改变量的存储类型65*1.5.2.2-list-命令的使用66*1.5.2.3定义变量的显示格式67*1.5.2.4数据和变量的标签68*1.5.2.5附加说明文字69*1.5.2.6搜索变量70*1.5.3基本统计量71*1.5.3.1-summarize-命令72*1.5.3.2-codebook-命令73*1.5.3.3-inspect-命令74*1.5.3.4列表统计(table,tabulate)Net_Course_A_contents-Printedon2010-4-1314:44:33Page275*1.5.3.5论文格式的统计表格(tabstat)7677*1.6执行指令78*1.6.1概览79*1.6.2命令的适用范围80*1.6.2.1列举多个变量81*1.6.2.2样本范围的限制82*1.6.3命令作用的增减:使用选项8384*1.7修改资料85*1.7.1数学表达式86*1.7.2变量的创建和修改87*1.7.2.1变量的存储类型88*1.7.2.2创建新变量89*1.7.2.3修改旧变量90*1.7.2.4删除变量和样本值91*1.7.2.5移动变量窗口中变量的位置92*1.7.2.6克隆已有变量93*1.7.2.7拆分变量94*1.7.3样本值的排序9596*1.8log文件:记录你的分析过程97*1.8.1log文件简介98*1.8.2将log文件转换为网页99*1.8.2.1-log2html-命令:制作“单页”网页100*1.8.2.2-hyperlog-命令:制作“框架型”网页101*1.8.2.3其他命令102103*1.9do文档:高效快捷地执行命令104*1.9.1do文档简介105*1.9.1.1打开do文档编辑器106*1.9.1.2保存和关闭107*1.9.1.3执行do文档108*1.9.2合理规划你的do文档109*1.9.2.1一些基本规则110*1.9.2.2注释语句111*1.9.2.3断行112*1.9.2.4大型do文档的设定113*1.9.3列印文字114*1.9.3.1-display-命令115*1.9.3.2列印的颜色116*1.9.3.3列印的位置117*1.9.4关于编辑器118*1.9.5do文件的转换(制作网页教程)119120*1.10stata与Excel、Word、LaTeX的亲密接触121*1.10.1统计表格、矩阵的输出122*1.10.1.1输出基本统计量123*1.10.1.2输出相关系数矩阵124*1.10.1.3输出矩阵125*1.10.1.4其它说明126*1.10.2估计结果的输出127*1.10.2.1-esttab-命令:回归结果的呈现128*1.10.2.2-logout-命令:输出【Excel、Word、TeX文档】129*1.10.2.3-xml_tab-命令:专业输出【Excel文档130*1.10.2.4-outreg2-命令:专业输出【Word、Excel文档】131132*1.11Stata设定133*1.11.1Stata帮助134*1.11.2文件目录135*1.11.3Stata外部命令的获取136*1.11.3.1外部命令的存储路径137*1.11.3.2外部命令的获取方式138*1.11.3.3外部命令的管理和更新139*1.11.4Stata的系统参数140*1.11.5文件和文件夹的操作141*1.11.5.1文件的基本操作:查找、查看、复制、编辑和删除142*1.11.5.2使用stata打开-.txt-,-Word-,-Excel-,-iexplorer-文件143*1.11.5.2文件夹的操作144*1.11.6每次启动时均需执行的命令(profile)145*1.11.7常用快捷键146*1.11.8退出stata(exit)147148Net_Course_A_contents-Printedon2010-4-1314:44:33Page3149150*=====================151*第二讲数据处理152*=====================153154*2.1创建变量的更多技巧155*2.1.1_n和_N156*2.1.1.1_n与_N157*2.1.1.2_n与_N的应用158*2.1.2虚拟变量的产生159*2.1.2.1基本方式160*2.1.2.2基于类别变量生成虚拟变量:-tab-命令161*2.1.2.3基于类别变量生成虚拟变量:-xi-命令162*2.1.2.4因子变量(stata11的一大亮点)163*2.1.2.5将连续变量转换为类别变量164*2.1.2.6利用条件函数产生虚拟变量165*2.1.3交乘项的产生166*2.1.4-egen-命令167*2.1.4.1egen与gen的区别168*2.1.4.2产生等差数列:seq()函数169*2.1.4.3填充数据:fill()函数170*2.1.4.4产生组内均值和中位数171*2.1.4.5跨变量的比较和统计172*2.1.4.6变量的标准化173*2.1.4.7变量的平滑化(MovingAverage)174*2.1.4.8更多的egen()函数175176*2.2分位数177*2.2.1分位数的基本概念178*2.2.2-pctile-命令179*2.2.3-xtile-命令180*2.2.4-_pctile-命令181182*2.3重复样本值的处理183*2.3.1检查重复的样本组184*2.3.2标记和删除重复的样本组合185186*2.4缺漏值的处理187*2.4.1缺漏值简介188*2.4.2缺漏值的标记189*2.4.3查找/删除缺漏值190*2.4.3.1缺漏值的形态191*2.4.3.2删除缺漏值192*2.4.4填补空缺(gap)193*2.4.5多重补漏分析(multiple-imputation)194*2.4.5.1MI简介195*2.4.5.2实例分析196*2.4.5.3MIimputeregress的假设条件197*2.4.5.4其它补漏方法198*2.4.5.5假设检验199200*2.5离群值的处理201*2.5.1离群值的影响202*2.5.2查找离群值203*2.5.3离群值的处理204*2.5.3.1删除205*2.5.3.2对数转换206*2.5.3.3缩尾处理207*2.5.3.4截尾处理208209*2.6资料的合并和追加210*2.6.1横向合并:增加变量211*2.6.1.1一对一合并212*2.6.1.2多对一合并213*2.6.1.3一对多合并214*2.6.1.4一个例子215*2.6.2横向关联:-joinby-216*2.6.3纵向合并:追加样本217*2.6.4大型数据的处理218*2.6.5一些有用的外部命令219220*2.7重新组合样本221*2.7.1样本的转置222*2.7.2数据的横纵变换Net_Course_A_contents-Printedon2010-4-1314:44:33Page4223*2.7.3样本的交叉组合224*2.7.3.1-fillin-命令225*2.7.3.2-cross-命令226*2.7.4样本的堆砌227228*2.8文字变量的处理229*2.8.1文字与数字的相互转换230*2.8.1.1以文字类型存储的数字之转换231*2.8.1.2纯文字类别变量之转换232*2.8.2将数字转换成文字233*2.8.3文字样本值的分解234*2.8.4处理文字的函数235*2.8.4.1文字函数简介236*2.8.4.2例-1-:上市公司日期、行业代码和所在地的处理237*2.8.4.3例-2-:银企关系数据中银行名称的提取238*2.8.4.4例-3-:处理不规则的日期239240*2.9类别变量的分析241*2.9.1类别数的统计242*2.9.2交叉类别变量的生成243*2.9.3分组统计量244*2.9.3.1单层分组统计量245*2.9.3.2二层次和三层次分组统计量246*2.9.3.3多层次分组统计量247*2.9.4计算分组统计量的其它方法248*2.9.4.1-egen-命令249*2.9.4.2转换原资料为分组统计量:-collapse-命令250*2.9.5图示分组统计量251*2.9.5.1柱状图252*2.9.5.2箱形图253254*2.10时间序列资料的处理255*2.10.1简介256*2.10.1.1声明时间序列:tsset命令257*2.10.1.2检查是否有断点258*2.10.1.3填充缺漏的日期259*2.10.1.4追加样本260*2.10.2时序变量的生成261*2.10.2.1滞后项、超前项和差分项262*2.10.2.2产生增长率变量:对数差分263*2.10.2.3日期变量的处理264265*2.11面板资料的处理266*2.11.1声明面板资料:xtset命令267*2.11.2公司数目和年度的统计268*2.11.2.1面板资料的基本描述:xtdes命令269*2.11.2.2记录面板的资料形态:xtpattern命令270*2.11.2.3统计公司数目:panels命令271*2.11.3产生连续的公司代码272*2.11.4处理为平行面板273*2.11.5剔除IPO当年的数据274*2.11.6行业发生变更的公司27
本文标题:Stata-A-dofiles中山大学连玉君教授stata初级讲义
链接地址:https://www.777doc.com/doc-1795875 .html