您好,欢迎访问三七文档
STATA硕士研究生班计量经济软件及应用对外经济贸易大学金融学院谢海滨InternationalBusinessSchool,UIBE第四讲、数据制图STATA是当前最为流行的统计计量分析之一STATA制图:-1.单变量作图-2.双变量作图-3.多变量作图-4.图形的合并-5.图形的美化第四讲、数据制图•频数分布图–1.价格直方图sysuseauto.dta,clearhistogramprice,bin(10)///ytitle(价格分布频率)///xtitle(价格:元)///scheme(s1mono)2.价格直方图,按产地分类sysuseauto.dta,clearhistogramprice,bin(10)by(foreign)///kdensity///ytitle(价格分布频率)///xtitle(价格:元)01.0e-042.0e-043.0e-04价格分布频率05,00010,00015,000价格:元01.0e-042.0e-043.0e-0405,00010,00015,00005,00010,00015,000DomesticForeignDensitykdensityprice价格分布频率价格:元GraphsbyCartype第四讲、数据制图•柱状图–1.纵向柱状图sysusecitytemp4,cleargraphbartempjulytempjan,over(division)over(region)nofill///bargap(-30)///ytitle(华氏温度)///legend(label(1七月)label(2一月))///title(七月和一月的平均温度)///subtitle(按地区划分)///note(数据来源:美国统计局,美国商务部)如果把graphbar改成graphhbar会是怎样的结果?020406080华氏温度N.E.N.CentralSouthWestN.Eng.MidAtlE.N.C.W.N.C.S.Atl.E.S.C.W.S.C.MountainPacific数据来源:美国统计局,美国商务部按地区划分七月和一月的平均温度七月一月第四讲、数据制图•饼状图–下面是某个班的学生平均成绩表,stu_ave.dta。现需要将学生成绩分为五档:90及以上为A,80到89之间为B,70到79之间为C,60到69之间为D,60分以下为F;用饼状图绘制出各档学生的比重。usestu_ave.dta,cleargenlevel=(ave_score=90)+2*((ave_score90)&(ave_score=80))///+3*((ave_score80)&(ave_score=70))+4*((ave_score70)&(ave_score=60))///+5*(ave_score60)//生成新变量level,level取值1~5labeldefinelevellb1A2B3C4D5F//用A~F指代1~5labelvalueslevellevellb//显示A~Flist//显示结果(请同学们自己运行这段命令)genindicator=1//生成示性变量indicator用来计数各档人数graphpieindicator,over(level)plabel(_allpercent)/////根据档位画出饼状图,并在图上标出各档位占比title(学生成绩各档占比%)///note(注释:A:90+,B:80~90,C:70~80,D:60~70,F:60-)///14.29%19.05%33.33%14.29%19.05%ABCDF注释:A:90+,B:80~90,C:70~80,D:60~70,F:60-学生成绩各档占比%IDnamegenderave_score1J10902J21703J30764J41655J51896J60347J70678J80899T107510T213511T316712T408713T507814T619115T719716M105617M217818K107519K218020K313521K4076第四讲、数据制图•散点图1.单坐标轴散点图useauto.dta,cleargraphtwowayscatterpriceweight或twowayscatterpriceweight或scatterpriceweight2.双坐标轴散点图useauto.dta,cleargraphtwoway(scatterpriceweight,///msymbol(oh)yaxis(1))(scatterlength///weight,yaxis(2))或twoway(scatterpriceweight,///msymbol(oh)yaxis(1))///(scatterlengthweight,yaxis(2))05,00010,00015,000Price2,0003,0004,0005,000Weight(lbs.)140160180200220240Length(in.)05,00010,00015,000Price2,0003,0004,0005,000Weight(lbs.)PriceLength(in.)第四讲、数据制图•带线性拟合的散点图useauto.dta,cleargraphtwoway(scatterpriceweight)///(lfitpriceweight)或twoway(scatterpriceweight)///(lfitpriceweight)05,00010,00015,0002,0003,0004,0005,000Weight(lbs.)PriceFittedvalues第四讲、数据制图•分类作图useauto.dta,cleartwoway(scatterpriceweight)///(lfitpriceweight),///by(foreign)比较与下面代码的区别useauto.dta,cleartwoway(scatterpriceweight)///(lfitpriceweight),///by(foreign,totalrow(1))如果将row(1)改成col(1)会得到怎样的结果?05,00010,00015,0002,0003,0004,0005,0002,0003,0004,0005,000DomesticForeignPriceFittedvaluesWeight(lbs.)GraphsbyCartype第四讲、数据制图•矩阵式制图•如果用户想一次性了解数据文件中某些变量两两之间的关系,那么可以使用graphmatrix命令(矩阵作图)。sysuseauto.dta,cleargraphmatrixpricempglengthgear_ratioPriceMileage(mpg)Length(in.)GearRatio5,00010,00015,0005,00010,00015,00010203040102030401502002501502002502.003.004.002.003.004.00第四讲、数据制图•如果用户想知道某一变量经过变换后的与正态分布的关系,那么可以使用ladder和gladder命令。下图是由下面的命令生成•sysuseauto.dta,clear•laddermpg•gladdermpg02.0e-054.0e-056.0e-058.0e-05020000400006000080000cubic05.0e-04.001.0015.002.00250500100015002000square0.02.04.06.0810203040identity0.2.4.6.834567sqrt0.511.522.533.54log051015-.3-.25-.2-.151/sqrt010203040-.08-.06-.04-.02inverse0100200300400-.008-.006-.004-.00201/square010002000300040005000-.0006-.0004-.000201/cubicDensityMileage(mpg)Histogramsbytransformation第四讲、数据制图•时序图•时间序列是一类特殊的数据结构,他是按照时间先后顺序收集到的数据样本。因此,在绘制时序图时要先确定标定时间先后的时间变量。•sysusetsline2,clear//导入时序数据文件tsline2•tssetday//用命令tsset来设定时间变量:day•tslinecalories,tlabel(,format(%tdmd))ttitle(Date(2002))340036003800400042004400CaloriesconsumedJan1Apr1Jul1Oct1Jan1Date(2002)第四讲、数据制图•图形构成•一般来讲,一个完整的图应包括以下要素:标题(主标题和副标题),坐标轴(横轴与纵轴)、图例、曲线(点/线/面)、脚注和插文。•sysuseauto.dta,clear•twoway(scatterpriceweightifforeign==0)///•(scatterpriceweightifforeign==1,msymbol(Sh)),///•title(主标题:价格与重量的关系)/////主标题•subtitle(副标题:1978年美国国产车和进口车)/////副标题•ytitle(纵坐标:价格)/////纵坐标•xtitle(横坐标:重量)/////横坐标•note(注释:数据来源于美国汽车行业协会)/////脚注•text(353400曲线类型:散点图)/////插文•legend(title(图形)label(1国产车)label(2进口车))/////图例•scheme(s2mono)//图形背景颜色曲线类型:散点图05,00010,00015,000纵坐标:价格2,0003,0004,0005,000横坐标:重量国产车进口车图形注释:数据来源于美国汽车行业协会副标题:1978年美国国产车和进口车主标题:价格与重量的关系第四讲、数据制图•图形美化•STATA提供了强大而丰富的图形绘制命令,掌握这些命令有助于用具绘制出优美的图形曲线。我们仅以一个例子来说明STATA绘图功能的强大,希望同学们能够读懂这个例子。请修改其中的部分命令,以便加深了解命令的功能。•sysuseauto.dta,clear•twoway(scatterpriceweight[fw=price]ifforeign==0,msymbol(o)///•mfcolor(green)mlcolor(red))(lfitpriceweightifforeign==0)///•(scatterpriceweight[fw=price]ifforeign==1,msymbol(th)///•mfcolor(black)mlcolor(pink))(lfitpriceweightifforeign==1),///•title(标题:汽车价格与汽车重量的关系)///•subtitle(副标题:国产汽车与进口车的差异)///•ytitle(汽车价格:美元)///•xtitle(汽车重量:千克)///•legend(position(12)label(1国产车)label(2国产车拟合值)label(3进口车)label(4进口车拟合值))///•note(数据来源:美国汽车协会)///•xlabel(1500(500)5000)///•xtick(1500(200)5000)///•ylabel(0(6000)18000)///•ytick(0(2000)18000)///•scheme(s2mono)06,00012,00018,000汽车价格:美元1,5002,0002,5003,0003,5004,0004,5005,00
本文标题:STATA第四讲
链接地址:https://www.777doc.com/doc-2647152 .html