您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > STATA软件应用(二)作图、统计描述
医学统计学实习课STATA软件的应用(2)——作图、统计描述STATA的作图作图命令GRAPHgraph[变量名][,图形类型通用选择项特殊选择项]图形类型histogram/*直方图,为缺省值。oneway/*一维散点图twoway/*二维散点图、线图matrix/*二维散点图阵bar/*条图、百分条图pie/*圆(饼)图box/*箱式图star/*星形图直方图:数值变量资料的分布0.05.1.15Density10203040Mileage(mpg)例ex7某地二个年份三种疾病的死亡率(1/10万)条图用等宽直条的长短来表示相互独立的各指标取值大小grap52p72,barby(d)条图0178.21952年1972年肺结核心脏病恶性肿瘤饼图主要表示全体中各部分的比重grap52p72,pieby(d)total/*total:增加合并的圆饼图饼图50%1952年50%1972年肺结核心脏病恶性肿瘤Total箱式图用于描述一组资料的中位数,四分位数及最大值、最小值的分布位置。箱式图120140160180BloodpressureMaleFemaleBeforeAfterBeforeAfter例ex6散点图:反应变量之间的关系graphyxgrayx,c(.)s(O)yx30396371线图grayx,c(l)s(d)yx30396371线图grayx,c(l[-])s(p)sortyx30396371线图grayx,c(J)s(.)sortyx30396371统计描述及区间估计定量资料的一般描述均数、标准差、百分位数、中位数summarize变量名[,detail]统计描述及区间估计百分位数centile变量名[,centile(#[#...])meansdccinormallevel(#)]detail/*详细描述,缺失时为简单描述centile(#[#...])/*指定需要计算的百分位数meansd/*指定百分位数用近似正态法,缺失时为直接算法cci/*指定百分位数的可信区间用保守算法normal/*指定百分位数的可信区间用近似正态法level(#)/*指定百分位数的可信区间的可信限原始数据某地100名成年男子红细胞计数(1012个/升)资料如下(例2.1)4.095.335.624.635.184.275.073.603.315.324.884.314.125.334.404.793.925.464.815.094.204.133.944.415.264.665.295.235.583.534.544.684.484.404.764.814.574.973.945.484.275.105.785.123.604.014.755.806.015.505.364.184.334.844.744.604.764.584.344.724.813.844.174.853.294.914.454.434.994.494.355.265.045.384.935.414.523.864.994.244.504.924.135.055.145.055.174.555.425.704.676.184.375.404.154.084.714.124.794.89ex3分析过程used:\ex3.dta“sumxsumx,detailcentilexcentilex,centile(10,20,30)频数图的制作例ex3used:\ex3.dtahistogramx,bin(10)freqxlab(3.2(0.3)6.2)ylab(0(5)20)norml(人数)b(红细胞)graphx,bin(10)freqxlab(3.2(0.3)6.2)ylab(0(5)20)norml1(人数)b1(红细胞)05101520Frequency3.23.53.84.14.44.755.35.65.96.2x人数红细胞红细胞人数统计描述及区间估计几何均数:means命令例2.35份血清的某种抗体效价分别为1:10,1:20,1:40,1:80,1:160求几何均数?统计描述及区间估计定性资料的一般描述按照分类变量给出频数和构成比tabulate变量名分类变量资料的描述单变量描述命令tabulate变量名,[missingnofreqnolabel]tab1变量1变量2变量3……[,missingnolabel]选项说明:missing/*包含缺失值nofreq/*不显示频数nolabel/*不显示数值标记分类变量资料的描述两个变量交叉分类描述tabulate变量1变量2[,cellcolumnmissingnofreqnolabel]tab2变量1变量2变量3……[,tabulate_options]选项说明:cell/*显示各小组的构成比(小组之和为1)column/*按栏显示各组之构成(各栏总计为1)row/*按行显示各组之构成(各行总计为1)例题例ex4used:\ex4.dta“tabgrouptabgroupsextabgroupsex,rowtabgroupsex,columntabgroupsex,cell分类变量与连续变量资料的综合描述tab分组变量,summ(数值变量)tab分组变量1分组变量2,summ(数值变量)例ex4tabgroup,sum(x1)tabgroup,sum(x2)tabgroup,sum(x1)nofreqtabgroupsex,sum(x2)统计描述及区间估计可信区间的估计ci变量[,level(#)binomialpoissonexposure(观察数变量)by(分组变量)total]cii观察数均数标准差[,level(#)]level(#)/*指定可信度,缺失时为95(%)by(分组变量)/*指定按分组变量分别估计均数的可信区间total/*指定除按分组变量估计可信区间外,还对整个数据估计,仅用于指定了by(分组变量)时统计描述及区间估计样本平均计数已知时cii观察数均数标准差[,level(#)]cii观察数阳性数[,level(#)]cii观察数事件数,poisson[level(#)]例:cii123.81670.9389cii102cii1034,poissonlevel(90)例ex4used:\ex4.dta“sortgroup/*在用by(分组变量)前,必须对分组变量排序cix1x2,by(group)练习(ex5.dta)请对某市1982年110名7岁男童的身高(cm)资料进行分析?数据集(ex5.dta)112.4119.3120.1116.4117110.8125.1115.4122.5121.5118.3116.3126.2124.4112.7114.8123.2114.8126.1113.2119.8123.5110.3122.8124.4122113116.3120117.7121.5116.8132.5117.4114.9121.8119.7125.6118.4123.8130.5128118.1122.4118.4117.2114.3123121119.5129.1120119.7120.6120.7112.3129.3114.7120.8119.6125.8114.9122.9118.9123.1120.1124.1120.7120.7120.2113116.3126.6120127.1122.8120.4124.1116.8112.2118118.5117.1119.8108.2114.3117.9114.3122.7122.1111.5125.2125.2120.8113.2120.5119.1116116.2130.8117.2125112.4119122.5118.2120.5121.2119.7120.3
本文标题:STATA软件应用(二)作图、统计描述
链接地址:https://www.777doc.com/doc-4384701 .html