您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > STATA软件操作(四)分类与等级资料的统计分析
医学统计学实习课Stata软件的应用(4)——分类与等级资料的统计分析主要内容定性资料的描述定性资料的统计推断等级资料的统计推断定性变量的统计描述tabulate变量1变量2[,cellcolumnrownofreqmissing]tab分组变量,summ(数值变量)tab分组变量1分组变量2,summ(数值变量)cell打印每个格子的频数占总频数的百分比column打印每个格子的频数占相应列合计的百分比row打印每个格子的频数占相应行合计的百分比nofreq不打印频数missing缺失作为一类列出例1(数据集名“c1.txt”)有三组(group)患者,男女(sex)若干人,sex=1表示男性,sex=0表示女性。测得其血红蛋白浓度(x,%)xgroupsex1.3.9102.4.2103.3.7104.4105.4.410……tabgroupgroup|Freq.PercentCum.------------+-----------------------------------1|1240.0040.002|1136.6776.673|723.33100.00------------+-----------------------------------Total|30100.00tabsexsex|Freq.PercentCum.------------+-----------------------------------0|1550.0050.001|1550.00100.00------------+-----------------------------------Total|30100.00tabgroupsex|sexgroup|01|Total------------+----------------------+----------1|84|122|47|113|34|7------------+----------------------+----------Total|1515|30tabgroup,sum(x)|Summaryofxgroup|MeanStd.Dev.Freq.------------+------------------------------------1|3.8166667.93889033122|4.8727273.52932203113|3.7714286.585133267------------+------------------------------------Total|4.1933333.8823687930tabsex,sum(x)|Summaryofxsex|MeanStd.Dev.Freq.------------+------------------------------------0|4.1266667.8224238151|4.26.962734215------------+------------------------------------Total|4.1933333.8823687930tabgroupsex,sum(x)Means,StandardDeviationsandFrequenciesofx|sexgroup|01|Total------------+----------------------+----------1|3.81253.825|3.8166667|.903070091.1528949|.93889033|84|12------------+----------------------+----------2|4.854.8857143|4.8727273|.3872984.6256425|.52932203|47|11------------+----------------------+----------3|43.6|3.7714286|.43588989.68313003|.58513326|34|7------------+----------------------+----------Total|4.12666674.26|4.1933333|.8224238.9627342|.88236879|1515|30定性资料的统计推断总体率和事件数的可信区间估计卡方检验四格表卡方检验R×C表卡方检验配对四格表卡方检验仅有原始资料,统计量未知时统计量已知时ci变量名,binomial其他选项总体率的可信区间估计cii样本含量阳性数(阳性率),选项cii253cii253/25cii253/25,level(90)cix,binomialcix,binomiallevel(90)例2有人调查29名非吸毒妇女,出狱时有1名HIV阳性,试问HIV阳性率的95%的可信区间是什么?cii291—样本量阳性数cii291/29—样本量阳性率Variable|ObsMeanStd.Err.[95%Conf.Interval]-------------+-------------------------------------------------------------|29.0344828.033883.0008724.1776544仅有原始资料,统计量未知时cix,exposure(time)cix,exposure(time)level(90)统计量已知时ci变量名,exposure(暴露时间变量)其他选项总体平均事件数的可信区间cii观察单位数样本事件数,poisson[其它选项]例3将一个面积为100平方厘米的培养皿置于某病房,1小时后取出,培养24小时,查得8个菌落,求该病房平均每100平方厘米的面积细菌数的95%可信区间。cii18,poisson--PoissonExact--Variable|ExposureMeanStd.Err.[95%Conf.Interval]-------------+-------------------------------------------------------------|182.8284273.45415.76225等价:cinumexp(time)2×2卡方检验方法的选择卡方检验:(stata有)N≥40,T≥5校正的卡方检验:N≥40,1≤T5确切概率法:(stata有)N40或者T1似然比检验:(stata有)只要自由度1,无须关心理论频数考点tabulatevar1var2[fw=频数变量][,选择项]tabiab\cd[,选择项]四格表卡方检验卡方检验chi2(Pearson)2检验——假设检验lrchi2似然比2检验——假设检验gammaGoodman-Kruskal的系数——相关系数taubKendall的相关系数b——相关系数VCramer的列联系数V——相关系数all同时给出以上五种结果exactFisher的确切概率expected计算期望频数例4(数据集c4)两药治疗贫血有效率的比较组别有效人数无效人数合计试验组431053对照组401656合计8326109Tmin=T12=53*26/109=12.64也可以使用expected选项数据录入格式:rcf1143121021402216tabrc[fw=f],rowall|cr|12|Total-----------+----------------------+----------1|4310|53|81.1318.87|100.00-----------+----------------------+----------2|4016|56|71.4328.57|100.00-----------+----------------------+----------Total|8326|109|76.1523.85|100.00Pearsonchi2(1)=1.4115Pr=0.235likelihood-ratiochi2(1)=1.4231Pr=0.233Cramer'sV=0.1138gamma=0.2647ASE=0.213Kendall'stau-b=0.1138ASE=0.094tabi4310\4016,rowchi2exact|colrow|12|Total-----------+----------------------+----------1|4310|53|81.1318.87|100.00-----------+----------------------+----------2|4016|56|71.4328.57|100.00-----------+----------------------+----------Total|8326|109|76.1523.85|100.00Pearsonchi2(1)=1.4115Pr=0.235Fisher'sexact=0.2671-sidedFisher'sexact=0.168R×C表的卡方检验tabulatevar1var2[fw=频数变量][,选择项]tabiab\cd\ef\…[,选择项]多个率的比较多组构成比的比较例5-多个率的比较(数据集c5)某县防疫站观察三种药物驱钩虫的疗效,在服药后7天得粪检钩虫卵阴转率(%)如下,问三药疗效是否不同?药物阴转例数未阴转例数合计阴转率(%)复方敌百虫片2893775.7纯敌百虫片18203847.4灭虫灵10243429.4合计565310951.4tabi289\1820\1024,rowchi2exacttabrc[fw=f],rowalltabi289\1820\1024,rowchi2exact|colrow|12|Total-----------+----------------------+----------1|289|37|75.6824.32|100.00-----------+----------------------+----------2|1820|38|47.3752.63|100.00-----------+----------------------+----------3|1024|34|29.4170.59|100.00-----------+----------------------+----------Total|5653|109|51.3848.62|100.00Pearsonchi2(2)=15.5559Pr=0.000Fisher'sexact=0.000例6-构成比比较(数据集c6)某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,收集到资料如下表,问两组患者血型构成比有无差别?分组ABOAB合计鼻咽癌患者336565100眼科病人5414525125合计872010810225tabi336565\5414525,rowchi2tabrc[fw=f],rowalltabi336565\5414525,rowchi2|colrow|1234|Total-----------+--------------------------------------------+----------1|336565|100|33.006.0056.005.00|100.00-----------+--------------------------------------------+----------2|5414525|125|43.2011.2041.604.00|100.00-----------+--------------------------------------------+----------Total|872010810|225|38.678.8948.004.44|100.00Pearsonchi2(
本文标题:STATA软件操作(四)分类与等级资料的统计分析
链接地址:https://www.777doc.com/doc-4384996 .html