您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 统计学案例分析-PPT课件
概念汇总案例讨论一案例讨论二案例讨论三案例讨论四1案例分析统计学封面封底案例分析概念汇总案例讨论一案例讨论二案例讨论三案例讨论四2案例讨论四案例讨论一案例讨论三案例讨论二ContentsPage目录页*概念汇总概念汇总案例讨论一案例讨论二案例讨论三案例讨论四3TransitionPage过渡页*概念汇总案例讨论四案例讨论一案例讨论三案例讨论二概念汇总案例讨论一案例讨论二案例讨论三案例讨论四4概念汇总1.均数(average):适用:对称分布或偏度不大的资料,尤其适合正态分布。1、算术均数(mean):2、加权均数:3、几何均数:2.中位数(median):观察值按照从小到大排列时,居中心位置的数值。适用于1、分布明显成偏态时,2、频数分布的一端或两端无确切数值时。不便于统计计算。M:中位数;LM:M所在组的上限;fL:M所在组之前积累的频数;fM:M所在组的频数;i:组距。3.百分位数(percentile):Px。在一组中找到这样一个数值P,全部观察值的x%小于P。P75、P25描述资料离散程度。4.众数:一组观察值中,出现频率最高的那个观察值。若为分组资料,则为频率最高组的组中值。适用于大样本,但粗糙。nXXnXfXnXlglgG1iffn5.0LPjMLM)(iffx%nLPxLxX)(1.1集中趋势的统计描述概念汇总案例讨论一案例讨论二案例讨论三案例讨论四5概念汇总1.2离散程度的统计描述1.极差(range,R):即全距。粗略。适用于任何分布。2.四分位数间距(quartile,Q):一组观察值按大小排序后,分成四个数目相等的段落,每个段落观察值的数目占总例数的25%。去掉两端含有极端数值的25%,取中间的50%的观察值的数据范围即为~。越大则数据变异越大。适用于偏态分布。Q=P75-P254.方差(variance):样本方差总体方差5.标准差(standarddeviations):适用于近似正态分布。p.s.1、可用于合并资料的直接计算2、与均数结合可以完整概括一个正态分布。1-nX-XSSS22)(NX-XSSS22)(SSSS2概念汇总案例讨论一案例讨论二案例讨论三案例讨论四6TransitionPage过渡页*概念汇总案例讨论四案例讨论一案例讨论三案例讨论二概念汇总案例讨论一案例讨论二案例讨论三案例讨论四7案例讨论一案例讨论一某年某课题组检测了某企业238名无工作也接触史工人的发汞含量(μmol∕kg),整理结果见下表,适对该企业工人发功水平进行统计描述。组段(μmol∕kg)组中值X0人数f频率(%)累计频数累计频率(%)1.5~2.5208.4208.43.5~4.56627.78636.15.5~6.56025.214661.37.5~~8.54820.219481.59.5~10.5187.621289.111.5~12.5166.722895.813.5~14.562.523498.315.5~16.510.423598.717.5~18.50023598.719.5~21.520.531.3238100合计—238100——为描述该企业工人发汞含量的平均水平和变异程度,某研究者采用算术平均数和标准差两个统计指标。按照频率表法计算算术均数为=1699/238=7.14(μmol∕kg)标准差为(μmol∕kg)因此该研究着认为该企业工人发汞的平均水平和变异程度为(7.14﹢/﹣3.23)μmol∕kg你认为这样统计描述恰当么?为什么?nXX32.31-23892.26141-nX-XSS22)(概念汇总案例讨论一案例讨论二案例讨论三案例讨论四8案例讨论一x经案例分析可知该发汞结果测定为偏态分布,因为均数(average)适用于对称分布或偏度不大的资料,尤其适合正态分布。标准差(standarddeviations)同样适用于近似正态分布。所以不能选用均数与标准差来计算该企业法功的平均水平与变异程度。因此通过统计描述类型的选择,中位数与四分位数间距更适合于描述变量值的平均水平与变异程度。iffn5.0LPMLM50)(Q=P75-P25概念汇总案例讨论一案例讨论二案例讨论三案例讨论四9案例讨论一综上所述:iffn5.0LPMLM50)(Q=P75-P25=8.85-4.70=4.15(μmol∕kg)=5.5+2/60(238*50%-86)=6.6(μmol∕kg)概念汇总案例讨论一案例讨论二案例讨论三案例讨论四10TransitionPage过渡页*案例讨论四案例讨论一案例讨论三案例讨论二概念汇总概念汇总案例讨论一案例讨论二案例讨论三案例讨论四11案例讨论二案例讨论二某单位1993年对1191名全体职工进行冠心病普查,按职业年龄分组统计,结果见下表,作者认为:该单位干部、工人的冠心病发病率均随年龄的增加而下降,发病率高峰都在40-50岁这一组,这与其他资料的结果不符。你同意上述分析么?请说明理由职业40~50~60~70发病人数合计发病人数发病率(%)发病人数发病率(%)发病人数发病率(%)干部2160925.7514.335工人1270.6423.515.917合计3363.5325611.552概念汇总案例讨论一案例讨论二案例讨论三案例讨论四12案例讨论二%100*单位总数可能发生某事件的观察数发生某事件的观察单位率K*平均人数同期内可能发生该病的观察期内新发病的例数发病率检查人口数时点现患病人数患病率%100*数各组成部分的观察单位数某组成部分的观察单位构成比概念汇总案例讨论一案例讨论二案例讨论三案例讨论四13案例讨论二职业40~50~60~70发病人数合计发病人数发病率(%)发病人数发病率(%)发病人数发病率(%)干部2160925.7514.335工人1270.6423.515.917合计3363.5325611.552首先,通过题目分析可知该题测得的不是发病率,而是相同情况下的构成比。构成比试强度指标,而不是频率指标,不能代表总体的情况,所以如下图应将发病率改为构成比。其次,题目给出进行冠心病普查的总人数,并不知道各组段的人数,所以不可能准确的求出发病率,只能表示40-50岁人群发病率所占的比重较大。所以,我们不同意题目分析!患病率概念汇总案例讨论一案例讨论二案例讨论三案例讨论四14TransitionPage过渡页*案例分析四案例分析一案例分析三案例分析二概念汇总概念汇总案例讨论一案例讨论二案例讨论三案例讨论四15案例分析三案例讨论三抽样调查某企业不同工种职工发生高血压病的情况,根据2827里受检者的结果,①该企业单位高血压发病率为7.5%,并随年龄增长递增,其中四十岁以上患者占全部病例的87.3%。②表中结果提示高血压发病率与工种有关,甲工种为9.0%,甲工种明显高于乙工种,(P<0.01),试对以上分析加以评述。年龄组(岁)甲工种乙工种受检人数病例数发病率(%)受检人数病例数发病率(%)20~33330.9712111.530~30141.314296.340~5176412.41852714.650~605768514.8611016.4合计172715691100575.2患病率概念汇总案例讨论一案例讨论二案例讨论三案例讨论四16案例分析三K*平均人数同期内可能发生该病的观察期内新发病的例数发病率K*检查人口数时点现患病人数患病率NPjijipN直接标准化法概念汇总案例讨论一案例讨论二案例讨论三案例讨论四17案例分析三原理:如果两组个体的年龄,性别,病情等变量在两组内分布存在差异,则粗死亡率,粗发病率,粗治愈率等不能进行直接比较,为了消除两组个体其他变量分布不同的影响,需要首先对两组数据做标准化处理。在该案例中,各年龄段的人数构成并不相同,所以需要做标准化处理。以甲乙两组合并作为标准人口,则标准化患病率为计算出结果后,乙甲,因此,该医生推断错误%95.617271100148.0*)57661(124.0*)517185(013.0*)301142(009.0*)333712(NPjijipN甲%86.817271100164.0*)57661(146.0*)517185(063.0*)301142(015.0*)333712(NPjijipN乙概念汇总案例讨论一案例讨论二案例讨论三案例讨论四18案例讨论三综上所诉①该企业单位的高血压患病率为7.5%,并随年龄的增长递增,其中40岁以上患者占全部病例的87.3%。②表中提示高血压的患病与工种有关。甲工种为6.95%,乙工种为8.86%,乙工种明显高于甲工种。%5.7%100*1100172757156*K检查人口数时点现患病率患病率%3.87%100*5715610278564*404040K岁以上检查人口数岁以上患病率时点现岁以上患病率①②③④%95.6NPjijipN甲%86.8NPjijipN乙概念汇总案例讨论一案例讨论二案例讨论三案例讨论四19TransitionPage过渡页*案例分析四案例分析一案例分析三案例分析二概念汇总概念汇总案例讨论一案例讨论二案例讨论三案例讨论四20案例分析四案例分析四小明和小聪竞选学生会主席。通过民意调查,小聪目前的支持率为43%,小明的支持率为41%,可谓旗鼓相当,小聪的竞选参谋彤彤根据调查结果绘制了一张条形图,用以反映目前两名竞争对手的支持率,改图作为小聪的竞选海报,请指出下图是否有不妥之处,改图作为小聪的竞选海报可能产生什么效果?支持率(%)概念汇总案例讨论一案例讨论二案例讨论三案例讨论四21案例讨论四该案例中,这张直条图给我们的感觉是小聪的支持率是小明支持率的两倍。小聪竞选成功的几率远高于小明。但实际小聪的43%与小明的41%仅相差2%。原理:直方图、累计频率分布图和直条图纵坐标要从0开始,而横轴刻度只需表示出观测值的实际范围即可,显然该图不符合,因此需要修改,以免产生误导。正确的图为:0%概念汇总案例讨论一案例讨论二案例讨论三案例讨论四22感谢收看请多指点谢谢观赏制作人:韩雪
本文标题:统计学案例分析-PPT课件
链接地址:https://www.777doc.com/doc-8347933 .html