您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 医学统计学-定量资料的统计描述
第二章:定量资料的统计描述引子:变量统计学医学统计学研究方法定性资料定量资料统计描述统计推断随机性现象概率论数理统计例2-2抽样调查某地120名18~35岁健康男性居民血清铁含量(μmol/L),数据如下:7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52目的:提取该组男性居民血清铁的分布信息。问题1.该组男性血清铁是怎样分布的?问题2.血清铁主要集中在哪个范围?频数表频数分布图问题4.变异情况?最高?最低?问题3.该组男性血清铁的平均水平?离散趋势集中趋势统计描述:从数据资料中获取信息最基本的方法把握资料基本的特征为统计分析打下基础频率表与频率分布图描述性统计指标统计表与统计图包括集中趋势的描述离散趋势的描述第一节频率分布表与频率分布图例2-2抽样调查某地120名18~35岁健康男性居民血清铁含量(μmol/L),数据如下:7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52求全距列表划记步骤:写组段定组距7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52⒈求全距(Range,简记R):是一组资料中最大值(Xmax)与最小值(Xmin)之差,亦称极差。R=Xmax-Xmin=29.64–7.42=22.22(μmol/L)2.定组距:将全距分为若干段,称为组段。每个组段有其上限和下限,上限和下限之差为组距,用小写i表示。原则:(1)“组段”数一般为10个左右,;(2)一般用等距分组;(3)“组距”一般为R/10取整。本例题:组距(i)=全距/预分组段=22.22/10=2.22≈23.写组段:即确定各组段的上、下限。原则:(1)第一组段要包括Xmin,最末组段包括Xmax;(2)每组段均用下限值加“~”表示,最终组段同时注明上下限。注:各组段连续但不能重叠,每一组段均为半开半闭区间。04.列表划记:用划记的方法整理原始资料,清点各组段内的数据频数。组段划记频率(1)(2)6~18~310~正612~正814~正正1216~正正正正2018~正正正正正2720~正正正1822~正正1224~正826~428~301合计120表2-2120名正常成年男子血清铁含量(μmol/L)频数另:用计算各组段的频率、累计频数和累计频率。频率直方图(frequencydistributionfigure):图2-2120例健康成年男子血清铁含量(μmol/L)的频率分布图0510152025血清铁(unol/L)频率(%)7911131517192123252729(三)频率分布表/图的用途:1.揭示资料的分布类型024681012血清铁(unol/L)频率密度(%)7911131517192123252729图2-2120例健康成年男子血清铁含量(μmol/L)的频率密度分布图对称分布频数分布偏峰分布正偏负偏集中部位在中部,两端渐少,左右两侧的基本对称,为对称(正态)分布。对称分布集中部位偏于较小值一侧(左侧),较大值方向渐减少,为正偏峰分布。集中部位偏于较大值一侧(右侧),较小值方向渐减少,为负偏峰分布。2.描述资料的分布特征离散趋势(tendencyofdispersion)集中趋势与离散趋势结合能全面反映频数的分布特征集中趋势(centraltendency)0510152025血清铁(unol/L)频率(%)7911131517192123252729分布特征4.样本含量足够大时,以频率作为概率的估计值。3.便于发现某些特大或特小的可疑值。5.作为陈述资料的形式。图3.1某市101名8岁男童身高(cm)的频数分布身高(cm)频数第二节描述集中趋势的统计指标算术均数几何均数中位数集中趋势:用于描述一组计量资料的集中位置,说明这种变量值大小的平均水平,常用平均数(average)表示。注意:1.同质的事物或现象才能求平均数平均数单峰对称分布(正态分布)对数正态分布偏态分布2.应根据资料分布状态选用适当的均数。(一)算术平均数(arithmeticmean)●简称:均数(mean)●使用条件:数据分布比较均匀呈正态分布或近似正态分布。●样本均数用符号:X表示●总体均数用符号:μ表示●计算方法有两种:直接法(小样本)和加权法(大样本)举例:某地10名18岁健康男大学生身高为(cm):168.7,178.4,170.0,170.4,172.1,167.6,172.4,170.7,177.3,169.7求平均身高?10X)(171.7cm=7169.4178.168.7+++=答:(1)直接法:方法:将观察值X1、X2、X3、……、Xn直接相加,再除以观察值的个数n。公式:nXnXXXXnin==+++=121适用范围:小样本资料,n30例2-2抽样调查某地120名18~35岁健康男性居民血清铁含量(μmol/L),求平均数:7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52(2)频率表法(加权法):计算各组段的组中值xi、fxi和Σfx答:57.181...31291...93710=++++++==ffXX(μmol/L)频率表法:方法:计算各组段的组中值xi、Σfxi,后除以总频数Σf。公式:适用范围:样本含量较大的数据集。nfXfffXfXfXfXkkk=++++++=212211算术平均数的适用范围:它适用描述一组性质相同的、单峰、且对称分布的(特别是正态分布的),且观察值之间差异不大的定量资料,此时均数最能反映分布的集中趋势,位于分布的中心。举例:设有5份血清样品,滴度分别为:1:1,1:10,1:100,1:1000,1:10000求其平均滴度。几何均数(二)几何均数(geometricmean,G)●概念:对一组观察值,先进行对数变换,按算术均数计算方法求其对数值的均数,该均数的反对数值即几何均数(G)。●使用条件:用于原始数据分布呈偏态分布,等比资料(倍数变化)或对数正态分布资料的平均数的计算。●表示符号:G●计算方法:直接法和加权法(1)直接法:方法:将n个观察值(X1,X2,X3,……Xn)直接相乘再开n次方。公式:适用范围:小样本资料nnXXXG=21用对数形式表示为:)lg(lg)lg...lglg(lg1211nXnXXXGn=+++=举例:设有5份血清样品,滴度分别为:1:1,1:10,1:100,1:1000,1:10000求其平均滴度。答:1001000010001001015=G=或G=lg-1((lg1+lg10+lg100+lg10
本文标题:医学统计学-定量资料的统计描述
链接地址:https://www.777doc.com/doc-6229247 .html