您好,欢迎访问三七文档
定量资料2【例4-1】2006年某市120名10岁男孩的身高(cm)资料如下。135.4139.8144.0147.3146.3142.5138.1143.6141.6152.6132.1144.7143.6146.8144.2141.3137.5142.8140.6150.4145.9140.2144.5148.2146.4142.4138.5148.9146.2155.4134.2139.2143.5141.6143.5142.3148.9143.6141.5151.1132.5138.7149.6146.9148.7141.5137.8142.7144.6151.8136.4140.0144.3147.5145.6142.5138.5143.7149.5153.6130.2138.9143.7146.5138.8141.7136.9142.0140.5150.3135.7145.7144.2147.8145.8142.6138.6143.8141.3153.9133.4139.6143.7147.5144.8148.0137.4142.1140.8141.8134.5139.4142.9147.5144.7141.8136.9143.5140.7151.4145.6147.3143.9141.9151.6145.6148.9144.3139.1145.8145.6145.3147.6148.6145.5137.3146.5140.3148.4136.5定量资料3【问题4-1】该组数据为何种类型资料?如何描述10岁男孩身高的数量特征?定量资料4本章主要内容频数表和频数图集中趋势的描述离散趋势的描述正态分布及其应用定量资料5第一节频数表和频数图定量资料6表达变量取值及其不同取值频数分布情况的统计表称为频数分布表,简称频数表(frequencytable)。频数表和频数图频数表定量资料7频数表的编制1.求极差(range)找出一组观察值中的最大值与最小值,其差值即为极差(或全距),用R表示。如例4-1中:R=155.4-130.2=25.2。频数表和频数图定量资料82.确定组数和组距(i)根据样本含量的大小及研究目的确定组数;一般设8~15个组。例4-1:i=25.2/10=2.52,取整数2做组距。频数表和频数图定量资料93.确定组段即确定每一组的起点(下限)和终点(上限)。起点称为下限(lowerlimit)终点称为上限(upperlimit)上限=下限+组距频数表和频数图定量资料104.归组计数,整理成表确定组段界限后,采用计算机或用划记法将各原始数据归入各组汇总,得出各组段的观察例数,也就是频数。频数表和频数图定量资料11表4-12006年某市120名10岁男孩身高(cm)的频数表身高(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106310.82.53.36.710.014.217.516.711.78.35.02.50.814816284566861001101161191200.83.36.713.323.337.555.071.783.391.796.799.2100.0合计120100.0——频数表和频数图定量资料12频数表的用途1.揭示资料的频数分布特征和频数分布类型频数分布的特征:集中趋势(centraltendency)离散趋势(dispersion)频数分布的类型:对称分布偏态分布频数表和频数图定量资料13肌红蛋白47.545.042.540.037.535.032.530.027.525.022.520.017.515.012.510.07.55.02.50.0人数121086420Std.Dev=10.75Mean=27.1N=91.00血清总胆固醇(mmol/L)5.755.505.255.004.754.504.254.003.753.503.253.002.752.502.2520100抗体滴度1250.01000.0750.0500.0250.00.03020100频数频数频数图1101名正常女子血清总胆固醇的频数分布图269例RA患者血清EBV-VCA-IgG抗体滴度的频数分布图3101名正常人血清肌红蛋白的频数分布血清肌红蛋白(μg/ml)正(右)偏态负(左)偏态对称分布定量资料142.便于进一步计算指标和统计处理可利用频数表计算百分位数、中位数、标准差等频数表和频数图3.便于发现某些特大或特小的可疑值。定量资料15频数图(graphoffrequency)是以变量值为横坐标、频数(频率)为纵坐标(不等距分组时以频率/组距=频率密度为纵坐标),以每个等宽的距形面积表示每组的频数(或频率)。频数表和频数图频数图定量资料16连续型定量资料:频数图中各距形是相连的,又称直方图(histogram);离散型定量资料:频数图中各距形是间隔的,又称直条图(bargraph)。频数表和频数图定量资料17图4-12006年某市120名10岁男孩身高的频数图频数表和频数图定量资料18第二节集中趋势的描述定量资料19定量资料集中趋势的描述,常用平均数(average)——表达一组同质定量数据的平均水平或集中位置。集中趋势的描述算术均数几何均数中位数众数调和均数定量资料20又称均数(mean),是用一组观察值相加除以观察值的个数所得。样本均数用,总体均数用。算术均数(arithmeticmean)x集中趋势的描述定量资料211.计算方法直接法:样本含量较少加权法:相同观察值较多或频数表资料12nxxxxxnn112212iikkkifxfxfxfxxffff集中趋势的描述定量资料22【例4-2】某医生测量了10名脑出血患者的血尿素氮(mmol/L)分别是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,试计算该组数据的均数。集中趋势的描述)/(3.7106.69.67.64.7Lmmolnxx定量资料23ifiifx【例4-3】根据表4-1资料,用加权法求120名10岁男孩身高的均数。身高(1)频数fi(2)组中值xi(3)fixi(4)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106311311331351371391411431451471491511531551313995401096166823973003290020581490906459155合计120()–17202()表4-22006年某市120名10岁男孩身高(cm)的均数计算表集中趋势的描述定量资料2412113131334135115517202143.35cm120iiikfxxffff2.应用均数适用于对称分布特别是正态分布资料。集中趋势的描述定量资料25是n个观察值乘积的n次方根,又称倍数均数,用G表示。几何均数(geometricmean)集中趋势的描述定量资料261.计算方法直接法:样本含量较少加权法:相同观察值较多或频数表资料集中趋势的描述1112lglglglglg()lg()nxxxxGnn11112212lglglglglg(lg()iikkkifxfxfxfxGffff定量资料27【例4-4】某实验室测得7人血清中某种抗体的滴度分别为1/4,1/8,1/16,1/32,1/64,1/128,1/256,试求平均滴度。集中趋势的描述111lg4lg8lg25610.5361lg()lg()lg1.50523277G定量资料28集中趋势的描述ifixlgixlgiifxiflgiifx【例4-6】50名麻疹易感儿接种麻疹疫苗后,测得血凝抑制抗体滴度资料见表4-3,求抗体的平均滴度。86.9977抗体滴度(1)频数(2)滴度倒数(3)(4)(5)1/41/81/161/321/641/1281/2561361013107481632641282560.60210.90311.20411.50511.80622.10722.40820.60212.70937.224615.505123.480621.072016.8574合计50--表4-350名麻疹易感儿血凝抑制抗体滴度定量资料29集中趋势的描述1111lg43lg87lg25686.9977lg(lg()lg1.73995413750G50名麻疹易感儿接种麻疹疫苗后血凝抑制抗体的平均滴度为1/54。定量资料302.应用及注意事项几何均数适用①对数正态分布②等比级数资料观察值中不能有0实验设计的基本要素定量资料31中位数与百分位数集中趋势的描述【例4-7】200名食物中毒患者潜伏期资料如表4-4,研究人员据此采用加权法计算均数得平均潜伏期为27小时。(1)该组数据在分布上有何特点?(2)用均数描述该资料的平均水平是否合适?定量资料32集中趋势的描述表4-4200名食物中毒患者的潜伏期潜伏期(小时)(1)频数(2)累计频数(3)累计频率(%)(4)=(3)/n0~303015.012~7110150.524~4914974.536~2817889.048~1419296.060~719999.572~841200100.0合计200--定量资料33中位数(median):将一组观察值由小到大排序后,居于中间位置的数值即为中位数,用表示。M中位数是一种位置平均数,它将全部数据排列成的有序数列平均分为两部分,小于和大于中位数的观察值个数相等,各占50%。集中趋势的描述定量资料341.中位数的计算(1)直接法:观察值个数较少集中趋势的描述(1)2nMx1221()2nnMxx定量资料35【例4-8】某实验师对10只小白鼠染毒后观察各小鼠的生存时间(分钟),得数据为:35,60,62,63,63,65,66,68,69,69,试计算小白鼠的平均生存时间。集中趋势的描述61265nxx12211()(6365)6422nnMxx6352xxn定量资料36(2)频数表法:频数表资料LM中位数所在组段下限MfLfi组距中位数所在组段的频数中位数所在组段前一组的累计频数)2(LMMfnfiLM定量资料37集中趋势的描述求:下表200名食物中毒患者的平均潜伏期潜伏期(小时)(1)频数(2)累计频数(3)累计频率(%)(4)=(3)/n0~303015.012~7110150.524~4914974.536~2817889.048~1419296.060~719999.572~841200100.0合计200--定量资料38集中趋势的描述(小时)8.23)302200(711212)2(LMMfnfiLM定量资料39百分位数(percentile):是指将一组观察值由小到大排序后,将其平均分成100等份,对应于每一分割位置上的数值就称为一个百分位数,用表示。集中趋势的描述xP定量资料40是一种位置指标,一个百分位数将一组观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。集中趋势的描述xP(%)xLxiPLnxff定量资料41【例4-10】根据表4-4,计算P25、P75。集中趋势的描述38.15)30%25200(711212)%(25LxfxnfiLP0.36)150%75200(281236)%(75LxfxnfiLP定量资料422.中位数与百分位数的应用中位数:偏态分布资料一端或两端无确切值总体分布不明百分位数:非正态分布资料集中趋势的描述定量资
本文标题:定量资料统计描述
链接地址:https://www.777doc.com/doc-8609225 .html