您好,欢迎访问三七文档
卫生统计学1本次串讲的说明•假设大家看完了教学光盘。•主要讲解考试大纲的内容。•按本科考试大纲讲解,专科学生可依据专科考试大纲跳过不考的内容。•不会象教学光盘中讲解的那样详细和系统。•同学们仔细看教学光盘中相关内容。•期末考试题型:客观题:35道单选题,70分主观题:3道计算题,30分2【第一章】基本概念31、频率在n次试验中,随机事件A发生了m次,则称为事件A发生的频率。例如:投一枚硬币算一次试验。共投了200次,事件A=“正面向上”发生了98次,则A发生的频率是:nm49.020098另一个人投了300次,事件A=“正面向上”发生了156次,则A发生的频率是:52.030015642、概率•频率的这种稳定性,揭示出一个随机事件发生的可能性有一定大小可言:频率稳定于较大的数值,表明该随机事件发生的可能性较大,频率稳定于较小的数值,表明该随机事件发生的可能性较小。•频率所接近的这个固定的的数值就是该随机事件发生可能性大小的一个客观的定量的度量,称为该随机事件的概率。5•概率:在n次试验中,随机事件A发生了m次,当加大n时,事件A发生的频率逐渐稳定在一个固定的常数附近,这个固定的常数叫事件A的概率。记作:P(A)。0≤P(A)≤1•在统计学上,习惯将P≤0.05或P≤0.01的事件称为小概率事件,表示该事件发生的可能性很小。•小概率事件:在一次观察中,可以认为不会发生的事件。63、总体和个体•总体:一个统计问题所研究对象的全体。个体:总体中的每一个单个成员。例如:研究Haier29寸彩电的质量问题。例如:某次研究进行随机抽样,测量得到北京市100名健康成年男子的血清总胆固醇值,则研究总体为?74、同质和变异•同质:总体中个体存在的共性。•变异:总体中个体存在的差异。•没有同质性就构不成一个总体供人们研究,总体内没有差异就无需统计学。85、样本•在一个总体中抽取的n个个体叫总体的一个容量为n的样本。•在一次抽取后,样本为具体的数值x1,x2,……,xn。统计学的任务就是由样本值来描述总体和推断总体。96、抽样•从总体中抽取样本的过程叫抽样。•从总体中抽取样本,一定要遵循科学原则。•一般来说,一个样本应具有代表性、随机性和可靠性,二个样本之间应具有可比性。10(1)代表性•就是要求样本中的每一个个体必须符合总体的规定。•这就要求对总体有一个明确的规定。这种规定是根据研究目的而具体确定的。(2)随机性•就是要保证总体中的每个个体有相同的几率被抽作样本。•重要的是要避免主客观的“偏性”。11(3)可靠性•即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。•由于个体之间存在差异,只有观察一定数量的个体方能体现出其客观规律性。如果根据少数几例就下结论,这种结论可靠性差,体现不了规律,可能被后人所否定。•每个样本的含量越多,可靠性就会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。•究竟需要多少例数,它与所观察的指标的变异程度有关。12(4)可比性•如果进行两个或多个样本之间的比较,那么要求每二个样本之间应具有可比性。•可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。•临床试验中:要求两组性别、年龄、病情、病程等无差异;动物试验中:要求两组性别、月龄、体重、种别等无差异。•对照组可以是空白组、安慰剂组、服用当前最好药物组。136、资料类型•医学统计资料一般可分为计量资料和计数资料两大类。•不同的统计资料应采用不同的统计分析方法。•计量资料:是对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般用度量衡单位表示。如:身高(cm)、体重(kg)、脉搏(次/分)、血红蛋白(g/L)等14•计数资料:男女治疗组5862对照组3129AOBAB急性34252131慢性2827193515•等级分组资料:痊愈、显效、好转、无效;-、+、++、+++;优、良、中、差;轻、中、重。痊愈显效好转无效治疗组3428166对照组231420916【第二章】集中趋势的统计描述17第二节描述集中趋势的统计指标•描述一组观察值集中位置或平均水平的统计指标。•常用的有算术均数、中位数、众数、百分位数。18一、算术均数•算术均数(mean),简称均数。x观察值是:nxnxnxxxxniin121nxxx,,,21•2,4,0,5,0,119(三)均数的应用•主要适用于对称分布或偏斜度不大的资料,尤其适合正态分布资料。•由于在计算均数时用到了每一个观察值,在偏态较大的情况下,算出的均值容易受到极大或极小值的影响,不能真正地反映分布的集中位置,这时应考虑改用其他方法。•12,13,12,14,12,15,500。20三、中位数中位数(median)是将n个观测值从小到大排列后,位置居于中间的那个数值。记为M。•当n为奇数时,中位数取位次居中的变量值。当n为偶数时,中位数取位次居中的两个变量值的均数。•例如:7名病人患某病的潜伏期(天)分别为2,3,5,6,7,9,15,则中位数M=6(天)。•例如:8名患者食物中毒的潜伏期(小时)分别为1,2,2,3,5,6,8,15,则中位数M=(3+5)/2=4(小时)。•中位数适用于各种分布类型的资料,尤其是偏态分布资料。•对于分布大致对称的资料,中位数接近于算术均数。21四、百分位数•百分位数(percentile),用PX表示。•将n个观测值从小到大排列,这n个观测值中有X%的观测值比PX小,有(100-X)%的变量值比PX大。•例如,第5百分位数P5的含义是:有5%个变量值比P5小,有95%个的变量值比P5大。22例如,第5百分位数P5的含义是:有5%个变量值比P5小,有95%个的变量值比P5大。最小值最大值P55%个95%个最小值最大值P55%个95%个23五、众数•众数(mode):在一组变量值中,出现次数最多的那个变量值即为众数。•例如,六个数据1,5,4,5,7,3,8的众数为5。24六、均数、中位数、众数的比较左(负)偏态分布均数中位数众数对称分布均数=中位数=众数右(正)偏态分布众数中位数均数25均数•易受极端值影响•数学性质优良•适用于对称分布或接近对称分布资料中位数•不受极端值影响•适用于各种分布类型的资料,尤其是偏态分布资料众数•不受极端值影响•具有不惟一性•适用于各种分布类型的资料,尤其是偏态分布资料26【第三章】离散趋势的统计描述27第一节描述离散趋势的统计指标变异:总体中个体存在的差异。甲组(kg):98,99,100,101,102。乙组(kg):80,90,100,110,120。这两组数据的均数都是100kg,但是两组的变异程度不同,或者说离散程度不同。•离散趋势的统计指标:描述一组变量值变异大小的指标。•常用的有:极差四分位数间距方差标准差变异系数28一、极差和四分位数间距(一)极差•极差(range)又称全距,记为R。•极差R=一组观测值的最大值和最小值之差。•反映个体差异的波动范围。•若极差大,说明该资料的变异度大;若极差小,说明该资料的变异度小。甲组:98,99,100,101,102(kg)。R=102-98=4(kg)乙组:80,90,100,110,120(kg)。R=120-80=40(kg)29•极差不能反映组内其它数据的变异程度。•极差是度量这组观察值的离散趋势的最粗略的指标。•一般仅适用于初步判断、观察值很少时,或与其他指标共同使用。•受两端极端数值的影响。•例如:1,23,22,22,20,21,23,15830(二)四分位数间距•四分位数是特定的百分位数。•若将全部变量值从小到大排序,划分为四等分:最小值最大值P25QL25%个Q=P75-P25四分位数间距Q25%个25%个25%个P50P75QU31•四分位数间距(quartilerange)记为Q。•四分位数间距是中间一半变量值的极差。•Q值越大,说明变异越大;Q值越小,说明变异越小。•不受两端极端值的影响。但仍未用到每一个具体的观察值。32二、方差和标准差(一)方差nxxnS222)(11•方差(variance),又叫均方差(meanofsquare)。•方差记为S2,MS。•观测值:x1,x2,……,xn。33ixx219896042999801310010000410110201510210404合计:50050010甲组(kg):98,99,100,101,102。5.2550050010151)(112222nxxnS34甲组(kg):98,99,100,101,102。(S2=2.5kg2)乙组(kg):80,90,100,110,120。(S2=250kg2)•反映一组变量值的的平均离散水平。•方差越小,说明数据的变异越小;方差越大,说明数据的变异越大。35(三)标准差nxxnS22)(11•标准差(standarddeviation)。记为S,SD。•观测值:x1,x2,……,xn。36甲组(kg):98,99,100,101,102。(S2=2.5,S=1.581)乙组(kg):80,90,100,110,120。(S2=250,S=15.811)•S越小,说明数据的变异越小;S越大,说明数据的变异越大。37三、变异系数变异系数(coefficientofvariation),记为CV。%100xSCV•变异系数是相对数,没有单位,更便于资料间的比较。•变异系数多用于下面两种情况变异程度的比较:1、观测指标单位不同时。如身高与体重的比较。2、均数相差较大时。如儿童身高和成人身高的比较。计算公式:38例3.3测得某地成年男子舒张压均数为77.5mmHg,标准差为10.7mmHg;收缩压均数为122.9mmHg,标准差为17.1mmHg。试比较舒张压和收缩压的变异程度。%8.13%1005.777.10CV%9.13%1009.1221.17CV舒张压收缩压两种指标的变异程度几乎没有什么差别。39第二节正态分布前一章的例2.1某地用随机抽样方法检查了140名成年男子的红细胞数。40正态分布的分布密度函数,即正态曲线的方程:其中:π≈3.14159,e≈2.71828。μ、σ为参数。X服从正态分布,记作:222)(21)(xexfx),(~2NX例如:)5,75(~2NX2252)75(251)(xexf575Sx415、正态分布曲线与X轴所夹面积=1。6、在μ土1.96σ范围内约为95%;在μ土2.58σ范围内约为99%;在μ土1.65σ范围内约为90%。42标准正态分布当μ=0、σ=1时:222)(21)(xexfx2221)(ueu43第三节医学参考值范围•医学参考值范围传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。•同属正常人也不能以某一个测量数据作为标准,而必须确定一个波动范围。一、医学参考值范围的概念442、正态分布法(1)如果某医学观测值过高或过低均属异常,则双侧95%参考值范围的下界值为、上界值为。Sx96.1Sx96.145例3.4若己算得某地正常成年男子红细胞数的均数为4.78×1012/L,标准差为0.38×1012/L,试估计该地成年男子红细胞数的95%参考值范围。正常成年男子的红细胞数近似服从正态分布,故可按正态分布法处理。又因红细胞数过多或过少均属异常,所以应计算双侧参考值范围。下限:上限:)/10(04.438.096.178.496.112LSx)/10(52.538.096.178.496.112LSxLL/1052.5~/1004.412124647(2)如果某医学观测值只以过低为异常,则单侧95
本文标题:卫生统计学PPT
链接地址:https://www.777doc.com/doc-3615067 .html