您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 冶金工业 > 医学统计学基本概念(马修强)
医学统计学(medicalstatistics)卫生统计学教研室马修强副教授2011-9-13名人名言学者不能离开统计学而研学;政治家不能离开统计学而施政;事业家不能离开统计学而执业;军事家不能离开统计学而谋略。——马寅初统计学的定义Asciencedealingwiththecollection,analysis,interpretationandpre-sentationofmessesofnumericaldata.(关于数据的收集、分析、解释和表达的学科)----Webster’sInternationalDictionary统计学的定义Thescienceandartofdealingwithvariationthroughcollection,classifi-cation,andanalysisinsuchawayastoobtainreliableresult.(通过数据的收集、分类和分析来处理变异以获得可靠结果的一门学科和艺术)----JohnM.Last,ADictionaryofEpidemiology统计学与医学统计学在医学方面应用的分支名称:生物统计学(biostatistics)医学统计学(medicalstatistics)卫生统计学(healthstatistics)医学统计学运用统计学原理和方法研究医学科研中有关数据的收集、整理和分析的应用学科。1.学会驾驭变异性(variation)变异性是社会和生物医学中的普遍现象。WHO报告中国期望寿命:平均71(岁)实际上每个人的实际寿命是不确定,有些用现有的知识可以解释,有些不能解释。统计试图为不能解释的问题(困惑费解的问题)提供线索和依据。统计学就是处理数据中变异的科学。为什么要学习医学统计学?Theoddsoffindingtwoidenticalfingerprintswere1in64billion.—FrancisGalton两个随机个体具有相同DNA图形的概率为3×10-11;如果同时用两种探针进行比较,两个个体完全相同的概率小于5×10-19。每支枪的枪管都有独一无二的特征,这种特征影响了它所发射的每一发子弹。—司法弹道学120名正常成年男子红细胞计数值(×1012/L)5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69120名正常成年男子红细胞计数直方图05101520252.63.23.84.45.05.66.2红细胞计数(1012/L)频数2.设计你的研究随机对照试验,RandomizedControlledTrial(RCT)不一定是最好的医学研究方法,但是最好的试验方法。国际生物医学杂志编辑协会一般要求(包含了统计学要求):UniformRequirementsforManuscriptsSubmittedtoBiomedicalJournals国际医学杂志编辑委员会对随机对照试验论文报告要求:CONSORT(ConsolidatedStandardsofReportingTrials)论文的统计学审查论文段(主题)序号论文段(主题)序号题目与摘要1统计学方法12序言2结果13方法与参与方3招募受试者14受试者4基线数据15干预措施5纳入分析的例数16结局指标6结局和估计值17样本量7辅助分析18随机数的产生8不良事件19随机分组(密封的方案)9局限性20随机的实施10可推广性21盲法11解释22在全世界报告的122个关于SelectiveSero-toninReuptakeInhibitors(SSRI)抗抑郁作用的RCT研究报告中,仅有一个(0.8%)报告符合CONSORT的描述规范。“良好愿望的医学”(well-meaningmedicine)转入“基于证据的医学”(evidence-basedmedicine,EBM)。所有临床试验的结果都是先有统计学结论(统计指标比较、P值),再给出专业结论。4.统计学结论是重要的科学证据之一统计学与数值计算统计学的结论是建立在正确的数值计算的基础上;数值计算可以由多种途径完成,如心算、手工计算、计算器、电脑(统计软件);使用统计软件仅仅是解决复杂统计计算的快速实现问题,其真正的精髓并不在于如何操作软件,而在于你是否具有足够的统计学知识选择合适的统计方法,并对结果作出合理的解释。产生的问题:1.数据的可靠性:数据造假问题2.统计方法的选择:误用非常严重舍恩(Schon)事件维克托·尼努夫化学元素发现造假事件黄禹锡事件数据造假2005年6月9日,《自然》杂志公布了一份令人震惊的调查结果。美国调查人员对3247名科学家的问卷调查结果显示:•约5%的科学家承认,由于得到的信息与他们正在进行的研究相抵触,他们曾丢弃某些数据;•10%%的科学家承认,他们在发表研究报告时,曾不适当地将自己或他人的名字列为作者;•超过15%的科学家承认,他们曾改变原来的设计或结果,或忽略一些观测以便使赞助商满意。统计方法的误用70%左右的文章有统计学错误;其中,70%的错误出在初等的、基本的统计学方法,30%的错误出在高等的、复杂的统计学方法。1966年,据对美国医师协会杂志(JAMA)等医学杂志的来稿的统计显示,149篇投稿论文中,仅有28%可以接受,67%有统计缺陷但尚可以纠正,5%不可救药。“生物统计学者是我们的可贵盟友。生物统计学不是远离我们的数学,而是现代医学的一门基本学科,就像大厦中的一个支柱”。--美国医师协会杂志编辑“非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险”。--Yates和HealyHowtoliewithstatistics--DarrellHuff如何用统计学说谎或统计数字会撒谎统计这种神秘的语言,在一个用事实说话的社会里是如此吸引人,但有时它却被利用并成为恶意夸大或迷惑他人的工具。统计方法和统计术语是必不可少的。但如果不能准确理解和恰当使用这些统计语言,不能正确了解其含义,统计结果只能是一堆废话。统计不仅是一门科学,更是一门艺术(加工、处理、升华)。统计学的几个基本概念同质与变异总体与样本参数与统计量变量与资料误差频率与概率同质:指事物的性质、影响条件或背景相同或非常相近。同质与变异(homogeneityandvariation)例:调查2010年上海市7岁男童的身高和体重同质:2010年、上海市、7岁男童变异:同质个体间测量结果的差异。变异:上海市7岁男童的身高和体重各不相同我的红细胞数比其他同事都低,该去医院看看了个体变异是普遍存在的。一种或多种不可控因素(已知的或未知的)作用下所产生的综合表现。变异是不可避免的。个体变异是有规律的。没有变异,就没有统计学!5.805.605.405.205.004.804.604.404.204.003.8035302520151050红细胞数(1012/L)150名正常成年男子红细胞数分布图人数同质与变异(homogeneityandvariation)总体(population)定义:根据研究目的确定的、同质的全部研究对象的观测值的全体。如研究18岁男青年的生长发育情况,指标为身高、体重,则所有18岁男青年的身高测量值为一个总体,体重测量值为另一个总体。有限总体(finitepopulation)如2011年上海市在校大学生无限总体(infinitepopulation)如高血压病人样本(sample)来自总体的部分研究对象的观测值。抽样(sampling):总体中的每个研究单位被抽取作为样本的过程。样本量(samplesize):样本包含的研究对象的个数。Today:18January2020参数:反映总体特征的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数。总体样本抽取部分观察单位统计量参数推断统计量:反映样本特征的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。SX、参数与统计量(parameterandstatistic)误差(error)误差的定义:实测值与真实值之间的差异误差的分类:随机误差(randomerror)非随机误差(nonrandomerror)系统误差(systematicerror)非系统误差(nonsystematicerror)随机误差由多种尚无法控制的因素引起的误差。无法消除或不可避免,但有规律可循。抽样误差(samplingerror)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。系统误差由可知的或可掌握的因素引起的误差。其值恒定不变或遵循一定变化规律,产生原因往往是已知或可能掌握的理论上可以通过周密的研究设计和严格的技术措施消除,实际操作上要看具体情况。实验者感觉或操作上的差异;仪器设备的测量精度;抽样不均匀,分配不随机等。举例:用动脉血压计测量某人血压(实际值为80mmHg),各次测量的均值为100mmHg。下图为系统误差和随机误差的示意图。随机误差80100舒张压(mmHg)系统误差发生频次血压计法测量舒张压值的分布非系统误差又称过失误差(grosserror)由研究者偶然失误造成的误差。可通过研究者的认真检查核对避免此类误差。仪器失灵记录错误(点错小数点、指标弄错等)确定性现象和不确定现象确定性现象:在一定条件下,必定会发生的现象。必然事件(P=1)和不可能事件(P=0)。随机现象:在同样条件下会出现两种或多种结果,事先不能确定可能发生何种结果的现象。在一定条件下可能发生的事件为随机事件(0P1)。频率与概率频率(relativefrequency):在相同条件下,独立地重复n次试验,随机事件A出现f次,则称f/n为随机事件A出现的频率。实验者Buffon(法)k.pearson(英)k.pearson(英)投掷次数40401200024000“正面”次数2048601912012频率0.50690.50160.5005频率与概率概率(probability):随机事件发生可能性大小的度量指标。当n趋近无穷大时,频率f/n始终在一个常数左右微小摆动,称该常数为随机事件A的概率用P表示,0P1。随着样本量的增加,频率越来越接近概率。只要观察单位数足够多,可将频率作为概率的估计值。Probability=Frequency?Patient:WillIsurvivethisriskyoperation?Surgeon:Yes,I'mabsolutelysurethatyouwillsurvivetheoperation.Patient:Howca
本文标题:医学统计学基本概念(马修强)
链接地址:https://www.777doc.com/doc-3149434 .html