您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 医学统计学基础与科研分析思路
2009-07-231卫生统计学基础知识与科研资料分析思路22009-07-23内容医学统计学基础知识实验设计科研资料的分析思路2009-07-233第一部分医学统计学基础知识42009-07-23内容一、医学统计学的定义二、统计学中的基本概念三、统计工作的步骤四、常见的抽样分布五、描述性指标六、总体参数的估计七、假设检验52009-07-23一、医学统计学的定义统计学(statistics)是认识社会和自然界中随机现象的数量特征的一门科学。自然界中存在的各种现象可归纳为两类:必然现象在一定条件下必然发生的现象。(一定条件下其发生与否是确定的)随机现象在同一条件下进行实验,一次实验结果不确定,而在一定数量的重复试验后呈现统计规律性的现象。62009-07-23industrygovernmentbusinesseducationresearchfinancehealththenaturalworldStatisticsin...医学统计学的定义72009-07-23医学统计学(medicalstatistics)是运用概率论和数理统计学的原理与方法,研究医学和卫生学领域中随机现象有关数据的搜集、整理、分析与推断,进而阐明其客观规律的一门应用科学。医学统计学的定义82009-07-23二、统计学中的基本概念同质与变异变量总体与样本抽样误差概率92009-07-23同质与变异-同质(homogeneity)影响研究指标较大的、可以控制的主要因素尽可能相同。-变异(variation)同质基础上的各观察值间的差异称为变异。变异可理解为同质基础上的个体差异。基本概念102009-07-23变量-变量(variable)搜集资料时,先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量。-变量值(valueofvariable)变量的观察结果或测量值称为变量值,亦称为资料(data)-变量按其值的性质可分为不同类型。基本概念112009-07-23变量-变量的类型数值变量(numericalvariable)分类变量(categoricalvariable)-无序分类变量(unorderedcategoricalvariable)二项分类(binomial)、多项分类(multinomial)-有序分类变量(ordinalcategoricalvariable)基本概念122009-07-23变量数值变量其变量值是定量的,表现为数值大小,多有度量单位。由数值变量的测定值构成的资料称为计量资料(measurementdata)或数值变量资料(numericalvariabledata)。多数的数值变量为连续型变量,如身高、体重、血压;但有的数值变量的测定值只是正整数,如心率、白细胞计数等,在医学统计学中也视为连续型变量。基本概念132009-07-23变量分类变量表现为互不相容的类别或属性,亦称定性变量。-无序分类变量的各类别或属性之间无程度(或顺序)上的差别;所得资料称为计数资料(enumerationdata)或无序分类变量资料(unorderedcategoricalvariabledata);又有二项分类和多项分类之分。-有序分类变量的各类别之间有程度(或顺序)的差别。所得资料称为等级资料(rankeddata)或有序分类变量资料(ordinalcategoricalvariabledata)。基本概念142009-07-23变量注意!变量类型不是一成不变的,可根据分析的需要进行转化。例,白细胞计数原属数值变量若按正常、异常分组,则为无序分类变量;若按过低(4000)、正常(4000~10000)、过高(10000)分组,则为有序分类变量。分类变量也可数量化:有序分类变量可用0、1、2、3、4表示;无序分类变量可用哑变量(dummyvariable)表示。基本概念152009-07-23总体与样本总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体所包含的范围随研究目的的不同而变化。在医学科学研究中,研究对象可以是人、实验动物、微生物等;观察单位可以是一个地区、一个家庭、一个人、一只眼睛、一个细胞株、一个基因片段等。基本概念162009-07-23总体与样本有限总体与无限总体在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限的,称为有限总体(finitepopulation)。总体是假设的,无时间和空间的限制,观察单位数是无限的,称为无限总体(infinitepopulation)。基本概念172009-07-23总体与样本样本(sample)样本是按随机化原则从同质总体中抽取的部分观察单位其变量值的集合。样本须具有代表性。“代表性”的前提是来自同质总体、足够的观察单位数和随机抽样。样本中所含的观察单位个数称为样本含量n。随机化原则通常是指总体中的每个个体都有同样的机会被抽到样本中;但不同的研究目的,所采用的抽样方法不同,如单纯随机抽样、系统抽样、整群抽样和分层抽样等。基本概念182009-07-23总体与样本抽样研究的目的是用样本信息去推断总体特征。描述样本特征的指标称为统计量(statistics);描述总体特征的指标称为参数(parameter)基本概念192009-07-23抽样误差抽样误差(samplingerror)由于个体变异的存在,抽样研究时,样本的统计量与总体参数往往不等;即使若干个样本是从同一总体中随机抽取的,各样本统计量也往往不等。这种因抽样研究所引起的各统计量之间以及统计量与参数之间的差异,称为抽样误差。抽样误差在抽样研究中是不可避免的,但只要遵循随机化原则抽样的话,抽样误差的大小是可以估计的。基本概念202009-07-23抽样误差反映抽样误差大小的指标为标准误。常用标准误X(或XS)反映均数抽样误差的大小;用率的标准误p(或pS)反映率的抽样误差的大小;用Poisson计数的标准误(或X)反映其抽样误差的大小。基本概念212009-07-23概率随机事件概率小概率事件基本概念222009-07-23概率随机事件(randomevent)对随机现象进行实验或观察称为随机试验(randomtrial)。随机试验的各种可能结果的集合称为随机事件(randomevent),简称事件(event)。在一次随机试验中,某随机事件可能发生,也可能不发生;但在一定数量的重复试验后,某随机事件的发生与否是有规律的。基本概念232009-07-23概率概率(probability)是描述随机事件在一定条件下发生的可能性大小的一个度量,通常用P表示。对事件A,若有,则称A为必然事件;若,称A为不可能事件。随机事件A的概率为。1AP0AP10P基本概念242009-07-23概率小概率事件(smallprobabilityevent)若随机事件A的概率,则称随机事件A为小概率事件。其统计学意义是小概率事件在一次随机试验中认为不可能发生。“小概率”的标准是人为规定的。在医学统计学中,通常设;但对于可能引起严重后果的事件,如术中大出血等,可设,甚至更小。P05.001.0基本概念252009-07-23三、统计工作的步骤设计搜集资料整理资料分析资料262009-07-23设计(design)在保证科学性、可重复性和高效性的前提下,为验证研究假说而进行的周密安排。明确研究目的和研究假说,确定研究内容、观察对象与观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用。根据医学研究类型,有调查设计和实验设计之分。统计工作的步骤272009-07-23搜集资料(collectionofdata)遵循统计学原理原则:及时、准确、完整来源:①统计报表②经常性工作记录③专题调查(或实验)资料储存:所搜集的原始记录,要妥善保存,并定期备份复制。统计工作的步骤282009-07-23整理之前的资料称为原始资料(rawdata)目的:经科学分组与归纳,使原始资料系统化、条理化,便于计算统计指标和分析。过程:①准确性审查(逻辑审查与技术审查)和完整性审查;②拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;③统计归纳。整理资料(sortingdata)统计工作的步骤292009-07-23分析资料(analysisofdata)目的计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计描述(descriptivestatistics)用描述性指标、统计表与统计图等,对样本资料的数量特征及其分布规律进行描述。统计推断(inferentialstatistics)如何抽样?如何用样本信息推断总体特征。统计分析时,要根据研究目的、设计类型、样本含量、资料类型及其分布特征选择恰当的统计指标和分析方法。统计工作的步骤302009-07-23四、常见的抽样分布数值变量资料-u分布-t分布分类变量资料-二项分布-Poisson分布312009-07-23抽样分布ut分布和分布N(,2)XuN(0,1)标准正态分布以固定样本含量n抽样N(,2/n)XnXu/nsXt/Xt分布0t0u322009-07-23u值的分布称为u分布。对于u分布,1.96为5%界,即1.96之外的两尾端面积占总面积的5%,其间的面积占95%。抽样分布332009-07-23t值的分布称为t分布,由于s随n的增大渐稳定于σ,故ν越大,t分布越逼近u分布。抽样分布342009-07-23t分布的特征:1.以0为中心,左右对称的单峰分布;2.t分布曲线的形态变化与自由度的大小有关,t曲线为一簇曲线。自由度越小,t曲线的中间部分越低平,两端越伸展;随自由度的增大,t曲线逐渐逼近u曲线;当时,t曲线为u曲线。抽样分布352009-07-23由于t曲线是一簇曲线,(对应于每一个自由度,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律),故其5%界不像u曲线那样,并非一个固定值,记为,05.0t;须根据查t界值表。单侧:)(,ttP,或)(,ttP双侧:)()(,2/,2/ttPttP双侧概率P为单侧概率P的2倍。如,双侧30,10.0t单侧697.130,05.0t抽样分布362009-07-23t分布的分位数(t界值)122,/,/tttP22,/ttP/2/21-t/2,-t/2,22,/ttP,tt阴影部分表示的概率抽样分布372009-07-23,ttP1-t,1,ttPt分布的分位数(t界值)阴影部分表示的概率,tt抽样分布382009-07-23在医药卫生领域的许多研究中,人们感兴趣的常是某随机事件是否发生?如,某药治疗某病有效还是无效;某化验结果是阳性还是阴性;大鼠在毒理实验中的生存与死亡。这类试验称为“成败型”试验或Bernoulli试验。在医学统计学中,称之为二项分类变量,所获得的资料称为二项分类资料,简称为两分类变量或两分类资料。二项分类资料的抽样分布服从二项分布。抽样分布二项分布(binomialdistribution)392009-07-23二项分布的应用条件①试验中只有对立的两类结果,每一个观察单位只能发生两种对立结果之一(即两分类资料);②已知其中一类结果的发生率为,其对立结果的发生率为;③在同一条件下,n次试验是相互独立的,即各观察单位的观察结果相互独立。)1(抽样分布402009-07-23二项分布的定义在上述条件下,若从已知的总体中以固定n抽样时,出现阳性数X为0,1,2,…..,n的样本的概率服从二项展开式:n
本文标题:医学统计学基础与科研分析思路
链接地址:https://www.777doc.com/doc-4710925 .html