您好,欢迎访问三七文档
第一章第一节中医药统计学的意义和内容1中医药统计学:是将数理统计学的原理和方法应用于生物医药特别是中医药科研,收集、整理和分析资料,推断不确定现象(随机现象)客观数量规律的一门应用学科。2中医药统计学的主要内容:(1)统计学基本原理(2)统计分析方法(统计设计、统计描述和统计推断、因素间的关系、生存分析、多元分析)第二节统计学发展及有关问题1、20世纪20年代,英国统计学家R.A.Fisher爵士(1890-1962)创立了实验设计方法和统计分析技术,奠定现代生物统计的基础。1948年,英国发表了评价链霉素治疗肺结核疗效的随机对照的临床试验报告,第一次采用生物统计方法进行临床干预试验。生物统计学方法在我国医学界的传播与运用始于20世纪初。1948年,郭祖超教授(1912~1999)编著的《医学与生物统计方法》,是我国第一部医学统计方法的教科书。2、评价链霉素治疗肺结核疗效试验目标总体:15~30岁肺双侧进行性肺结核患者样本人群:目标总体中的107例患者试验方法:将107例患者随机(尽可能保证两组患者的病情相同,见下表1)分为两组,分到试验组的55例患者用链霉素治疗,分到对照组的52例患者用常规疗法(主要是卧床休息)试验结果:6个月后,试验组的生存率为93%,对照组的生存率为77%。两组的生存率有较大差别,并且P0.05。应用统计学理论,可以得出链霉素对所有15~30岁肺双侧进行性肺结核患者都有效果的结论表1随机化分组后两组患者的病情比较表2两组疗效比较分组疗效合计生存率(%)分组身体状况血沉降/(mm.h-1)生存死亡好一般差0~11~21~50试验组5145593试验组81730031636对照组40125277对照组820241220293、医学论文中的统计:医学论文的两个作用:(1)通过撰写和发表论文,报告自己观察或试验的研究结果。撰写论文,要求我们对自己研究结果的数据资料能够正确地表达和分析。(2)阅读别人的论文,吸取新知识,了解学术进展。阅读论文,要求我们能够理解和评价别人研究成果的可信程度。4、医学论文中的统计学问题:60年代到80年代,国外医学杂志调查结果:有统计错误的论文20%~72%。国内1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。5、伪造统计数据违反科学道德:1976年NewScience(新科学)杂志关于科研舞弊行为的调查:(1)74%的调查表反映有不正当修改数据的情况(2)17%拼凑实验结果;(3)7%凭空捏造数据;(4)2%故意曲解结果。第三节统计学基本概念:1、同质与变异:同质:性质相同个体的同质性是构成研究总体的必备条件;研究内容不同,对同质的要求不同。变异:指同质的个体之间的差异(1)一种或多种不可控因素作用下所产生的反应的综合表现。(2)结果是随即的(无法正确的预测)。(3)个体变异是普遍存在的。(4)个体变异是有规律的(5)没有个体变异就没有统计学。同质与变异的例子:例1调查2003年沈阳市7岁男童的身高和体重例2研究某降压药的疗效同质:2003年(年份)、沈阳市(地区)、7岁同质:高血压患者、病情相近、用(年龄)男(性别)童某药治疗变异:身高和体重各不相同变异:疗效各不相同2、总体与样本:总体:根据研究目的确定的同质研究对象(个体)的全体(集合)。分有限总体与无限总体。样本:从总体中随机抽取的部分观察单位。随机抽样:为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。3、参数与统计量:(1)参数:总体的统计指标,如总体均数μ、标准差σ,采用希腊字母分别记为μ、σ。固定的常数。(2)统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。4、抽样误差:抽样误差:由随机抽样造成的样本统计量和总体参数间的差异。原因:个体变异+抽样表现:(1)样本统计量与总体参数间的差别(2)不同样本统计量间的差别(3)抽样误差是有规律的5、随机变量:随机变量(变量):对某项变异进行观察或测量得到的指标(个体观察指标)变量值(观察值):变量的观察结果特征:不确定性、规律性6、变量的表示:变量(variable),统计上习惯用大写拉丁字母表示,如X、Y、Z、…。变量值习惯用小写拉丁字母表示,如性别x1=1(男)、x2=1(男)、x3=0(女)、…。7、医药统计中的变量类型(1)按取值结果分类:离散型——取值为有限个连续型:取值可充满某个区间(2)按观察指标的性质分类:定量变量:计量变量分类变量:二分类变量、多分类变量(无序分类变量(名义变量)、有序分变量(等级变量)8、医药统计中的资料类型定量资料:计量资料分类资料:二分类资料:计数资料多分类资料:无序分类资料:计数资料有序分类资料:等级资料9、概率与频率确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。随机事件的特征:①随机性;②规律性:每次发生的可能性的大小是确定的。10、频率与概率概率probability:描述随机事件发生的可能性大小的数值,用大写的P表示;取值[0,1]。频率frequency:样本的实际发生率。设在相同条件下,独立重复进行n次试验,事件A出现m次,则事件A出现的频率为m/n。(0≤m/n≤1)11、小概率事件必然事件P=1P≤0.05(5%)或P≤0.01(1%)称为小概不可能事件P=0率事件(习惯),统计学上认为小概率事随机事件0P1件在一次抽样中不大可能发生。12、频率与概率间的关系:(1)频率是统计量,反映样本特(2)随着样本含量n增大,频率将稳定在一个常数------概率(3)概率是频率的稳定值。是总体参数,刻画总体特征(4)n足够大时,频率近似概率掷币实验:当实验次数很大时,出现正面的频率逐渐趋于稳定(稳定于0.5)13、统计描述与统计推断统计描述:通过统计指标、统计图、统计表等方法来描述资料的特征(分布的形状、集中趋势、离散趋势)统计推断:包括参数估计与假设检验14、常用的统计表:由标题、标目、线条、数据等四部分组成。分为:简单统计表(分组变量1个)、组合统计表(分组变量多于1个)。常用的统计表:频数表、列联表等。15、常用的统计图:直条图、直方图、百分条图、圆形图、普通线图、箱图、散点图、回归线图、生存线图等。16、常用的统计指标:计量资料:均数、中位数、标准差等计数资料:率、构成比、相对比等变量间关系:相关系数、回归系数等第四节变量及资料类型1、计量资料:对观察对象测量指标的数值大小所得的资料,即为计量资料,也叫定量资料。特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)2、计数资料:按某种属性分类,然后清点每类的数据,称计数资料,也叫定性资料。特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女)3、等级资料:半定性或半定量的观察结果。有大小顺序,所以也叫有序分类资料。1)癌症分期:早中晚。2)药物疗效:治愈好转无效死亡3)尿蛋白:++,+++及以上4、三类资料间关系例:一组2040岁成年人的血压(计量资料)8低血压8正常血压12轻度高血压15中度高血压17重度高血压(等级资料)以12kPa为界分为正常与异常两组,统计每组例数(计数资料)第五节统计工作的基本步骤1、统计设计:(1)包括调查、实验设计。运用医学统计学的起点,也是高质量地完成整个研究的重要础。(2)收集资料:在研究设计基础上,通过试验或调查,取得准确可靠的原始资料(3)整理资料:对资料进行清理、改错,数量化(4)分析资料:包括统计描述、统计推断。将所得数据进行统计学处理的过程(5)作出结论:在数据分析的基础上,应用统计学处理的结果,进行统计学推断。同时,依据相应的专业知识,作出专业性的结论。2、SPSS软件的特点(1)操作简便,方便自学。数据转换功能较强:可存取和转换多种数据类型(2)数据管理功能强大且操作直观:在基本界面上集数据录入、转换、检索、统计分析、作图、制表及编辑等功能于一身;(3)可用SPSS命令编程,形成SPSS环境下的可执行文件。(4)统计分析方法比较全面:包括一般统计描述、简单列联表分析、均数比较、一般线性模型、混合模型、相关回归、对数线性模型、聚类和判别、因子分析、非参数检验、时间序列、生存分析及缺失值估计等内容;(5)SPSS结果输出的管理也很有特色;(6)绘图和图形编辑功能也很方便、全面。3、变量加权:作用:加权后的变量被说明成频数,常用于频数表资料。第二章医药研究的类型:1、实验研究(干预,第2章):将同一总体的研究对象根据研究目的与内容随机分组,对各处理组的研究对象施加不同的干预,比较结果差异。2、调查研究(观察性研究,无干预,第14章):不对研究对象施加任何人为干预,是在自然条件下观察、记录研究对象的特征,可根据研究目的与内容进行随机抽样,但不能随机分组。3、医药研究的类型:实验研究:研究对象:人——临床试验动物——动物实验临床试验:治疗——临床疗效实验预防——社区干预实验联系:调查研究可为实验研究提供线索,而实验研究还需通过调查研究加以证实。第一节实验研究的三要素三要素:1)处理因素;2)受试对象;3)实验效应1、处理因素:因素:实验研究中,对实验指标产生影响的各种原因。(1)处理因素:研究者根据研究目的欲施加或欲观察的,能作用于受试对象并引起直接或间接效应的因素,又称试验因素或研究因素。实验研究的目的:阐明处理因素的作用处理因素的数目与水平:单因素实验:t检验、单因素方差分析。多因素实验:析因设计、正交设计方差分析除了处理因素对实验结果产生影响外,还有一些“非研究因素”也会对研究结果产生影响。(2)混杂因素:与处理因素同时存在,能使受试对象产生效应的其他非研究因素称非处理因素或混杂因素。研究者在确定处理因素的同时,根据专业知识与实验条件,尽可能找出对研究结果产生影响的非处理因素,并加以控制是十分重要的。(3)处理因素与混杂因素1)区分处理因素与混杂因素:混杂因素在各处理组中条件基本相同,以凸显处理因素作用。2)常见的混杂因素:年龄、性别、病情、病程、病史、家族史3)对混杂因素的处理:采用良好的设计:排除、平衡4)处理因素必须标准化:处理因素在整个实验过程中始终如一,保持不变。2、受试对象受试对象:处理因素作用的客体基本条件:(1)敏感性:对处理因素敏感(2)特异性:不易受非处理因素干扰(3)稳定性:反应稳定。动物的选择:种类、品系、年龄、体重、窝别、营养……病例的选择:纳入标准、剔除标准3、实验效应:处理因素作用于受试对象后所表现出来的效果,通过观察指标表达,有定量指标和定性指标。观察指标应客观、精确、灵敏、特异。第二节实验设计的基本原则1、实验设计三原则对照:去除随机变异和其他非研究因素的影响,凸显研究药物的效果随机:保证受试者情况在各组间的均衡性重复:充足的样本量,保证能检出的确存在的差异2、对照原则对照的意义:运用比较的手段将处理因素的效应充分显露出来(1)区分处理因素与非处理因素的效应,是比较的必要基础(2)消除和减少实验误差常用对照方法:空白对照、安慰剂对照、标准对照、实验对照、自身对照、相互对照、历史对照等1)空白对照:对照组不加任何处理因素。例:特点:简单易行,但容易引起心理差异,从而影响实验效应的测定。2)安慰剂对照:安慰剂:指对受试对象无任何副作用和药理作用的“假药”,它不含试验药物的有效成分,而其感官如颜色、大小、剂型、重量、口感、气味等与试验药物应尽可能一致,不能被受试
本文标题:统计笔记统计学复习
链接地址:https://www.777doc.com/doc-2064888 .html