您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 中医药统计学中医药统计学
中医药统计学第一章绪论引子:概率应用示例随机50个人聚在一起,其中有两个人生日是同一天的概率在97%以上,几乎可以说50个人中一定有两个人是同一天的生日。神奇吧!计算如下:统计应用示例李颖同学的《中医基础理论》与《伤寒论》成绩分别为87分与80分,李颖同学所在班的这两门课程的平均成绩分别为80分和65分,标准差分别为7分和10分。那么,在班里,李颖同学擅长《中医基础理论》还是《伤寒论》的学习?标准正态分布下:李颖同学在班里《中医基础理论》成绩排在前16%,《伤寒论》成绩排在前7%,可见李颖同学比较擅长《伤寒论》的学习。耐人寻味吧!医药统计应用示例小儿麻痹症在没有研制出疫苗之前是一种瘫痪或死亡率很高的疾病。在疫苗人体试验的过程中,科学家随机抽取了400000名儿童并随机分成两组,试验组注射疫苗,对照组注射安慰剂。结果发现试验组和对照组分别有56、138名儿童患上该病。56与138的差别是由随机抽样造成的,还是由疫苗的免疫作用所致的?统计推断分析结论是二者的差别超出了随机性本身所能解释的范围,疫苗有效。从此以后,这种疫苗普遍接种,在许多国家根除了小儿麻痹症。这是统计学为医学研究提供有力支持的代表实例之一。脊髓灰质炎病毒是引起脊髓灰质炎的病毒。该疾病传播广泛,是一种急性传染病。病毒常侵犯中枢神经系统,损害脊髓前角运动神经细胞,导致肢体松弛性麻痹,多见于儿童,故又名小儿麻痹症。统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。(至理名言)—H.G.Wells赫伯特·乔治·威尔斯(HerbertGeorgeWells1866-1946),英国著名小说家,尤以科幻小说创作闻名于世。1895年出版《时间机器》一举成名,随后又发表了《莫洛博士岛》、《隐身人》、《星际战争》等多部科幻小说。谨与同学们共享共勉!第一节概述中医药统计学的概念统计学的发展简史统计学的研究对象中医药统计学的主要内容统计学的特点和基本思想三类现象数学研究方法统计学(statistics)是研究随机现象数量规律性的应用数学,是从随机现象数据中提取信息、知识的一门科学与艺术,是一门方法性学科。它分为理论统计学和应用统计学两大类。理论统计学(theoreticalstatistics)即数理统计学(mathematicalstatistics),是以概率论为基础,从纯理论的角度,对统计方法加以推导论证,中心的内容是统计推断问题,实质是以归纳方法研究随机现象的一般规律。应用统计学(appliedstatistics)是数理统计学的原理方法在不同学科领域的具体应用。数理统计学在生物学中的应用形成了生物统计学(biostatistics);在医学中的应用形成医学统计学(medicalstatistics)、卫生统计学(healthstatistics)和中医药统计学(statisticsfortraditionalchinesemedicine)等。中医药统计学(statisticsfortraditionalchinesemedicine)是研究中医药领域中随机现象客观规律的一门方法性学科,它运用数理统计学的基本原理与方法,结合医药实际,阐述中医药领域研究设计、收集资料、整理资料、分析资料、结果报告与结论表达。它属于应用统计学,是医药科学研究的重要工具与手段。统计学的发展简史人类实践是统计学产生的源泉,人类认识是统计学发展的动力。远古时代,人类利用手指、石子、贝壳、小木棍以及绳索等工具进行的计数活动就蕴藏着统计萌芽,但是,人类由统计实践上升到统计学,却只有300多年的历史。17世纪中叶至18世纪初期为古典统计学的发展时期。统计学一词源于state,统计学意指国家国情的叙述,其研究方法主要采用文字记述和形式逻辑比较法,用于人口、国力等情况的统计和分析。18世纪后叶至20世纪初期为近代统计学的发展时期。误差理论和大数法则得到了应用和发展,其研究方法主要是建立在大样本上的大量观察法,重视运用统计指标和统计图表对数字资料进行统计描述。20世纪初期至今为现代统计学的发展时期。1908年,英国统计学家戈赛特(W.S.Gosset,1876-1937)在生物统计杂志“Biometrika”上以笔名student发表了t分布,开创了小样本的研究,从而使统计学由“描述统计”向“推断统计”发展,开创了现代统计学的新纪元。20世纪50年代,电子计算机技术的发展和应用,促进了统计方法的应用与发展。当今,现代统计学的发展有如下几个明显趋势:随着数学的发展,统计学依赖和吸收的数学方法越来越多;统计方法与计算机技术相结合,已渗透到了所有学科部门,以统计学为基础的边缘学科不断形成;统计与实质性学科(如社会、经济、生物、医学等)、统计软件、现代信息相结合,所发挥的功效日益增强;统计学的作用与功能已从描述事物现状、反映事物规律,向抽样推断、预测未来变化方向发展,已成为具有方法论性质的综合性学科。统计学的研究对象统计学所研究的对象是具有变异的事物,其变异为同质基础上的变异。同质(homogeneity)指观察单位间被研究指标的影响因素相同。(可控因素)变异(variation)指在同质基础上各观察单位间某观察指标的差异。统计学是处理变异数据的科学,没有变异就无需统计学。医药事物(现象)大多数都是具有变异的事物(现象),概率论称具有变异的事物(现象)为随机事件。中医药统计学可将医药随机事件通过一定数量的观察、对比、分析与推断,由偶然性(不确定性)现象的剖析,发现事物内在的必然性(确定性)规律。中医药统计学的主要内容中医药统计学以研究统计设计和统计方法为主要内容。研究统计设计:实验设计、临床试验设计以及调查设计等统计方法包括:统计描述、统计推断和关系分析等。统计学的特点和基本思想统计学认识事物现象有如下特点:数量性、群体性、具体性和概率性等。统计学的基本思想可归纳为:变异、随机抽样研究和概率的思想。统计结论中没有“证明”,只有在一定概率水平上的推论。第二节统计学几个基本概念总体与样本参数与统计量误差概率总体与样本总体(population)是根据研究目的所确定的同质观察单位的全体。有限总体与无限总体样本(sample)是从总体中随机抽取的具有代表性的个体的集合。抽样研究(samplingstudy)是从总体中抽取样本,通过对样本的定量或定性测量结果来推断总体。抽样研究的目的是用样本的特征正确可靠地推断总体的特征,所以样本必须对总体具有良好的代表性,抽样研究应注意如下几点:样本含量足够大遵循随机抽样原则样本的构成分布应基本上与总体构成分布保持一致参数与统计量反映总体的统计指标称为参数(parameter),用希腊字母表示,如:反映样本的统计指标称为统计量(statistics),用拉丁字母或英文字母表示,如:对某一事物而言,总体参数是该事物本身固有的、不变的,而统计量则随着实验不同而不同,但统计量的分布是有规律的,如小样本均数服从t分布,大样本均数服从正态分布等,这些规律是统计推断的理论基础。误差误差(error)泛指观测值与真实值之差以及样本统计量与总体参数之差。主要分为非随机误差与随机误差,非随机误差包括系统误差和过失误差,随机误差包括随机测量误差和随机抽样误差。系统误差(systematicerror)是指在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。如仪器初始状态未调整到零、标准试剂未经校正所致误差。其特点为:观察值有系统性、方向性、周期性的偏离真值。这类错误可以通过严格的实验设计和技术措施消除。过失误差(grosserror)由于观察过程中不仔细造成的错误判断或记录。应认真检查核对,否则将会影响研究结果的准确性。随机测量误差(randommeasurementerror)是指各种偶然因素(如电压、环境温度等)的影响造成对同一对象多次测定的结果不完全一样,或同一样品不同观察者之间的差异。该误差不可避免,但要控制在容许范围内。提高操作者熟练程度可以减少这种误差。随机抽样误差(randomsamplingerror)简称抽样误差(samplingerror),是由于随机抽样所引起的样本统计量与总体参数间的差异以及各样本统计量之间的差异。医学现象的变异总是客观存在的,因而在抽样研究中,抽样误差总是不可避免的,它虽无方向性,但有一定的分布规律,是可估计、可控制的,其大小可通过计算标准误间接地反映出来。样本对总体的代表性越好,抽样误差越小,反之,抽样误差越大。抽样误差揭示样本距总体的实际值可能有多远。准确度、精确度、效度、信度概率频率(frequency)概率(probability)在《概率论》上称频率收敛于概率。概率是反映随机事件发生的可能性大小的度量,用P表示,取值范围为[0,1]。随机事件的概率为0-1;必然事件的概率等于1;不可能事件的概率等于0。统计学通常把等于小于0.05或0.01的随机事件称为小概率事件。(人为规定)一般认为小概率事件在一次试验中是不大可能发生的,这就是小概率原理,它是统计推断的重要原理。第三节资料类型数值资料分类资料相互转换资料(data)又称数据,由变量及其变量值组成。资料类型与变量类型相对应。变量(variable)是指观察单位的某种特征或属性,即研究的项目或指标。变量的测定结果称为变量值(valueofvariable)或观察值(observedvalue)。数值资料(numericaldata)又称定量资料(quantitativedata)或计量资料(measurementdata),是由仪器、工具或其它定量方法测定的某项指标量的大小所得到的资料。例如:测量100名男大学生的身高所获得的资料就是数值资料。分类资料(categoricaldata)又称定性资料(qualitativedata)或计数资料(countdata),是将事物按不同的属性归类,清点每一类的数量多少所得到的资料。根据类别数的不同,计数资料分为二分类资料(binarydata)、无序多分类资料(unorderedcategoricaldata)和有序多分类资料(orderedcategoricaldata),后者也称等级资料。例如将100名大学生按性别分组:男53例,女47例,此资料就是二分类资料;按ABO血型分组:A型39例、B型20例、O型17例、AB型24例,此资料就是无序多分类资料。等级资料(ordinaldata)又称半定量资料(semi-quantitativedata)或有序多分类资料(orderedcategoricaldata),是将事物属性按组别之间有程度或等级差别进行归类所得到的资料。例如用某中药治疗某种疾病患者50名,按临床疗效等级分为痊愈26例、显效12例、好转7例、无效5例,此资料就为等级资料或有序多分类资料。根据分析的需要,各种资料可进行相互转化。可将数值资料转化为分类资料或等级资料,反过来,分类资料和等级资料可通过数字编码或赋值,即数值化方式,转化为数值资料。需要注意的是:数值资料变为分类资料或等级资料时信息量将减少,因此在收集数据阶段应尽量收集数值数据,并用原始数值资料建立数据集。连续型随机变量是指在某一区间可取任何值的变量,如身高(cm)、体重(kg)、血压(KPa)等;离散型随机变量是指在某一区间只可取有限的几个值的变量:如家庭人口数、脉搏(次/分)等。数值资料对应的数值变量可以是连续型随机变量,也可以是离散型随机变量;分类资料和等级资料对应的分类变量和等级变量只能是离散型随机变量。无序多分类变量又称名义变量(nominalvariable),意指各种被命好的分类,在各种分类中没有隐含的顺序,这与等级变量不同。但是,等级变量中各分类之间的差异不能被认为是相等的。第四节基本步骤研究设计收集资料整理资料分析资料结果报告与
本文标题:中医药统计学中医药统计学
链接地址:https://www.777doc.com/doc-4529600 .html