您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 医学统计学_名词解释_名解_复习资料
第1页共3页6.数值变量(Numericalvariable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。对每个观察单位用定量的方法测定某项指标的数值,组成的资料。7.计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。分类变量(categoricalvariable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unorderedcategories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。2)有序分类(orderedcategories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。8.抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。9.抽样误差(samplingerror):由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。10.误差(error):统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差。11.可信区间(confidenceinterval,CI):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间,又称置信区间。12.总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。常用的可信度为95%和99%,故常用95%和99%的可信区间。13.变异(variation):同质事物间的差别。由于观察单位通常即为观察个体,故变异亦称为个体变异(individualvariation)。14.组间变异(variationbetweengroup):用各组均数与总均数的离均差平方和表示i2ii)xx(nS组间Sν组间=k-1,k为实验分组数,组间均方为MS组间=SS组间/(k-1)15.组内变异(variationwithingroup):用各组均数与总均数的离均差平方和表示i2iiij2iij)s(n)x(xS1组内S,各组自由度为ni-1,则组内自由度为ν组内=N-k,组内均方为MS组内=SS组内/(N-k)16.平均数(average):也叫平均值,是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列的数据的中心,包括算术平均数(arithmeticmean)、几何平均数(geometricmean)、中位数(median)等。17.中位数(median):将一组观察值按升序或降序排列,位次居中的数,常用M表示。适用于偏态分布资料或不规则分布资料和开口资料。所谓“开口”资料,是指数据的一端或两端有不确定值。当n为奇数时,M=X(n+1)/2;当n为偶数时,M=[Xn/2+Xn/2+1]/2。18.百分位数(percentile):是一种位置指标,以Px表示,一个百分位数Px将全部观察值分为两个部分,理论上有x%的观察值小于Px小,有(1-x%)的观察值大于Px。19.变异系数(coefficientofvariance,CV):亦称离散系数(coefficientofdispersion),为标准差与均数之比,常用百分数表示。100%Xs/CV,变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。20.统计表(statisticaltable):统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。21.频率(relativefrequency):在n次随机试验中,事件A发生了m次,则比值试验的总次数发生的试验次数Anmf称为事件A在n次试验中出现的频率(relativefrequency)。m称为出现的频数(frequency)。在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。频率是概率的估计值。22.概率(probability):在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。描述随机事件发生的可能性大小的数值,常用P来表示。23.统计量(statistic):由样本所算出的统计指标或特征值。24.相关系数(correlationcoefficient):用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数,又称为积差相关系数(coefficientofproduct-momentcorrelation),总体相关系数用希腊字母ρ表示,而样本相关系数用r表示,取值范围均为[-1,1]。25.回归系数(regressioncoefficient):直线回归方程Yˆ=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X每增加一个单位,Y平均改变b个单位。26.参考值范围(referencerange):也称为正常值范围(normalrange),医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。绝大多数:可以是90%、95%、99%等等,最常用的是95%。正常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。27.正偏态和负偏态分布:频数分布可分为对称分布和非对称分布两种类型。非对称分布又称为偏态分布,是指观察值偏离中央的分布。当尾部偏向数轴正侧(或右侧)时,称正偏态(或右偏态)分布,如人体中一些重金属元素的分布等。反之,尾部偏向数轴负侧(或左侧)时,则称为负偏态(或左偏态)分布。28.统计推断(statisticinference):从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程称为统计推断。29.标准误(standarderror,SE):在统计理论上将样本统计量的标准差称为标准误,用来衡量抽样误差的大小。据此,样本均数的标准差Xσ称为标准误。30.参数估计(parameterestimation):由样本信息估计总体参数。它包括两种:点估计(pointestimation)和区间估计(intervalestimation)。31.点估计(pointestimation):直接用样本统计量作为对应的总体参数的估计值。32.区间估计(intervalestimation):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,第2页共3页这个范围称作可信度1-α的可信区间(confidenceinterval,CI),又称置信区间。这种估计方法称为区间估计。33.95%可信区间含义:如果重复若干次样本含量相同的抽样,每个样本均按同一方法构建95%可信区间,则在这些可信区间中,理论上有95个包含了总体参数,还有5个未估计到总体均数。34.Ⅰ类错误(typeⅠerror):统计学上规定,拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误或第一类错误,Ⅰ型错误的概率用α表示。35.Ⅱ类错误(typeⅡerror):统计学上规定,不拒绝实际上不成立的H0,这类“存伪”的错误称为Ⅱ型错误或第二类错误,Ⅱ型错误的概率用β表示。36.检验效能(powerofatest):又称把握度,即两总体确有差别,按α水准能发现它们有差别的能力。37.参数检验:总体分布已知,对其中一些未知参数进行估计或检验。这类统计推断的方法叫参数统计或参数检验。参数检验:假定比较数据服从某分布,通过参数的估计量(x,s)对比较总体的参数(μ)作检验,统计上称为参数法检验(parametrictest)。如t、u检验、方差分析。38.非参数检验:适用于任意分布(distributionfree)的统计方法,这种方法称为非参数统计。这种假设检验方法,比较的是分布而不是参数,故称为非参数检验。非参数检验:是指在统计检验中不需要假定总体分布形式和用参数估计量,直接对比较数据的分布进行统计检验的方法,称为非参数检验(nonparametrictest).39.率(rate):又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。其计算公式为:(K)比例基数单位总数可能发生某现象的观察单位数实际发生某现象的观察率40.构成比(proportion):又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,其计算公式为:100%的观察单位总数同一事物内各组成部分位数某一组成部分的观察单构成比41.比(ratio):又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,它是对比的最简单形式。其计算公式为:比=A/B。统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。抽样误差(samplingerror)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。标准误(StandardError)样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(intervalestimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidenceinterval,CI),又称可信区间。参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围参数统计(parametricstatistics)非参数统计(nonparametricstatistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。回归系数有单位,而相关系数无单位β为回归直线的斜率(slope)参数,又称回归系数(regressioncoefficient)。线性相关系数(linearcorrelationcoefficient):又称Pearson积差相关系数(Pearsonproductmomentcoefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。参数(parameter):描述总体特征的统计指标。统计量(statistic):描述样本特征的统计指标。实验设计的基本原则对照(control)对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组重复(replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异随机化(randomization)采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。变异指标是用于描述一组观察值围绕中心位置散布的范
本文标题:医学统计学_名词解释_名解_复习资料
链接地址:https://www.777doc.com/doc-2584986 .html