您好,欢迎访问三七文档
集中趋势的描述算术均数:频数表资料(X0为各组段组中值)nfXffXxOO几何均数:nnXXXG...21或)log(log1nXG频数表资料:nXffXfGloglgloglog11中位数:(1)*21nXM(2))(21*12*2nnXXM百分位数LXXfnXfiLP100其中:L为欲求的百分位数所在组段的下限,i为该组段的组距,n为总频数,Xf为该组段的的频数,Lf为该组段之前的累计频数方差:总体方差为:式(1);样本方差为式(2)(1)NX22)((2)1)(22nXXS标准差:1)(2nXXS或1/)(22nnXXS频数表资料计算标准差的公式为1/)(22fffxfxS变异系数:当两组资料单位不同或均数相差较大时,对变异大小进行比较,应计算变异系数%100XSCV常用的相对数指标(一)率(二)相对比(三)构成比1.直接法标准化NpNpii'iipNNp)('2.间接法标准化预期人数实际人数SMRiiPnrSMRSMRPP'正态分布:密度函数:)2/()(2221)(XeXf分布函数:小于X值的概率,即该点正态曲线下左侧面积)()(xXPxF特征:(1)关于x=μ对称。(2)在x=μ处取得该概率密度函数的最大值,在x处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,决定曲线的形状。(5)曲线下面积分布有一定规律标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换Xu,u服从总体均数为0、总体标准差为1的正态分布。u值左侧标准正态曲线下面积为标准正态分布函数,记作)(u医学参考值的确定方法:(1)百分位法:双侧(P25,P975),单侧P95以下或P5以上,该法适用于任何分布型的资料。(2)正态分布法:若X服从正态分布,双侧医学参考值范围为SX96.1样本均数标准误的估计值为Xsnst分布的概念:小样本总体标准差未知时,服从自由度为n-1的t分布/XXXtssn总体均数可信区间的计算:大样本或总体标准差已知:式(1);小样本:式(2)(1)nSX96.1(2)nSntt)1(,05.0单样本t检验:检验统计量:式(1);样本例数估计:式(2)(1)nSXt/0自由度为n-1;(2)22/])([ZZN配对样本t检验:检验统计量:nSdtd/0样本量计算同前两样本t检验:检验统计量:)11(2121nnSXXtc(错)2)()(2)1()1(21222211212222112nnXXXXnnSnSnSc随机分组方法:样本例数估计)(])([121122/QQZZN方差不齐的近似t检验检验统计量:式(1);校正自由度为:式(2)(1)22212121'nSnSXXt(2)11)(24142222121nsnsssxxxx方差齐性检验:H0:两总体方差齐,H1:两总体方差不齐,α=0.1检验统计量:(较小)(较大)2221SSF分子自由度为n1-1,分母自由度为n2-1方差分析的基本思想:1、总变异:总离均差平方和:2()1TijijSSSSXXN总总=nXX/)(222.组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。21()1BiiiSSSSnXXk组间组间===CnXiiij2)(3.组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。222()(1)WEijiiiijiSSSSSSXXnSNk组内组内222()(1)WEijiiiijiSSSSSSXXnSNk组内组内1(1)()NkNk总组间组内组间均方与组内均方比值一般地服从分子自由度为ν1,分母自由度为ν2的F分布121MSFkNkMS组间组间组内组内,多个样本间的多重比较Dunnett检验:用于各实验组与对照组比iXXiSXXt)(误差ixxnnMSSi11查dunnett界值表,确定P,自由度等于方差分析中ν误差SNK-q检验:用于各组间全面的两两比较Q=)11(2/)(BABAXXBAnnMSXXSXXBA误差查q界值表确定相应的概率P,自由度等于方差分析中ν误差,表中a为按均值大小排序,两对比组所包含的组数。二项分布的概率函数P(X):XnXXnCXP)1()(;)!(!!XnXnCXn二项分布的均数和标准差:进行n次独立重复试验,出现X次阳性结果X的总体均数为n总体方差为)1(2n总体标准差为)1(n如果将阳性结果用频率表示nXp率的总体均数p标准差np)1(nppnppSp)1(1)1(又称率的标准误它反映率的抽样误差的大小。单侧累积概率计算:出现阳性的次数至多为k次的概率为kXkXXnXXnXnXPkXP00)1()!(!!)()(出现阳性的次数至少为k次的概率nkXnkXXnXXnXnXPkXP)1()!(!!)()(率的可信区间的估计正态近似法:当)1(,pnnp均大于等于5时npppnppP)1(96.1,)1(96.1样本率与总体率的比较:检验假设H0:π=π0,H1:π≠π01.满足正态近似时,计算检验统计量)1(000nnXZ或npZ)1(0002.不满足正态近似时用直接概率计算法两样本率的比较:H0:π1=π2,H1:π1≠π2,检验统计量:)11)(1(||2121nnppppZcc2121nnXXpcPoisson分布的概率函数为!)(XeXPXPOISSON分布的应用:单侧累计概率计算:稀有事件发生次数至多为k次的概率为kXkXXXeXPkXP00!)()(发生次数至少为k次的概率为)1(1)(kXPkXP总体均数的区间估计:正态近似法95%总体均数的可信区间为XXXX96.1,96.1样本率和总体率的比较正态近似法:当满足正态近似条件时,对检验假设H0:λ=λ0,H1:λ≠λ0,检验统计量为XZ两组独立样本资料的Z检验:当两总体均数都大于20时,对检验假设H0:λ1=λ2,H1:λ1≠λ2,当两样本观测单位数相等时,检验统计量为:式(1);当两样本观测单位数不等时,检验统计量为:式(2)(1)2121XXXXZ(2)221121nXnXXXZ四格表2检验的步骤:1.检验假设,H0:两总体率相等,H1:两总体率不等。Α=0.05。2.统计量3.确定p值。4.结论。n≥40,且T≥5,=(行数-1)(列数-1)TTA22)(,nnnTcr,))()()(()(22dbcadcbanbcad当n≥40,如果有某个格子出现1<T5,校正公式TTA22)5.0())()()(()2/|(|22dbcadcbannbcad注意如果出现n<40或一个T<1则不能用2检验多样本率和构成比的χ2检验:假设H0:各总体率相等,H1:各总体率不等或不全等,α=0.05,自由度=(行数-1)(列数-1)。统计量为TTA22)(或122crnnAn构成比的比较:假设H0:构成比相同,H1:构成比不同配对四格表的χ2检验:配对设计列表:假设H0:B=C两阳性率相等;H1:B≠C两阳性率不等检验统计量:式(1)若b+c<40:式(2)(1)cbcb22)((2)cbcb22)1|(|两分类变量的关联性检验:假设:H0:两分类变量无关(满足概率独立性),H1:两分类变量有关配对设计资料的符号秩和检验:正态近似法:计算u统计量,如果数据超出表的范围可计算u统计量。下式中tj为第j(j=1,2…)次相持所含相同秩次的个数48)(24)12)(1(4/)1(3jjcttnnnnnTZ两独立样本比较的秩和检验:确定P值和作出推断结论。如果n1或n2-n1超出了成组设计T界值的范围,可用正态近似检验。12)1(2)1(2121211nnnnnnnTZcZZc)/()(133NNttcjj完全随机化设计多组独立样本的秩和检验:统计量)1(3)1(122NnRNNHii确定P值并做出推断结论:如取相同秩次个数较多时需校正cHHc)()(133NNttcjj随机化区组设计资料的秩和检验:计算统计量M值2)(RRMj,4/)1(222kkbRMj确定P值并做出推断结论:χ2分布近似法:当处理数k或区组数b超出M界值表的范围时,采用近似χ2分布法)1(122kbkMr或)1(3)1(12122kbRkbkkjjr自由度为(k-1)。当各区组间出现相同秩次时,需进行校正,校正公式为(其中b为区组个数,k为处理组个数)cc22)1()(123kbkttcjj直线相关:Pearson积差相关系数:描述线性相关程度nininiyyxxxyyyxxyyxxlllr11221)()())((nxxlniiniixx2112,nyylniiniiyy2112nyxyxlniniiiniiixy111式中Lxx,Lyy,Lxy分别表示X的离均差平方和、Y的离均差平方和、X与Y的离均差乘积和。相关系数的统计推断:检验假设为H0:ρ=0,H1:ρ≠0rrsrt0212nrsr自由度为n-2的t分布直线回归:反应变量(Y)依赖于另一自变量(X)简单线性回归模型表述为iiiXY,Yi为第i个个体的反应变量值,Xi为其自变量值,α为回归直线的截距参数,β为回归直线的斜率参数,εi为误差。线性表达式称为回归方程:bXaYˆ,a与b分别为模型参数α与β的估计;是与X相对应的Y的平均值回归参数估计的最小二乘原则:残差为)(ˆiiiiibXaYYYe,用一定的数学方法确定a和b的适宜值,使所有n个数据点的残差平方和达到最小值,则称这一对a和b为和的最小二乘估计niiniiiXXYYXXb121)())((niniiininiiniiiinXXnYXYXb1212111)()()(回归截距a:XbYa回归系数的统计推断:H0:β=0,H1:β≠0(1)t检验(自由度为n-2)bbSbt,niixybXXss12.)(,2)ˆ(12.nYYsniiixy(2)方差分析法:总变异SS总,回归平方和SS回,残差平方和SS残,SS总=SS回+SS残;MS是均方,即SS与自由度之商。MS回与MS残之比值就是F值。222)()(总yyyySS/nxxxxxyxylblllbSS22回,回总残SSSSSS回归方程的应用:(1)Y的总体均数的(1-α)置信区间ynStYˆ2,ˆ,22.ˆ)()(1XXXXnSSipxyyp(2)个体Y预测值的区间估计pXYnpSty|2,ˆ22.|)()(11XXXXnSSpXYXYp样本含量的估计:单样本均数检验(1)两样本均数比较(2)单样本率检验(3)两样本率比较检验(4)22/])([ZZN)(])([121122/QQZZN0021][
本文标题:医学统计学公式整理
链接地址:https://www.777doc.com/doc-4042425 .html