您好,欢迎访问三七文档
.'.统计学公式汇总(1)αβδμσνπρυtuFXs2(2)均数(mean):nXnXXXXn21式中X表示样本均数,X1,X2,Xn为各观察值。(3)几何均数(geometricmean,G):)lg(lg)lglglg(lg121121nXnXXXXXXGnnn式中G表示几何均数,X1,X2,Xn为各观察值。(4)中位数(median,M)n为奇数时,)21(nXMn为偶数时,2/][)12()2(nnXXM式中n为观察值的总个数。(5)百分位数)%(LxxfxnfiLP式中L为Px所在组段的下限,fx为其频数,i为其组距,Lf为小于L各组段的累计频数。(6)四分位数(quartile,Q)第25百分位数P25,表示全部观察值中有25%(四分之一)的观察值比它小,为下四分位数,记作QL;第75百分位数P75,表示全部观察值中有25%(四分之一)的观察值比它大,为上四分位数,记作QU。(7)四分位数间距等于上、下四分位数之差。(8)总体方差NX22)((9)总体标准差NX2)((10)样本标准差1/)(1)(222nnXXnXXs(11)变异系数(coefficientofvariation,CV)%100XsCV(12)样本均数的标准误理论值nX估计值nssX式中σ为总体标准差,s.'.为样本标准差,n为样本含量。(13)样本率的标准误理论值np)1(估计值nppsp)1(式中π为总体率,p为样本率,n为样本含量。(14)总体率的估计:正态分布法,(nppupnppup/)1(,/)1()式中p为样本均数,s为样本标准差,n为样本含量。(15)总体均数的估计t分布法:(nstXnstX,,,)式中X为样本均数,s为样本标准差,n为样本含量,ν为自由度。(16)总体均数的估计u分布法:总体标准差σ未知但较大时,(nsuXnsuX,)式中X为样本均数,s为样本标准差,n为样本含量。总体标准差σ已知时,(nuXnuX,)式中X为样本均数,σ为总体标准差,n为样本含量。(17)样本均数与总体均数比较的t检验:nsXt/01n式中X为样本均数,0为欲比较的总体均数,s为样本标准差,n为样本含量,ν为自由度。(18)样本均数与总体均数比较的u检验:nsXu/0式中X为样本均数,0为欲比较的总体均数,s为样本标准差,n为样本含量。(19)样本均数与总体均数比较的u检验:nXu/0式中X为样本均数,0为欲比较的总体均数,σ为总体标准差,n为样本含量。(20)配对设计差值的符号秩和检验正态近似法公式:48)(24)12)(1(4/)1(3jjttnnnnnTu式中T为秩和,求秩和方法:差值d=(X-μ0);依差值的绝对值从小到大编秩;差值为0者,舍去不计;如果差值相等,取平均秩次;分别求出正、负秩次之和T(+)、T(-);T为二者绝对值较小者;n为样本含量,但不包括差值等于0者;tj(=1,2,···)为第j个相同差值的个数。(21)配对设计两样本均数比较的t检验:nsdtd/01n式中d为差值d的均数,.'.sd为差值d的标准差,n为样本含量(即样本对子数),差值d=各对子数据之差(含正负号!),ν为自由度。(22)成组设计两样本均数比较的t检验:)11(2/)(/)(21212222212121212211nnnnnXXnXXXXsXXtXX221nn式中1X和2X分别为两个样本均数,n1和n2为两个样本含量,ν为自由度。(23)样本率与总体率的比较:未校正的正态近似法)1(000nnXu或npu/)1(000式中X为样本阳性数,π0为欲比较的总体率,p为样本率,n为样本含量。(24)样本率与总体率的比较:校正的正态近似法)1(5.0||000nnXu或nnpu/)1(2/1||000式中X为样本阳性数,π0为欲比较的总体率,p为样本率,n为样本含量。(25)样本率与总体率的比较:直接计算概率法:首先按照二项分布的原理计算从0到n各个X的概率值P(X)=XXnXnXn00)1()!(!!。左单侧:PL表示从0到Xs的累计概率;右单侧:PR表示从Xs到n的累计概率;单侧概率P=MIN(PL,PR);双侧概率P的计算方法有三种:A,单侧概率乘2;B,当X大于nπ0时,双侧概率=P(≥X)+P(≤(2nπ0-X));当X小于nπ0时,双侧概率=P(≤X)+P(≥(2nπ0-X));C,将P(X)≤P(Xs)的各个概率值相加,即得双侧累计概率,即P=∑P(X),X满足条件P(X)≤P(Xs)。式中X为样本阳性数,π0为欲比较的总体率,Xs为样本阳性数,n为样本含量。(26)两个样本率的比较:正态近似法222111212221)1()1(21nppnppppssppupp式中p1和p2分别为两个样本率,n1和n2为两个样本含量。(27)两个样本率的比较:正态近似法2132112121,)11)(1(nnpnpnpnnppppuccc式中p1和p2分别为两个样本率,n1和n2为两个样本含量。.'.(28)四格表2检验:TTA22)(ν=(行数-1)(列数-1)式中A为实际频数(actualfrequency),T为理论频数(theoreticalfrequency),nnnTCRRC式中TRC表示R行(row)C列(column)的理论频数,nR为相应行的合计值,nC为相应列的合计值,n为总例数,ν为自由度。(29)四格表2检验专用公式:))()()(()(22dbcadcbanbcadν=(行数-1)(列数-1)式中a,b,c,d为四格表的四个实际频数,n为总例数,ν为自由度。(30)四格表2值的校正公式:))()()(()2/|(|22dbcadcbannbcadν=(行数-1)(列数-1)式中a,b,c,d为四格表的四个实际频数,n为总例数,ν为自由度。(31)行×列表2检验公式:)1(22CRnnAnν=(R-1)(C-1)式中A为实际频数(actualfrequency),nR为相应行的合计值,nC为相应列的合计值,n为总例数,,R为行数,C为列数,ν为自由度。(32)行×列表2检验公式:)1(112RiCjjiijmnAnν=(R-1)(C-1)式中Aij为实际频数(actualfrequency),ni为相应行的合计值,mj为相应列的合计值,n为总例数,R为行数,C为列数,ν为自由度。(33)四格表的确切概率法:!!!!!)!()!()!()!(ndcbadbcadcbaP式中a,b,c,d为四格表的四个实际频数,n为总例数。取表原则可分为“差数极端法”和“概率极端法”。多数情况下,二者所得结果一致,但个别情况下,所得结果不同。一般认为,“概率极端法”最准确。(34)配对四格表的2检验:cbcb22)(,ν=1,式中b,c为结果不一致的对子数。(35)配对四格表的2检验校正公式:cbcb22)1(,ν=1,式中b,c为结果不一致的对子数。(36)矩法正态性检验2/3223231)}1/(]/)(){2)(1(/)(23nnfXfXnnnfXfXfXfXng)3)(2()1(3)}1/(]/)(){[3)(2)(1(]/)(3/)(64)[1(22222422342nnnnnfXfXnnnnfXnfXfXfXfXfXnng.'.)3)(1)(2()1(61nnnnng)5)(3)(2)(3()1(2422nnnnnng111/gggu222/gggu式中X为变量值,f为相同X的个数,n为样本例数。(37)二项分布的概率A.恰有X例阳性的概率,记为P(X)XXnnXXP)1)(()(,X=0,1,2,…,n)!(!!)(XnXnnX式中X为阳性数,π为总体阳性率,n为样本例数,!为阶乘符号。B.最多有k例阳性的概率,记为P(X≤k)P(X≤k)=kXP0)(X=0,1,2,…,nC.最少有k例阳性的概率,记为P(X≥k)P(X≥k)=nkXP)(X=0,1,2,…,n(38)Poisson分布的概率A.恰有X例阳性的概率,记为P(X))!/()(XeXPX,X=0,1,2,…,n式中μ=nπ,为Poisson分布的总体均数,X为单位时间(或面积、容积等)某事件发生数,e为自然对数的底。式中X为阳性数,π为总体阳性率,n为样本例数,!为阶乘符号。B.最多有k例阳性的概率,记为P(X≤k)P(X≤k)=kXP0)(X=0,1,2,…,nC.最少有k例阳性的概率,记为P(X≥k)P(X≥k)=nkXP)(X=0,1,2,…,n(39)Poisson分布样本均数与总体均数比较Xu。式中X为样本阳性数,λ为总体均数。注意:样本的观察单位数应等于总体的观察单位数,否则,应根据二者观察单位数之比相应调整λ。.'.(40)Poisson分布两个样本均数比较2222112211nXnXnXnXu。式中∑X1为第一个样本阳性数之和,n1为第一个样本的观察单位数之和,∑X2为第二个样本阳性数之和,n2为第二个样本的观察单位数之和。(41)Pearson相关系数计算公式:YYXXXYiiiilllYYXXYYXXr22)()())(((42)Pearson列联系数计算公式:nP22式中n为样本含量。(43)关联系数:nr2式中n为样本含量。(44)
本文标题:统计学公式汇总
链接地址:https://www.777doc.com/doc-5640078 .html