您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 社会统计学公式汇总及要点
1社会统计学公式汇总及要点2011.09.09-09.10(仅供参考,如不能显示公式,请安装Microsoft公式3.0)一、归类总结之一测量层次特质数学特质单变项:X定类变项只分类Mo、V比例、比率、对比值、次数分布、长作图、圆瓣双变项:X、Y定序变项不仅分类,有大小、高低、程度等Mo、V、Md、Q累加次数、累加百分率定距变项不仅分类,有大小、高低、程度,还可加减Mo、V、Md、Q、X、S(S2)同上定比变项最高测量层次加减乘除二、归类总结之二①2个定类、y、tau-y1.集中趋势测量法:Mo、Md、X2.离散趋势测量法:V、Q、S2.有下标,表示不对称3.具有消减误差比例意义的有:r2、E2、G、dy、、y、tau-y、rs2(rs斯皮尔曼系数)4.参数检定:Z、t、F非参数检定:x2、U、H、K-S、走动检定P201②2个定序G、dy③2个定距R、b,即r=rxy,b=bxy④定类+定距E⑤定类+定序同①:、y、tau-y大多数社会学者将定序看作定类,即2个定类。三、归类总结之三:理解如下:(红色字体为特别关注的公式)变项X变项Y可计算检定法①两个定类定类定类、y、tau-yx2②定类+定序定类定序同上③两个定序定序定序G、dyZ(n≥100)、t(n≤30)④两个定距定距定距r、b,即r=rxy,b=bxyF、r(n≤30)⑤定类+定距定类定距E只能用F检定⑥定序+定距定序定距E只能用F检定四、归类总结之四:有关计算题1.第二章、第四或第六章、第七八章2.相关系数→第四章;定类、定序、定距→第四章;假设、推论→检定→第七、八章3.一个变项,1个样本X:①(n≥100):XMZSn②(n≤30):1XMtSn,df=b-14.1个变项,2个样本X1X2n=n1+n2>100→12221212XXZSSnn2五、归类总结之五:有关消减误差比例1.有消减误差比例意义,且对称、G、Q拉系数、rs2、r2、rxy.12、、Ry.122=Ry.x1x222.有消减误差比例意义,且不对称dy、y、tau-y、E2、CR2(特征值)3.无消减误差比例意义,且对称、V系数、C系数、tau-a、tau-b、tau-c、Vs、r4.无消减误差比例意义,且不对称b、E六、其他细节1.显著度的表达①两端检定:1.96Z;②一端检定:1.65Z;③(df)Z;④F(df1,df2);⑤x2(df)2.有无自由度的表达G、r、F、x2结果解释加上“其显著度水平达到或没有达到……水平”3.有关r净相关系数(两个定距变项)r=rxy.1——引入第三个变项时对X、Y变项产生共同影响。rx(y-1)——引入第三个变项时,只对Y产生影响,无消减误差意义。ry(x-1)——引入第三个变项时,只对X产生影响,无消减误差意义。计算公式表(一)⑥①②③④⑤⑥(红色字体为特别关注的公式)1.众值Mo=次数最多之值。2.中位项Md位置=12n,Md=L+2ncffW,Md=L+12mmncffW有三种情况:单个数奇、偶、区间。fm:原始次数;cfm-1:累加次数P483.均值X=xnP494.离异比率V=nfmon=总个数-众值的次数总个数P525.四分位差由低到高排列,分四个等分计算Q1、Q3位置,Q1位置=14n,Q3位置=3(1)4n,Q=Q3-Q1有单个数(n为偶数时会出现偏离)、区间之分。(有几种Q,就有几种S计算法)当为区间表格时(n/4)①计算向上累加数cf;②Q1位置=4n,Q3位置=34n;③Q1=L1+1114ncffW1,Q3=L3+31334ncffW3;④Q=Q3-Q1P575.标准差①单个数:S=2(X)Xn,②区间:S=2(Xm)fXnP60对S的解释:如以均值来估计各个个案的数值,所犯的错误(X)X平均是S。用均值作估计变项数值时所犯错误的大小。S2方差:就是标准的平方值,其意义与标准差相同。3计算公式表(二)二个变项1.两个定类变项①()2()xyxyxymmMMnMM②yyyymMnMMy=Y变项的众值次数,Mx=X变项的众值次数,n=全部个案数目。my=X变项的每个值(类别)之下Y变项的众值次数,mx=Y变项的每个值之下X变项的众值次数,③tau-y=121EEE(E1=()yynFfn,E2=()xxFffF)n=全部个案数目,f=某条件次数,Fy=Y变项的某个边缘次数,Fx=X变项的某个边缘次数。2.两个定序变项G=sdsdNNNNNs是同序对数,Nd是异序对数对G检定,只有两种检定法:Z、t。dy=sdsdyNNNNTNs是同序对数,Nd是异序对数,Ty是只在依变项Y上同分的对数。因为dy系数是以X预测Y,如果两个个案在X上有高低之分,就要预测或估计他们在Y上的相对等级。因上分母要加上Ty。rs=226D(n1)n斯皮尔曼rho系数。常出现在填空选择,一般不考计算题。3.两个定距变项Y’=bX+a,22()()()(X)()nXYXYbnXa=Y—bX=()YbXn简单线性回归分析X是自变项数值,自变项数值,b是回归系数,表示回归张的斜率,a是截距,即回归线与Y轴的交点,Y’是根据回归方程式所预测的Y变项的值。r=rxy=2222()()X()()nXYXYnXnYY积矩相关测量法r系数与简单线性回归分析都是假定X与Y的关系具有直线的性质。4.定类+定项22222iinYnYEYnY,ni是每个自变项Xi的个案数目。iY=每类的平均值,2Y每个竖列平方的和。E值无负值,因为是定类变项。相关比率与非线性相关又称为eta平方系数(E2),是以一个定类变项X为自变项,以一个定距变项Y为依变项。是根据自变项的每一个值来预测或估计依变项的均值。E是假定X是非线性关系。E值从0-1,其E2具有消减误差的意义。5.定类+定序=两个定类,大部分的社会学研究都采用Lambda或tau-y系数来测量6.定序+定距因此社会学家常改用相关比率——即将定序变项看做是定类变项。E参数值的估计:间距估计:均值、百分率、积矩相关求总体的均值M①已知:n,X(样本的均值),可信度为95%,求M。1.96()SeMXn(S是样本的标准差)③已知:n,可信度95%,样本比率p,求总体比率P。(百分率(或比例)的间距估计)(1)1.96()ppepPn②已知:X,可信度,M或e,求n。(决定样本的大小)1.96()Sen④已知:可信度,p,Pore,求n。(1)1.96PPen4计算公式表(三)假设的检定:两个变项之相关Z(5个)、t(4)、F(2个)Z检定法(大样本)、t检定法(小样本):定矩变项、随机抽样、总体正态分布。1、Z检定法2、t检定法①(大样本)n≥100(单均值)2XMXMZSSnn①(小样本)n≤30以t值来表示样本的均值在标准化抽样中分布中的位置。1XMXMtSSEn②两个均值的差异n=n1+n2≥10012221212XXZSSnn②两个小样本n1+n2<100XMtSE,2211221212122nSnSnnSEnnnndf=(n1-1)+(n2-1)=122nn(自由度)③单百分率(单均值)(1)pPpPZSEPPn③小样本n≤30八:P1882(1)sdNNtGnG,df=Ns+Nd-2④两个百分率的差异一个变项两个样本的比率。12112212(1)(1)PPZppppnn两个随机样本百分率之相差的抽样分布接近正态分布。分母就是标准误差。⑤Z对G的检定八:P188-1892(1)sdNNzGnG3、F检定(方差分析)4、x2检定(非参数检定法)①F对E检定221222/()11(1)/EnkEdfFEkEdfdf1=k-1,df2=n-k。(df1=1,df2=n-2)()fexe22自由度df=(r-1)(c-1)(r—横c—列)都是定类变项,用来检定是否相关。H1:X与Y相关H0:X与Y不相关(总体中)X12f11f12f21f22A1A2(A1、A2:X的边续次数:行)(B1、B2:Y的边续次数:列)②由E派生12//BSSdfFWSSdf③F对r检定2122/(1)/rdfFrdf1112212211122122,,,BABABABAeeeennnn其中:f是根据所抽取的样本而计算出来的实际次数,e是与每个实际次数相应的预期次数,A与B分别是X与Y两个变项的边缘次数,n是样本大小,r与c分别是表的行数与列数。
本文标题:社会统计学公式汇总及要点
链接地址:https://www.777doc.com/doc-2230203 .html