您好,欢迎访问三七文档
第四章综合指标第四节标志变异指标一.标志变异指标概述二.标志变异指标的计算一、标志变异指标概述标志变异指标——是反映总体各单位标志值变动程度或差异程度、度量统计分布离中趋势的综合指标。又称为标志变动度或离散程度。离中趋势:指远离中心值的程度。变异指标反映离中趋势:离散程度不同就意味着变量在平均数周围分布的密集程度不同,从而同样的平均数对于两个总体具有不同的代表性。【例】A组:65、68、72、75分B组:34、51、95、100分A组的总成绩:280分,平均成绩70分B组的总成绩:280分,平均成绩70分1X平均指标反映了各变量值向中心值聚集的程度,即集中趋势;变异指标反映了各变量值远离中心值的程度,即离中趋势。图示:Xf2X=0标志变异指标的作用:①是衡量平均数代表性的尺度;变异指标越大,平均数的代表性越小,变异指标越小,平均数的代表性越大。①可以用来说明现象变动过程的稳定性和均衡性;②有助于确定必要的抽样数目。种类:全距四分位差平均差标准差离散系数二、标志变异指标的计算(一)极差(二)平均差(三)标准差(四)变异系数(五)是非标志分布的数值特征(一)极差(全距、R)minXXRmaxminmaxLUR全距的特点:优点:计算简便,含义清晰,可以说明总体中标志值变动的范围。还是编制组距数列确定组数、组距的重要依据。缺点:容易受两极端值影响,带有较大的偶然性,而对于两个极端值之间标志值的分散状况没有反映,因而不能准确描述出数据的分散程度,只是测定标志变异指标的粗略方法,不能全面反映总体各单位标志的变异程度。补充:四分位差把一个变量数列分成四等份,形成三个分割点Q1、Q2、Q3,这三个分割点的数值就称为四分位数,Q2也是中位数,四分位差为:Q.D.=Q3-Q1数四分位差Q.D.数值越大,说明中位数Me的代表性愈差,反之,则说明中位数Me的代表性愈好。(二)平均差(A·D)平均差:是总体中各单位标志值与其算术平均数之间绝对离差的算术平均数。它能综合反映总体标志值的变异程度。n|xx|ΣDAΣff|xx|ΣDA【例】:有两个生产小组,每组都是5名工人,某天日产量的件数如下:甲组:5060708090乙组:6869707172则:70(件)/nxx70(件)/nxx乙乙甲甲ΣΣ12(件)|)/57090||7080||7060||7050(||)/nxx|(ΣDA甲1.2(件)|)/57072||7071||7069||7068(||)/nxx|(ΣDA乙结果表明:乙组工人日产零件平均数的代表性比甲组高。【例】某班统计学考试分数资料如下60以下55211047.5060-7065639082.5070-80751075037.5080-9085191615118.7590以上95328548.75合 计—403150335.00总成绩xf按成绩分组(分)组中值x人数(人)ff|xx|计算平均差如下:78.75(分)403150ΣfΣxfx8.375(分)335/40Σff|xx|ΣDA注:离差——总体单位的标志值与其平均数之差即。平均差使用绝对值是为了避免各变量值与平均数的离差之和等于零。xx平均差的特点:①平均差是根据全部变量值与平均数离差计算出来的,能全面、客观地反映标志值的离散程度。②平均差计算有绝对值符号,不适合代数方法的演算使其应用受到了限制。(三)、标准差和方差(σ与σ2)标准差(σ):是总体各单位的标志值与其算术平均数的离差平方的算术平均数的平方根,又称均方差。方差(2):是标准差的平方。Σff)xΣ(x或σn)xΣ(xσ22标准差与平均差比较:标准差是以离差的平方来消除正负号的影响,对离差平方求平均数得方差,然后再开方,就恢复了原来的计算单位。且加大离差,突出了标志变异的程度。标准差的计算还应用了最小平方原理,以算术平均数为中心,使标准差成为反映标志变异程度的最理想的计算方法,是实际应用最广泛的离散程度测度值。【例】有两个生产小组,每组都是5名工人,某天日产量的件数如下:甲组:5060708090乙组:6869707172则:70(件)/nΣxx70(件)/nΣxx乙乙甲甲计算标准差如下:1.414(件))/5211(2σ14.14(件))/5201010(20σn)xΣ(xσ2222乙2222甲2结果表明:乙组工人日产零件平均数的代表性比甲组高。某班统计学考试分数资料如下60以下5521101128.13605060-706563901134.382535070-807510750140.635625080-9085191615742.1913727590以上953285792.1927075合 计—4031503937.50252000x2f总成绩xf按成绩分组组中值x人数f(人)f)x(x2【例】78.75(分)x9.92(分)403937.52Σff)xΣ(xσ29.92(分)2(78.75)402520002)ΣfΣxf(Σff2Σxσ其标准差计算如下:标准差的变形公式:2222222222222222xx)ΣfΣxf(ΣffΣx或σxx)nΣx(nΣxxx2nΣxnxnnΣxx2nΣxn)xx2xΣ(xn)xΣ(x)()(方差与标准差的性质:①具有“平移不变”的特性,即:σx+a2=σx2σX+a=σx②σbx2=b2σx2σbx=|b|σx将这两条性质结合起来,就有:变量X的线性变换的方差和标准差分别为:σbx+a2=b2σx2σbx+a=|b|σx③如果两个变量X和Y相互独立,它们的代数和的方差就等于原来两个变量的方差之和;它们的代数和的标准差则等于两个变量方差之和的正平方根,即有:2Y2XYX2Y2X2YXσσσσσσ【例】已知某校一年级小学语文成绩X的标准差为10分,数学成绩Y的标准差为6分,则两门功课总成绩的方差与标准差就应该是:11.66(分)136σσσ136(分)610σσσ2Y2XYX222Y2X2YXii2i2ii2i2iΣffΣσσn)xΣ(xσii2i2Σff)xxΣ(δ④总方差=组内方差的平均数+组间方差22i2δσσ其中:方差与标准差的性质:⑤对于同变量分布,其标准差永远不会小于平均差。即:xxσDA【例】某班组11个工人日产零件数如下:151719202222232325263016.18116416911492549n)xΣ(xσ22(件)242/11Σx/nX22如果分组如下:15-193172.6720-245221.2024以上3274.67日产零件数(件)工人数(人)组平均数组内方差ix2i4.67327)(3027)(2627)(25σ1.20522)(2322)(2322)(20σ2.67317)(1917)(15σ222232222222212.5435334.6751.2032.67ΣffΣσσii2i2i13.6411322)(27322)(17Σff)xxΣ(δ22ii2i216.18=2.54+13.6422i2δσσ验证:总方差=平均组内方差+组间方差即:标准差与全距、平均差的关系:①σ与R的关系经验表明,当分布数列接近于正态分布时,存在以下经验公式:R为4至6个σ当标志值项数较少时,R≈4σ当标志值项数较多时,R≈6σ②σ与A·D的关系对同一资料,所求的平均差一般比标准差要小,即A·D≤σ(四)变异系数【例】某车间某小组有6个工人,分别带了1个徒工,其日产量(件)数列如下:甲组(工人组):626570738082乙组(徒工组):8131719222472(件)x甲17.17(件)x乙可以看出甲组标志值变异程度较小,平均数更具有代表性,但进一步计算,7.97(件)n)xΣ(xσ2甲5.91(件)n)xΣ(xσ2乙通过观察:计算结果发现:甲组标准差大于乙组标准差,似乎可得出甲组平均数比乙组平均数代表性差的结论,这与事实不符。究其原因,是因为两数列原有标志值水平不一样,不能用来判断平均数的代表性。那么,怎样判断两个总体标志值的离散程度,评价其平均数的代表性大小呢?应进一步计算其标志变异的相对程度——标志变动系数。变异系数概念:变异系数:又称为离散系数,是将各种绝对数或平均数形式的标志变异指标与其算术平均数对比的结果,以反映总体各单位标志值相对离散程度的指标。常见的变异系数有:极差系数:平均差系数:标准差系数:XRVRXDAVDAXσVσ标准差系数的特点:不受计量单位和标志值水平的影响,消除了不同总体之间在计算单位、平均水平方面的不可比性。标准差系数的作用:①比较性质不同的变量数列标志值的差异程度;②比较计量单位不同的变量数列的平均数代表性大小。根据前面的例子有:(1)0.01714701.2xDAV0.17147012xDAVD乙AD甲A0.0202701.414xσV0.2027014.14xσ乙甲V计算结果表明:乙组工人日加工零件的平均数代表性高。(2)变异系数的计算例子:(3)根据某班统计学考试分数计算的变异系数如下:0.126078.759.92XσV0.106378.758.375XDAVσDA【例】亩产(公斤)播种面积(亩)300-40040400-50070500-60075600以上20乙品种资料:平均亩产=412公斤,σ=80公斤。要求:计算有关指标比较两个品种水稻单产的稳定性。甲品种资料甲、乙两个品种的水稻产量资料如下:甲品种的平均产量及标准差计算表亩产(公斤)播种面积(亩)xxfx2f300-40040350140004900000400-500704503150014175000500-600755504125022687500600以上20650130008450000合计205—9975050212500先计算平均数与标准差:90.38(公斤))20599750(20550212500)ΣfΣxf(ΣffΣxσ486.59(公斤)99750/205Σxf/ΣfX222甲甲再计算甲、乙两个品种的标准差系数:V甲V乙,甲品种产量的稳定性好。19.42%41280xσV18.57%486.5990.38xσV乙乙乙甲甲甲从甲市任抽100户,得其平均年收入是42000元,年收入的标准差是38060元;从乙市任抽150户,得其平均年收入是62000元,年收入的标准差是50980元。试计算适当指标比较两个不同城市居民家庭收入的差异程度。即问即答由于V乙<V甲,据上述抽样资料可知,乙市家庭的收入差异程度低于甲市家庭的收入差异程度。注意,在这里不能用标准差作比较,否则会得出错误结论。【解】90.62%4200038060XσV甲82.23%6200050980XσV乙(五)是非标志分布的数值特征是非标志:用“是”、“非”或“有”、“无”来表示的分组标志,也称为交替标志成数:标志表现为“是”、“非”的单位数分别占全部总体单位数的比重。用P、Q表示。成数指标:P、Q设总体单位数N=N1+N0,则:所以Q=1-P成数反映了数列中单位数“是”与“非”的构成,并且代表该种性质或属性反复出现的程度,即频率。NNP1NNQ01NNNNQP01是非标志平均数与标准差的计算品质标志标志值(x)是1P非0Q合计—1“1”表示具有某种性质的单位标志值,“0”表示不具有某种性质的单位标志值。其中:频率(f/Σf)P)P(1PQP)PQ(QQPPQNNPNNQNNNP)(0NP)(1Σff)xΣ(xσ2202120102122
本文标题:43 标志变异指标
链接地址:https://www.777doc.com/doc-3818405 .html