您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > 1.1数据分组与变量数列
1.1数据分组与变量数列数据170184175190164181173176165182159178169175188160177178179身高(cm)单项分组184190181176182178188177178179170175164173165171159169175160组距分组160160-170170-180=180159160170164165169175173171175176178177178179184190181182188单项分组组距分组将变量的全部取值按照其大小的顺序划分成若干个不同数值的区间将变量的不同取值作为一组的组别,变量有多少个不同的取值就划分为多少组。离散型变量且取值不多采用单项分组连续型变量,或取值较多的离散型变量采用组距分组变量数列在对变量取值进行分组的基础上,将各组不同的变量值与其出现的次数排列成的数列,称为变量数列组距数列14105变量值出现次数160160-170170-180=180单项数列170164173165171159169175160变量值出现次数1111111118419018117618217818817717911111111变量值出现次数2214105变量值出现次数160160-170170-180=180频率向上累计频数向下累计频数总计200.050.20.50.25115=1+415=1+4+1020=1+4+10+520=1+4+10+519=4+10+515=10+55组数=4组别组距=10频数组上限180组下限170组距数列相关的几个概念变量数列的编制的5个步骤1、确定组数2、确定组距3、确定组限4、计算各组的次数(频数)5、编制变量数列1、确定组数斯特吉斯H.A.Sturges公式组距分组的组数通常选取在5-20组之间变量值变化不均匀应采用异距分组;变量值变化均匀应采用等距分组.等距分组便于比较和分析处理,实践中应尽量采用等距分组𝑚=1+3.322⋅lgN(m为组数,N为变量值的个数)2、确定组距𝑑=max𝑥𝑖−min(𝑥𝑖)𝑚公式计算出的值为组距的最小值,在实际分组中,为了使全部变量值都能有组可入,实际的组距只能比此值大。3、确定组限组限应尽量采用整数,特别是5和10的倍数。离散型变量邻组的上下限可以不用同一个数值,连续型变量邻组的上下限必须用同一个数值。邻组的上下限为同一数值时,约定:上限不包含在本组之内。称为上限不在内原则变量数列的分布图身高(cm)人数(个)17016417316517111691751601841901811761821781881771792159柱状图150160170180190身高(cm)人数(个)510直方图150160170180190身高(cm)人数(个)510折线图洛伦兹曲线研究的是国民收入在国民之间的分配问题。它是美国统计学家洛伦兹提出的。它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。例如,收入最低的20%人口、40%人口……等等所得到的收入比例分别为3%、7.5%……等等,最后,将这样得到的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。洛伦兹曲线人口累积收入累积0%0%20%3%40%7.5%60%29%80%49%100%100%20%40%60%80%100%20%40%60%80%100%M(收入)(人口)OLAB洛伦兹曲线H显而易见,洛伦兹曲线的弯曲程度具有重要意义。一般来说,它反映了收入分配的不平等程度。弯曲程度越大,收入分配程度越不平等;反之亦然。特别是,如果所有收入都集中在某一个人手中,而其余人口均一无所有,收入分配达到完全不平等,洛伦兹曲线成为折线OHL;另一方面,如果任一人口百分比等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配就是完全平等的,洛伦兹曲线成为通过原点的45直线OL。一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间;相应的洛伦兹曲线,既不是折线OHL,也不是45o线OL,而是像OBL那样向横轴凸出,尽管凸出的程度有所不同。收入分配越不平等,洛伦兹曲线就越是向横轴凸出,从而它与完全平等线OL之间的面积越大。基尼系数因此,可以将洛伦兹曲线与45o线之间的部分A叫做“不平等面积”;当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL,OHL与45o线之间的面积A+B就是“完全不平等面积”。不平等面积与完全不平等面积之比,称为基尼系数,是衡量一个国家贫富差距的标准。设G为基尼系数,则G=A/(A+B)(0≤G≤1)A=0,G=0,收入分配绝对平等;B=0,G=1,收入分配绝对不平等。基尼系数被西方经济学家普遍公认为一种反映收入分配平等程度的方法。也被现代国际组织(如联合国)作为衡量各国收入分配的一个尺度。按国际上通用的标准:基尼系数小于0.2表示绝对平均;0.2—0.3表示比较平均;0.3—0.4表示基本合理;0.4—0.5表示差距较大;0.5以上表示收入差距悬殊。
本文标题:1.1数据分组与变量数列
链接地址:https://www.777doc.com/doc-3276313 .html