您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 统计学原理(00974)第二章
第二章统计资料的搜集与整理统计学原理第一节统计资料及其搜集方法一、统计资料的意义统计资料是对客观事物的数量特征进行观察和度量所形成的数量信息资料。获得统计资料是认识和研究客观事物的基础。统计资料有三个基本性质:1.数量性统计学以事物数量特征为主要研究对象,因此统计资料都具有数量性。运用统计方法所形成的资料具有数量性的特点。2.总体性统计资料描述的是大量的、密集型事物的总体特征。统计资料必然具有总体性。3.客观性统计资料的客观性也体现在它的非抽象性。统计资料都是对具体事物的描述,都是具体的数量,而不是如同数学所研究的那种抽象的量。(如虚数)二、统计资料的搜集获得统计资料有多种渠道和方法。从获得资料的途径看。统计资料可以分为原始资料和次级资料。所谓原始资料就是指通过统计调查或试验所取得的统计资料,都属于第一手资料。所谓次级资料就是指来源于别人通过统计调查或试验所取得并已经加工整理过的统计资料,都属第二手资料。(一)次级资料的搜集主要有两种情况:1.公开出版的资料2.非公开出版的资料(二)原始资料的搜集在内容上可分为两大类:观察性的和实验性的。所谓观察性的,指的是调查人员不对客观发生的事物进行干预,仅凭观测而获得统计资料。所谓实验性的,指的是观察人员要通过对一些具体事项的安排才能获取不同条件下的统计数据。原始资料的搜集方法有以下几种:(1)访问调查优点:有利于获得详细深入的信息,准确程度较好缺点:调查费用较高,调查时间长,对调查人员的素质要求较高。(2)电话调查优点:调查效率比访问调查高,数据质量也有一定的保障。缺点:会受到电话普及程度的影响,电话普及率低,影响调查效果的可靠性。(3)邮寄问卷优点:调查成本较低,用时不长,有利于被调查者对一些敏感性的问题进行真实回答。缺点:通常回收率和合格率较低(4)观测优点:调查效果好缺点:一般调查成本很高(5)互联网调查优点:可给调查活动带来许多方便缺点:目前仍受到普及率的影响三、搜集资料的注意事项需要考虑的注意事项有:(1)涉及范围要适度。资料太少不足以反映情况,资料太多又需要花费大量的时间和费用。(2)事先进行规划,提高搜集资料的效率。(3)注意版权问题。第二节调查方式与调查方案原始资料需要通过组织多种形式的统计调查来获得。要进行统计调查,一方面要选择恰当的调查方式,另一方面也要在调查之前通盘设计好调查方案。一、统计调查的方式(一)普查(二)抽样调查(三)统计报表(四)重点调查(五)典型调查二、统计调查方案统计调查方案是指导整个调查活动的纲领性文件。一般包括以下主要内容:(一)调查目的(二)调查对象和调查单位(三)调查内容和调查表(四)其他内容主要内容有:(一)调查目的调查目的是指调查活动所要达到的具体目标(二)调查对象和调查单位调查对象就是指根据调查目的确定的调查研究总体或调查范围。调查单位是指调查范围内的个别单位,它是具体调查项目和指标的承担者,即所要了解的信息的载体。调查单位的层次和类型可以是多种多样的。(三)调查内容和调查表调查活动的核心就是将要进行调查的内容,也就是需要向调查单位了解的情况和问题。调查表是把所调查的内容具体化为一些明确的项目或指标,并适当排列制成表格。(四)其他内容调查方案中还应明确规定调查内容的时间特征和调查工作的时间限制,确定搜集数据的具体方法以及调查的具体组织实施工作。第三节统计调查误差统计误差是客观存在的。不论采取什么途径或调查方法,搜集到的数据总会由于各种原因产生一定程度的误差。一、统计调查误差的种类统计调查误差是指通过调查或实验所获得的统计数据与调查对象的实际数量的差别。在统计活动中,存在误差这种现象是非常普遍的,几乎所有统计调查都会产生误差,其产生的原因也是多种多样的。统计误差可分为登记误差和代表性误差。(1)登记误差登记误差是由于调查过程中在测量、记录、填报、计算等活动中产生的误差。(2)代表性误差代表性误差是指在非全面调查中,由于选取的那部分单位对全部单位的代表性不足而产生的误差。二、产生误差的客观原因(一)客观随机性(二)操作不当(三)计算中的舍入误差(四)故意制造的误差三、怎样看待误差(一)误差降低了统计数据的质量(二)误差是难以避免的(三)人们对准确性的要求是相对的(四)追求过高的准确性往往得不偿失第四节统计数据的整理一、统计数据整理的意义和步骤(一)统计数据整理的目的原始数据杂乱无章,很难从中看出事物的内在规律性,进行数据整理的基本目的是使数据简单化、系统化。(二)统计数据整理的基本方法分组是进行数据整理的基本方法。分组的依据是事物的相似性。(三)统计数据整理的步骤(1)对原始资料进行审核。审核的主要方法有:①常识性审查。②比较性审查。③设置疑问框审查。(2)对原始资料进行分组和汇总(3)将汇总结果用统计表或统计图的方式表现出来,未统计资料的使用和分析做好准备。二、统计分组(一)统计分组的意义统计分组是将总体所有单位按照一定的标志区分为若干部分,在不同的部分之间,存在着差异,而在每一部分内部,忽略其差异,视为性质相同。分组的关键是选择恰当的分组标准和准确地划分组的界限。(二)统计分组的类型品质分组和数量分组品质分组指的是按照事物的某种客观属性进行分组,或是对“定类尺度”和“定序尺度”的数据进行分组。这些“客观属性”的共同点是:它们都必须用文字来表述而不能数量化。数量分组指的是按照事物的某一种数量特征来划分组间界限,或是对“定距尺度”和“定比尺度”的数据进行分组。三、次数分布(一)次数分布的概念将原始资料按某个标志分成若干组,每个组内都会包括不同数目的个别单位,这个数目就是各组的次数。次数与每组的数量界限共同排列,就形成次数分布。次数分布描述了总体的结构和数量特征。(二)数量分组的次数分布1.分组方法组数与组距基本上成反比关系,组距越大,组数越少;组距越小,组数越多。一般情况下,资料中的数据分为5~15组较好。2.分组组距及组中值次数分布中,组限可以相等,形成等距式分组;组限也可以不相等,形成不等距分组。这两种分组方法适合不同的情况:前者常用于数值变化比较平缓的情况;后者常用于变量值变化比较剧烈的情况。组中值的计算方法为:组中值=(下限+上限)/2对于开口组,计算组中值的方法为:首组(数值最小的一组)组中值=本组上限-邻组组距末组(数值最大的一组)组中值=本组下限+邻组组距3.累计次数分布为了统计分析需要,有时要观察某一数值以上或某一数值以下的次数之和,这就要在分组的基础上列出累积次数值。4.分组变量的类型对不同类型的数据进行分组,需要考虑数据本身的性质——是连续变量还是离散变量来选择组限的标示方法。对连续变量分组时,本组的上限与后一组的下限是重叠的,即数值相同。对数据分组时还需要注意“上组限不在内”原则。离散变量通常是由计数而产生的,其数值都是自然数,不像连续变量那样存在着数值连续或“处处稠密”的特点。因此,在划分组限时,本组的上限与后一组的下限是相邻的自然数。统计学在处理连续变量和离散变量时,并未完全依照数据自身的数学特征来划分变量的性质。当数据数值较小、不易或不必取得连续变量的准确数值等情况时,可按照离散变量的方法处理;而当数据数值较大时,可按照连续变量的方法处理。(三)次数分布的图示为了使次数分布的特征形象化,需要绘制次数分布图。次数分布图是在平面直角坐标系上画出直方图或折线、曲线图,来表现不同的组各自的次数或频率的方法。一般都把横轴用作分组,纵轴用来表示次数或频率。1.品质分组次数分布的图示2.等距分组次数分布的图示3.不等距分组次数分布的图示4.累积次数分布的图示(四)次数分布的类型常见的分布曲线有三种类型:1.钟形分布曲线基本特征是“两头小,中间大”,即靠近变量极大值和极小值的单位比较少,而靠近中间的单位比较多。钟型分布经常出现不对称的情况,根据其长尾拖向哪个方向又可分为右偏和左偏两种类型。右偏时,靠近最小值一端的单位比较多;左偏时,靠近最大值一端的单位比较多。2.J型曲线根据其方向分为正J型曲线和反J型曲线。正J型曲线,随着变量值的上升,各组次数也上升,即“越来越多”;反J型曲线,随着变量值的上升,各组次数下降,即“越小越多”。3.U型曲线U型曲线的分布特征恰与钟型曲线相反,是“两头大,中间小”,靠近极端值的单位数比较多。
本文标题:统计学原理(00974)第二章
链接地址:https://www.777doc.com/doc-2138408 .html