您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 58第二章统计调查与整理
第二章统计调查与整理本章内容•第一节统计调查概述•第二节统计调查方案设计•第三节统计整理概述•第四节统计分组•第五节次数分布•第六节统计表•本章重点和作业第一节统计调查概述•一、统计调查的含义•1、统计调查的定义:P31。•2、统计调查的要求:•二、统计调查的种类返回本章首页2020/1/23第二章统计调查和整理32、统计调查的要求(1)准确性(2)及时性(3)完整性—全面性(4)系统性返回本节首页2020/1/23第二章统计调查和整理4二、统计调查的种类(一)按调查对象包括的范围来分(二)按调查的组织形式来分返回本章首页2020/1/23第二章统计调查和整理5(一)按调查对象包括的范围来分1、全面调查:对调查对象中的全部单位,都一一进行调查。如普查(书P36)、全面统计报表。2、非全面调查:抽样调查、重点调查、典型调查、非全面统计报表。主要的非全面调查介绍:返回2020/1/23第二章统计调查和整理6抽样调查1、概念:P39。抽样调查目的:推算总体数值。2、抽样调查的特点:(1)按随机原则抽取调查单位;(2)根据部分推断总体。2020/1/23第二章统计调查和整理7重点调查1.重点调查的概念:P37。2、重点单位的涵义:举足轻重的单位,标志值在标志总量中占有绝大比重的单位。2020/1/23第二章统计调查和整理8典型调查典型调查:在调查对象中有意识的选取若干具有代表性的单位进行的非全面调查。典型有三种:先进、中间、后进。返回首页2020/1/23第二章统计调查和整理9(二)按调查的组织形式来分1、统计报表:书P32。2、专门调查:为了研究某些专门问题而专门组织的调查。包括:普查重点调查典型调查抽样调查返回第二节统计调查方案设计一、确定调查目的二、确定调查对象和调查单位三、确定调查项目四、确定调查时间和调查期限五、制定调查的组织实施计划返回本节首页二、确定调查对象和调查单位1、调查对象—指总体范围。2、调查单位:构成调查对象的每一个单位,即总体单位。3、填报单位(报告单位):是指负责向上级汇报调查内容、提交统计资料的单位。返回首页四、确定调查时间和调查期限1.调查时间:调查资料所属的时间(时期或时点)。2.调查期限:进行调查工作的时间。返回首页2020/1/23第二章统计调查和整理13第三节统计整理概述一、统计整理的概念:书P70。二、统计整理的内容1、录入数据,建立数据表2、数据排序与分组3、编制次数分布表与累计次数分布表4、绘制统计图返回本节首页14问卷调查数据如何录入:问卷示例1、序号2、姓名3、性别1男2女4、出生年月日(dd/mm/yyyy)5、请问您通常获取新闻的方式有哪些1报纸2杂志3电视4收音机5网络6、每天上网的小时数:小时7、对于XX产品满意程度1非常满意2满意3无所谓4不满意5非常不满意问题的类型:单选题----3,7数值型开放题----1,6文字型开放题----2日期型开放题----4多选题----52020/1/23第二章统计调查和整理1515开放题的录入1序号2姓名4出生年月日(dd/mm/yyyy)2020/1/23第二章统计调查和整理1616多选题的记录格式(1)多重二分法–确诊高血压后,您按医生的建议采取了哪些非药物方法控制高血压?□调理饮食□做适宜运动□保持情绪稳定□其它措施–每一个题项设立一个二分类变量,用Y/N或者‘0/1’表示该选项是否被选择。17(2)多重分类法:有排序的多选题–请在下面列出的6个手机品牌中选出您认为最信得过几个(最多列三个),并将代码填入下面空格1.____2.____3.____候选品牌列表:1、诺基亚2、摩托罗拉3、三星4、TCL5、海尔6、波导Excel应用1:数据排序(1)直接排序:“数据”——“排序”(升序或降序)(2)排名次:RANK(指定数字,范围,0)[0或者忽略表示降序,非零值表示升序;范围要用绝对地址]注意:A、输入公式时:必须以“=”开始;B、灵活运用压缩对话框按钮;Excel应用1:数据排序C、复制方法:(a、用十字架拖;b、用复制功能,按住SHIFT键);D、引用单元格分相对引用和绝对引用。绝对引用的格式:在单元格行和列前加上“$”符号,或是按一次F4键。(3)分类汇总:先排序“数据”——“分类汇总”——选好“分类字段”、“汇总方式”、“汇总项”——“确定”2020/1/23第二章统计调查和整理20第四节统计分组•一、统计分组的概念与作用:P73。•二、统计分组方法(一)分组标志的选择(二)统计分组的形式(三)统计分组应遵循的原则1、穷尽性原则2、互斥性原则返回本章首页(一)分组标志的选择1、按品质标志分组如按性别分组,见表2-7表2-7某班学生的性别构成情况按性别分组绝对数人数比重(%)男3075女1025合计401002、按数量标志分组(1)单项式分组见表2-8工人平均日产量(件)绝对数比重(%)2108.731513.043026.154034.862017.4合计115100.0表2-8某厂第二季度工人平均日产量工人数(2)组距式分组表2-9某工厂工人完成生产定额情况表工人按完成定额分组(%)工人数绝对数比重(%)80-9090-100100-110110-120120-130304060302016.722.233.316.711.1合计180100.0返回(二)统计分组的形式1、简单分组:对被研究现象总体只按一个标志进行分组;2、复合分组:对同一总体选择两个或两个以上标志层叠起来进行分组。辅助工技术工女辅助工技术工男返回首页第五节次数分布一、次数分布的概念和种类1、次数分布的概念:P80。2、次数分布的种类二、变量数列中的几个重要概念三、分布数列的呈现四、变量数列的编制步骤返回本章首页2、分配数列的种类返回本节首页分组各组对应的次数或频率构成要素变量数列品质数列分类组距数列单项数列品质数列举例我国大陆人口的性别分布(某年末)各组名称次数或频数频率(比重)性别人数(万人)比率(%)男性6362950.98女性6118149.02合计124810100返回首页单项数列举例表2—8工人平均日产量(件)工人数绝对数比重(%)2345610153040208.713.026.134.817.4合计115100.0返回首页组距数列举例表2—9工人按完成生产定额分组(%)工人数绝对数比重(%)80—9090—100100—110110—120120—130304060302016.722.233.316.711.1合计180100返回首页二、变量数列中的几个重要概念(一)组数、组限、组距(二)组中值(三)等距数列与异距数列返回本节首页(一)组数、组限、组距1、组数:指变量数列共分多少组。2、组限:指各组的数量界限。分为上限和下限。(开口组、闭口组)3、组距:各组所包含的变量值的变动范围。组距=上限—下限表2-10、表2-11返回首页(二)组中值组中值:组距数列中各组所有变量值的代表值,实际上是各组上限与下限之间的中点值。计算公式为:闭口组:缺下限的开口组:缺上限的开口组:2下限上限组中值2邻组组距上限组中值2邻组组距下限组中值举例返回组中值举例按完成净产值分组(万元)10以下缺下限:组中值=10—10/2=510—20组中值=(10+20)/2=1520—30组中值=(20+30)/2=2530—40组中值=(30+40)/2=3540—70组中值=(40+70)/2=5570以上缺上限:组中值=70+30/2=85返回首页(三)等距数列与异距数列1、等距数列:每个组的组距都相等的组距数列。2、异距数列:各组的组距不尽相等。表2-10、表2-11返回首页考分人数(人)比重(%)50~6025.060~70717.570~801127.580~901230.090~100820.0合计40100.0返回首页表2—10某班学生统计学考试成绩表下一页人口按年龄分组人口数(万人)1岁以下(婴儿组)11~7岁(幼儿组)67~17岁(学龄儿童组)1217~55岁(有劳动能力的人口组)24.655岁以上(老年组)8.1合计51.7表2-11某地区人口分布状况返回首页三、分布数列的呈现(一)编制分布表——列表法:(二)编制分布图——图示法:有柱形图、折线图、曲线图、圆饼图等等。[应用](三)累计次数分布返回本节首页“插入”—“图表”——按照“图表向导”的指令进行操作。第1步:选好“图表类型”第2步:选好“图表数据源”第3步:选好“图表选项”第4步:选好“图表位置”Excel应用2:绘制统计图绘制“直方图”:A、在柱形图的基础上画直方图:柱形图—修改“数据系列格式”中的选项——间距宽度改为0,点上依数据点分色B、用直方图分析工具:“工具”—“数据分析”—“直方图”,选好“输入区域”、“接收区域”和“输出区域”—修改“数据系列格式”Excel应用2:绘制统计图累计次数分布从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。向上累计向下累计从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。2020/1/23第二章统计调查和整理41销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)5以下5~1010~1515~2020~2525以上410161343820322686合计50100fff2020/1/23第二章统计调查和整理42销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向上累计5以下5~1010~1515~2020~2525以上41016134382032268641430434750828608694100合计50100——fff销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向下累计向上累计向下累计5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合计50100————fff四、变量数列的编制步骤1、将数据排序,确定最大值、最小值和全距;2、确定变量数列的形式:是编制单项数列还是组距数列;3、确定组数、组距和组限;4、分组计算次数。返回单项数列指每个组值只用一个具体的变量值表现的数列。同时具备变量是离散变量变量的不同取值个数较少编制条件:【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。日产量(件)X工人数(人)f202122232425263564321合计24编制结果如下:组距数列指每个组的变量值用一个区间来表现的变量数列。变量是连续变量;或:总体单位数较多,变量不同取值个数也较多的离散变量。编制条件:应用FREQUENCY(data_array,bins_array)函数Data_array:用来编制频数分布的数据,Bins_array:频数或次数的接收区间Excel应用3:利用Excel频数分布函数进行数据分组“插入”—“函数”——选择“FREQUENCY”,单击“确定”——设好“数据区域”、“数据接受区间”——按住Ctrl+Shift组合键,再敲“回车”键。Excel应用3:利用Excel频数分布函数进行数据分组第六节统计表•一、统计表的结构•二、统计表的种类返回本章首页一、统计表的结构1、从形式上,统计表由总标题、行标题、列标题、指标数值和附加五个部分构成;2、从内容上,统计表由主词和宾词两个部分构成。返回本节首页总标题纵栏标题项目产值(亿元)比重(%)横行标题轻工业20584.631资料数字重工业45840.669合计66425.2100工业增加值表2-142005年全国工业增加值主词宾词二、统计表的种类1、
本文标题:58第二章统计调查与整理
链接地址:https://www.777doc.com/doc-3251868 .html