您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计数据分析基础教程3
第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang统计数据分析基础教程―基于SPSS和Excel的调查数据分析第3章问卷数据的录入与清理第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang本章内容3.1问卷数据的录入3.2在Excel中录入数据3.3核对和清理数据3.4在Excel中核对数据3.5在SPSS中录入数据3.6在SPSS中核对数据附录ⅠExcel数据分析工具附录Ⅱ在Excel中生成随机数第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang问卷数据的录入与清理进行数据统计分析之前,必须先将问卷数据录入计算机。为了保证不“GIGO,GarbageInGarbageOut”(垃圾进垃圾出),在统计分析之前,需要对录入的数据进行核对和清理。第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang3.1问卷数据的录入数据输入就是将问卷数据所对应的编码通过扫描或用键盘输入计算机,建立数据文件的过程。目前,数据输入的方式主要有三种:人工输入计算机辅助系统转换光电输入第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang3.1问卷数据的录入(人工输入)人工输入的注意事项:要规定统一的输入内容和输入格式。挑选和培训数据输入人员。数据输入过程中需要注意:第一,统一规定数据文件名。第二,数据输入时要为每一个输入人员提供一份有关输入内容和格式的手册。第三,要为每个输入人员提供足够的空间摆放问卷,避免不同输入人员的问卷或者同一输入人员已输入和未输入的问卷发生混淆,造成漏输或重复输入,影响问卷的质量。第四,每个输入人员在完成各自负责的问卷的输入任务后,由研究者把他们的数据合并成一个总的数据文件,以供统计分析使用。为了避免数据丢失,要把每个输入人员输入的数据单独存档,以备查找。第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang3.2在Excel中录入数据(单选题)1.确定取得单一答案2.尽可能使用单选题3.单选题如何编码和输入Q1.请问您现在是否拥有手机?□1.有□2.没有(跳至Q12题)例3-1在Excel中录入单选题Q1的数据单选题的编码和输入(用文字当列名,图3-1)单选题的编码和输入(用题号当列名,图3-2)第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang3.2在Excel中录入数据(多选题)多选题分为多项限选题、多项排序题、多项任选题。Q2.请问您当初购买手机的原因是什么?(可多选,最多3项)□1.方便与家人联络□2.方便与朋友同学联络□3.追求流行□4.工作需要□5.同学间比较的心理□6.别人赠送□7.手机价格下降□8.厂商推出的促销方案□9.网内互打较便宜□10.其他例3-2在Excel中录入多选题Q2的数据多选题的编码有2种:分类法和二分法。“分类法”编码和输入(图3-3)“二分法”编码和输入有关“分类法”和“二分法”编码,请参见P72~74冻结窗格(比较图3-4和图3-5)第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang3.2在Excel中录入数据(填空题)填空题也称开放题,不提示任何答案,要求使用者直接填写。对数值型的数据,为了取得其真正的数字(如:55),而非只取得区间(如:41~60),会采用填空题的方式取得数据(定量数据),例如:请问您平均每个月手机的话费约元?定量数据可不经任何转换,即可计算各种统计量:均值、标准差、最大值、最小值等,而且也可以直接进行均值比较与检验,甚至可以作为回归分析的因变量或自变量。如果为了取得数据的方便,就设计成选择题(单选题):请问您平均每个月手机的话费约多少钱?□1.20元及以下□2.21~40元□3.41~60元□4.61~80元□5.81~100元□6.101元及以上例3-3在Excel中录入填空题的数据(图3-6)第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang3.2在Excel中录入数据(量表)量表其实是一种顺序尺度(定序变量,有序变量),只有大小先后的关系,无倍数关系。量表有多种编码方式,如表3-2是量表常用的三种编码方式。例3-4在Excel中录入量表的数据(图3-7)产品属性非常重要重要普通不重要非常不重要(1)大小适中□5□4□3□2□1(2)重量轻巧□5□4□3□2□1(3)颜色炫丽□5□4□3□2□1(4)外型大方□5□4□3□2□1(5)符合人体工学□5□4□3□2□1(6)附属功能多□5□4□3□2□1第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang3.2在Excel中录入数据(排名题)排名(多项排序)是一种衡量的方式。如:下列几种手机的入网方式,请问您认为哪一种的收费最便宜?请依排名顺序,填入1、2、3、4、5:全球通神州行如意通动感地带新时空分此种类型的问卷,作为被排名的对象也不宜太多。否则,受访者也无法排列好。排个5、6项基本就是上限了。例3-5在Excel中录入排名题的数据(图3-8)可将排名题改为单选题第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang3.3核对和清理数据数据有效范围的清理对数据中的奇异值进行清理。数据逻辑一致性的清理依据问卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的合理性,主要针对的是相倚问题和多项限选题。数据质量的抽查第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang3.4在Excel中核对数据筛选出范围不合理的单列例3-6在Excel中核对“大小适中”的数据用自动筛选找出不合理的关联题例3-7在Excel中核对关联题“是否有手机”与“平均月费”的数据用高级筛选找出重复的记录例3-8用Excel处理重复的记录第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang3.5在SPSS中录入数据手工建立数据文件例3-9在SPSS中,手工建立调查问卷的数据文件1.调查问卷(P68-69)2.确定变量的个数3.在SPSS中定义变量4.单选题的变量定义5.多选题的变量定义:二分法和分类法从Excel获取数据文件例3-10将Excel中的数据导入到SPSS数据文件中方法一:先在SPSS中定义好变量,然后通过“复制-粘贴”方式将数据从Excel复制到SPSS中。方法二:利用打开文件的方法直接把Excel中的数据导入到SPSS中,然后再定义变量属性。第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang3.6在SPSS中核对数据利用SPSS的一维频率分析Frequencies命令可以发现单变量范围不合理的数据。利用SPSS的交叉表分析Crosstabs命令可以发现两个变量之间的逻辑一致性问题。第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang实践题1999年关于外商投资企业雇员调查问卷(P80~81)要求:(1)确定问卷中每个问题应该设置的变量的个数,并区分是定性变量还是定量变量。(2)给每个变量定义变量名、数据类型、变量名标签。(3)对于定性变量,定义相应的变量值标签(编码含义)。(4)自己填写一份问卷,并把有关信息输入数据文件中。(5)利用Excel随机数发生器,按照问题的编码,随机生成900份问卷数据,并对生成的数据进行核对。(6)保存这901份问卷的数据。请参见实验3.4随机数生成方法请参见实验3.1实验3.2第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang附录ⅠExcel数据分析工具1.Excel数据分析工具及其安装(1)工作表函数与数据分析工具的区别(2)数据分析工具的安装(两种方法)方法二有2个要求①“工具”-“宏”-“安全性”为“中”;②Analysis文件夹下的5个文件都要有2.统计分析工具的内容3.统计分析工具的使用更详细的安装步骤请参见Analysis文件夹下的“Excel数据分析工具的安装说明.doc”第3章问卷数据的录入与清理RUC,SchoolofInformation,YeXiang附录Ⅱ在Excel中生成随机数1.在Excel中生成序号2.在Excel中生成随机数利用“数据分析”工具“离散”分布“柏(伯)努利”分布利用RANDBETWEEN随机整数函数由于每次计算工作表时都将返回一个新的数值,所以最好能够将其产生的随机整数保存不变,具体做法是先“复制”再在原处“粘贴”为“值”。变量个数(m):表示要产生m列随机数个数(n):表示要产生n行一共产生n行×m列的随机数
本文标题:统计数据分析基础教程3
链接地址:https://www.777doc.com/doc-4755353 .html