您好,欢迎访问三七文档
第八章数据处理访问或其他方式搜集到的问卷资料,必须通过一定的数据处理程序,转换成可供计算机分析的数据形式。大体上,调查数据的处理包括资料检查与校订、资料编码、数据录入与整理等几个步骤。第一节一、资料检查资料检查是指对调查得到的原始资料质量的审查与核实,目的是要确定哪些资料可以接受,哪些资料要剔除掉。它主要通过对回收问卷的完整性、准确性和真实性的检查来实现。首先,访问员没问某些问题,或没记录某些问题的答案。其次,访问员的记录字迹不清。第三,记录的答案模棱两可或含义不清楚。第二节资料编码原则上是将被访者对一个问题的回答,分配一个相对应的计算机软件能够识别的代码,这个代码就是代表该项回答内容的编码。就具体的编码方式而言,研究者可以在问卷设计时事先赋予被访者所可能回答的选项一个代码,编码时只要逐一记录被访者回答的选项代码即可,这种与问卷设计同步进行的编码形式被称为事前编码,或预编码。研究者也可以在访问结束后,再逐一就受访者的回答进行编码的工作,这种编码方式被称为事后编码。在事后编码中,编码员首先要对已出现的各种答案进行分类,即分析每一个答案,将相类似的归并为一类。其次,代码指南的编制要在设计问卷时就开始,在小组讨论、深入访谈和试调查过程中,研究者要有意识地摘要记录每个不同的答案。第三,编码时,研究者在为编码员提供每一个编码项目的代码指南的同时,还应该附上几张单页编码纸,将需要编码项目的名称和誊写答案的位置清楚地标在每页的顶端。最后,对于事后编码来说,如果有两个或多个编码员参与编码工作,那么他们要么在不同的时间进行编码;要么同时在同一地点,依照同一编码手册进行编码。在对资料进行编码时,必须事先制订详尽的计划和明确的规则,通常需要编制一份编码手册,用来记载资料数量化的所有格式、内容,以及使用计算机资料的具体步骤。事前编码和事后编码所用的编码手册编码手册最直接的作用是提供一套标准化的编码作业程序。所谓特殊题型主要是指复选题和排序题,即被访者可以选取多个答案,或对选出的多个答案进行排序的情况。与单选题编码相比,这两类题型的编码稍有些复杂,而且相应的统计分析也需要特别的软件指令。(一)复选题的编码在调查研究中,研究者经常要求被访者针对某一问题在多个答案选项中进行复选,(二)要求被访者从几个答案选项中选择的答案不止一个,所以具有复选题的特性;与此同时,又由于要求被访者对选项排出顺序,故每一个被选中的答案选项,其排序位置有1、2或3多种可能,这样在实际编码和统计分析中,排序题与复选题有其第三节资料编码完成后,就可以进行数据的计算机录入和数据文件的整理工作了。数据录入是将问卷资料所对应的代码扫描或用键盘直接输入计算机磁盘,建立起数据文件。而数据文件整理包括数据清理和缺失值的处理,前者是利用统计软件查找数据错误;后者则是通过分析,有效地对缺失值予以数据录入目前大致采用三种方式进行:人工输入、计算机辅助系统转换和光电输入。计算机辅助系统转换和光电输入一般都是用与设备配套的软件。而人工输入无论是直接录入,还是登录表转录,都有许多通用的软件可以选择。第一,在正式录入开始前,研究者必须统一规定需要录入的资料内容和数据录入格式。第二,要对数据录入人员进行培训,绝不能假定会计算机操作的人员就懂得如何进行数据录入。第三,数据录入中的工作要点(一)可能数值清理是针对每一个变量,检查它是否有超出合理范围的数值。(二)一致性清理涉及数据结构的检查,通常会牵涉两个或两个以上变量。所谓逻辑不一致数值,是指两个或两个以上变量之间出现了逻辑上彼此互斥的数值。(一)对于系统性缺失,研究者应先不要简单地对缺失值进行填补或估计,而是进行缺失分析。具体做法是,运用一个虚拟变量,将发生缺失的样本归为一类,然后与其他没发生缺失的样本进行对比如果二者在一些重要的统计量上,具有显著差异,则研究者应该修改问卷或研究设计,重新进行调查。如果没有条件修正研究过程,则研究者应该在调查报告中,诚实地交代这一系统性缺失的发生原因和可能的影响。(二)首先,在编制问卷阶段,可以考虑在答案选项中,安排“其他”这种开放式选项,这样被访者在答案选项中找不到适合自己的情况时,就可以在“其他”选项中,写出自己的答案。其次,在数据录入阶段,要注意保持处理各种缺失情况方案的内在一致性。(三)缺失值的估计第一,平均值估计法。第二,回归估计法。第三,删除缺失值。
本文标题:市场调研与预测08
链接地址:https://www.777doc.com/doc-7948412 .html