您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 5问卷调查中的编码与信息处理
问卷调查中的编码与信息处理本次主讲:郭永昌区域地理调研方法系列讲座五1、编码的含义与功能编码是指将各种类别的市场信息资料用代码来表示的过程。代码是用来代表事物的记号,它可以用数字、字母或特殊的符号,或者它们之间的组合来表示。编码与分类紧密相关,是一项重要的工作,特别是在运用计算机管理的情况下,由于计算机是通过代码来识别事物的,编码是必不可少的环节。编码具有重要的功能。一是为各项信息资料提供一个概要而清楚的认定,便于储存和检索;二是可以显示信息资料单元的重要意义,并能协助资料的检索和操作;三是有利于信息资料处理的效率和精度,节省处理费用。一、编码编码方案应能使转化后的数据完全保持原始资料特性,并为减少编码过程和统计过程的误差打下基础。[例1]1999年调查A公司某部门20名职工的性别、年龄、月收入以及年终业务考核成绩数据。职工编号——按原数码形式;性别——“男”以“1”表示,“女”以“2”表示;年龄——按原数码形式;月收入——原数码形式去掉小数点;考核成绩——“优”以“1”表示,“良”以“2”表示,“中”以“3”表示,“及格”以“4”表示,“不及格”以“5”表示。2、数据文件的结构数据文件是为了某一特定目的而形成的同类记录的集合,数据的组织方式及内在联系的表示方式决定着数据处理的效率,因而设计数据文件的结构是数据处理工作的主要内容之一。目前,最常用的数据文件结构是关系数据库结构:字段一记录一文件,如果用文件描述某一事物的总体(例如工资单),则文件中的若干记录描述的就是总体中的个体的情况(例如每个人的工资情况),而字段则是描述该事物某一方面的属性(例如姓名、基本工资、津贴、房租、水电费等)。3预编码一般来说,调查问卷中的多数问题都是封闭性的,预先已经设计出可供选择“”的答案。有时,为了方便计算机处理,在设计问卷时就预先给这些答案设计了编码,这种编码方式称为预编码(precoding)。对于大型问卷调查来说,由于调查的范围、对象、所调查的内容、问题形式等都比较复杂,为了便于统一处理,一般会对某些问题答案进行预编码。预编码印在问卷每页的右侧,用纵线将其与问题及答案隔开。例如一份人力资源基本信息调查的问卷中问题与相应的编码安排如下:A.员工的性别1.男2.女B.员工的工龄C.员工的文化程度1.大学2.大专3.高中4.初中5.小学6.其他此外还有另一种预编码方式,即在问卷之外另行制作登录卡(机器直接扫描读取数据)。4后编码后编码是整理开放式问题答案并对其进行编码的有效方法。开放式问题的提出,是补充封闭式问题的不足,为深入追问被调查者对待特定问题的一些深层次看法而设计的。因为,调研设计者事先对问题不可能预见到所有可能的答案,无法在问卷中给出数目不太多,又能互斥、穷举的一组供选择答案。对这类问题所给的答案进行编码时,首先要阅读部分(最好是全部)回答,记录和分析出包括多少类别,这些类别应该是相互独立的和穷尽所有可能的,然后对这些类别编码。后编码可以按下列步骤进行:1)挑选少量具有代表性的答卷,对答案进行全面的阅读和初步分类,以便初步判断答案的分布状况。通常会抽取全部问卷数的20%来实施这一步工作。2)将所有有效的答案列成频数分布表。3)拟定适宜的分组数。要从调研目的出发,考虑分组的标准是否能确实符合调研目的;同时也要考虑计算机的处理能力和数据处理软件的处理要求。4)根据拟定的分组数,对列在答案频数分布表中的答案进行选择和归并。5)为所确定的分组选择正式的组别标志。6)根据分组结果为数据制订编码规则。7)对全部回收问卷(开放式问题答案)进行编码。5编码说明书编码说明书(codebood)是一份说明问卷中各个问题(即变量)及其答案与数据文件中的编码值之间一一对应关系的文件。1)所有的资料必须转换成数值,不允许使用字母或其他字符。2)使编码的内容保持一致性,通常的操作技巧是,用固定的数字顺序表示回答项的次序。例如,对所有测量等级、程序内容的项目答案,都以从小到大的原则分派编码。比如:“l”表示最不喜欢;“2”表示不太喜欢;“3”表示喜欢等。3)每一个数值码占据一列。要为每个变量留出足够的码位。4)对无信息的答案赋予标准代码。例如,可以用“0”表示“不知道”;“9”表示“无回答”;“0”表示“不适合”。5)尽可能用真实的数字作为编码,例如,对于年龄、分数、收入等在调查时获得的数据,在编码时,就以原数据作为编码。如“59”岁,编码就为“59”;“98”分,编码就为98”;“2000’元,编码就为“2000'’。这样可以保持数据库的原始资料性质。二、录入整理将纸质的问卷信息转化为数据库数据库之间的对接与转换(数据分析)空间信息转化为属性数据库(GIS空间分析)三、数学处理一是数学运算。它主要是对那些定量化的信息数据,根据需要所进行的各种数学计算。二是统计分析。它是根据统计学原理,运用统计方法,对有关信息资料进行计算,比如计算平均数、中位数、概率分布等。三是建模与解模。它是根据所调研与预测事物的内在关系和发展规律,建立相关的数学模型,并通过解模运算,得出某些预期的结果。数学处理的结果,往往能形成新的信息资料,能揭示事物的发展趋势和规律,有利于人们更深刻更全面的认识客观事物。当前流行的数学处理方法(地理学中的数学方法,徐建华主编,2004年再版)SD模型GM(1.1)模型神经网络模型小波分析模型Arcgis9.0空间分析模型其它模型四、系统研究系统研究是在充分掌握各种信息资料的前提下,运用系统观点思维推理,对所研究问题进行全面的科学的研究,以得出正确的结论。系统研究不是孤立地分析每一个信息资料,而是从总体上,把各种信息资料联系起来加以考察。其原则是把内部因素与外部因素相结合,局部因素与全局因素相结合,历史因素与现状和未来趋势相结合,静态与动态相结合,定性与定量相结合。
本文标题:5问卷调查中的编码与信息处理
链接地址:https://www.777doc.com/doc-3260034 .html