您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 第十一章 定量资料分析
第十一章定量资料分析原始数据整理和录入单变量分析双变量分析多变量分析第一节资料的整理和录入一、资料的审核资料审核的含义–研究者对所收集的原始资料(主要是问卷)进行初步的审阅,校正错填、误填的答案,剔出乱填、空白和严重缺答的废卷,以保证原始资料具有较高的准确性、完整性和真实性,为后继资料整理录入和统计分析工作打下基础。资料审核的内容检查问卷中出现的问题重新向被调查者核实资料审核的方法边收集边审核/实地审核及时,效果好;组织安排工作要细,调查员个人处理能力要强。系统审核/集中审核工作统一组织,审核有指导,审核标准一致,检查质量高;周期会拉长,少数个案无法重新核实。二、资料的转换编码:给每个问题及答案一个数字作为它的代码。将被调查者对问卷中问题的回答转化成供计算机识别和统计的数字。编码手册:为减少资料转换工作的误差,保证资料转换的数量,研究者需要编制编码手册。三、数据录入两种录入方式–直接从问卷上将编好码的数据输入计算机避免了再次转录中可能出现的错误,但录入速度慢。–先将问卷上编好码的数据转录到专门的登录表,然后再从登录表上将数据输入计算机。录入方便,速度较快,但差错增加。登录表的格式–横栏为问题及变量名,且给定栏码,纵栏为个案记录。四、数据清理有效范围清理–有效编码值的范围。如性别:1=男,2=女,0=无回答如果在数据中出现了其它数字,则数据是错误的。逻辑一致性清理–根据问卷中问题相互之间存在的某种内在逻辑关系,来检查前后数据间的合理性。以相倚问题为例过滤性问题:你们有娃吗?1=有,2=没有后续性问题:请问你们的娃多大了?过滤性问题选2的,应该在后续性问题不做回答(即该项缺省,用0表示)。如果做了其它回答,则该个案的数据有问题。数据质量抽查–在有效值范围内,且与其它变量间不存在逻辑关系,需要随机抽样法抽取一部分个案,进行校对。如个案的数据在“文化程度”这一变量上输错了,问卷中填答是2(初中),录入为3(高中),在有效值范围内。第二节单变量统计分析一、单变量描述统计集中趋势分析–用一个典型值或代表值来反映一组数据的一般水平,或者说反映这组数据向这个典型值集中的情况–常见的集中趋势分析均值、众数、中位数离散趋势分析–用一个特别数值来反映一组数据相互间的离散程度–对相应的集中趋势的代表性做出补充说明–全距、标准差、异众比率、四分位差二、单变量推论统计推论统计–用样本的统计值对总体的参数值进行估计的方法。区间估计–在一定的可信度(置信度)下,用样本统计值的某个范围(置信区间)来估价总体的参数值。–置信度,把握性;置信区间,精确度。(1)总体均值的区间估计(2)总体百分比的区间估计假设检验–不是检验理论假设,是统计假设,即和抽样手段联系在一起并依靠抽样数据进行验证的经验层次的假设。–统计假设检验的原理:小概率事件在一次观察中不可能出现–假设检验的步骤建立虚无假设和研究假设,原假设作为虚无假设根据需要选择适当的显著性水平根据样本数据计算统计值,并根据显著性水平查出对应的临界值比较临界值和统计值,统计值大于临界值,接受研究假设,反之,接受虚无假设。第三节双变量统计分析一、交互分类和χ2检验交互分类–专门用来分析两个定类变量(或一个定类变量,一个定序变量)之间关系的统计分析方法。–作用深入描述样本的分布状况和内在结构分组比较,分析和解释变量之间的关系χ2检验–保证样本中所体现的变量关系也反映了总体的情况–步骤–作用对两变量相关关系进行审查(独立性检验)对较小规模的样本资料进行差异的显著性检验–局限较小的分布差异能够在大样本中通过检验,不能测出大样本中两变量间的关系强度二、不同层次变量的相关测量和检验Χ2值大小,只代表两变量关系的可信程度;不能代表两变量关系强度。(一)定类变量与定类变量λ系数–测量两个定类变量,或一个定类一个定序变量–以众值作为预测的标准–取值范围0-1–缺点–样本中变量关系的结果推论到总体,用χ2检验(二)定序变量与定序变量G系数取值范围:-1--+1样本中有关两定序变量关系的结果推论到总体,要进行Z检验(三)定类变量与定距变量E系数表示相关强度E2系数表示用定类变量(X),去预测定距变量(Y),能消除的误差比例。F检验(四)定距与定距变量r系数F检验和t检验三、回归分析回归分析增加了因果性,具有预测功能回归分析的对象是定距层次的变量,中心问题是建立回归方程。要注意的问题–注意时间条件–回归方程的预测在变量取值上有一定的临界条件第四节多变量统计分析一、阐释模式通过引进并控制第三变量,来进一步了解和探讨原来两变量之间的关系性质。类型–因果分析–阐明分析–条件分析(一)因果分析目标–X和Y之间,是否存在因果关系方法–引进若干第三变量,以判明X和Y之间的因果关系是否虚假,即二者间的关系是否是第三变量的影响。可能是真的(二)阐明分析目标–探明因果关系的作用方式或作用途径。(三)条件分析目标–原关系在不同的条件下是否相同。二、复相关分析含义–以一个统计值来简化多个自变量与一个因变量之间关系的统计分析方法要求–定距以上层次的变量系数–R系数–R2系数三、多元回归分析能够用多个自变量预测一个因变量的数值,能够弄清不同的自变量对因变量所具有的影响力大小。要求定距以上层次的变量标准化回归方程
本文标题:第十一章 定量资料分析
链接地址:https://www.777doc.com/doc-4250635 .html