您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 沈阳理工大学徐静霞版统计学-第2章-数据的收集
LOGO第2章数据的收集2.1直接数据的收集2.2调查问卷2.3间接数据的搜集2.4统计数据的误差学习目标直接数据的收集方法。掌握几种调查方式和调查方案设计相关问题,了解实验数据;调查问卷的设计。能够合理设计简单问卷;间接数据的收集。掌握间接数据的主要收集渠道;数据的误差及其控制。了解数据误差的类型及其控制方法。第2章数据的收集2.1直接数据的收集2.1.1统计调查方式2.1.2调查方案设计2.1.3实验数据2.1.4收集数据的具体技术2.1.1.1普查普查(census)是为某一特定目的而专门组织的一种全面调查,如人口普查、工业普查和经济普查等。特点:1.普查通常是一次性的或周期性的。2.规定统一的标准时点。3.规定统一的普查期限。4.规定普查的项目和指标。5.普查的数据一般比较准确,规范化程度也较高,因此它可以为抽样调查或其他调查提供基本依据。6.普查的使用范围比较窄,只能调查一些最基本及特定的现象。2.1.1.2统计报表制度统计报表按其性质和要求不同,有如下几种分类:1)按调查范围不同可分为全面统计报表和非全面统计报表。2)按实施范围不同,分为国家统计报表、部门统计报表和地方统计报表。3)按报送周期长短不同,分为日报、旬报、季报、半年报和年报。4)按填报单位不同,分为基层统计报表和综合统计报表。5)按报送方式的不同,可分为邮寄报表和电讯报表。统计报表三个显著的优点:1)统计报表可以事先布置到基层填报单位,基层单位可以根据报表的要求,建立和健全各种原始记录,使数据来源有可靠的基础,保证数据的准确、及时、完整。基层单位也可以利用统计报表资料,对生产、经营活动进行科学管理。2)由于它是逐级上报、汇总,各级领导部门都能得到管辖范围内的统计报表资料,可以经常了解本地区、本部门的发展情况。3)它所包括的调查单位比较全面,项目比较系统,项目内容、调查周期都有相对的稳定性,便于连续观察对比,如编制动态数列。2.1.1.3抽样调查样抽调查是一种非全面调查。它是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。抽样调查有如下几个特点:1)样本单位按随机原则抽取,排除了主观因素对选样的影响。2)根据部分调查的实际资料对调查对象总体的数量特征作出估计。3)抽样误差可以事先计算并加以控制。2.1.1.4重点调查重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查。所谓重点单位,是指在总体中具有举足轻重地位的单位。这些单位数量虽然少,通过对这些单位调查,就能掌握总体的基本情况。2.1.1.5典型调查典型调查也是专门组织的一种非全面调查,它是根据调查研究的目的和要求,在对总体进行全面分析的基础上,有意识地选择其中有代表性的典型单位进行深入细致的调查,借以认识事物的本质特征、因果关系和发展变化的趋势。典型调查具有两个作用:1)研究尚未充分发展、处于萌芽状况的新生事物或某种倾向性的社会问题。2)分析事物的不同类型,研究它们之间的差别和相互关系。三种选典方法1)“解剖麻雀”的方法。2)“划类选典”的方法。3)“抓两头”的方法。2.1.2调查方案设计2.1.2.1调查目的2.1.2.2调查对象和调查单位2.1.2.3调查项目和调查表2.1.2.4确定调查时间2.1.2.5确定调查的组织实施计划2.1.3实验数据实验数据(experimentdata)是指在试验中控制实验对象而收集得到的变量的数据。实验的统计设计要遵循三个基本原则:(1)重复性原则。(2)随机性原则。(3)双盲原则。实验法的主要优点是:(1)可以探明不明确的因果关系。(2)试验的结论有较强的说服力。2.1.4搜集数据的具体技术2.1.4.1访问调查2.1.4.2邮寄调查2.1.4.3电话调查2.1.4.4座谈会2.1.4.5个别深度访问2.1.4.6电脑辅助调查第2章数据的搜集2.2调查问卷2.2.1问卷设计的原则2.2.2问卷设计的程序2.2.3问卷的结构2.2.4问题的形式2.2.5问卷调查设计技巧2.2.6问卷设计应注意的问题2.2.1问卷设计的原则(1)有明确的主题。(2)结构合理、逻辑性强。(3)通俗易懂。(4)控制问卷的长度。(5)便于数据的校验、整理和统计。2.2.2问卷设计的程序(1)确定主题和资料范围。(2)分析样本特征。(3)拟定并编排问题。(4)进行试问试答。(5)修改、付印。2.2.3问卷的结构2.2.3.1卷首语(1)称呼、问候。如“××先生、女士:您好”。(2)调查人员自我说明调查的主办单位和个人的身份。(3)简要地说明调查的内容、目的、填写方法。(4)说明作答的意义或重要性。(5)说明所需时间。(6)保证作答对被调查者无负面作用,并保守秘密。(7)表示真诚的感谢,或说明将赠送小礼品。2.2.3问卷的结构2.2.3.2正文第一部分包括向被调查者了解最一般的问题。第二部分是主要的内容,包括涉及调查主题的实质和细节的大量题目。第三部分一般包括两部分的内容:一是敏感或复杂的问题,以及测量被调查者的态度或特性的问题;二是被调查者基本状况、经济状况。2.2.3问卷的结构2.2.3.3结尾(1)调查人员(访问员)姓名、编号(2)受访者的姓名、地址、电话号码等(3)问卷编号(4)访问时间(5)其他,如设计分组2.2.4问题的形式2.2.4.1开放式问题主要优点是:应答者可以自由表达自己的意见和看法。调动被调查的的积极性。防止固定选项对被调查者的诱导。从回答中可以检查被调查者是否误解了问题。主要缺点是:标准化程度低,资料整理与分析较困难。要求被调查者有一定的文字表达能力。回答率不高。需占用较多的时间。2.2.4.2封闭式问题封闭式问题的优点:答案标准化,对答案进行编码和分析都比较容易;回答者易于作答,节省调查时间,有利于提高问卷的回收率;问题的含义清楚。因为所提供的答案有助于理解题意,这样就可以避免回答者由于不理解题意而拒绝回答。封闭式问题缺点:回答者对题目理解不正确,难以觉察出来。可能产生“顺序偏差”或“位置偏差”,即被调查者选择答案可能与该答案的排列位置有关。2.2.5问卷调查设计技巧2.2.5.1事实性问题例如应答者个人的资料:职业、收入、家庭状况、居住环境、教育程度等。2.2.5.2意见性问题例如:你是否喜欢××电视节目?2.2.5.3困窘性问题例如:你除了工作收入外,还有其他收入吗?1)间接问题法。2)卡片整理法。3)断定性问题。2.2.6问卷设计应注意的问题(1)问卷的开场白(2)问题的措辞在设计问题时应注意以下几个原则:1)避免一般性问题。2)问卷的语言要口语化,符合人们交谈的习惯,避免书面化和文人腔调。(3)问题的选择及顺序容易回答的问题放前面,较难回答的问题次之,困窘性问题放最后面,个人资料的事实性问题放卷尾。封闭式问题放前面,自由式问题放后面。由于自由式问题往往需要时间来考虑答案和组织语言,放在前面会引起应答者的厌烦情绪。要注意问题的逻辑顺序,按时间顺序、类别顺序等合理排列。第2章数据的搜集2.3间接数据的搜集2.3.1间接数据的来源2.3.2间接数据的收集步骤2.3.3间接数据的特点2.3.4间接数据的评价2.3.1间接数据的来源2.3.1.1统计年鉴《中国统计年鉴》、《国际统计年鉴》、地方统计年鉴、《中国县(市)社会经济统计年鉴》、《中国金融年鉴》《中国人口统计年鉴》、《中国统计摘要》2.3.1.2期刊《中国经济数据分析》、《经济预测分析》2.3.1.3网站中国统计信息网,国研网,中国经济信息网,中国经济时报网,步:确定你希望知道主题的哪些内容及已经知道的内容。清晰地定义主题、相关的事实、研究人员的姓名或与主题相联系的组织名称、关键文章及已熟悉的其它出版物等,将会对查找与主题相关的信息有所帮助的。第2步:列出关键术语和姓名。第3步:通过一些图书馆信息源来开始收寻。第4步:对已找到的文献进行编辑并评价发现。2.3.3间接数据的特点优点:它能被快速获得;比起收集原始数据,它的成本要低许多;通常情况下,它较为容易获得;它能辅助现有的原始数据。缺点:所获得间接数据的度量标准与研究者所要求的度量标准不一致,既相关性不高;数据所属时间不符,出现严重过时问题;资料不充分。2.3.4间接数据的评价这可以通过询问以下四个问题来完成:谁收集的?信息数据的来源是关系到信息数据准确程度的最关键因素。研究的目的是什么?弄清研究的动机,有助于判断数据的质量。什么内容?研究者一定要时时注意辨明信息数据的内容,即使间接数据的质量可以让人接受,但也可能难于使用或不能适应自己的研究需要。何时收集的?过时的信息数据是没有什么用处。第2章数据的收集2.4统计数据的误差2.4.1概率抽样和非概率抽样2.4.2数据的误差类型2.4.3误差的控制2.4.1概率抽样和非概率抽样2.4.1.1概率抽样概率抽样(probabilitysampling)也称随机抽样,是指遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入样本。概率抽样有三个特点:(1)抽样时是按一定的概率以随机原则抽取样本。(2)每个单位被抽中概率是可以计算的或已知的。(3)用样本估计总体时,要考虑样本被抽中概率。2.4.1.2非概率抽样非概率抽样(non-probabilitysampling)是相对于概率抽样而言的,指抽取样本时遵循的不是随机原则,而是根据研究目的对数据的要求采用特定的方式抽取样本。方便抽样判断抽样配额抽样滚雪球抽样自愿抽样非概率抽样操作简便、时效快、成本低,对抽样中的统计学技术要求低。它适合于探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备,还可以用于市场调查中的概念测试,如产品包装测试、广告测试。但由于非概率抽样没有遵循随机原则进行取样,样本统计量的分布不确定,所以无法用样本对总体进行推断。概率抽样遵循随机原则进行取样,样本统计量的理论分布可知,适用于对总体有关参数进行估计,计算估计误差,得到总体参数的置信区间,并用于提出估计精度,或根据估计精度计算样本容量。这种调查方法的主要目的在于掌握总体的数量特征,进行区间估计。这种方法技术含量高,要求具备一定的统计学专业知识,调查成本较高,但结果科学、准确。2.4.1.3概率抽样与非概率抽样的比较2.4.2数据的误差类型抽样误差(sampingerror),是由于抽样的随机性造成的,是用统计量估计总体参数时出现的样本结果与总体真值之间的误差。非抽样误差(non-sampingerror),是相对于抽样误差而言的,是除抽样误差之外的,由于其他原因引起的样本结果与总体真值之间的误差。调查人员误差,是由于调查人员业务培训不到位所导致。无回答误差,是被调查者拒绝接受调查而产生的误差,也包括调查者不在家等原因产生的误差。测量误差,是由于测量工具不准确而造成的计量误差。2.4.3误差的控制抽样误差是由于抽样的随机性带来的,只要采用抽样调查,抽样误差就会存在,是不可避免的,但其大小可以进行控制和计算,进行控制的主要方法是改变样本容量的大小。非抽样误差存在于概率抽样和非概率抽样中,产生原因也较多较复杂。实际中可通过合理设计调查问卷、合理选择抽样框、对调查过程进行质量控制等方法来降低非抽样误差。LOGO
本文标题:沈阳理工大学徐静霞版统计学-第2章-数据的收集
链接地址:https://www.777doc.com/doc-5820470 .html