您好,欢迎访问三七文档
第四章抽样调查⑴抽样相关概念;⑵随机与非随机抽样调查技术;⑶抽样误差的计算以及样本量的确定方法。房地产市场调查中的抽样问题:内容提要一、定义总体二、确定抽样框架三、选择抽样技术四、确定样本容量五、计算抽样误差抽样设计过程一、定义总体目标总体:是指拥有研究人员所要寻找的信息的个体或物体的集合。–目标总体必须被精确的定义,不精确的定义总体将会导致研究无效,甚至误解;–目标总体应该根据个体、抽样单位、范围和时间来定义;个体是这样一个物体,关于它的信息或者来自它的信息是我们想要的;抽样单位是指在抽样过程中的某一阶段可供选择的个体,或者包括这个个体的单位;范围指的是地理边界;时间因素是指的调研的时间周期。抽样调查的相关概念总体与总体单位标志与指标样本与抽样抽样调查总体是统计学的一个名词,是指统计所要研究对象的全体。总体单位是指组成总体的个别事物。标志是用于说明总体单位特征的概念。数量标志:建筑面积、平均售价品质标志:楼型、付款方式。样本是抽样总体的简称,是指从总体中抽取来作为直接观察对象的全部单位。样本单位数达到或超过30个称为大样本,30个以下称为小样本。抽样即指对样本的抽选过程。抽样调查也称为抽查,是指从调研总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。推断过程总体样本样本统计量(X)总体参数估计二、确定抽样框架抽样框架指的是目标总体中的个体的表示法,它由一份或一组用于识别目标总体的指示说明组成–电话本、公司名的协会目录、邮寄名单、姓名地址录或者地图–可能造成抽样框架误差。–有三种办法处理抽样框架误差:根据抽样框架重新定义总体;通过数据收集阶段的筛选被访者来考虑抽样框架误差;通过加权的方案来调整所收集的数据,弥补抽样框架误差。抽样调查的程序(1)确定总体(2)个体编号(3)选择样本(4)实施调查(5)测算结果(1)不同的营销调研目标(2)生成调研设计(3)选择调研方法(4)选择抽样程序(5)收集数据(6)分析数据(7)撰写并提交报告(8)跟踪抽样设计的过程抽样设计(1)问题/机会的识别与界定:为什么要寻求这些信息?这些信息已经存在?问题可回答?销售分析,市场份额分析,分销情况分析,成本利润分析,人员分析等。确定调查目标:具体和切实可行为何要调查?想要知道什么?知道了有何用?谁想知道?向谁说明?用何种方式说明较好?1)确定曾经在驾车外出旅游中至少迷路一次的家庭百分比;2)确定小型面包车车主对卫星可视地图系统在不同价格水平下的接受程度;3)确定对在小型面包车中安装冰箱的需求;4)确定对在小型面包车中安装放像机的需求;通用汽车1997年对“后排顾客”购车的调查,调查目标:抽样设计(2)案例:某公司新生产的饮料颇受欢迎,有供不应求的趋势,公司考虑建新厂增加供应能力。因内部资料欠缺需收集更多信息,该公司应如何确立调查目的?收集哪些信息?解析问题所在及问题焦点调查问题明确化确立调查目的设定调查假定确立调查目的抽样设计(3)制定实施总体方案的办法和步骤,经费与日程等。确定抽取样本单位的方法确定必要的样本容量对主要抽样指标的精度提出要求确定总体目标量的估算方法确定调查对象(总体)和样本单位三、选择一种抽样技术抽样技术可以被宽泛地分为非概率抽样和概率抽样非概率抽样依赖于研究人员的个人判断而非随机选择样本个体;可以对总体的特征很好的估计;无法对样本结果的精确度作出客观的评价。概率抽样随机选择样本单位,选择每个样本的概率相等每个样本不一定有相同的选择概率,但可以指定选择任一给定大小的特定样本的概率;可以确定样本估计值的精确度;可以根据个体抽样对整群抽样、相等单位概率对不等概率、非分层抽样对分层抽样、随机选择对系统选择、单阶段技术对多阶段技术,这5个方面所有的可能组和分成32种不同的抽样技术。抽样调查可以分类随机抽样,又称概率抽样概率抽样是按照随机原则进行抽样,不加主观因素,组成总体的每个单位都有被抽中的概率(非零概率),可以避免样本出现偏差,样本对总体有很强的代表性。非随机抽样,又称非概率抽样。非概率抽样是按主观意向进行的抽样(非随机的),组成总体的很大部分单位没有被抽中的机会(零概率),使调查很容易出现倾向性偏差。抽样技术的分类抽样技术概率性非概率性简单随机抽样类型抽样等距抽样整群抽样任意抽样判断抽样配额抽样滚雪球抽样定期做经常做可计算误差费钱费时不方便不能判断误差省钱省时方便概率抽样技术概率抽样是指总体的全部基本单位都有同等被抽中的机会,也称随机抽样。单纯随机抽样法、系统抽样法、分层随机抽样法、分群随机抽样法。要求市场调研人员掌握总体的某些基本信息;具有比较熟练的技术水平与丰富的工作经验;调查所花费的时间较长;支出较大。简单随机抽样法•在简单随机抽样中,总体中每一个个体都有一个已知且相等的抽中概率•首先确定一个抽样框架,其中的每一个个体被分配了一个唯一的号码;•然后产生出随机的数字来确定那些个体被包括进样本中;•盲选BlindDraw•随机数表thetableofrandomnumber•优点是易于理解,样本结果可以推断总体,大多数统计推论方法都假定数据是由简单随机抽样法法获得的•局限性:抽样框难以构建;数据收集时间和成本高;比其他概率抽样精确度低,标准差较大。以下调查应该采用什么样的抽样调查方法?我班学生身高分布调查?034743738636964736614699698162977424676242811457204253323732167602276656502671073290797853125685992696966827310503729315555956356438548246223162430990162277943949544354821737932378844217533157245506887704744767630163785916955567199810507175332112342978645607825242074428576086324409472796544917460962181807924644171658097983861962266238977584160744998311463224234240547482977777810745321408623628199550922611970056763138378594351283395008304234079688702917121340332038261389510374566218373596835087759712259347994957227788429545721664361600160815047233271434094559346849311693324350278987192015370049简单随机抽样自有限总体的抽样自无限总体的抽样1、每个个体来自同一总体2、各个个体的选择是独立的某些情况下,总体数目无限或太大以致在实际应用中必须视为无限的对待。如果从容量为N的总体中抽取一个样本容量为n的样本,使得样本中每个样本点以相等的概率被抽出,这就是简单随机抽样。放回抽样(重复抽样)无放回抽样系统抽样法依据构成总体中个体的出现顺序,排列起来,每隔K个单位抽一个单位作为样本,如逢十抽一,逢七抽一。每隔多少个样本抽中一个:K=N/n分层随机抽样法•分层抽样是一个两阶段过程,总体被分割为子总体,或称为“层”后,再用随机方法,从每一层中选出个体。•各层间应相互独立,并且全体上没有遗漏;分层随机抽样在分层时,要将同一性质的基本单位分成一层,但层与层之间基本单位特性的差异较大。•与配额抽样法法的不同是自总体的样本选取是随机的;•分成抽样可以确保子总体在样本中都得以体现。例如:对鄂州市的商店进行资金周转情况的调查,必须首先把各种各样的商店进行分类,然后再进行样本的抽取。A层B层C层请对鄂大的师生做一个关于手机的市场调查:鄂大现有各类人员总数为1.3万人,学生1.2万人,行政管理人员300人,教师700人,现要抽取1200个样本进行市场调查,你如何抽取?以下调查应该采用什么样的抽样调查方法?如果采用分层调查方法,其分层控制指标如何选择?我国女装品牌的消费偏好调查?我国大学生对于手机消费偏好调查?分层比例抽样法各层抽样数按各层基本单位数占总体的比例确定。SVVSiiSi——第i层应该抽取的样本个数Vi——第i层个体总数例如:关于鄂州市私人购房情况的调查我市现有常住人口10万户,抽1%作为样本,调查每月用于购房的款项。房地产的档次差别非常大,总体中各元素的差异大,适用于分层比例抽样。家庭收入按高、中、低分层,其中高收入家庭约占总住户的10%,中等收入家庭约占总住户的70%,低收入家庭占总住户的20%。分层最佳抽样法:不按比例根据各层基本单位标准差的大小,决定各层样本数目的抽样方法。适用:各层差异过分悬殊;某些层的重要性大于其他层。值各层样本标准差的估计各层所包含的个体总数——iiiiiiiSNSNSNnn例如:接着前面的例题高收入层的样本标准差为300中收入层的样本标准差为200低收入层的样本标准差为50确定样本数量的数据表层每层中调查单位总数:万户各层中样本标准差估计值积分层样本数高1300300167中72001400778低25010055合计18001000iNiSiiSN778180014001000in分层最低成本法指根据抽样费用确定各层应该抽取的样本数量。每层的调查费用—//iiiiiiiiCCSNCSNnn分群抽样方法是将市场调查总体分为若干群体,然后以单纯随机抽样方法选取若干群体作为调查样本,对群体内各子体进行普遍调查。分群随机抽样与分层随机抽样分层抽样层与层之间有较大差异;同一层内分子具有相同性。分群抽样各群之间具有相同性;每一群体内的分子具有差异性。高收入层高、高、高中收入层中、中、中低收入层低、低、低A群体高、中、低B群体高、中、低C群体高、中、低例如:调查武汉市大学生消费支出情况,拟抽出10000个样本,假定全市共有50所大专院校,每校的在校学生平均为5000名。如何抽取样本。多阶段随机抽样多阶段随机抽样,是指把从调查总体中抽取样本的过程分成两个或两个以上阶段进行抽样的方法。具体步骤是先将调查总体各单位按照一定标准分成若干群体作为抽样的一般群体,然后将一般群体又分成若干小的群体,依此类推,可以分三段、四段甚至更多。再按随机原则,先在一段群体中抽选出若干一段群体作为一段样本单位,然后再在一段样本单位中抽选出二段样本单位。如此类推,还可以抽选出三段样本单位、四段样本单位等。把工作落实到二段样本单位,叫二段随机抽样;落实到三段样本单位、四段样本单位,则分别称之为三段随机抽样、四段随机抽样。例如,鄂州市调查全区居民家庭在购房方面的支出,考虑到每个街道办事处居民用户较多,拟用二段随机抽样抽选调查单位。其具体做法是:第一步,从全市的所有街道办事处中抽取若干街道办事处,第二步,在每个选中的街道办事处中分别按照随机原则抽选若干户居民进行调查。收集相关信息。等距随机抽样等距随机抽样,又称系统随机抽样,是指将调查总体单位按照一定标准有序排列,编上序号,根据抽样距离从总体单位中抽取样本。排列顺序可用与调查项目有关的标志为依据,如在购买力调查中,按收入多少由低至高排列,也可用与调查项目无关的标志为依据,如按户口册、姓名笔画排列。抽样距离是由总体单位数除以样本量求得的,用公式表示为R=N÷n。当遇上总体单位数不能被样本量整除时,要用四舍五人的方法化为整数,并且为了避免出现抽不足样本数量的情况,通常将总体单位排列成一个封闭圈。等距随机抽样的步骤为:①按一定标准把总体单位有序排队。②计算抽样距离。③采用简单随机抽样在第一距离段内抽选一单位。④以此单位编号为准,在后续距离段内抽取相应编号的单位。这里所谓的相应,是指后续抽选到的单位编号与此单位编号相
本文标题:第四讲抽样调查
链接地址:https://www.777doc.com/doc-420019 .html