您好,欢迎访问三七文档
打开几扇窗户看世界----如何做抽样设计知识目录•抽样过程与选择•抽样方法•抽样的基本条件*(选讲)•抽样误差•抽样容量目录•抽样过程与选择•抽样方法•抽样条件•抽样误差•案例研究提问:生活中个人决策使用小样本例子?2019/8/205名词库:抽样的專有名詞概念•母体:研究调查对象。•基本单位:母体中的个别单位。•样本:母体的一部分。•参数:母体某一属性或变量数值。•统计量:根据样本数据求得,用以估计参数的数值•抽样框:可得之抽样单位名册。•抽样偏误:抽到特殊特征之单位。•抽样误差:减损样本代表性。Lapin1978(一)经济性(二)时效性(三)母体过大(四)母体中某些基本单位难以接触(五)破坏性调查(六)正确性抽样的原因2019/8/207抽样的过程定义同质总体选择资料收集方法购置抽样框选择抽样方法决定样本量建立和详细选择样本的可操作性计划执行可操作性的样本计划评估抽样结果2019/8/208•二、抽样框(Yates1953)•(一)足夠•(二)完整•(三)不重複•(四)正確•(五)便利目录•抽样概论•抽样方法•抽样条件•抽样误差•案例研讨2019/8/2010抽样方法抽样方法(samplesurvey)非概率抽样(probabilitysampling)概率抽样方便抽样判断抽样配额抽样滚雪球抽样简单随机抽样系统抽样分层抽样整群抽样多层抽样2019/8/2011请辨别下列的抽样设计:•200个娱乐场光顾者的名单是上月娱乐场光顾者的名单中抽出来的,对他们进行问卷调查•电台节目主持人请听众打电话进来,就禁止核武器问题以“是”“否”的方式发表意见•一个狗食制造商想测试一个狗食新产品,他决定选择100个用罐装食品喂养狗的狗主人,选择100个使用干食喂养的狗主人和100个用半湿食品喂养狗的狗主人,进行调查。•就对退休老人的生活询问了在公园散步的老人,在通过他们推荐,进行调查。2019/8/2012抽样方法——总论•随机抽样2019/8/2013抽样方法——总论•非随机抽样2019/8/2014抽样方法——分论一、简单随机抽样SimplerandomSampling•实施方法•优缺点•适用情境(BoyedJr.,Westfall,&Stasch1985)1.成本高2.详细完备的最新抽样框3.统计效率低4.管理困难(补)5。无法排除极具代表性的样本(BoyedJr.,Westfall,&Stasch1985)1.母体小2.有适当的抽样框3.单位访问成本不受距离影响4.无其它有关母体的信息2019/8/2015手把手教你——随机数表依机率抽取。•假定由2000名调查对象,以随机数表随机抽取150名样本,其抽样步骤如下:(1)将2000名调查对象,由0001编至2000等2000个连续编号。(2)由随机数表,利用抽签方法选取号码开始点。例如选取为第十五行第四列。(3)由设定之起始点,选取号码,选取号码以调查对象之编号位数相同:即1475,9938,4460,0628,....,有效号码样本2000以下。(4)若抽样单位与随机数表抽样号码条件相同即为样本,大于调查编号,跳过不取。(5)若逢重复号码,亦应跳过。(6)依上述方法,连续采用150个号码,即为完成样本选用。2019/8/2016抽样方法——分论(二)机械抽样•实施方法•优缺点•适用情境限制:1.抽样偏误2.随机偏误适用情境:抽样单位以随机次序编列2019/8/2017抽样方法——分论(二)机械抽样•实施方法•优缺点•适用情境限制:1.抽样偏误2.随机偏误适用情境:抽样单位以随机次序编列2019/8/2018抽样方法——分论(三)分层抽样•实施方法【圖示】:分層抽樣方法母體樣本********抽樣第一層第二層第三層2019/8/2019抽样方法——分论(三)分层抽样•优缺点優點:1.可靠性高2.利於比較2019/8/2020抽样方法——分论(三)分层抽样StratifiedSampling关注要素1.分层基础2.层级数目—不超过六层(Cochran1963)3.等比例或不等比例样本2019/8/20212019/8/2022抽样方法——分论(四)整群抽样ClusterSampling实施方法(图示)*******抽樣***2019/8/2023案例:歌曲著作權使用費的分配•美国作曲家组织(ASCAP)每年向广播电台收取播曲权利金$435百万(每年播放53百万小时歌曲),将分配给作曲家会员。–将所有电台依小区种类(都会区、乡村等)、地区(新英格兰、太平洋等)及付出权利金额度(反应电台听众数)等特性分成432层。–每层随机选几台随机录音数小时,共录音60,000小时。由专家辨认所有歌曲的作曲作词者,记录后依比例分配权利金。2019/8/2024抽样方法——分论(四)整群抽样优缺点(图示)優點:1.經濟2.簡便缺點:抽樣偏差2019/8/2025·•(五)多级抽样2019/8/2026非概率抽样•方便抽样(任意抽样)任意抽样又称为便利抽样法。它是调查人员按工作的方便,随意抽选样本的一种抽样方法。运用任意抽样技术进行抽样,一般由调研人员从工作方便出发,在调研对象范围内随意抽选一定数量的样本进行调查。“街头拦人法”和“空间抽样法”是任意抽样的两种最常见的方法2019/8/2027•任意抽样技术简便易行,可以及时取得所需的资料,节约时间和费用。这种方法适用于探测性调查,或调查前的准备工作。一般在调查总体中每一个体都是同质时,才能采用此类方法。但是,实践中并非所有总体中每一个体都是相同的,所以抽样结果偏差较大,可信程度较低,它的样本没有足够的代表性。2019/8/2028•判断抽样判断抽样又称为目的抽样法。这是一种根据调查人员的经验或某些有见解的专家选定样本的抽样方法。2019/8/2029•判断抽样法具有简便、易行、及时,符合调查目的和特殊需要,可以充分利用调查样本的已知资料,被调查者配合较好,资料回收率高等优点。但是,这种方法易发生主观判断产生的抽样误差,同时由于判断抽样中各个调查个体被抽取的概率不知道,因而无法计算抽样误差和可信程度。如果调查者的经验丰富,知识面广,判断能力强,抽取的样本代表性就大,反之则小。2019/8/2030(三)配额抽样•配额抽样是按照一定标准,分配样本数额,然后在规定数额内由调查人员任意抽选样本的一种抽样方法。•配额抽样是非概率抽样中最流行的一种。运用配额抽样技术进行抽样,要按照一定标准分配样本数额,并在规定数额内由调查人员任意抽选样本。2019/8/2031案例分析•在某项调查中,确定样本总数为180个,可单独选择消费者收人、年龄、性别三个标准中的一个进行抽样。按独立控制配额抽样,其各个标准样本配额比例及配额数如表所示。年龄人数18-294030-406041-557056以上30合计200性别人数男100女100合计200收入人数高36中74低90合计2002019/8/2032最终配额表格高中低合计男女男女男女18-2934789940(20%)30-40651111131460(30%)41-55661313161670(35%)56以上33657630(15%)小计181837374545200合计36(18%)74(37%)90(45%)2019/8/2033•相互控制配额抽样对每一个控制特性所需分配的样本数都做了具体规定,调查者必须按规定在总体中抽取调查个体,由于调查面较广,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。2019/8/20344、滚雪球抽样滚雪球抽样的主要目标是分析调研总体的稀有特征。•滚雪球技术的主要优点表现在,通过对调研总体设定期望的特征,从而增强了样本个体的相似性。因此,采用这种方法所产生的抽样误差比较小,成本比较低。2019/8/2035走向实践:央视收视率网的建设≥•1999年,央视—索福瑞公司为建立一个收视率调查网(人员测量仪技术),需要调查一个有代表性的n=2000户的样本,采用了分层多级pps整群抽样技术。根据以往研究,知道非农业人口的比例是一个显著影响指标。•因此将电视观众分为三大区域:(1)城市域:行政区划中的所有地级市(只含非农业人口在≥50%的市辖区的家庭户)(2)中间域:行政区划中的所有地级市(只含非农业人口在50%的市辖区的家庭户)(3)农村域:行政区划中的所有县和县级市的家庭户2019/8/2036走向实践:央视收视率网的建设•然后,按对收视率有显著影响的六大指标进行聚类分析,将城市区域分成6小层,中间域分成4小层,农村域分为10小层。•分层指标分别为:人口规模,0-14岁少儿的比例,65岁以上老人的比例,非农业人口的比例,识字率和年平均气温。2019/8/2037动手实践厦门商业银行•厦门商业银行在厦门市的各个区和街道设立了分支机构。这家银行提供了全方位的金融服务。厦门市有112,500人使用的白鹭信用卡。从最初的申请开始,银行致力于搜集客户的个人信息,包括姓名、地址、邮政编码、电话号码、收入、文化程度和资产等。厦门商业银行对信用持有卡在信用卡上的花费和其人口统计特征之间是否有关联感兴趣,例如在厦门某个地方,客户是否是信用卡最频繁的使用者?他们的个人收入与信用卡的使用是否有关系?2019/8/2038动手实践厦门商业银行问题:•对于这样的问题,你将如何定义总体?•你将在这个研究中使用什么样的抽样框?•在选择抽样框中,你将采取什么样的步骤进行简单随机抽样?•在这样情况下,分成抽样有意义么?为什么?如何设计一个分层抽样程序?•你能使用你设计的抽样框抽出一个整群样本么?为什么?•你将选择哪种概率抽样法?为什么?2019/8/2039思考•简单随机抽样极少采取挨家挨户访谈法,为什么?那种概率抽样法可以使用挨家挨户法?•假定电话号码簿是某项研究可接受的抽样框,你能发现从电话号码簿中抽取等距样本有什么问题么?•给下列的情况列举概率抽样框a读来读往吧的顾客b便携式电脑持有者c苍蝇拍的持有者d在去年去过一个或多个欧洲国家的人e居住在厦门少于两年的移民f长粉刺的人2019/8/2040抽样方法——选择•选择概率抽样和非概率抽样的条件•基本抽样方法的优缺点比较•应用抽样方法应考虑的因素2019/8/2041随机抽样与非随机抽样的比较一、样本效度(一)正确性(二)精确性二、抽样方法的比较(一)估计值的可信性—机率抽样(二)统计效率之评估—机率抽样(三)母体信息—机率抽样(四)经验技巧—非机率抽样(五)时间—非机率抽样(六)成本—非机率抽样2019/8/20422019/8/2043实践:美国282家企业抽样方法的应用参考消息:《市场调查的管理要点》先锋企管中心市场调查小组译犬田充着台北先锋企业管理发展中心出版注:单纯随机抽样=简单随机抽样集团抽样=群集抽样2019/8/2044教你一招:电话访问抽样方法一、电话号码簿抽样法(一)传统抽样方法(二)改良抽样方法1.加一抽样法2.加十抽样法3.两位随机数字法4.倒数抽样法二、随机数字拨号法目录•抽样概论•抽样方法•抽样条件(补充)•抽样误差与容量•案例研讨2019/8/2046温故知新:抽样样本使用方式•重复调查(RepeatedSurvey)每次调查均重新抽样,使用新样本(FreshSurvey)进行同样调查,是最常用之方法。•同样本调查(PanelSurvey)利用同一样本作长期的观念调查,以集中力量于样本变化研究上。又称追纵调查(LogitudiualSurvey)。研究消费者品牌忠诚度或消费者购买行为,多使用此一方式。•轮换样本调查(RotatingPauelSurvey)每次换取部份样本,以代表母体变化;维持部份样本的连续性及稳定性又降低成本。•分裂调查(SplitPauelSurvery)一部份每次均采用新样本(重复调查);一部份均用相同样本(同样本调查)。2019/8/2047自习思考题为什么随机抽样能实现对总体参数的估计?而非随机抽样则不行?(自习课本第五章和第六章)2019/8/2048基本符号及含义参数统计量总体抽样样本均值μu或X成数(
本文标题:抽样设计2
链接地址:https://www.777doc.com/doc-418823 .html