您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 市场营销 > 《传播研究方法》第八讲
复习为什么抽样?经济、提高研究质量抽样的类型:概率抽样、非概率抽样7种非概率抽样(NonprobabilitySampling)抽样类型原则便利样本Haphazard样本的选取主要考虑它们是否便利于收集、研究。目的样本Purposive尽可能收集到符合某一标准的全部样本。配额样本Quota样本在某些变量上有与总体相同的比例,以反映总体的多样性。但个案以便利抽样的方式抽取。滚雪球Snowball由一组成员来确定其他选入样本的成员。反常案例Deviantcase选取与主导范式不同的样本(一种特殊类型的目的样本)。贯序样本Sequential持续收集样本,直到样本中不再含有额外的信息或特征。理论样本Theoretical样本能够帮助揭示具有理论重要性的某一特殊场景/主题的特征。复习:概率抽样的逻辑和理论代表性(Representativeness)当选出的样本的各种集合特征大体接近于总体的集合特征时,样本就具有代表性。样本不需要在每一方面都具有代表性,代表性只需局限于与研究的实质性需要相关的特征。概率抽样的基本原则:总体中的每一单位都有一个已知的、非零的被包含在样本中的概率,尽管对于总体的所有单位而言,选择的概率并非总是相同的。EPSEM(Equalprobabilityofselectionmethod):在这种样本设计中,总体中的每个成员都具有相等的被选进样本的机会。概率抽样的独特优点:虽无法完美地代表总体,但能避免各种偏见;能够估计样本的精确度及代表性。复习:概率抽样的逻辑和理论代表性(Representativeness)当选出的样本的各种集合特征大体接近于总体的集合特征时,样本就具有代表性。样本不需要再每一方面都具有代表性,代表性只需局限于与研究的实质性需要相关的特征。概率抽样的基本原则:总体中的每一单位都有一个已知的、非零的被包含在样本中的概率,尽管对于总体的所有单位而言,选择的概率并非总是相同的。EPSEM(Equalprobabilityofselectionmethod):在这种样本设计中,总体中的每个成员都具有相等的被选进样本的机会。概率抽样的独特优点:虽无法完美地代表总体,但能避免各种偏见;能够估计样本的精确度及代表性。复习:概率抽样的逻辑和理论随机选择(RandomSelection)获得代表性样本的核心步骤。随机并非偶然,而是一种非常仔细的特别的程序,能确保每一样本单位的选择都独立于其他单位的选择。独立:总体中的任何一个成员的选择都不会对总体中任何其他正在被选择的成员的选择的可能性产生影响。例如:投掷硬币以随机数表或电脑程序完成。随机选择的优点此过程可以避免研究者自觉或不自觉的偏见;符合概率理论,提供了估计总体参数和抽样误差的基础。复习:概率抽样的逻辑和理论——一些基本概念总体(Population):我们感兴趣的、试图概括的群体或集合体。如:全国人口要素(Element):构成总体的单位,也是样本所包含的内容。在一个既定研究中,要素与分析单位往往是相同的。要素用于抽样,分析单位用于资料分析。样本率(samplingratio):样本个案数和总体之比,即n/N.例:总体包含50,000人,研究者从中抽取150人作为样本,则样本率为150/50000=0.003or3%复习:概率抽样的逻辑和理论——一些基本概念样本框(SamplingFrame)“总体”是个抽象的概念。样本框:用于抽样的总体列表。如果样本能够代表总体,则其样本框必须包含所有(或几乎所有)的总体成员。例:对组织的研究【成员名单即为样本框】以电话黄页为样本框复习:概率抽样的逻辑和理论——一些基本概念样本框(SamplingFrame)样本框存在的四个潜在的缺陷1.丢失:样本框中丢失了目标总体的某些人口单位2.重复:某些单位在清单中登录了一次以上3.不合格:样本框中有不属于目标总体的单位4.整群登录:样本框中的单位以群体形式登录样本框定义出现问题,会导致非抽样偏倚:样本框造成的偏倚;无回答偏倚测量误差【定义和测量工具的问题】复习:概率抽样的逻辑和理论——一些基本概念参数(parameter):对总体中某变量的概括性描述。统计值(statistic):对样本中的变量的概括描述,并被用来估测总体参数。统计值Statistic样本框SamplingFrame总体(Population)参数Parameter抽样过程SamplingProcess样本(Sample)数据中实际观察到的抽样逻辑模型我们想要研究的复习:概率抽样的逻辑和理论——一些基本概念抽样单位(samplingunit)抽样过程中的基本单元。在简单随机抽样中,抽样单位是个体(individuals);在群集(clustersampling)抽样中,抽样单位是由个体组成的群集。层级(stratum):样本的一个子集。层级的划分通常是研究所关心的某一变量为依据。同一层级中的个案,就该变量而言,是同一的(homogeneous)。复习:概率抽样的逻辑和理论抽样要解决的两大问题:如何选择一个用于代表总体的样本?如何判断样本是否完好地代表了总体?抽样偏倚/误差:在研究总体的值与期望值之间存在的差异。抽样分布(SamplingDistribution):一种估计量,如从许多样本计算的,围绕以它的期望值为中心的分布。SB:抽样偏倚:从研究总体中得到的均值:均值的期望值,即对研究总体反复进行抽样得到的均值的平均值抽样误差(SamplingError))(sXSBxEx)(xEsXsXsXsX抽样分布假设研究州立大学的学生对校方拟实行的一套学生管理条例的态度。研究总体为20,000名该校注册学生,随机从中抽取100名学生为样本以估计总体的情况。假设学生中有一半赞成,一半反对(研究者预先并不知道这一情况)。三种假设的抽样所产生的结果对学生名册上的每一个学生予以编号,使用随机数表选出其中的100位,询问其对于校规的态度。其中:48位学生赞同,52位不赞同;以相同的方法选出另外100个样本。结果:51%赞同;在第三组样本中,有52位学生持赞同态度。抽样分布如果扩大抽样数量,我们会发现,虽然抽样结果分布在一个相当大的范围内,但是大部分的抽样结果都出现在图中的50%附近。抽样误差(SamplingError)标准误:某抽样设计的期望误差程度;指出抽样结果集中在总体参数附近多大的范围内。其中一种测量方法:P、Q:二项变量的总体参数值−60%的学生赞成校规而40%的学生反对,则P=60%,Q=60%−N:每组样本包含的样本量【如n=100】−S:标准误nQ*PS样本容量n:越大,S越小样本同质性:p=0or1,S=0正态曲线(NormalCurve)不论总体有何特质,当反复地从总体中抽取样本时,曲线的数值就接近正态曲线的形状。大约34%的样本估计值会落在大于总体参数值一个标准误的范围内;另外34%的样本估计值会落在小于总体参数值一个标准误的范围内。估测抽样误差:置信水平(ConfidentLevel)和置信区间(ConfidentInterval)置信水平:总体参数落在一既定置信区间的估测概率。例如:我们有95%的信心说35%-45%的投票者会支持候选人A。置信区间:估测总体参数值的范围。例如:我们有95%的信心保证样本统计值会落在与参数值相距正负5%的范围内。置信区间扩大时,置信水平也会增加。几乎所有样本估计值(99.9%)都会落在与真实值相距三个标准误的范围内。估测抽样误差:置信水平(ConfidentLevel)和置信区间(ConfidentInterval)当决定了允许的抽样误差范围后,便可依此范围计算所需要的样本量。样本量二项分布百分值50/5060/4070/3080/2090/10100109.89.2862007.16.96.55.74.23005.85.75.34.63.540054.94.6435004.54.44.13.62.76004.143.73.32.47003.83.73.532.38003.53.53.22.82.19003.33.33.12.7210003.23.12.92.51.91100332.82.41.812002.92.82.62.31.713002.82.72.52.21.714002.72.62.42.11.615002.62.52.42.11.516002.52.42.321.5找出样本量和样本二项式分布值得交叉点,出现的数字代表当置信度为95%时,以百分点(正负)所显示的抽样估计误差。例:400名受访者样本中,60%回答是,40%回答否,抽样误差估计为正负4.9个百分点。则我们可以预测,当置信度为95%时,总体中回答“是”的比例落在55.1%-64.9%之间。若希望有95%的信心让研究结果与总体参数值的差异在正负5%以内,那么样本容量至少要有40人。传播研究方法第八讲:抽样的逻辑(2)中国青年政治学院赵菁2015年11月5日本讲概要概率抽样的类型第二次作业抽样设计的类型简单随机抽样(Simplerandomsampling,SRS)系统抽样(Systematicsampling)分层抽样(Stratifiedsampling)多级整群抽样(Multistageclustersampling)概率比例抽样(Probabilityproportionatetosize,PPS)抽样设计的类型——1.简单随机抽样(SimpleRandomSampling,SRS)通过对总体随机抽取而获得的样本。方法:第一步编制包含所有要素的抽样框;第二步给名册中每一个要素一个号码;第三步确定所需样本数;利用随机数表(randomnumberstable)选择要素两个基本特征:1)同一概率;2)独立性要求:有所有个体的名单,并且可以接触到所有个体。例:简单随机抽样随机数表的使用方法【要求】:假设要从800人的总体中用简单随机抽样方法选取50个人作为样本。【步骤】:1.将总体中所有的人编码(1-800);2.确定所选择的随机数需要几位数字(3位,001-800)3.翻到随机数表第一页:1.如何从五位数字号码中产生三位数字号码?【建立原则】2.按照什么顺序在表中选择号码?3.从哪里开始选择?1.超过800的数字:忽略它;2.碰到同一个号码:跳过第二个重复的;3.依此进行,选足50个随机数问题:1.成本高;2.不精确等距抽样:系统化地选择完整名单中的每第K个要素组成样本。例:从120个人(总体)中选出10个人(样本)抽样间距(samplinginterval):两个被选择的要素间的标准距离。总体大小/样本大小,120/10=12【步骤】:1.将总体中所有要素编码;2.(从1-12中)随机选择一个数字作为起点;3.每隔12个数字选一个作为样本抽样设计的类型——2.系统抽样(Systematicrandomsampling)潜藏危机:周期性问题如果要素名单是以与抽样间隔一致的循环方式排列的,系统抽样方法可能产生一个有重大偏误的样本。例如:报纸抽样;公寓样本;士兵名册抽样抽样设计的类型——2.系统抽样(Systematicrandomsampling)案例1丈夫2a妻子3丈夫4妻子5丈夫6a妻子7丈夫8妻子9丈夫10a妻子11丈夫12妻子随机起始:2抽样间距:4选入样本:a在抽样之前将总体分为同质性的不同群(或层)。每一子集就所研究的有关特征而言(如年龄、收入、种族等)是同一的。之后可与简单随机抽样、系统抽样或整群抽样相结合,在每一子集中抽取随机样本,组成一个总的随机样本。关键功能:将总体分成几个同质的次级集合(次级集合间有异质性),然后再从每个次级集合中抽出适当数量的样本。次级集合除了在用来分层的变量方面具有同质性之外,在其他变量方面也可能具有同质性。E.g.按年级
本文标题:《传播研究方法》第八讲
链接地址:https://www.777doc.com/doc-3190425 .html