您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 第五章大众传播学研究方法抽样
1第五章抽样第一节抽样的基本概念第二节非概率抽样第三节概率抽样2•抽样设计将要解决的是调查谁的问题,即如何挑选调查对象的问题。•要解决包括选择哪一部分作为调查对象,这部分应包含的个体有多少,用什么样的方法进行选择,以及所选出来这一部分调查对象与总体间的关系是什么等问题。3第一节抽样的基本概念•一、为什么需要抽样•普查45•抽样调查起源于统计学,1895年,挪威统计学家凯尔在国际统计学会(InternationalStatisticalInstitute,ISI)第五届大会上提出“用代表性样本方法来代替全面调查”的建议,这一年被认为是抽样调查历史的开端。6•抽样就是从一个总体中抽取部分个体或元素组成样本的过程。•原因:•1、节省研究经费和时间•2、提高研究者对研究过程的管理效率总体样本7抽样的假设:•1、部分是含于整体之中;•2、部分与整体具有相同的特征、规律、相互关系及变化过程;•3、部分能够为研究者提供一个有关整体状态、态度、意见和行为更加清晰的脉络。8•抽样的目的——获得具有代表性的样本•代表性意味着:•1、样本和总体的分布系统相同•2、总体和样本的均值相同•3、总体和样本里变量之间的关系相同9二、抽样的基本概念•(一)总体和元素•1、总体•总体是研究中所涉及的所有个体的集合,它可以是一群人,一批文件,一些事件或观念。•2、元素•构成总体的每一个个体就是元素。•例如,研究我国媒体对艾滋病的报道,那么上万家媒体就成为本研究的总体,每一家具体的媒体是构成总体的元素。10•确定研究的总体和元素,要依赖研究者个人的判断。•例如调查我国新闻工作者的职业意识,“新闻工作者”都包括哪些人?11•(二)样本(sample)•按照一定方法,从总体抽取出的部分个体就组成了样本,用它来代表总体。•如果对总体中所有元素进行研究,称为普查(census)。12•如:《上海地区记者生存状态调查》总体限定为上海地区报纸、广播电视、杂志的拥有记者证的一线采编人员,主要媒体单位包括SMG、文新集团、解放日报集团、第一财经日报、新民周刊、瞭望东方等上海主流媒体集团。被调查的200名记者以报纸平媒体记者为主要组成部分,占到样本总数的60.67%。因此本次调查样本偏向于报纸、杂志平面媒体记者。主要基于以下因素考虑:上海主流媒体中广播电视呈现一家独大的局面,文广集团是上海最大的广播电视集团,而竞争相对激烈的领域在于平面媒体。表7.1样本媒体类别构成108452525.28%14.04%60.67%020406080100120报纸广电杂志13•抽样框指的是包含总体所有元素的详细名单、地图或其他形式的资料。可以分为名单抽样框、地图抽样框、时间抽样框等。•在抽样框中,每个元素都有自己的对应位置或顺序,通常通过编号来实现。抽样框14第一节抽样的基本概念几个概念的区别总体样本抽样框抽样研究对象的总体总体中抽出的成员总体的列表名单抽出样本的过程15假定要进行一项有关改革开放30年来全国性报纸的广告内容方面的研究,试说明抽样过程•为了简化问题,假定研究的主要目的是改革开放30年来《人民日报》、《中国青年报》、《光明日报》三份全国性报纸的广告规模、内容及形式等方面的变化;•总体:1978年1月1日至2007年12月31日在上述三份报纸上刊出的全部广告;•抽样框:北京图书馆内可以查阅到的在此30年期间上述三份报纸上的广告;•抽样单位:报纸,可以按照等距抽样来进行;•记录单位:每份报纸上各个版面各种类型的广告;•总体参数:各类报纸和版面上不同时期刊出的平均广告条数、平均面积数、各种类型广告条数所占的比重、面积所占的比重等。16(三)概率抽样和非概率抽样•概率抽样是根据随机原则进行的选择,每个个体被选择的概率是已知的。它可以在抽样过程中避免人为因素造成的误差,还可以计算出由样本推断总体时的抽样误差,因而其样本能够推断总体;•非概率抽样并不遵循随机原则,而是根据主观意识在研究对象中进行的选择,它无法确定每个个体被选中的概率是多少,无法计算抽样误差,所以不能从样本推断总体。17(四)随机性•随机性意味着没有任何已知的准则能够描述事件或解释结果。•随机不等于随意或随便,它是根据概率论的基本原理来确定样本,不遵循任何已知的确定的准则。18三、抽样的原理•小样本、大样本•为什么大样本能够代表总体?•大数法则:总体中的每一个元素都包含着能够体现总体规律的稳定特征和不能体现总体规律的偶然现象。–对某个元素来讲,对总体的结论可能不成立;–但当总体规模很大的时候,偶然现象可以相互抵消,总体呈现出稳定特征。19•对大样本进行统计分析所得出的并非是针对所有个体都适用的结论,而是估计一定概率机会下总体特征出现的可能性有多大,个体所体现出的无规律的偶然性被限制在“一定概率机会”这个前提之下。2034%标准常态曲线21中心极限定理•当样本数量足够大的时候(如大于30),那么,无论总体的分布如何,其样本的平均值所构成的分布都趋于正态分布。•当无穷次地按照同一原则进行抽样时,虽然每次抽取出来的样本所包含的个体并不相同,但是这些样本的均值的分布呈现正态分布,而且这个正态分布的中间位置(即样本的平均值的平均值)就是总体的平均值。22四、抽样过程中的误差•1、随机误差:不可控因素造成的误差,降低了个体被选入样本或被分析的机会。•案例:《文学摘要》的厄运预测结果实际结果阿尔夫.伦敦55%阿尔夫.伦敦37%富兰克林.罗斯福41%富兰克林.罗斯福61%23《文学摘要》为什么会出现这样严重的错误?•原因之一是抽样框和总体不符:抽样框主要是根据电话号码簿和汽车登记册建立的。•另一个原因是由于回收率低引起的误差:总共寄出了一百多万份问卷,但是返回的问卷不足25%。24•2、抽样误差:抽样误差是指在采用随机抽样技术,由调查结果推算全体时,预先能算出来的误差。•抽样误差会受到样本规模的影响:一般而言,采用随机抽样时,样本规模愈大,抽样误差愈小。•抽样误差是衡量样本代表性强弱的标准。25•样本规模是指抽样单位数,在随机抽样时必须确定必要的样本数。–样本数过多,浪费人力、物力、财力和时间;–样本数过少,会影响调查结果的精确度,造成较大误差。五、样本规模26影响样本规模的因素:•(一)对精确性的要求•置信水平(confidencelevel):从样本推论总体时,我们有多大的信心确定样本会在可容忍误差内正确反映总体。•一般有90%、95%或99%置信水平。•社会科学研究通常把置信水平定为95%。27•简单随机抽样中推论总体平均数的样本规模计算公式为:•推论总体成数(或百分比)的样本规模计算公式为:222etn221epptn224etn28简单随机抽样所需要的最小样本量抽样误差(±)置信水平90%时的样本规模置信水平95%时的样本规模置信水平99%时的样本规模1%68069604166412%1702240141603%756106718494%42560010405%2723846666%18926746229•(二)研究者的精力和经费•(三)总体的异质性程度•总体异质性程度越高,需要的样本量越大。•(四)研究方法和研究目的•(五)数据分析里所涉及的变量数目•一般来说,多变量数据分析比一元二元变量分析要求更大的样本规模。30•我们能不能说“总体越大,样本规模越大”?31第二节非概率抽样•优点:1.按一定的主观标准抽选样本,可以充分利用已知资料。2.可以缩小抽样范围,节约调查时间、调查人员和调查费用。•不足:无法判断其误差,检查调查结果的准确性。32一、偶遇抽样(accidentalorhaphazardsampling)•或任意抽样、方便抽样:研究者把一定时间内一定环境里最容易接触到的人作为样本的方法,如街头拦访、商业调查、试测。•但是偶遇抽样不是随机的,结果偏差较大,可信程度较低,没有足够代表性。33•志愿者抽样(volunteersampling)34•志愿者抽样存在的问题:•1、回收率低;•2、参加研究的志愿者往往更倾向于“夸大”真实情况。35二、立意抽样(purposivesampling)•或目的抽样、判断抽样:指研究者根据特定目的和主观判断而确定研究样本。•适用情况:•1、研究对象是那些难以接触的、特定总体中的个体•2、研究对象是独一无二的个案•3、研究者清楚地知道自己的目的是试图深入了解某些特定类型的人群36•三、配额抽样(quotasampling)•根据调查目的找出与研究目的关系密切的特性作为配额指标,抽样时保证样本中具有某种特性的比例与总体中具有这种特性的比例一致。37•配额抽样法是在分层基础上进行的。配额抽样法的基本步骤:1、选择控制特性作为分层标准2、分层3、确定各层样本额4、配额指派38•配额抽样根据其抽样方法可以分为:•1、独立控制配额抽样,规定按独立的控制特征分配并抽取样本,即对调查对象只规定具有一定控制特征的样本抽取数目并规定配额,而不是规定具有两种或两种以上控制特征的样本抽取数目并规定配额。•2、非独立控制配额抽样,也称为相互控制的配额抽样或交叉控制配额抽样。是同时对具有两种或两种以上控制特征的每一个样本数目都作出具体的规定。39独立控制配额抽样案例一项研究要调查400名北京市区18-42岁的白领阶层对时尚的看法,配额的重要指标是城区、性别、年龄、职业。根据已知的资料得知总体中这四个指标的大致比例,则400人的样本也应该与总体中各项指标的比例相一致:城区东城西城朝阳海淀宣武崇文合计50501001005050400性别男女400人200200年龄18-28岁29-35岁36-42岁400人100200100职业公务员企业管理公司行政事业单位大学生400人8060140804040非独立控制配额抽样•某大学有4000名学生,其中男生占60%,女生占40%,管理类和理工类学生各占50%,大一、大二、大三、大四的学生比例分别为40%、30%、20%和10%,现在要抽取500人进行调查,按非独立控制配额抽样,其情况如下:男女管理类理工类管理类理工类年级一二三四一二三四一二三四一二三四人数6045301560453015403020104030201041四、滚雪球抽样(snowballsampling)•或网络抽样(networksampling):是指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象。•这种抽样中有些分子最后仍无法找到,有些分子被提供者漏而不提,两者都可能造成误差。42第三节概率抽样•优点:1.排除了人为的干扰。2.能够计算调查结果的可靠程度。•不足:1.对所有调查样本都给予平等看待,难以体现重点。2.抽样范围广,所需时间长,参加调查的人员和费用多。3.需要具有一定专业技术的专业人员进行抽样和资料分析。43概率抽样的基本程序•1、明确研究的目的,确定研究所要估计的主要总体参数;•2、确定研究总体和抽样单元;•3、确定和构造抽样框:在确定调查总体和抽样单位后,应将总体按照抽样单位划分为各部分,构成抽样框;•4、选择适当的抽样方法以及确定样本量的大小;•5、制定抽样方案的具体实施细节。44一、简单随机抽样(simplerandomsampling)•又称单纯随机抽样,是所有随机抽样方法中最简单的一种方法。•它按照随机的原则从调查总体中不加任何分类、排序、分组等先行工作,直接从总体中逐个抽取若干单位组成研究样本。45•1、无放回的简单随机抽样•2、非常简单随机抽样•概率抽样是不是等概率抽样?46抽样框•在进行随机抽样时,研究者首先要列出一个包含所有元素的详细名单,每个元素都对应着一个独一无二的、以数字表示的位置,这个名单就是抽样框。既没有遗漏,也没有重复。47•简单随机抽样的方法•1、抽签法:当总体很小的时候,将抽样框中的N个元素编号,把每个元素的号码写在签上,将签充分的混合,随机不放回的抽取直至样本规模符合要求。•2、随机数表法:从随机数表上的任意位置开始,横向或纵向地连续选择数
本文标题:第五章大众传播学研究方法抽样
链接地址:https://www.777doc.com/doc-3190449 .html