您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第5章群体间的差异比较T检验
第5章5.1假设检验概述5.2单样本的T检验5.3双独立样本的T检验5.4配对样本的T检验3假设检验是一种根据样本数据来推断总体的分布或均值、方差等总体统计参数的方法。为什么要根据样本来推断总体?总体数据不可能全部收集到。如:全国的电视观众收集到总体全部数据要耗费大量的人力和财力如果原假设是关于总体参数的,则称它为参数假设,相应的检验为参数检验;如果原假设是关于总体分布类型的,则称它为分布假设,相应的检验为分布检验(或称非参数检验)假设检验的基本思想:小概率事件在一次实验中不应当发生。小概率事件:习惯上将发生概率很小,如P≤0.05的事件称为小概率事件。例如:对全国电视观众日收视时间进行推断H0:平均时间182分钟(根据以往的抽样结果)样本平均时间为160分钟,由于存在抽样误差,不能直接拒绝H0。需要考虑:在H0成立的条件下,一次抽样得到平均时间为160的可能性有多大。如果可能性较大,是个大概率事件,则认为H0正确。否则,如果可能性较小,是个小概率事件,但确实发生了,则只能认为H0不正确。构造的检验统计量应能够体现样本取值情况和H0,且应服从某种已知分布。备择假设应该按照实际情况所代表的方向来确定,即它通常是被认为可能比零假设更符合数据所代表的现实。原假设H0:总体均值μ=182分钟备择假设H1:μ<182分钟比如上面的H1为μ<182;这意味着,至少样本均值应该小于182;至于是否显著,依检验结果而定:检验结果显著(significant)意味着有理由拒绝零假设。因此,假设检验也被称为显著性检验(significanttest)。经典的假设检验第一步:正式地陈述原假设(如H0:总体均值μ=182分钟),同时设定样本大小(如n=100),以及检验的错误水平(α=5%)第二步:构造检验统计量,且该统计量一定服从某种已知分布。第三步:假定H0为真,根据样本数据(如X=160分钟)和基本假设计算检验统计量的值,并得到相应的相伴概率p值。第四步:如果概率p值落在了拒绝区域内,那么就有充分理由判断这与H0相抵触,从而拒绝H0。否则,H0就是可以接受的。只有拒绝H0才是统计上有明确意义的结果,因此,应该将不希望出现的情况列为原假设,而将希望得到的结论设为备择假设,然后想尽办法在检验中拒绝原假设。单尾检验(One-TailedTest):研究者了解假设发生变化的方向,备择假设以单方向的形式表述;H0:μ=10H1:μ>10H0:μ=10H1:μ<10双尾检验(Two-TailedTest):研究者不了解假设发生变化的方向,备择假设以双方向的形式表述。H0:μ=10H1:μ≠10需要注意的是:计算机输出结果中的p值是双尾检验的概率。如果备选假设选择的是单尾检验,则要将计算机给的p值除以2,即取p值的一半。计算机给的p值为0.045,即p=4.5%,如果是单尾检验,则p=0.045/2=0.022511单样本T检验的目的:来自总体的样本均值与已知值的比较。已知值通常是以往的经验数据或统计结果。数据要求:检验的变量是定距变量总体服从正态分布样本是随机抽取的数据“住房状况调查.sav”推断家庭人均住房面积的平均值是否为20平方米。Analyze——CompareMeans——OneSampleTTest原假设H0:μ=20备择假设H1:μ≠20One-SampleStatisticsNMeanStd.DeviationStd.ErrorMean人均面积299322.006012.70106.23216One-SampleTestTestValue=20tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpper人均面积8.6402992.0002.005961.55082.4612P值均值差95%的置信区间实际检验的是检验统计量与20的差值!结果说明:此问题是双尾检验,比较α/2和p/2,由于pα,因此拒绝原假设,认为家庭人均住房面积的平均值与20平方米有显著差异。95%的置信区间说明:有95%的把握认为家庭人均住房面积的均值在21.55~22.46平方米之间。20没有包含在置信区间中,也证实了上述判断。由中心极限定理可知,即使原数据不服从正态分布,只要样本量足够大,其样本均数的抽样分布仍然是正态的。因此当样本量较大时,研究者很少去考虑单样本t检验的适用条件,此时真正会限制该方法使用的是均数是否能够代表相应数据的集中趋势。也就是说,只要数据分布不是强烈的偏态,一般而言单样本t检验都适用.当样本数n较小时,一般要求样本取自正态的总体,可以通过正态性检验或直观的作图方法来完成。17双独立样本T检验的目的:利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异;数据要求检验的变量是定距变量来自的总体应服从或近似服从正态分布;两样本相互独立。例:为了评价某个电视栏目的改版效果,在改版前从一个居民点中抽取了5位居民,他们对该栏目的评分分别是:65、70、85、80、75;改版后又从另一居民点中抽取了6位居民,他们对该栏目的评分分别是70、75、80、85、85、85。数据见节目改版评分.sav。试问在5%的显著性水平下,该电视栏目的改版是否取得了较好的效果?原假设H0:μ1-μ2=0备择假设H1:μ2-μ1>0Analyze——CompareMeans——Independent-SamplesTTest指定分组变量两独立样本的分组变量为二分变量GroupStatisticstypeNMeanStd.DeviationStd.ErrorMeanscorebefore575.00007.905693.53553after680.00006.324562.58199IndependentSamplesTestLevene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpperscoreEqualvariancesassumed.205.662-1.168.273-5.000004.281744.28174-14.685984.68598Equalvariancesnotassumed-1.142.288-5.000004.377984.37798-15.173895.17389方差齐性检验结果说明:(1)总体方差相等(方差齐性检验也叫Levene’s检验):方差齐性检验的原假设是总体方差相等判断F统计量对应的P值,如果P值大于显著性水平α,则可认为两总体的方差无显著差异(即接受原假设);(2)总体方差不等如果P值小于显著性水平α,则拒绝总体方差相等的假设,认为两总体的方差不等。在本例中,可以接受两总体的方差是相等的假设,从而采用第一行的数据,而显著性检验的结果P=0.273/2>0.025,所以不能拒绝原假设,即认为节目的改版没有取得较好的效果。练习:根据数据“住房状况调查.sav”,分析本地户口和外地户口的人均住房面积是否有显著差异。23使用配对样本的目的?在实际研究中,常常需要考察某一特定因素对于被研究者(被试者)的影响,一个很好的方法是实验法。实验法是通过严格控制无关变量的同质性,然后对需要检验的变量进行操作,记录下操作前与操作后该检验变量的特定属性的数值,被称作“前测”与“后测”。通过比较前测与后测的差异,可以判断该操作是否对检验变量产生了显著的影响。例如媒体中的暴力场面是否在人们的心理上产生某种特殊的示范效应?某减肥茶对肥胖人群是否有显著的减肥效果?配对样本的特征严格的配对样本是指进行一次随机抽样产生出测试对象,然后对这些测试对象进行操作前后的两次测量,从而得到“成对的结果”;两组配对样本的观察顺序必须一一对应;必须正确把握两次测量的时间间隔,必须等到第一次测量的影响完全消失后才能进行第二次测量。配对样本进行t检验的数据要求:两次测量的差值服从正态分布。假设某电影中惊悚情节和画面能刺激脑神经,在短时间内提高人们的精神集中程度。于是从同一个班里抽出20名同学,在看影片前让他们在限定的时间里完成50道测试反映逻辑性和灵敏度的题目;看影片后再做一次难易程度相当但表述不同的50道题目,前测与后测的成绩形成了配对样本,数据见电影效果.sav。分析影片中的情节是否能提高人们的精神集中程度。原假设H0:μ1-μ2=0备择假设H1:μ2-μ1>0Analyze——CompareMeans——PairedSamplesTTestPairedSamplesStatisticsMeanNStd.DeviationStd.ErrorMeanPair1before13.40202.604.582after32.30208.1511.823PairedSamplesCorrelationsNCorrelationSig.Pair1before&after20.537.015PairedSamplesTestPairedDifferencestdfSig.(2-tailed)MeanStd.DeviationStd.ErrorMean95%ConfidenceIntervaloftheDifferenceLowerUpperPair1before-after-18.9007.1001.588-22.223-15.577-11.90519.000从结果可知P值为0.000,小于0.025,因此拒绝原假设。事实上15.6<μ2-μ1<22.2,也说明该影片中情节的确能提高人们的精神集中程度。双独立样本T检验单样本T检验配对样本T检验1、假设去年江苏城市频道在南京地区的晚间收视率为3.0。今年频道改版之后的收视率见“南京地区收视率.sav”。分析频道的改版是否有成效?2、针对数据”movie.sav”,分析两家公司的票房水平是否有显著差异。3、针对数据“手机购买.sav”,分析男女生在手机购买动机上是否有显著差异?4、在一个广告测试比较实验中,研究广告A和广告B哪个更能使人们对某品牌的评价产生积极的影响,研究人员随机抽取了40人做研究对象,首先让他们对该品牌进行评价打分,然后随机指定20位受试者观看包含广告A的一组广告,另外20位受试者观看除把广告A换成广告B、其他要素完全相同的另一组广告。受试结束后,让这40位受试者重新对该品牌进行评价打分。结果发现,第一组中有12位受试者对该品牌的评价比观看广告A之前有所提高,第二组中有8位受试者的评价有提高。数据见“广告AB效果比较.sav”。(1)广告A对提升该品牌的积极影响是否产生了效果?(2)广告B对提升该品牌的积极影响是否产生了效果?(3)广告A是否比广告B效果更好?
本文标题:第5章群体间的差异比较T检验
链接地址:https://www.777doc.com/doc-3481716 .html