您好,欢迎访问三七文档
第四讲均值比较和T检验例在一次期末考试中,一班学生各科的平均成绩是79分,二班学生各科考试的成绩是83分,能否说明二班学生的学习成绩要明显好于一班?仅用平均数和标准差不能揭示事物的本质,只有通过检验揭示事物的本质。统计检验:从总体中抽取一个样本,用样本来判断总体假设的正误,这是通常的研究方法,用于判断一项假设是正是误的判定规则或者统计程序称为统计检验。Means过程4.1单一样本T检验4.2两独立样本T检验4.3两配对样本T检验4.4在正态或近似正态分布的计量资料中,经常在使用统计描述过程分析后,还要进行组与组之间平均水平的比较。本章介绍的T检验方法,主要应用在两个样本间比较。如果需要比较两组以上样本均数的差别,就不能使用上述的T检验方法作两两间的比较。对于两组以上的均数比较,可使用方差分析方法。4.1Means过程4.1.1统计学上的定义和计算公式定义:Means过程是SPSS计算各种基本描述统计量的过程。Means过程其实就是按照用户指定条件,对样本进行分组计算均数和标准差。如按性别计算各组的均数和标准差。Means过程的计算公式为研究问题比较不同性别同学的数学成绩平均值和方差。数据如表4-1所示。表4-1数学成绩表性别数学Male99795989798999Female88545623实现步骤图4-1在菜单中选择“Means”命令图4-2Means对话框图4-3“Means:Options”对话框4.1.3结果和讨论4.2单一样本T检验4.2.1统计学上的定义和计算公式定义:SPSS单样本T检验是利用来自某总体的样本数据,推断该总体的均值与某指定值之间是否存在显著差异。它是对总体均值的假设检验。这里方法涉及的是单个总体,并采用t检验的方法,因此,称为单样本t检验。单样本t检验的基本步骤:1提出零假设单样本t检验的零假设(H0):总体均值与检验值之间不存在显著检验。表述为u=u02选择检验统计量检验统计量为t统计量3计算检验统计量观测值和对应的概率p值4给出显著性水平a,并作出决策。如果概率p值小于a,则应该拒绝零假设,认为总体均值与检验值之间存在显著差异,反之,则无差异。计算公式如下:单样本T检验的零假设为:H0=总体均值和指定检验值之间不存在显著差异。采用T检验方法,按照下面公式计算T统计量:4.2.2SPSS中实现过程研究问题分析某班级学生的高考数学成绩和全国的平均成绩70之间是否存在显著性差异。数据如表4-1所示。实现步骤图4-4“One-SampleTTest”设置框图4-5“One-SampleTTest:OPtions”对话框表示当计算时涉及的变量上有缺失值时,则剔除在该变量上为缺失值的个案。剔除所有在任意变量上含有缺失值的个案4.2.3结果和讨论sig第四列是t统计量观察值的双尾概率p值为0.584MD第五列样本均值与检验值的差六七两列是总体均值与原假设值差的95%的置信区间,由此算出总体均值的95%的置信区间在(70-11.7496~70+19.7496)如果显著性水平a为0.05的话,0.584大于0.05,因此数学成绩与全国高考平均成绩没有差异。练习1:有居民存款数额的调查数据,推断储户总体一次平均存款金额是否为2000元。见数据结果One-SampleStatisticsNMeanStd.DeviationStd.ErrorMeanck3132.4738E36760.86744382.14682表中各列分别表示:样本数、平均数、标准差、均值标准误表4-1储户一次存款金额基本描述统计结果One-SampleTestTestValue=200095%ConfidenceIntervaloftheDifferencetdfSig.(2-tailed)MeanDifferenceLowerUpperck1.240312.216473.77955-278.13121225.6903表4-2储户总体一次平均存款金额单样本t检验结果表中各列分别为:t值、自由度、t统计量观测值的双尾概率p值、样本均值与检验值的差,即t统计量的分子部分、第六和第七列是总体均值与检验值差的95%的置信区间。由此可以计算出总体均值的置信区间(1721.87~3225.69)4.3两独立样本T检验4.3.1统计学上的定义和计算公式定义:所谓独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个样本之间是否有显著差异存在。这个检验的前提如下:两个样本应是互相独立的,即从一总体中抽取一批样本对从另一总体中抽取一批样本没有任何影响,两组样本个案数目可以不同,个案顺序可以随意调整。样本来自的两个总体应该服从正态分布。两独立样本T检验的零假设:H0=为两总体均值之间不存在显著差异。在具体的计算中需要通过两步来完成:第一,利用F检验判断两总体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对t检验的结论作出判断。1.判断两个总体的方差是否相同SPSS采用LeveneF方法检验两总体方差是否相同。2.根据第一步的结果,决定T统计量和自由度计算公式(1)两总体方差未知且相同情况下,T统计量计算公式为(2)两总体方差未知且不同情况下,T统计量计算公式为t统计仍然服从t分布,但自由度采用修正的自由度,公式为由此可见,两总体方差是否相等是决定如何计算抽样分布方差的关键。因此要通过有效地方法对其进行统计检验。从两种情况下的t统计量计算公式可以看出,如果待检验的两样本均值差异较小,t值较小,则说明两个样本的均值不存在显著差异;相反,t值越大,说明两样本的均值存在显著差异。4.3.2SPSS中实现过程研究问题分析A、B两所高校大一学生的高考数学成绩之间是否存在显著性差异。实现步骤表4-2两所学校学生的高考数学成绩表学校数学清华998879595489795689北大992389705067788956图4-6“Independent-SamplesTTest”对话框图4-7“DefineGroups”对话框Use…表示分别输入两个对应两个不同总体的变量值Cut…表示框中应输入一个数字,大于等于该值的对应一个总体,小于该值的对应另一个总体4.3.3结果和讨论在分析结果中,SPSS还自动给出了两样本均值差值的估计标准误差(Std.ErrorDifference)。在方差相同的情况下,估计标准误差的计算方法是在方差不相同的情况下,估计标准误差的计算方法是:练习2根据数据,分析城镇和农村储户的一次平均存款金额是否存在显著差异?结果GroupStatistics户口类别NMeanStd.DeviationStd.ErrorMean城镇2232.6872E35737.56623384.21585存款数额农村901.9450E38816.36583929.32656表4-3城镇和农村储户一次存款金额的基本描述统计结果表4-4城镇和农村储户一次存款金额两独立样本t检验结果IndependentSamplesTestLevene'sTestforEqualityofVariancest-testforEqualityofMeans95%ConfidenceIntervaloftheDifferenceFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifferenceLowerUpperEqualvariancesassumed.627.429.879311.380742.23513844.61631-919.649782404.12003存款数额Equalvariancesnotassumed.738120.613.462742.235131005.61905-1248.717582733.18784分析:1两总体方差是否相等的F检验,2两总体均值差的检验结论:城镇居民和农村居民的一次存款金额的平均值无显著差异。4.4.1统计学上的定义和计算公式4.4两配对样本T检验定义:两配对样本T检验是根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。两配对样本T检验的前提要求如下。两个样本应是配对的。首先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改变。样本来自的两个总体应服从正态分布。两配对样本T检验的零假设:H0=为两总体均值之间不存在显著差异。首先求出每对观察值的差值,得到差值序列;然后对差值求均值;最后检验差值序列的均值,即平均差是否与零有显著差异。如果平均差和零有显著差异,则认为两总体均值间存在显著差异;否则,认为两总体均值间不存在显著差异。SPSS将自动计算T值,由于该统计量服从n−1个自由度的T分布,SPSS将根据T分布表给出t值对应的相伴概率值。如果相伴概率值小于或等于用户设想的显著性水平,则拒绝H0,认为两总体均值之间存在显著差异。相反,相伴概率大于显著性水平,则不拒绝H0,可以认为两总体均值之间不存在显著差异。4.4.2SPSS中实现过程研究问题研究一个班同学在参加了暑期数学、化学培训班后,学习成绩是否有显著变化。数据如表4-3所示。表4-3培训前后的成绩变化人名数学1数学2化学1化学2hxh99.0098.00100.0090.00yaju88.0089.0045.0099.00yu79.0080.0056.0070.00shizg59.0078.0067.0078.00hah54.0078.0078.0088.00s89.0089.0087.0088.00watet79.0087.0089.0087.00jess56.0076.0097.0098.00wish89.0056.0076.0098.002_new199.0076.00100.0099.002_new223.0089.0089.0089.002_new389.0089.0089.0098.002_new470.0099.0089.0088.002_new550.0089.0098.0099.002_new667.0088.0078.0087.002_new778.0098.0078.0087.002_new889.0078.0089.0088.002_new956.0089.0068.0079.00实现步骤图4-8“Pared-SamplesTTest”对话框4.4.3结果和讨论第一列数学分数前后的平均差异第二列差值样本的标准差第四列差值样本均值抽样分布的标准差练习3为研究减肥茶是否具有明显的减肥效果,将35名志愿者喝茶前后的体重记录下来,通过数据分析推断减肥茶是否具有减肥作用。见数据。结果PairedSamplesStatisticsMeanNStd.DeviationStd.ErrorMean喝茶前体重89.2571355.33767.90223Pair1喝后体重70.0286355.66457.95749表4-5喝茶前与喝茶后体重的基本描述统计量表4-6喝茶前后体重的两配对样本t检验结果PairedSamplesTestPairedDifferences95%ConfidenceIntervaloftheDifferenceMeanStd.DeviationStd.ErrorMeanLowerUppertdfSig.(2-tailed)Pair1喝茶前体重-喝后体重1.92286E17.981911.3491916.4866921.9704514.25234.000t值为14.252,对应的双尾概率p值接近0,因此可以认为该减肥茶具有显著的减肥效果。小结在研究分析中,通常需要进行组与组之间平均水平的比较。本章介绍的T检验方法,就是主要用来进行两个样本间的比较。T检验的基本原理是:首先假设零假设H0成立,
本文标题:均值比较和-T检验
链接地址:https://www.777doc.com/doc-5499483 .html