您好,欢迎访问三七文档
第四章差异量数描述一组数据参差不齐的程度观察下面3组数据:有没有区别呢?(1)0,3,3,5,5,5,5,7,7,10(2)0,1,2,3,5,5,7,8,9,10(3)3,4,4,5,5,5,5,6,6,7这三组的平均、中数、众数都是5,即它们的中心位置都位于5。有区别,即数据的散布程度不一样。三组数据的离散状况比较在教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。这些特殊性常表现为数据的变异性。405060708090100本章内容第一节全距四分位差百分位差第二节方差和标准差第三节差异系数第四节偏态量和峰态量第五节标准分数第一节全距四分位差百分位差1.全距:一组数据中最大值与最小值之差。用R(Range)表示。请分别计算右边三组数据的全距和平均数。优:简单、方便缺:易受两极端值的影响。4204404604805005205405605802.四分位差:依据一定顺序排列的一组数据中间50%个频数距离的一半;依据一定顺序排列的一组数据除去两端四分之一数据后再取其一半的距离。公式Q=(Q3-Q1)/2Q1是从小到大排列的数据1/4处的数值,称为第1四分位数,Q3是位于3/4处的数值,称为第3四分位数。思考:中数处于什么位置?四分位差与Q1、Q2、Q3之间的关系中数可以看做是第二四分位点,即50%点,因此中数有时也常用Q2表示。四分位差的计算:求以下16个数据的四分位差12141517192022252930313335373940vvQ1=18Q3=34Q=(Q3-Q1)/2=(34-18)/2=8求下列原始数据的全距和四分位差2336202533312729把数据依一定顺序进行排列2023252729313336Q=(32-24)/2=4R=36-20=163.百分位差是指两个百分位数之差。以全距来表示一组数据的离散程度时,容易受极端值的影响。因此,可以取消分布两端10%的数据,即用P10和P90之间的距离作为差异量数,即百分位差。在实践中已较少使用。第二节方差和标准差1.方差含义:是指离差平方的算术平均数。也称变异数、均方。作为样本统计量,用符号S2表示,作为总体参数,用符号2表示。2.方差公式nxxSi22请计算下面三组数据的方差2.18.106.6232221SSS三组的平均数均为5。第二组的方差最大。第三组的方差最小。全距R1=R2=10。用方差表示组间离散度的差异更为敏感。0,3,3,5,5,5,5,7,7,100,1,2,3,5,5,7,8,9,103,4,4,5,5,5,5,6,6,73.标准差公式方差和标准差意义:全面反映了一组观察值的变异程度。标准差越大,表明数据离散程度越大,数据分布范围越广,数据参差不齐。思考:标准差是大好还是小好?2)(nxxSi4.标准差和方差的应用计算简单,可以进行代数运算。用样本数据来推断总体差异时,方差和标准差是最好的估计量。应用范围最为广泛。补充资料5.无偏方差和无偏标准差无偏方差公式:无偏标准差公式:区别:无偏方差是总体方差的无偏估计。212)(11xxnSnii2SS22221SSSnnS第三节差异系数(变动系数)差异系数是标准差与其算术平均数的百分比(没有单位)公式意义:差异系数越大,表明离散度越大。用途:主要比较不同单位数据的差异程度。%100xsCV1.已知某小学一年级学生的平均体重为25千克,体重的标准差为3.7千克,平均身高110厘米,标准差为6.2厘米,求体重和身高的离散程度哪个大?CV1=3.7/25*100%=14.8%CV2=6.2/110*100%=5.64%结论:体重的分散程度比身高的分散程度大。第四节偏态量和峰态量偏态量和峰度量是描述数据分布特征的统计量,又称偏度和峰度。1.偏度:是描述图形离开对称的方向和程度的指标。偏度SK=0图形对称偏度SK0图形呈正偏态偏度SK0图形呈负偏态2.峰度(Ku)峰度是描述图形中次数最多之处的山峰高耸的程度Ku=0图形呈标准的常态状Ku0图形的山峰显得尖Ku0图形的山峰显得矮平第五节标准分数1.标准分数,又称Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。2.计算公式:Z的数值有正负,表示正向(或负向)离开平均多少个标准差单位Z=0表明其原始分数为平均数Z0表明其原始分数高于平均数Z0表明其原始分数低于平均数sxxzi3.标准分数的优点及应用优点:(1)可比性(2)可加性应用:(1)可以比较不同观测值在各自数据分布中相对位置的高低例1.某年高考理科数学全国平均成绩65分,标准差是12.5分,考生A,B,C三人的数学原始分数分别是50,65,85分,求他们的标准分数是多少?Z1=(50-65)/12.5=-1.2Z2=(65-65)/12.5=0Z3=(85-65)/12.5=1.6结论:C的分数高于平均分。当求出分布中某一原始分数的Z分数,就可以通过查正态分布表得到此原始分数的百分等级,从而知道在它之下的分数个数占全部分数个数的百分之几。(2)计算不同性质的观测值的总和或平均值,以表示在团体中的相对位置。例2.有A、B两个学生在三种考试中的分数如下,试比较二人的分数是否有差别。考试平均分数标准差A同学B同学170870902554575134254540考试平均标准差A分数B分数ZAZB1708709002.5255457510.5-1342545400.6-0.4Σ1671721811.11.1结论:两个学生在三门功课中的成绩总分没有差异。4.标准分数的转换由于Z分数会出现小数、负数等缺点,我们常常将其转换成正态标准分数。韦克斯勒的韦式成人智力量表IQ=15Z+100baZZ5.原始分数与标准分区别以下是两位老师对5位同学的作文评分及名次(原始分数)学生老师甲评分老师甲顺序老师乙评分老师乙顺序甲乙老师平均分成绩顺序A85150567.55B802604704C75370372.53D704802752E65590177.51总分375350362.5平均分757072.5标准差7.0714.14从上表中,我们可以得出:两老师的评分次序完全相反;两老师的平均分的排序与乙老师的排序相同;两老师评分的标准差相差一倍;分数的标准差影响原始总分的排序。作业1正确理解偏度和峰度的含义解释标准分数Z的意义计算方差、标准差及无偏方差和无偏标准差作业2某班36个学生,英语测验分数的标准差为9.6,求其离差平方和。76.33176.936)(222nSxxi作业3.通过同一测验,一年级学生的平均分数为60分,标准差为4.02分,三年级学生的平均分为80分,标准差为6.04,问两个年级的测验分数哪一个分散程度大?CV1=4.02/60*100%=6.7%CV2=6.04/80*100%=7.55%结论:三年级的测验分数分散程度大。作业4下表是高等学校入学考试中两名考生甲和乙的成绩分数。试问根据考试成绩应该优先录取哪名考生?考试科目甲原始成绩乙原始成绩全体考生平均分标准差数学85897010政治7062655外语6872698语文5340506历史7287758考试科目甲原始成绩乙原始成绩平均分标准差Z甲Z乙数学858970101.51.9政治70626551-0.6外语6872698-0.1250.375语文53405060.5-1.67历史7287758-0.3751.5Σ3483502.51.505结论:如果按原始总分应该录取乙考生;若按标准分数录取则应该是甲考生。
本文标题:教育统计学4
链接地址:https://www.777doc.com/doc-3849201 .html