您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 北师大教育统计学期末复习
大二上·教育统计学1教育统计学期末复习1.统计学分为数理统计学和应用统计学,教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。描述性统计和推断性统计(估计和假设检验)2.随机现象的每一种结果叫做一个随机事件,能表示随机现象各种结果的变量称为随机变量,统计处理的变量都是随机变量。第二章数据的初步整理一、数据的来源、种类及其统计分类(一)来源1.经常性资料:文字记载的资料2.专题性资料①教育调查:在没有预定因子、不施行控制的条件下,对现成的教育方面有关客观事实所进行的观察和分析。分为:现情调查、回顾调查和追踪调查或全面调查和非全面调查②教育实验:在预定的控制因子影响下,对教育方面有关客观事实所进行的观察和分析。一般设立两种实验处理进行对照和比较:单组实验(看两种形式对结果的影响)、等组实验(甲乙两组基本条件相同的情况下,对之施行不同的实验处理)和轮组实验(在实验组和对照组分别进行两种实验处理,并且每种处理各重复一次:甲组实验先A后B,重复为先B后A;乙组实验先B后A,重复先A后B)(二)种类1.变量①定类(称名)变量:如性别、专业②定序(顺序)变量(无相等单位和绝对零点):1级、2级、三级③定距(等距)变量(有相等单位无绝对零点):摄氏温度④定比(比率)变量(有相等单位有绝对零点):身高、体重2.数据①点计:人数、物品个数。度量:用工具得到的数据②间断型随机变量数据(类别数据,人数、等级),连续型随机变量数据(数据可以用小数表示,连续区间)大二上·教育统计学23.统计量与参数(统计量:在统计工作中,对一系列原始数据进行计算,得出的平均数,标准差)参数(由样本估计总体的水平)二、统计图表1.统计表一般由标题、表号、题目、线段、数字(暂缺或未记录…表示,无用—表示)、表注构成表2.1某年级各班学生人数班别一班二班总和人数423678表2.838名学生6道选择题做对的频数分布做对题数0123456总和频数13613104138表2.11二年级80个学生身高的频数、累积频数、累积百分比分布表身高组中值频数累积频数累积百分比115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.5138102019124211412224261737779801.255.0015.0027.5052.5076.2591.2596.2598.75100.00总和80表2.12师大附小和云岭小学二年级学生身高的频数百分比分布表身高频数频数百分比师大附小云岭小学师大附小云岭小学112-115-1161.252.5015.00总和8040100.00100.00顶线底线总标目横标目纵标目大二上·教育统计学32.统计图标题、图号、标目、图形、图注①表示间断变量:直条图(纵条图和横条图)、圆形图②表示连续变量:线形图、频数分布图(直方、多边、累积频数和累积百分比图)00.511.522.533.544.55甲乙丙人数等级图2.1某年级操行评定结果男女甲58%乙23%丙10%丁9%图2.2某年级操行评定结果大二上·教育统计学4三、抽样0123456类别1类别2类别3类别4坐标轴标题坐标轴标题图表标题系列1系列2系列3大二上·教育统计学5为了使统计推断正确可靠,就应当使样本对于总体有较好的代表性,这就引伸出抽样的问题:抽样方法:1.单纯随机抽样:抽签,等概率,一般来说要放回,但无限总体放回与不放回不改变2.机械抽样:从总体中抽取样本时,按照时间或空间的等距间隔抽取,可与单纯随机抽样结合起来(前20人中选任一个,再从下一个20人中任选一个)3.分层抽样:分组后单纯随机抽样4.整群抽样:如要调查北京市五年级小学生患近视眼的情况,不是个别地抽取每个学生,而是按照学校来抽样,然后对抽取到的学校中的每个五年级小学生进行检查。组织便利容易抽取,缺点是样本单位在总体中的分布不均匀,代表性有限。样本容量:一般认为n30为小样本,n≥30为大样本第三四章集中量和差异量一、集中量:用一个数据表示总体(或样本)某一方面的一般水平(一)算术平均数(𝑿)及加权平均数(𝑿𝒘)频数分布表计算法中,把X替换为fx(组中值)X频数(二)中位数(Md)频数分布表计算法:类似四分位距计算法(三)众数(Mo)1.皮尔逊经验法:Mo≈3Md-2𝑋(四)算术平均数、中位数和众数的关系当频数分布呈正态时,算数平均数、中位数、众数三者重合为一点。中位数始终在中间,正负偏态看𝑋大二上·教育统计学6二、差异量:一组数据离散程度(一)绝对差异量1.四分位距(QD):数量中间的50%Q1(累积频数为25%)Q3(累积频数为75%)𝑄𝐷=𝑄3−𝑄12(1)原始数据求法(2)频数分布表求法(内插法)分数频数累积频数四分位距50-11Q3=85+36−2910X5=88.555-2360-3665-41070-51575-62180-82985-103990-54495-448总和482.平均差(MD)各数与算术平均数或中数之绝对利差的平均数:大二上·教育统计学73.方差(𝝈𝒙2)和标准差(𝝈𝒙)(1).原始数据法𝜎𝑥=√Σ𝑋2𝑁−(Σ𝑋𝑁)2(2).频数分布表法:把X换成组中值fx(二)相对差异量:两种单位不同,身高体重CV=𝜎𝑥𝑋̅×100%CV大,表明离散程度大,CV小,表明离散程度小(三)偏态量和峰态量1.偏态量SK=0SK0SK0大二上·教育统计学82.峰态量α4=0正态峰α40高狭峰α40低阔峰第五章概率及概率分布一、概率(P(X))(一)分类:先验概率后验概率二、二项分布:1.二项展开式通式:P(x)=𝐶𝑛𝑥𝑝𝑥𝑞𝑛−𝑥2.在n次二项试验中成功事件出现次数的平均数为:μ=np,标准差为σ=√𝑛𝑝𝑞三、正态分布:标准差大的,正态分布形态低阔,标准差小的,正态分布形态高狭1.标准正态分布:Z=𝑋−𝑋𝜎𝑋图形,面积的含义,整个曲线面积可大致分为6个部分2.确定录取分数线(将录取率200/1600=0.125作为正态分布上端的面积。然后根据0.5-0.125=0.375查表得P,进而得到Z)、确定等级评定的人数(可将正态分布基线上Z=-3至Z=+3之间6个标准差的距离分成相等的几份)★第六章抽样分布及总体平均数的推断通常以拉丁字母𝑋、s、r、n表示样本的平均数、标准差、相关系数统计量,以希腊字母大二上·教育统计学9μ、σ、ρ、Ν表示总体的平均数、标准差、相关系数、总个数等总体参数。估计和检验统称统计决断。一、抽样分布(一)概念:某一种统计量的概率分布(二)定理:1.从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数E(𝑋)=μ(E表示平均的符号,𝑋表示样本的平均数,μ表示总体平均数)2.容量为n的平均数在抽样分布上的标准差等于总体标准差除以n的平方根:𝜎𝑋=𝜎√𝑛(平均数标准误)Z=𝑋−𝜇𝜎𝑋=𝑋−𝜇𝜎√𝑛S=√𝑛𝑛−1𝜎𝑋S为总体标准差的估计值推导为:𝑆𝑋=√𝑛𝑛−1𝜎𝑋√𝑛=√1𝑛−1𝜎𝑋(三)t:t=𝑋−𝜇𝑆𝑋(df=n−1,df=30时≈Z)df越大,曲线越高二、总体平均数估计(点估计·区间估计·双侧)实际研究工作中,除特殊情况外,把它假定为正态分布或接近正态分布。(一)σ已知1.95%置信区间:P(𝑋−1.96𝜎√𝑛μ𝑋+1.96𝜎√𝑛)=0.952.99%置信区间:P(𝑋−2.58𝜎√𝑛μ𝑋+2.58𝜎√𝑛)=0.99大二上·教育统计学10(二)σ未知1.大样本:同上2.小样本:①95%置信区间:P(𝑋−𝑡(𝑑𝑓)0.05𝜎𝑥√𝑛μ𝑋+𝑡(𝑑𝑓)005𝜎𝑥√𝑛)=0.95②99%置信区间:P(𝑋−𝑡(𝑑𝑓)0.01𝜎𝑥√𝑛μ𝑋+𝑡(𝑑𝑓)0.01𝜎𝑥√𝑛)=0.99三、假设检验显著性水平α:(一)σ已知Z(1)提出假设:H0:μ=66H1:μ≠66(2)选择检验统计量并计算其值:Z=𝑋−𝜇0𝜎√𝑛(3)确定检验形式:双侧/单侧(4)统计决断:丨Z丨双侧(1.962.58)单侧(1.652.33)(二)σ未知tⅠ大样本Z=𝑋−𝜇0𝜎𝑋√𝑛Ⅱ小样本(1)提出假设(2)选择检验统计量并计算其值:t=𝑋−𝜇𝜎𝑋√𝑛−1(3)确定检验形式(4)统计决断:𝑡(df)0.01𝑡(df)0.05★第七章平均数差异的显著性检验一、基本原理平均数之差:𝐷=𝑋1−𝑋2差的方差:大二上·教育统计学11𝜎𝐷2=∑(D−𝐷)2𝑛=∑(X1−𝑋1)2𝑛+∑(X2−𝑋2)2𝑛−2∑(X1−𝑋1)(X2−𝑋2)𝑛相关样本平均数之差的标准误𝜎𝐷√𝑛=𝜎𝐷=√𝜎12+𝜎22−2r𝜎1𝜎2𝑛独立样本平均数之差的标准误𝜎𝐷=√𝜎12𝑛1+𝜎22𝑛2二、显著性检验(一)相关样本1.配对组(1)提出假设𝐻0:𝜇1=𝜇2(或𝜇𝐷=0)𝐻1:𝜇1≠𝜇2(或𝜇𝐷≠0)(2)选择检验统计量并计算其值t=𝐷−μD𝑆𝐷=𝐷𝑆𝐷=𝑋1−𝑋2√𝜎X12+𝜎X22−2𝑟𝜎𝑋1𝜎𝑋2𝑛−1(3)确定检验形式(4)统计决断2.同一组T换为Z(二)独立样(方差齐性用t检验,方差不齐性用t’检验)1.独立大样本S𝐷=√𝑆12𝑛1+𝑆22𝑛2≈√𝜎𝑥12𝑛1+𝜎𝑥22𝑛2Z检验大二上·教育统计学122.独立小样本(略)t=𝑋1−𝑋2√𝑛1𝜎𝑋12+𝑛2𝜎𝑋22𝑛1+𝑛2−2·𝑛1+𝑛2𝑛1𝑛2对两个总体的方差是否有显著性差异所进行的检验称为方差齐性检验,对两个独立样本方差是否齐性,要F检验第八章方差分析一、方差分析的基本原理:以F检验来推断几个平均数差异的显著性F=𝑀𝑆𝑏𝑀𝑆𝑤𝑀𝑆𝑏组间方差=组间平方和S𝑆𝑏除以组间自由度𝑑𝑓𝑏(组数−1)𝑀𝑆𝑤组内方差=组内平方和S𝑆𝑤除以组间自由度𝑑𝑓𝑤(各组容量之和−组数)S𝑆𝑡总平方和=S𝑆𝑏组间平方和+S𝑆𝑤组内平方和SSb=n∑(𝑋𝑗−𝑋𝑡)2=4[(3−7)2+(8−7)2]SSw=∑∑(𝑋−𝑋𝑗)2SSt=∑∑(𝑋−𝑋𝑡)2★第十章χ2检验(类别变量,不能有具体数值)考察比例,检验两个因素是否相关,根据样本的频数分布来推断总体的分布。自由分布的非参数检验。一、χ2𝛘𝟐=∑(𝒇𝒐(实际频数)−𝒇𝒕(理论))𝟐𝒇𝒕二、χ2的抽样分布呈正偏态,右侧无限延伸,但永远不与基线相交。自由度越小,χ2分布偏斜度越大,自由度越大,分布形态趋于对称(一)单变量的χ2检验:单相表的自由度=组数-1大二上·教育统计学13①按一定比率决定理论频数的χ2检验(1)提出假设:H0:健康状况好中差的人数比率为1:2:1,H1:健康状况好中差的人数比率不为1:2:1(2)计算χ2值χ2=(15−13.5)213.5+(23−27)227+(16−13.5)213.5(3)统计决断:自由度为3-1②一个自由度的χ2检验各组𝑓𝑡≥5的情况(1)提出假设H0:喜欢与不喜欢体育的人数相等;H1:喜欢与不喜欢体育的人数不等(2)计算χ2值(3)统计决断③频数分布正态性检验:将各组面积与频数相乘,求各组的理论频数(二)双变量的χ2检验(横行为r,纵行为)(1)提出假设:H0:学生是否愿意报考师范大学的态度与家庭状况没有关系;H1:学生是否愿意报考师范大学的态度与家庭经济状况有关系(2)计算χ2值𝑓𝑡=𝑛𝑟(横实际频数总和)𝑛𝑐𝑁(样本容量总和)𝐝𝐟=(𝐫−𝟏)(𝐜−𝟏)在双向表χ2检验中,如果是判断几次重复实验的结果是否相同,这种χ2检验叫做同质性检验。如果
本文标题:北师大教育统计学期末复习
链接地址:https://www.777doc.com/doc-1547300 .html