您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 质量专业理论与实务讲义(二)
(1)t分布:设x1,x2,…,xn是来自正态总体N(μ,σ2)的一个样本,则有:x~N(μ,n2),对样本均值x施行标准化变换,则有:xnnxu/~N(0,1),当用样本标准s代替上式中的总体标准差σ,则上式u变量改为t变量,标准正态分布N(0,1)也随之改为“自由度为n-1的t分布”,记为t(n-1),即:niixxnxnsxnt1211~t(n-1)。(2)χ2分布:自由度为n-1的χ2分布的概率密度函数在正半轴上呈偏态分布。(3)F分布:设有两个独立的正态总体N(μ1,σ2)和N(μ2,σ2),它们的方差相等。又设x1,x2,…,xn是来自N(μ1,σ2)的一个样本;y1,y2,…,ym是来自N(μ2,σ2)的一个样本,两个样本相互独立。它们的样本方差比的分布是自由度为n-1和m-1的F分布,其中n-1称为分子自由度或第1自由度;m-1称为分母自由度或第2自由度。F分布的概率密度函数在正半轴上呈偏态分布。考点17:参数估计重点等级:※参数主要是指:①分布中的未知参数,如二项分布b(1,p)中的p,正态分布N(μ,σ2)中的μ,σ2或σ;②分布的均值E(X)、方差Var(X)等未知特征数;③其他未知参数,如某事件的概率P(A)等。上述未知参数都需要根据样本和参数的统计含义选择适宜的统计量并作出估计。参数估计有两种基本形式:点估计与区间估计。考点18:点估计重点等级:※※※※1.点估计优良性标准无偏性是表示估计量优良性的一个重要标准,只要有可能,应该尽可能选用无偏估计量,或近似无偏估计量。有效性是判定估计量优良性的另一个标准。2.求点估计的方法--矩法估计由于均值与方差在统计学中统称为矩,总体均值与总体方差属于总体矩,样本均值与样本方差属于样本矩。获得未知参数的点估计的方法称为矩法估计。矩法估计简单而实用,所获得的估计量通常(尽管不总是如此)也有较好的性质。但是应该注意到矩法估计不一定总是最有效的,而且有时估计也不唯一。3.正态总体参数的估计①正态均值μ无偏估计有两个,一个是样本均值x,另一个是样本中位数x;②正态方差σ2的无偏估计常用的只有一个,就是样本方差S2,即niixxns122211ˆ;③正态标准差σ的无偏估计也有两个,一个是对样本极差R=x(n)-x(1)进行修偏而得,另一个是对样本标准差s进行修偏而得,具体是:212ˆdxxdRnR,421411ˆcxxncsniis。考点19:区间估计重点等级:※※※※1.1-α置信区间的含义。所构造的随机区间[θL,θU]覆盖(盖住)未知参数θ的概率为1-α。由于这个随机区间随样本观测值的不同而不同,它有时覆盖了参数θ,有时没有覆盖θ,但是用这种方法作区间估计时,100次中大约有100(1-α)个区间能覆盖未知参数θ。如果P(θ<θL)=P(θ>θU)=α/2,则称这种置信区间为等尾置信区间。2.正态总体参数的置信区间。①总体均值μ的置信区间的求法:μ的估计一般用样本均值x,从x的分布来构造置信区间。当总体标准差σ已知时,利用正态分布可得μ的1-α置信区间为:nuxnux//2121,今后也记为nux21,其中21u是标准正态分布的1-2分位数;②总体方差σ2与标准差σ的置信区间的求法:σ2的估计常用样本方差s2,因此从s2的分布来构造置信区间。利用χ2(n-1)分布可以得到σ2的1-α置信区间为:11,112222212nsnnsn,其中122n与1221n分别是χ2(n-1)分布的2分位数与1-2分位数。将上式两边开平方,可得σ的1-α置信区间为11,1122221nnsnns。考点20:假设检验的基本思想与基本步骤重点等级:※※※※1.假设检验问题①这不是一个参数估计问题;②这里要求对命题“μ=x”作出回答:是与否;③这一类问题称为假设检验问题;④这类问题在质量管理中普遍存在。2.基本步骤(1)建立假设;(2)选择检验统计量,给出拒绝域分形式;(3)给出显著性水平α:在作判断中会犯错误,要允许犯错误,我们的任务是控制犯错误的概率。在假设检验中,错误有两类。①拒真错误:原假设H0为真,但由于抽样的随机性,样本落在拒绝域W内,从而导致拒绝H0,其发生概率记为α,又称为显著性水平;②取伪错误:原假设H0不真,但由于抽样的随机性,样本落在W内,从而导致接受H0,其发生概率为β。理论研究表明:①在相同样本量下,要使α小,必导致β大;②在相同样本量下,要使β小,必导致α大;③要使α、β皆小,只有增大样本量n才可达到,这在实际中有时并不可行。折中方案是:控制α,但不使α过小,在适当控制α中制约β。(4)确定临界值c,给出拒绝域W:由标准正态分布N(0,1)的分位数性质知2u与21u互为相反数,即2u=-21u,从而可得拒绝域W=21212uuuuuu或。(5)判断。考点21:正态均值µ的假设检验(σ已知情形)重点等级:※1.关于正态均值μ常用的三对假设。①H0:μ≤μ0,H1:μ>μ0单侧假设检验问题;②H0:μ≥μ0,H1:μ<μ0单侧假设检验问题;③H0:μ=μ0,H1:μ≠μ0双侧假设检验问题。2.检验统计量都用u统计量,在μ=μ0,nxu/00~N(0,1)。3~4.给出显著水平性α,确定拒绝域W5.判断考点22:正态均值µ的假设检验(σ未知情形)重点等级:※1.关于正态均值μ常用的三对假设。①H0:μ≤μ0,H1:μ>μ0;②H0:μ≥μ0,H1:μ<μ0;③H0:μ=μ0,H1:μ≠μ0。2.检验统计量都用t统计量,在μ=μ0,nsxt/0~t(n-1)。3~4.给出显著水平性α,确定拒绝域W①H1:μ>μ0W={t>t1-α(n-1)}②H1:μ<μ0W={t>tα(n-1)}③H1:μ≠μ0W={|t|>t1-α/2(n-1)}5.判断考点23:正态方差σ的假设检验重点等级:※1.关于正态方差σ2常用的三对假设。①H0:σ2≤20,H1:σ2>20;②H0:σ2≥20,H1:σ2<20;③H0:σ2=20,H1:σ2≠20。2.检验统计量为χ2统计量,当σ2=20时,20221sn~2(n-1)。3~4.给出显著水平性α,确定拒绝域W①H1:σ2>20W={χ2>21(n-1)}②H1:σ2<20W={χ2<2(n-1)}③H1:σ2≠20W=112212222nn或5.判断第二章常用统计技术考点1:方差分析的几个概念重点等级:※※1.因子将在试验中会改变状态的因素称为因子,常用大写字母A、B、C等表示。因子常被分为两类:定性因子(如工厂,原料产地等)与定量因子(如温度、压力等)。回归分析主要研究定量因子,定量因子又称为变量。2.因子的水平因子所处的状态称为因子的水平,用因子的字母加下标来表示,譬如因子A的水平用A1、A2、…等表示。3.方差分析数据分析主要是要检验:H0:μ1=μ2=…=μrH1:μ1,μ2,…,μr不全相等,检验这一对假设的统计技术便是方差分析。方差分析是在相同方差假定下检验多个正态均值是否相等的一种统计分析方法。具体地说,该问题的基本假定是:①在水平Ai下,指标服从正态分布;②在不同水平下,方差σ2相等;③数据yij相互独立。考点2:单因子方差分析重点等级:※※※※※引起数据差异的原因有两个:①由于因子A的水平不同,当假设H0不真时,各个水平下指标的均值不同,这必然会使试验结果不同,我们可以用组间平方和来表示,也称因子A的平方和;riiAyymS12这里乘以m是因为在每一水平下进行了m次试验;②由于存在随机误差,即使在同一水平下获得的数据间也有差异,这是除了因子A的水平外的其他所有原因引起的,我们将它们归结为随机误差,可以用组内平方和表示:rimjiijeyyS112,eS也称为误差平方和。可以证明有如下平方和分解式:ST=SA+Se。可以设想:当H0不真时,因子A水平不同引起的波动相对于误差来讲是比较大的,而当假设H0为真时,两者都可以看成都是由随机波动引起的,它们都可以作为误差方差的某种估计。由于两者所包含的误差的量有差别,所以为了进行比较,还需要将每个平方和除以各自的自由度。ST、SA、Se的自由度分别用fT、fA、fe表示,分解式为:fT=fA+fe,其中,fT=n-1=rm-1,fA=r-1,fe=fT-fA=r(m-1)。因子或误差平方和与相应的自由度之比,也即按自由度平均的平方和称为均方,并分别记为:MSA=SA/fA,MSe=Se/fe,当MSA与MSe相差不大时,认为因子A不显著;而当MSA相对于MSe大得多时,认为A是显著的。这一比较可以用两者的比表示,称为F比,记为:F=MSA/MSe,当F>F1-α(fA,fe)时认为因子A在显著性水平α上是显著的,其中F1-α(fA,fe)是自由度为fA,fe的F分布的1-α分位数。在以上计算中,关键是计算各个(离差)平方和,在计算时运用以下的等式是很有帮助的:rimjijrimjijTnTyyyS1122112,ririiiAnTmTyymS11222,ATeSSS,其中mjijiyT1是第i个水平数据的和,rimjijyT11表示所有n=rm个数据的总和。方差分析的一般步骤为:①计算因子A的每一水平下数据的和T1,T2,…,Tr及总和T;②计算各类数据的平方和2ijy,2iT,T2;③依次计算ST,SA,Se;④计算各均方及F比值并列出方差分析表;⑤对于给定的显著性水平α,将求得的F比与F分布表中F1-α(fA,fe)比较,当F>F1-α(fA,fe)时认为因子A是显著的,否则认为因子A是不显著的。考点3:散布图与相关系数重点等级:※※※※※1.散布图为了研究两个变量之间存在什么关系,可以画一张图,把每一对(xi,yi)看成直角坐标系中的一个点,在图中标出n个点,称这样的图为散布图。2.相关系数n个点基本在一条直线附近,但又不完全在一条直线上,则可用一个统计量来表示它们的线性关系的密切程度,这个量称为相关系数,记为r,它定义为:yyxxxyiiiiLLLyyxxyyxxr22其中:niiixyyyxxL1niixxxxL12niiyyyyL12当r=±1时,n个点完全在一条直线上,这时称两个变量完全线性相关。当r=O时,称两个变量线性不相关,这时散布图上n个点可能毫无规律,不过也可能两个变量间存在某种曲线的趋势。当r>0时,称两个变量正相关,这时当x值增加时,y值也有增大的趋势。当r<0时,称两个变量负相关,这时当x值增加时,y值有减少的趋势。可以根据r的绝对值的大小去判断两个变量间线性相关的程度,|r|愈大,线性相关就愈强。由于上述的相关系数是根据样本求出的,即使实际上两个变量不相关,但是求出的相关系数r不见得恰好等于0。考点4:一元线性回归方程重点等级:※※※※1.一元线性回归方程的求法求一元线性回归方程的步骤为:①计算变量x与y的数据和Tx,Ty;②计算各个变量数据的平方和及其乘积和;③按nTxyxyyxxLyiiiiixy/,nxxxxLiiixx/222,nyyyyLiiiyy/222;④按b=Lxy/Lxx,xbya,求出b与a;⑤写出回归方程bxayˆ,也可以表示为xxbyyˆ。注意由回归方程bxayˆ画出的回归直线一定通过(0,a)与(x,y)两点。2.回归方程的显
本文标题:质量专业理论与实务讲义(二)
链接地址:https://www.777doc.com/doc-443263 .html