您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 6sigma第二章基础统计1
作者:项目支持部日期:2012/02/20第二章基础统计2第一节统计的基本概念3统计学的概念在日常生活中经常接触,且每天都在使用-为预测棒球比赛的胜负,调查各个Team的过去胜率-用收集的气象资料预测天气统计学为了对不确实的未来的预测提供必要的情报收集,分类,分析资料及以此为基础提示结论的学问统计学4观察的偏差当重复测量时,经常产生不同的结果,这就是偏差通常原因的偏差测量中的差异是被期望的并可以预测的特殊原因的偏差(随机)测量中的差异是不可预测的偏差:观察值与实际值之间的差异5偏差所有的茄子产于一块地并同一天采摘问题:你期望存在偏差吗?什么类型的偏差?6观察的偏差(续)我们期望观察出偏差,当没有时将引起注意如果所有的区域的产品的销售量完全相同,我们将怀疑数据的真实性.偏差使我们的工作更有挑战性,我们通常不相信来源于单个数据的结果,通常收集多个数据并注意收集的方法以减少偏差,偏差是自然存在的,被期望的并是统计的基础7数据类型•连续变量用长度或时间等作为测量尺度。•离散变量是分类的信息如“合格”或“不合格”。例如:零件编号.逻辑连续1合格2.0312合格2.0343不合格2.0764合格2.0225不合格2.001连续变量离散变量问题解决方案8连续变量参数如:尺寸,重量或时间来描述产品或过程特性,这个测量尺度可以被细细分成有意义的小数你能举出三个设备吗?可用来收集连续变量的.相比仅仅知道零件的好或坏连续变量能告诉更多的信息连续变量9离散变量不可能再细分成有意义的小数离散变量是事情发生或不发生的次数或测量发生的频率.离散变量也是可分类的数据,如;销售区域,生产线,操作班组和工厂,单板有缺陷的焊点离散变量10离散变量•通常如果能获得更多的信息优先考虑连续变量.•如果不能获得连续变量可以分析逻辑变量,找出结果并做结论.连续和离散变量的注释:离散变量的例子:单板的合格合格/不合格发票的正确性正确/不正确按时付款按时/迟交为了有效的分析,离散变量要求更多的数据点11在下列的例子边,画圈选择A=“离散”或V=“连续变量”1.销售的准确性2.数据输入的准确性3.销售区域4.用“通过”/“不通过”量具测直径5.焊膏厚度6.直供协议7.网板厚度8.供应商产品的缺陷数9.计划部下达合同的变更次数AVAVAVAVAVAVAVAVAV练习12总体(母集团)和样本成为关心对象的所有个体的集合称为总体,在总体中作为调查对象采纳的一部分称为样本。总体样本总体的特性:个数(N)平均µ分散2标准偏差样本的特性:统计量(n)平均x分散S2标准偏差S如果能够准确计算总体的个数时没有问题,但如果难以计算时以样本计算的统计量为基础进行推定.13平均值-总体或样本的平均值。-总体的平均值用表示-样本的平均值用X均方差-与平均值间距的平方的平均值.(表示数据的离散程度.)-总体的方差用表示-样本的方差用s2表示标准的方差是方差的平方根。(表示数据的离散程度.)-总体标准偏差由表示-样本标准偏差由s表示14极差--在一个子组中最高值与最低值的差值极差=X高-X低.极差用R表示中位数--反应中间50%的数值,一系列数据由低到高排列后所得到的中间数。众数--在一个数据集中最频繁出现的值。15平均值下列是茄子的重量1.01.21.52.53.04.26.11.11.52.03.04.04.26.20.91.42.13.14.54.46.01.21.62.53.24.44.51.01.52.43.34.56.0茄子的平均重量是多少?16平均值••=平均值茄子个数=平均值-总体或样本的平均值。样本用x,总体用表示。x=xnwherexfirstpointandxisthelastpointofasample.i1n1n,平均值公式^175721255510531052105810除了平均值,我们还要知道其它信息吗?•数据的离散程度怎样?例如:五位数的中心值是5X5555R062025R=极差=X高-X低平均值相同!这是子组极差18除了中心值和极差,我们还要知道其它更多信息吗?•极差是足够具体吗?59616363645962666565646065626468706563646866656667646658656571636963667064676466626464646164636564686667697168666563646468676564656470656865666966666563686662676566676660676360647390个女工的平均身高把数据标在下面5760657075xx直方图1975706560151050heightFrequency直方图20离散程度的测量用来判定一个数据集合离散程度或宽度的恒量尺度极差=最大值-最小值均方差=与平均值差的平方的平均值标准偏差=方差的平方根,提供与平均值的标准的距离的测量。均方差为什么有用?21标准偏差--恒量数据的离散程度总体的标准偏差用“”表示,样本的标准偏差用S表示=(Xi-)2i=1NN总体的标准偏差方差--与中心值间距的平均值S=(Xi-X)2i=1nn-1样本的标准偏差统计术语和定义^让我们练习...22例子课堂例子:计算均方差和标准偏差(2,6,4)计算平均值,均方差和标准偏差x=xnii=1ns2=n(Xi-X)2i=1n-1s=(Xi-X)2i=1nn-1平均值均方差标准偏差均方差(s2)=8/(3-1)=4标准偏差(s)=平方根(4)=2ixi(xi-4)(xi-4)212-2426243400总和120823课堂练习:计算均方差标准偏差(1,3,5,4,7)用下列表格做指导首先计算平均值计算中心值均方差标准偏差x=xni1ns2=n(Xi-X)2i=1n-1s=(Xi-X)2i=1nn-1平均值均方差标准偏差均方差(s2)=标准偏差(s)=ixixi-x(xi-x)212345Totals练习24还有其它的统计概念吗?中位数&众数:59616363645962666565646065626468706563646866656667646658656571636963667064676466626464646164636564686667697168666563646468676564656470656865666966666563686662676566676660676360647390位女士的身高:中位数-反应中间(50%)处的数值,一系列数据由低到高排列所得的中间数。什么是中位数?众数-在一个数集中最频繁出现的数。什么是众数?25平均值,中位数和众数是所有居中趋势的测量值聚集在某个中心值附近26何时应用807060504030201003002001000NegSkew中位数平均值130120110100908070603002001000PosSkew中位数平均值1101009080706050403020100500Normal平均值=中位数27到目前为止我们知道:•偏差.•数据的类型•中心值•中位数•众数•极差•标准偏差•均方差28第二节概率分布概率分布是将分布的形状演变成数据模型成为品质管理及6Sigma开展的基本。291)正态分布UnitsofMeasure直方块的中点中心光滑连接形成曲线大多数(但不是所有)数据是正态分布或钟形曲线正态分布告诉我们数据的离散情况30正态分布(Normaldistribution)正态分布在统计应用领域最重要的分布并成为6Sigma开展的基本.正态分布也可如下表示X~N()2,变量正态分布平均标准偏差即正态分布由平均和标准偏差来定义31正态分布的形态是?95.5%43210-1-2-3-468.3%99.73%以平均为轴对称(Symmetric)原点在一个位置(Unimodal)钟形(Bell-shaped)32正态分布的标准偏差()规范上限(USL)规范下限(LSL)分布的中心值(U)分布的标准偏差()1XorUCLp(d)3中心值LCL33Sigma是?95.5%43210-1-2-3-468.3%99.73%第一个弯曲点(倾斜从减少到增加的位置,DeflectionPoint)与平均间的距离以平均为中心占据68%的面积34正态分布的函数式正态分布的密度函数-X+:3.142e:2.7183:分布的平均:分布的标准偏差1√22e-(x-)2/22f(X)=X~N()2,35正态曲线(Normalcurve)形态95.5%43210-1-2-3-468.3%99.73%121=112121221[因和而异的正态分布形状]12,1=21=2,1212,12应熟悉教材后部分的正态分布表的读法36标准正态分布平均(中心)为0,标准偏差为1的正态分布X-利用Z=————将正态分布式进行座标转换95.5%43210-1-2-3-468.3%99.73%N(0,12)37回到先前的例子:身高直方图和和正态曲线65.162.359.556.760657075051015HeightFrequencyHistogramofHeight,withNormalCurveX=65.1s2.8R=1538正态分布例1问题对某一制品的拉长长度进行品质管理,平均为40,标准偏差为2.即N(40,22).购买此制品时顾客要求拉长长度在35以上.此工程生产的制品满足顾客要求的概率为多少?39解40235已知这个时面积是多少?N(40,22).Minitab中求面积的部分40正态分布例2例2假设某一工艺的品质特性遵守标准正态分布(平均=0,标准偏差=1)不良率为1%时,z值(Sigmalevel)是多少?解已知累计概率时求Z值,在minitab的normal分布中使用inversecumulativeprobability.41关于正态分布的附加说明影响制造工程的平均值或分散的要因区分为1)偶然要因和2)异常要因.偶然要因指的是如现场的温度变化等不可管理的要因,异常要因指设备的异常,作业者的失误等要因.没有异常要因介入,只有偶然要因作用时取出的数据必然遵守正态分布.在教育中大家也能感觉到利用连续概率分布函数的统计分析中最先观察的是是否正态.就是说正态分布是非常重要的.今后要学习的t-分布,F-分丰,2-分布等是人为制造的概率密度函数.但正态分布是说明自然现象的自然的分布.42(2)二项分布(Binomialdistribution)Data形态为不良品(Defective)Data时使用掷硬币时出现正面与反面的概率是相互独立的概率分布二项分布需要满足下列条件1)贝鲁诺实验:实验的结果只存在两种可能性例)良品,不良品.2)在同一条件下进行实验3)各个实验是相互独立的,即,前结果不影响后结果4)对每个实验结果的概率是相同的.43二项分布的例问题某一制造工程一天生产1000个Diode平均不良率为1%。检查者在每个小时随机地抽取50个样品选出不良品。此时发现一个以下不良品的概率是多少?解发现一个以下不良品的概率是发现一个不良品的概率加上一个也发现不了的概率首先求一个不良也发现不了的概率44对二项分布的理解二项分布的概率密度函数P(X=x)=nCxpx(1-p)n-xnCx=()=n!x!(n-x)!nx二项分布在品质管理经常使用,适用于在相当大的母集团中抽取标本,在这里p意味着母集团的不良率(Defectiverate)这里x是抽取任意n个标本时不良个数.下一页说明的二项分布的平均,分散,标准偏差是C阶段管理图的基础。45二项分布的形态01234P(X)x1/162/163/164/165/166/1601234P(X)x0.10.20.3n=4,p=1/2时二项分布n=9,p=1/3时二项分布56789二项分布的形状1)n即使少p=0.5时概率分布总是对称的2)p
本文标题:6sigma第二章基础统计1
链接地址:https://www.777doc.com/doc-1235858 .html