您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 6sigma统计知识--baidu-taobao-网赚1
六西格玛(6sigma)管理法培训xx企业管理顾问有限公司xx第六次课程内容提要统计知识一、抽样和统计量二、正态分布三、直方图四、假设检验五、回归分析一、抽样和统计量总体:1000个或未知个数样本:50个随机抽样时:形状不变;百分比不会变。即:数据中心和数据集中程度不变。所以我们可以使用样本来预测总体的情况。总体:研究的对象全体个体:构成总体的每个成员。样本:从总体中抽取部分样品:构成样本中的个体样本量:构成样本中样品的个数1、抽样一、抽样和统计量2、统计量总体:1000个或未知个数样本:50个准确度:数据中心x=(x1+x2+…+xn)/n精确度:数据集中程度Sigma标准偏差S=标准方差S=2ABCD准确度:数据中心μ:未知量精确度:数据集中程度σ:未知量估计二、正态分布X轴:身高值Y轴某身高的学生数量1.50m1.90m1.70m1.60m1.80m13个1、出现对称的图形,中间高,两边低。2、太高的很少、太矮的也很少。越高比率越少、越矮的比率越少。3、大多数的集中在中间区域:1.60~1.80占90%X轴:功率因素电压波动、产品使用30分钟过程中最高温度、风扇转速、噪音、电容来料的电容量、电感来料的电感量等Y轴某值的产品数二、正态分布X轴:数据值Y轴频率uσ2σ3σ2、标准正态分布:用N(u,σ2)表示二、正态分布-4-3-2-1012340.40.30.20.10.02、标准正态分布:u=0,σ=1时的正态分布曲线面积为1面积为0.5用N(0,12)表示二、正态分布01.52-0.7501.52-0.750-1.520P(≤1.52)=Φ(1.52)=0.9357P(≤-1.52)=Φ(-1.52)=?P(≤-0.75)=Φ(-0.75)=0.7734P(≥-0.75)=?P(-0.75≤μ≤1.52)=?有一种表,包含了Φ(0)~Φ(6)的面积,这个表叫《标准正态分布函数表》Φ(6)=0.9999999990136(9个9)大于6的可以默认为1。Φ(3)=0.9986Φ(4.5)=0.999996602,P(≥4.5)=3.4ppm。二、正态分布-11P(≤1)=Φ(1)=0.8413P(-1≤μ≤1)=?-22P(≤2)=Φ(2)=0.9773P(-2≤μ≤2)=?-33P(≤3)=Φ(3)=0.9986P(-3≤μ≤3)=?P(≤6)=Φ(6)=0.99999999901P(-6≤μ≤6)=?其余面积为多少?P(≤4.5)=Φ(4.5)=0.9999966其余面积为多少?P(-4.5≤μ≤4.5)=?其余面积为多少?二、正态分布-11P(≤1)=Φ(1)=0.8413P(-1≤μ≤1)=?68.26-22P(≤2)=Φ(2)=0.9773P(-2≤μ≤2)=?95.46-33P(≤3)=Φ(3)=0.9986P(-3≤μ≤3)=?99.72P(≤4.5)=Φ(4.5)=0.9999966其余面积为多少?3.4ppmP(-4.5≤μ≤4.5)=?其余面积为多少?P(≤6)=Φ(6)=0.99999999901P(-6≤μ≤6)=?其余面积为多少?如果没有四舍五入的情况,1为68.27%,2为95.45%,3为99.73%。4.5为99.999932%即不良率为6.8ppm二、正态分布正态分布的概率计算:三、直方图X轴:身高值Y轴某身高的学生数量1.50m1.90m1.70m1.60m1.80m13个我要知道学校学生身高分布状况,怎样才能得到上述的图形,我要分析功率因素、电压波动、产品使用30分钟过程中最高温度、风扇转速、噪音、电容来料的电容量、电感来料的电感量等分布状况,怎样得到这种图形?三、直方图X轴:身高值Y轴某身高的学生数量1.50m1.90m1.70m1.60m1.80m13个1、收集数据2、分级(确定适当的极距和最初值)3、统计每级中的个数4、绘制图形最大值:1.92最小值:1.5490个数据Data样本数(n)级数(k)50未满5~750~1006~10100~2507~12250以上10~20极距:(1.92-1.54)/9=0.042≈0.04最初值:最小值-测定最小位/2=1.535第二值:最初值+极距=1.575,同样推至其它值。1.5351.5751.6151.6551.6951.7351.7751.8151.8551.8951.935三、直方图1)正常型2)缺齿型3)下摆牵引型4)峭壁型5)高原型6)双峰型7)离岛型三、直方图规格1)正常的状况2)平均偏移规格规格3)变异过大4)平均值偏移且变异过大规格四、假设检验四、假设检验ab面积为0.95T分布曲线表示我们通过抽样来计算x的平均值有95%的可能是在a到b的范围,只有5%的情况是不属于a到b的范围。如果我们得到的x属于这个范围,则可以表示是一个较正常的抽样,如果我们得到的x不属于这个范围我们可以说95%情况下是不正常的抽样,或者这些数据所表示的过程同总体所表示的过程不同,即可以用来判断被抽取数据的过程是否同我们心目中的过程相同;或者两个数据代表的过程是否有差别。四、假设检验n/00σμxn/0Sxμμ=t=一个正态分布的总体均值、方差的显著性水平为α的检验检验法条件H0H1检验统计量拒绝域μ检验σ已知μ=μ0μ≠μ0|μ|≥μ1-α/2(n-1)查u表t检验σ未知μ=μ0μ≠μ0|μ|≥|μ|≥t1-α/2(n-1)查t表χ2检验μ未知σ2=σ02σ2≠σ02χ2=(n-1)S2/σ02χ2≤χ2α/2(n-1)或χ2≥χ21-α/2(n-1)查χ2表四、假设检验两个总体均值、方差的显著性水平检验α检验法条件H0H1检验统计量拒绝域F检验μ1、μ2未知σ12=σ22σ12≠σ22F=Sx2/Sy2F≤Fa/2(n-1,m-1)或F≥F1-α/2(n-1,m-1)查F表四、假设检验例1、某厂生产的化纤纤度x服从正态分布N(μ,0.0422),其中μ的设计值为1.40,每天都要对“μ=1.04”作例行检验,以观察生产是否正常运行。每天从生产中随机抽取25根化纤,测得纤度值为:x1、x2、x3……、x25,平均值为1.38问当日生产是否正常?(1、判断该使用何种检验:已知σ、μ0,求μ值,应使用u检验。2、计算出u值。3、挑选1个显著性水平α,查相应表可以得出拒绝域。4、用u同拒绝域相比较,如果属于拒绝域,则当日生产不正常。)四、假设检验2、工业用的塑料要求有较高折断强度,有两种型号的塑料可供制造业使用,它们的折断强度的标准差基本相同。公司现有供应商A与公司有很好的正常供货关系。但供应商B生产的塑料有较强的折断强度。公司的态度是:只有两种塑料强度间有实际的差别时才会改变供应商。现从供应商A获得12个样品,测得强度为x1、x2…x12,其分布为N(μA,σ2)。从供应商B获得10个样品,测得强度为y1,y2…,y10,其分布服从N(μB,σ2)并由样本观察值算得:样本量样本标准差供应商An=12Sx=0.60供应商Bm=10Sy=0.93四、假设检验五、回归分析17181920212223年龄身高1.81.71.61.51.4电感量功率因素因变量和自变量之间的关系怎样,以及关系的强弱的问题就是回归分析所要讨论的问题。五、回归分析XY由专业知识知道,合金的强度y与合金中碳的含量x%有关,为了生产强度满足用户需要的合金,在冶炼时如何控制碳的含量?在冶炼过程中通过化验和测试得到12组数据,列于下表中:上图出现强的正相关性,我们可以通过计算相关系数r来判断他们的线性相关强弱。r=nininiyyixxiyyixxi12121)(*)())(((r的范围为-1≤r≤1)序号iXiY序号iXiY10.104270.164920.114380.175330.124590.185040.1345100.205550.1445110.215560.1547.5120.2360r=0.9705Q&A
本文标题:6sigma统计知识--baidu-taobao-网赚1
链接地址:https://www.777doc.com/doc-1235968 .html