您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第七章基础统计学六西格玛
基础统计学基础统计学第四事业部冯春园编写基本统计基本统计1.数据的类型2.数据概要用数值描述集中趋势离散趋势形状图形描述点图盒子图直方图3.正态分布4.介绍一些其他分布5.一些其他的图形时间序列图散点图柏拉图本章的主要内容什么是数据什么是数据数据是来自观察的由一个流程所收集的数据可以让我们描绘流程、了解流程、改善流程、甚至是控制流程六西格玛的基础六西格玛的基础数据驱动决策和行动Data已数据为依据,谈论事情前先拿出数据。StatisticsStatistics——AnOverviewAnOverview统计纵览统计纵览Statistics统计DescriptiveStatistics描述性统计InferentialStatistics推断性统计GraphicalPresentations图表法NumericalMeasures数量表示法ParameterEstimation参数估计HypothesisTesting假设检验Charts图Tables表Location位置Dispersion离差Shape形状PointEstimate点估计IntervalEstimate区间估计ParametricMethods变量方法NonparametricMethods非变量方法TypesofOutputs(Data)TypesofOutputs(Data)输出输出((数据数据))的类型的类型Attribute/DiscreteData(QualitativeorCategorical)属性/离散数据(定性或类别数据)Categories类别Yes,No是,否Go,Nogo去,不去Machine1,Machine2,Machine3机器1,机器2,机器3Pass/Fail通过/失败DiscreteData离散数据,不能在有限的范围内连续变化的数据例如设备故障维修次数,光纤断裂数,障碍的数量ContinuesData连续性数据Decimalsubdivisionsaremeaningful在一定尺度范围内可以无限细分。Dimension,chemicalyield,cycletime尺寸,化学反应率,循环时间Caliper卡尺Time时间Thermometer温度计NO-GOGOFAIL失败PASS通过ElectricalCircuit电流TypesofOutputs(Data)TypesofOutputs(Data)输出输出((数据数据))的类型的类型请标示出下列数据的类型,A代表计数型数据,V代表变量型数据1.顾客平均消费,电话待机时间2.产品缺陷率.3.职员名字-Tom,Nancy,Howard4.合格率5.输入支出费用的时间Continuous连续数据TheAdvantageofContinuousDataTheAdvantageofContinuousData连续数据的优点连续数据的优点Discrete离散数据SparseInformation信息量少RichWithInformation信息丰富计量型数据计量型数据益处能够为小范围抽样流程提供详细的信息适用于低缺陷率能够预估发展趋势和情况缺点通常较难得到数据分析更为复杂计数型数据计数型数据益处容易得到数据,并且计算方法简单数据容易理解数据随时可得缺点无法显示缺陷怎么发生及流程如何变化不适合低缺陷率(需要大量的抽样)不能预测发现趋势和情况如可以,尽量将计数数据转换为计量数据能增加它的功能。WarmWarm--upExerciseupExercise热身练习热身练习Describethedata..描述下列数据Whatarethenumbersthatcanadequatelyrepresentthedata?什么统计量可以充分的描绘下列数据?8059837275578280737262707167677885649368756077708070一分钟脉搏跳动次数请各位同学测量一下一分钟的脉搏跳动次数,我们来看一下班级同学的大致身体状况WarmWarm--upExerciseupExercise热身练习热身练习90807060中位数平均值7876747270第一四分位数67.000中位数72.000第三四分位数80.000最大值93.00069.19876.18769.30077.3506.78611.944A平方0.15P值0.952平均值72.692标准差8.652方差74.862偏度0.178916峰度-0.085154N26最小值57.000Anderson-Darling正态性检验95%平均值置信区间95%中位数置信区间95%标准差置信区间95%置信区间脉搏跳动次数摘要DataDescriptionDataDescription数据描述数据描述CentralTendency(Location)集中趋势(位置)¾Mean均值¾Median中位数¾Mode众数Variation(Dispersion)数据的分布趋势¾Range极差¾Inter-QuartileRange四分位数¾Variance方差¾StandardDeviation标准差Shape形状¾Skewness偏斜¾Kurtosis峰度Mean:均值:算术平均值¾反映了所有数据的影响¾特别受极端值的影响Median:中位数:数据按顺序重新排列,中间位置所对应的值。¾不必考虑所有的数值影响¾极值对其影响不显著Mode:众数:出现频率最多的那个数在改进项目的衡量指标中,为何用均值而不用中位数呢?nnnnxx∑==1MeasuresofCentralTendencyMeasuresofCentralTendency集中趋势的测量集中趋势的测量⎪⎩⎪⎨⎧+=++evenisnif2xxoddisnifxx~)1]2/n([)2/n()2/]1n([CentralTendencyCentralTendency––ExerciseExercise集中趋势集中趋势------练习练习计算以下数据的均值,中位数和众数。1,3,3,5,9Mean均值=Median中位数=Mode众数=Minitab:StatÆBasicStatisticsÆDescriptiveStatistics统计Æ基本统计Æ描述性统计CentralTendencyCentralTendency––ExerciseExercise集中趋势集中趋势------练习练习Minitab:统计Æ基本统计量Æ显示描述性统计在变量输入DataCentralTendencyCentralTendency--ExerciseExercise集中趋势集中趋势------练习练习Minitab:统计Æ基本统计Æ显示描述性统计Range:极差最大值与最小值之间的数字距离Inter-QuartileRange四分位数四分之一位数:把数据从小到大排列后,25%位置的那个数四分之三位数:把数据从小到大排列后,75%位置的那个数Variance(s2):方差每个独立数据点偏离均值的平方数学期望(平方的平均值)StandardDeviation(s):标准差方差的算术平方根最常用来描述数据变异1n)X(Xn1i2i−−=∑=sminmax−=Range1n)X(Xn1i2i2−−=∑=sMeasuresofVariationMeasuresofVariation变异的测量变异的测量13qqIQR−=4-115005003-248395002-3994166113-245444.892.21CalculatingStandardDeviation计算标准差iXXXi−2)(XXi−X∑−2)(XXi∑−−)1/()(2nXXiSumofsquares偏差的平方和VariationVariation––ExerciseExercise变异变异------练习练习计算下面数据的极差,四分位数,方差,标准差4553852963Range极差=Inter-QuartileRange四分位数=Variance方差=StandardDeviation标准差=VariationVariation––ExerciseExercise变异变异------练习练习Minitab:统计Æ基本统计Æ描述性统计8059837275578280737262707167677885649368756077708070一分钟脉搏跳动次数22Total22222X12X2total212121So,,then2;XVariableInputtoduevariance1;XVariableInputtoduevarianceoutput;processtheofvarianceIfXXXXTotalXXσσσσσσσσσ+=+====于是的方差输入变量的方差输入变量过程中总的方差一条重要的统计规则一条重要的统计规则一条重要的统计规则一条重要的统计规则2322221XXXTotalσσσσ++=σ1σ2σ325223222421XXXXXTotalσσσσσσ++++=σ1σ2σ3σ4σ5如果已知贴合两片的偏移量为σ,是否能预估此两种产品的不良率?两种TP产品,已知其加工过程如下图,多片组合,根据以往经验知道两片贴合的偏移的标准偏差。形状的测量形状的测量------偏斜偏斜()()()31321sxxnnnSkewnessnii∑=−−−=偏度平均线在左侧平均线在右侧MeasuresofShapeMeasuresofShape形状的测量形状的测量------峰度峰度()()()()()()()()321332112414−−−−⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧−−−−+=∑=nnnsxxnnnnnKurtosisnii峰度Kurtosis=-veKurtosis=0Kurtosis=+veMeasuresofShapeMeasuresofShape形状的测量形状的测量Minitab:统计Æ基本统计Æ图形化汇总8059837275578280737262707167677885649368756077708070一分钟脉搏跳动次数90807060中位数平均值7876747270第一四分位数67.000中位数72.000第三四分位数80.000最大值93.00069.19876.18769.30077.3506.78611.944A平方0.15P值0.952平均值72.692标准差8.652方差74.862偏度0.178916峰度-0.085154N26最小值57.000Anderson-Darling正态性检验95%平均值置信区间95%中位数置信区间95%标准差置信区间95%置信区间一分钟脉搏跳动次数摘要MeasuresofShapeMeasuresofShape形状的测量形状的测量Minitab:StatÆBasicStatisticsÆGraphicalSummaryMinitab:统计Æ基本统计Æ图形化汇总性质一:正态分布可以仅用均值和标准差来描绘.TheNormalDistributionTheNormalDistribution正态分布正态分布DistributionOne分布一DistributionOne分布一DistributionTwo分布二DistributionTwo分布二DistributionThree分布三DistributionThree分布三Whatisthedifferenceamongthesethreenormaldistributions?三个正态分布有什么不同?TheNormalDistributionTheNormalDistribution正态分布正态分布质量管理中,最常遇到的连续分布是正态分布,很多质量特性X都可以用正态分布来描述其取值的规律性。如果某项指标受到很多项随机因素的干扰,而每项干扰都很小的话,则所有干扰影响的综合结果将导致此项指标的分布为正态分布。其概率密度函数为:ex222)(221),|x(fσμπσσμ−−=μ1σ2σ3σ4σ5σ6
本文标题:第七章基础统计学六西格玛
链接地址:https://www.777doc.com/doc-421574 .html