您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 6sigma培训-基本统计概念(新)
基本统计概念基本统计概念16σ普及培训第二部分基本统计概念2012年9月1日(CK-V1.1)讲师:讲师:JakeChenJakeChen基本统计概念基本统计概念2统计概念解释以下基本统计概念。1.波动(偏差)2.连续数据和离散数据3.平均值、方差、标准差4.正态曲线5.用Z值将数据标准化6.中心极限定理7.过程能力-使用Z值作为衡量工序能力的指标-通过改进关键值Xs来改进Y8.稳定性因子基本统计概念基本统计概念3波动所有的人不会都是同样的高度;所有的葡萄不可能同一天采摘问题:什么类型的波动会影响品质?基本统计概念基本统计概念4观测值变化当重复进行测量的时候,通常会得到不同的答案,这就是波动!系统波动预期的和可预测的测量结果之间的差异。举例:夏季和冬季的空调的销售量不同。随机波动不可预测的测量结果之间的差异。举例:具有同一种设计的两台冰箱,由同一个技术人员、在同样的气温条件下、使用同样的测量仪器,在两个不同的日子对其能量消耗进行测试…...可能得到两个不同的结果。1.2.基本统计概念基本统计概念5观测值变化(续)我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。如果所有地区的手机销售量是一样的,那么我们就会怀疑是数据库出了问题。.如果我们测量10台电冰箱,得到同样的能耗测量结果,我们就会怀疑测量是否正确。这种变化使我们的工作更具挑战性!一般来说,我们不能相信来自一个数据点的结果。通常我们收集多个数据点,而且非常注意如何选取这些样本,以减少偏差。波动的产生是很自然的,意料之中的,是统计学的基础基本统计概念基本统计概念6数据数据数据的意义数据的分类(按特性分)–计数值数据﹕以个数计算的数据或数据是间断的﹑不连续的﹐如不良数。–计量值数据﹕可以连续量测的连续或连续呈连续性的﹐如强度﹑压力等等。数据的差异(就是波动)可靠度﹑精密度﹑准确度基本统计概念基本统计概念7何何谓谓精密度精密度??精密度:用同一测定方法,测同一样本,並反复作无限次的测定或用同一抽样方法,抽取同一群体,並反复作无限次的抽样,一定会有变异发生,变异的宽度亦即是数据分配的宽度,这种宽度的大小就是代表精密度,而此宽度愈窄,表示精密度越好.基本统计概念基本统计概念8何何谓准确谓准确度度??准确度:用同一测定方法,测同一样本,并反复作无限次的测定或用同一抽样方法,抽取同一群体,並反复作无限次的抽样,一定会有变异发生,变异的均值亦即是数据分配的平均值与真值之间的差值,这个差的大小就称为准确度,而此差值一般来说,差值越小,表示准确度越好.基本统计概念基本统计概念9数据的两种类型•连续(可变)数据使用一种度量单位,比如英寸或小时。•离散(属性)数据是类别信息,比如““通过”或““未通过”。连续数据离散数据问题解决办法举例:部件号离散连续1通过2.0312通过2.0343未通过2.0764通过2.0225未通过2.001基本统计概念基本统计概念10连续数据以参数的形式,比如尺寸、重量或时间,说明一个产品或过程的特性。测量标准可以有意义地不断分割,使精确度提高。你能举出我们用来获得连续数据的三个器具例子吗?相对于仅仅知道部件是否合格而言,连续数据可以提供更多的信息。相对于仅仅知道部件是否合格而言,连续数据可以提供更多的信息。连续数据(也称为可变数据)基本统计概念基本统计概念11离散数据不能更进一步精确地细分。离散数据不能更进一步精确地细分。离散数据可以是某件事发生或未发生的次数,以发生的频数来表示。离散数据也可以是分类数据。如:销售地区、生产线、班次和工厂。离散数据(也包括属性或类别数据)地区亮和不亮基本统计概念基本统计概念12离散数据•一般来说,连续数据比离散数据更可取,因为你可以利用更少的数据获得更多的信息。•如果不能得到连续数据,就可以对离散数据进行分析,发现结果,作出判断。连续数据与离散数据进行比较的解释:离散数据举例:有凹痕的部件数量通过/未通过申诉决议产出个数生产线不合格品数量及时交货数量离散数据需要更多的数据点才能进行有效的分析离散数据需要更多的数据点才能进行有效的分析基本统计概念基本统计概念13请在下面的例子旁,写出它是“连续”还是“离散”1销售订单准确度2数据输入准确度3孔径4销售地区5制冷氟利昂的重量(克)6使用“合格/不合格”测量仪器得到的孔径7应答中心对话时间8每百万部件中有缺陷部件的数量9装配线缺陷(ALD)应用你所学到的东西连续数据和离散数据并没有绝对的区分!基本统计概念基本统计概念14•收集数据的目标或期望结果是什么?•一般来讲,为了达到目的需要收集什么数据?•为收集数据,你将监测什么过程和产品?第1步起草项目数据收集计划建立数据收集目标决定测量对象决定如何测量数据收集基本统计概念基本统计概念15第2步决定测量对象时,思考下列问题:•我们需要什么数据?决定具体的测量数据(将被集中起来)以满足第1步所述的目标。确认所需的每一个Y或X.•对每一个测量,其操作定义是什么?写下每一个定义,以确保所有团队成员对于收集的数据有一个共同的理解.起草项目数据收集计划建立数据收集目标决定测量对象决定如何测量数据收集基本统计概念基本统计概念16数据收集第3步当决定使用测量工具时,首先检查该工具是否存在;如果不存在,你将需要重新选择一个工具。下列是一些工具的例子:秒表,量具,眼睛,直尺,千分尺,计算机,测量图,温度计,天平,调查表和X-射线仪器。例如,如果你决定测量一个拜访电话打了多长时间,合适的测量工具可能是一只秒表,或者储存在拜访系统里的计时软件。测量工具准备抽样方案抽样方案决定数据收集的频率和数量。起草项目数据收集计划建立数据收集目标决定测量对象决定如何测量基本统计概念基本统计概念17为什么要抽样SamplePopulationStatisticEstimate基本统计概念基本统计概念18抽样抽样观察少数...以估计总体起草项目数据收集计划建立数据收集目标决定测量对象决定如何测量基本统计概念基本统计概念19科学取样•运用选取的样本,你能获得关于一个总体或过程的结论;这就是所谓的“统计推论”。•如果样本是总体的代表,在实践就没有风险或不确定。•然而,当样本尺寸被缩小到只有总体的一小小部分时,出现样本不能表达总体或者得出错误的结论的风险随之增加。•对任何项目,必须平衡样本尺寸和风险等级以满足数据收集目标的要求。样本小样本高风险大样本低风险总体基本统计概念基本统计概念20科学取样好样本的特质:样本必须是无偏颇的。一个样本的偏颇是指任何这种因素的出现或影响,这种因素使得被取样的总体或过程显得与其实际不同。当收集的数据与影响总体或过程的关键因素无关时,就产生了偏颇。无偏颇•有代表性•随机的无代表性有代表性总体基本统计概念基本统计概念21科学取样样本必须具有代表性在一个有代表性的样本里,收集的数据应该精确地反应一个总体或过程。有代表性的抽样有助于避免偏颇于调查中的总体或过程的某一特定区域。样本必须是随机的在一个随机的样本里,数据的收集无序进行,每一个元素都有相等的机会被选来测量。随机抽样有助于避免偏颇于收集数据的特定时间和顺序,操作员,或数据收集员。基本统计概念基本统计概念22科学取样大多数的统计工具需要使用随机的和有代表性的数据。不论你是从一个过程还是从一个总体收集数据,你必须选定正确的抽样方法,以确保你的样本从统计角度看是有效的。应采取什么方法从总体或过程抽样?总体过程基本统计概念基本统计概念23科学取样过程抽样总体抽样过程在运动样本样本决定总体的特征有助于理解过程的特性和状况基本统计概念基本统计概念24科学取样总体当从总体抽样时,运用随机或分组随机抽样法有助于确保获得一个有效的数据系列或样本。在许多情况下,从一批中抽样可以被认为是从总体中抽样,并且适用于同样的规则。随机抽样最适用于只包含通常原因连续变量的总体。当一个总体具有明显的分类特征时,应用分组随机抽样法,或分区抽样,可清晰地了解每一个类别的表现。警告当决定抽样方案时,你应确保谨记数据收集目标。随机抽样可以提供一个总体的好样本,但是它可能不能让你发现罕见的或偶然的情况(特殊原因造成的数据点)。为了发现这样的缺陷,运用随机抽样法时你可能需要收集很大的样本。总体样本基本统计概念基本统计概念25科学取样从一个统一总体中抽样例子:如果从一箱材料中抽样,箱子的每个地方都有相等的机会被抽取为样品。例子:如果从一批单据中抽样以检查其正确度,被检查的单据应是可从这批单据的任何地方获取的。从一个分类总体中抽样加工的轴2组的样本加工的直径总体样本基本统计概念基本统计概念26科学取样抽样的方法抽样的方法分组随机抽样随机抽样系统随机抽样子群抽样每第n个元素过程在运动在该点每小时3个样品每个元素被选中的可能性相等总体被分成若干组,在每组内随机选择基本统计概念基本统计概念27样本分配:图形样本平均的标准差σX:x样本平均一般常态X:母体标准差σσX:平均标准差因此,n愈大时,估计母数平均的误差会愈小.μμ基本统计概念基本统计概念28常常态态分配的性分配的性质质X=Me=Mo曲线下的面积等于1典线的两端无限接近于橫轴﹐但不与橫轴相交。基本统计概念基本统计概念29统计学术语和定义总体-全部对象.举例–2012年9月在西可生产的所有的触摸屏手机样本-代表总体的一个子集数据。举例-2012年9月在西可生产的一百二十台触摸屏手机举例:XXXXXXXXXXXXXXXXXXXXXXXXX这个矩阵代表25个X的总体。画上圆圈的那些是由总体中的六个X组成的样本。这个矩阵代表25个X的总体。画上圆圈的那些是由总体中的六个X组成的样本。基本统计概念基本统计概念30何何谓谓群群体体??何何谓样谓样本本??群体(以N表之):为统计调查对象的全部.群体有限群体无限群体样本(以n表之):为研究群体的情形或有某种目的而从群体或批中随机抽取,并以此为代表者,而用以测定或推定群体或批的状况者谓之.N≧30称大体本;n30为小样本.基本统计概念基本统计概念31参数与统计量参数与统计量总体(参数)样本(统计量)备注均值µx反映位置准确性中位数mx反映位置准确性四分位数(LQ/UQ)x0.25/x0.75反映位置准确性方差σ2s2反映离散程度标准差(SD)σs反映离散程度级差(R)Max-Min反映离散程度四分位数间距(IQR)UQ-LQ反映离散程度变异系数(CV)σ/µs/x反映离散程度~基本统计概念基本统计概念32均值、中位数、众数的几何表示均值、中位数、众数的几何表示众数众数中位数中位数均值均值此分布为一直方此分布为一直方图的近似曲线图的近似曲线基本统计概念基本统计概念33均值、中位数、众数的几何表示均值、中位数、众数的几何表示1、在平均数处图形将保持平衡(图形重心在均值正上方);2、中位数的左右两边,图形具有相等的面积;3、众数是密度最大的位置;4、分布具有长长左尾的时候,这3条线依均值/中位数/众数排列;当分布具有长长右尾的时候,这3条线依众数/中位数/均值排列;5、所以在处理长尾的分布时,常常使用中位数而不使用均值,因为在某情况下均值过多地注意了分布极端尾部的小概率事件。基本统计概念基本统计概念34中位数或中间值:将资料由大到小或从小到大(排序)排列,中间的那个值即是。--资料个数为奇数:最中间的数1715109743--资料个数为偶数:最中间两个数相加除以2171510974众数:资料中出现最多的值,若所有数值只出现一次,那就沒有众数。众数可能两个值以上,它和平均数、中位数不同,平均数、中位数只有一个值。注意:1.计算中位数必须先经排序由大到小2.众数可能不只一个中位中位数数(median)(median)、、众数众数(mode)(mode)基本统计概念基本统计概念35平均值-总体或样本的平均值。用x来表示样本,用μ来表示总体。举例:给定一个样本:{1,3,5,4,7},平均值就是:统计学术语和定义x=xn在这里X1是样本的第一个点,Xn是样本的最后一个点。.i1n∑,平均值的公式x=(1+3+5+4+7)=20=4.055样本的平均值等于4。样本的
本文标题:6sigma培训-基本统计概念(新)
链接地址:https://www.777doc.com/doc-1235363 .html