您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据结构与算法 > QC小组的数据统计基本知识(含新、老七工具)
1QC小组数理统计工具使用培训提纲2QC小组活动的基本特征(P36)质量改进和质量创新。QC小组活动解决问题涉及到两方面的技术:专业技术和管理技术专业技术:小组解决问题的专业技术范围管理技术:指程序、证据、方法、技巧等专业技术各有特性管理技术为共性3管理技术的三个主要方面1.遵循PDCA活动程序:四个阶段,十个步骤P(Plan)计划阶段(六步)D(Do)执行阶段:(一步)C(Check)检查阶段:(一步)A(Action)处理:(两步)4管理技术的内容PDCA循环两个特点:1、阶梯上升PDCAPDCAAPDCAPDCAPDCPDCA2、大环套小环5◆为什么选这个课题?◆问题的症结是什么?◆为什么制订这个目标?◆为什么确定这几条主要原因?◆每条对策是否有效,能否完成?◆活动效果怎样?2、以事实为依据,用数据说话63、应用统计技术目的:进行数据的整理、分析。方法:全数检验或随机抽取。工具:“老七种工具”“新七种工具”等。7统计工具菜单(一)排列图因果图调查表分层法直方图控制图散布图关联图系统图(树图)亲和图(KJ法、A型图解)PDPC法(过程决策图法)矩阵图矩阵数据分析法矢线图老七种工具新七种工具8统计工具菜单(二)饼分图折线图柱形图水平对比雷达图0、618法正交实验法抽样检验方差分析假设检验价值工程简易图表专用工具类其它类推移图流程图9◆统计方法分类:一般分为描述性和推断性两类。(1)描述性:对统计数据进行整理和描述(2)推断性:在对统计数据进行描述的基础上,进一步进行分析、解释和作出推断性结论。统计方法基础知识(P93)统计:收集和整理国情、资料的一种活动。一、什么是统计方法◆统计方法:收集、整理、分析和解释统计数据,并对其所反映的问题做出一定结论的方法。10统计方法基础知识二、统计方法的性质:描述性、推断性、风险性。三、统计方法的用途:1、提供表示数据特征的数据(平均数、标准偏差、极差等)2、比较两事物的差异(水平对比、假设检验等)3、分析事物影响变化的因素(因果图、系统图、分层法等)4、分析事物间相关关系(散布图、正交试验等)5、研究取样和试验方法,确定合理的试验方案6、发现质量问题,分析掌握质量数据的分布状态和动态变化(排列图、直方图、散布图等)7、描述质量形成过程(流程图、控制图等)通过归纳分析问题,显示事物的客观规律,不解决质量问题11一、正常波动:随机原因引起的产品质量波动。特点:大量存在、影响很小、消除难度大、经济代价高。要求:一般情况下在生产过程中允许存在。控制状态:仅有正常波动的生产过程,简称为控制状态或稳定状态。产品质量的波动产品质量具有波动性和规律性。产品质量波动分为正常波动和异常波动两类。12特点:不经常发生,一旦发生影响较大,容易查明原因,容易预防和消除。要求:由于对生产影响大,生产过程中不允许存在。质量管理工作的一项重要工作,就是把正常波动控制在合理范围之内,消除异常波动。产品质量的波动二、异常波动:由系统原因引起的产品质量波动。13产品质量的波动引起产品质量波动六个方面,“5M1E”因素:人员(Man)操作者的意识、技术、素养及熟练程度等;机器(Machine)设备、工夹具精度、维护与保养等;材料(Material)化学成份、物理性能及外观质量等;方法(Method)加工工艺、操作规程的作业程度;测量(Measure)测量设备、试验手段和测试方法等;环境(Enviroment)工作场地的温、湿度,照明噪声等;正常波动—随机原因—随机特点—普遍存在异常波动—系统原因—系统特点—单一现象14波动无处不在。当过程处于稳定状态时,产品质量特性数据,其波动服从于一定的分布规律。例如:长度尺寸必然形成右图的分布规律。分布有两种类型:一种是连续型分布常见的有:正态分布(计量数据)一种是离散型分布,常见的有:1、二项分布(计件数据)2、泊松分布(计点数据)三波动的规律性正态分布图问题:什么情况下没有波动?15关于正态分布正态分布受两个参数影响μ(总体平均值)——集中位置σ(总体标准偏差)——分散程度通常用样本平均值:X样本的标准偏差:S正态分布曲线,又称高斯曲线、钟型曲线。μσXS16打靶与分布17正态分布特性区间内的概率0.68260.95450.9973XS±σ±2σ±3σ18集中趋势(位置)离中趋势(分散程度)偏态和峰度(形状)数据分布的特征19统计数据及分类数据分类:计量数据、计数数据一、计量数据服从于正态分布凡是可以连续取值的,或可以用测量工具测量出小数点以下数值的数据。如:用于计量的长度、重量、温度、时间、强度等数据。特点:两个数之间相对独立,一个变另一个不变。20统计数据及分类二、计数数据凡是不能连续取值的或用测量工具也得不到小数点以下的数据,而只能自然数的数据称为计数数据。计数数据分为:计件数据服从于二项分布计点数据服从于泊松分布12345特点:两个数之间相互影响,一个变另一个随着也变。如:一辆汽车两道划痕,两辆汽车四道划痕。21请说明以下数据的类型自来水表数、电冰箱、衣服溅了油、电机噪声、培训班学员人体重、布上的疵点、体温、车门被划了几道、酒瓶的汽泡一丈布、一箱玻璃、手机不合格率、工资、秒表数、错字率计量数据计件数据计点数据自来水表数、人体重量、体温、工资、秒表数、一丈布、电机噪声。电冰箱、培训班上的学员、手机不合格率、错字率、一箱玻璃。衣服溅了油、车门被划了几道、酒瓶上的汽泡、布上的疵点。百分数类型判别:数据分类取决于分子。22总体:指某次统计分析中研究对象的全体又称母体。样本:从总体中随机抽取出来要对其进行分析的一部分个体,也称为子体。抽样:从总体中随机抽取样品组成样本的活动过程。随机抽样:使总体中每一个个体都有同等的机会,被抽出来组成样本的活动过程。总体与样本23总体可以是一批产品,可以是一个过程。判断随机抽取测量总体样本数据总体与样本随机抽样方法:1、简单随机抽样法2、系统抽样法(等距抽样)3、分层抽样法(类型抽样)4、整群抽样法(集团抽样)24统计特征数是对样本说的。常用的统计特征数可分为两类:一:表示数据的集中位置1、样本平均值2、样本中位数二:表示数据的离散程度1、样本方差s22、样本标准偏差s;3、样本极差R统计特征数X~x25均值--集中位置1、一组数据向其中心值靠拢的倾向和程度2、测量集中位置就是寻找数据一般的代表值和中心值。中心位置—X~x26样本平均值—X式中样本的算术平均值;n:样本大小。最常用的测度值,是集中趋势的测度值之一,易受极端值影响。计算公式:=nixn1i1x—X:27样本平均值—X原始数据:105913685.868613951066543211++++++++++XXXXXXNXXNii计算算例:28样本中位数将所收集的数按大小排序,在正中位置的数为中位数。集中趋势的测度值之一。不受极端值影响。50%50%~x当N为奇数时,中位数为正中间位置的数。当N为偶数时,中位数为正中间两个数的算术平均值。~x29五个数据取中位数原始数据:10591268排序:5688.591012位置:123456原始数据:2422212620排序:2021222426位置:12345六个数据取中位数中位数8+928.5中位数22301.数据分布的另一个重要特征2.离散程度的各测度值就是对数据离散程度所作的描述3.它所反映的是各变量值远离其中心值的程度,因此也称为离中趋势4.从另一个侧面说明了集中趋势测度值的代表程度离散程度minmax—X离中趋势31如果你想过河,有人只告诉你河的平均深度是1.5米,你是否还想知道它的变化范围。为什么要研究数据的离散程度?离散程度样本标准偏差s32方差和标准差1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方法或标准差4681012X=8.333样本方差和标准偏差计算公式1)(1221nxxSniin1)(121nxxSniinS:样本标准偏差,样本方差的正平方根。样本方差S2:(xi-x):表示某一数据与样本平均值之间的偏差。n:采集的样本数n-1:样本方差的自由度样本标准偏差S:341.一组数据中可以自由取值的数据的个数2.当样本数据的个数为n时,若样本均值确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值;3.例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x=5确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值;4.样本方差用自由度去除,其原因可以从多方面来解释,从实际应用的角度看,主要为了更精确。—X(n-1)样本方差的自由度35样本方差算例原始数据:10591368平均数据:10+5+9+13+6+8÷6=8.53.816)5.88()5.85()5.810(1)(2221221+++nxxSniin36原始数据:1059136888.23.81)(121nxxSniin样本标准偏差算例371.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.表示数据的分散范围4.易受极端值影响极差RR=max(Xi)-min(Xi)=205–145=60(公分)205145平均:17538minmax—XXS±σ±2σ±3σ区间内的概率0.68260.95450.99730.999940.999994极差相当于6倍的标准偏差99.73%±σ±2σ±3σ±4σ±5σ正态分布特性39XS±σ±2σ±3σ±4σ±5σ±6σ6σ6σ1.5σ(6西格玛)百万分之三点四的计算分布中心向左偏移1.5σ时,左边为4.5σ,区间外的概率为3.4/百万。右边为7.5σ可以忽略不计40两类错误和风险根据随机抽样检测,研究样本质量状况,以此推断整批产品的好坏,并做出决定接收或拒收。可能会出现四种情况:(1)假定这批产品质量是好的,样品好:接收(2)假定这批产品质量是好的,样品不好:拒收(3)假定这批产品的质量不好,样品不好:拒收(4)假定这批产品的质量不好,样品好:接收41第1、3项为正确推断,第2、4项为错误推断。第2项判断错误称为“弃真”α,是把质量好的产品作为坏的处理,这类风险是企业风险。第4项判断错误称为“取伪”β,是把质量坏的产品作为好的处理,这类风险是用户风险。运用统计方法,就是要把两类风险率和总损失率控制在期望的范围之内。两类错误和风险42QC小组常用的工具与方法用于数字数据分析,非数字数据分析均可用于数字数据分析(统计型)用于非数字数据分析(情理型)老七种工具调查表分层法排列图直方图控制图散布图因果图新七种工具矩阵数据分析法亲和图(分层图)系统图(树图)关联图过程决策程序图箭条图矩阵图GB/T19004-4-1994ISO9004-4-1993质量改进指南调查表排列图直方图控制图散布图头脑风暴法分层图(亲和图)因果图树图(系统图)流程图水平对比法试验方法单因素试验法正交设计试验法其它方法过程能力指数简易图表:柱状图折线图饼分图带状图雷达图等项目类别43应用调查表的步骤:(1)明确收集资料的目的;(2)确定所需搜集的资料;(3)确定对资料的分析方法及负责人;(4)设计记录资料调查表格式;(5)对先期收集和记录的资料进行检查;(6)必要时,对调查表格式进行评审和修改。调查表(P109)用来系统的收集资料、积累数据、确认事实并对数据进行粗略整理分析的图表。44用于数字数据分析的调查表实例批次产品型号成品量(箱)抽样数(支)不合格品数(支)不合格率(%)外观不合格项目切口贴口空松短烟过紧钢印油点软腰表面1烤烟型1050030.61112烤烟型1050081.6112223烤烟型1050040.81214烤烟型1050030.6215..烤烟型1050051.011111250烤烟型1050061.211211合计
本文标题:QC小组的数据统计基本知识(含新、老七工具)
链接地址:https://www.777doc.com/doc-7032377 .html