您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 数据统计分析在GMP实施中的应用
27张新数据统计分析在GMP实施中的应用---数据统计分析基础知识54数据统计分析基础知识1.数据及其特征值2.基本统计概念3.抽样检验基础知识4.质量波动简析28551.数据及其特征值数据是一种观测值,是实验、测量、观察、调查等的结果。数据是科学决策的前提56有数据不是目的2957数据的分类定性数据定量数据1)计量型数据:表示每个单位产品的特性值的数值大小进行测量与记录所得到的观测值。如:时间、长度、重量、纯度等。2)计数型数据:表示每个个体是否具有某种特性(或特征),计算具有该特性的个体数量。如:不良个数、缺点数、是否通过、事故数等。58数据统计统计(statistics)是指对与某一现象有关的数据的搜集、整理、计算和分析等的活动。统计方法分类:•描述性:对统计数据进行整理和描述。•推断性:在对统计数据进行描述的基础上,进一步进行分析、解释和作出推断性结论。3059数据的特征值•均值•极差•标准差•RSD相对标准偏差•中位数60数据的特征值-均值,极差,案例1-1•均值(平均年龄)=(27+27+33+46+57)÷5=38岁•极差=最大年龄—最小年龄=57‐27=30数据的特征值中位数,案例1‐12727334657中位数:33岁一批(6个样品)产品某指标的检测结果为:0.16,0.15,0.18,0.13,0.14,0.16从小到大排序:0.13,0.14,0.15,0.16,0.16,0.18该批产品某指标的中位数为:(0.15+0.16)/2=0.15561样本标准差样本标准差(SampleStandardDeviation)‐‐‐表示分散程度的特征值6231数据的特征值‐标准差,案例1‐1S=13.2岁均值=3811years11years19years8years5years272733465763案例1‐2用某规格电子天平做了砝码校准,称量结果如下表(mg):试求:是否达到USP的要求。备注:该规格的电子天平,按USP41要求:连续称取10次,计算标准差。比值3S/M≤0.001(M是砝码真实质量)20.0120.0020.0020.0120.0120.0020.0020.0220.0120.00标准差:0.00699.计算3*0.00699/20=0.00105能够达到USP要求。64323365相对标准偏差•相对标准偏差,(relativestandarddeviation,简称RSD),或称变异系数(coefficientofvariation),简称CV;•影响RSD的因素只有两个,一个是标准差,一个是均数。66案例1‐3QC实验室,对检验人员进行技术考评,一批产品,做10次,得结果如下:142.1143.4146.6143.6145.6147.2150.1148.2151.0143.7标准差:3.00均值:146.15RSD=2.05%结论:RSD应控制在1%以内,上述结果,可认为该检验员技术不达标,应重新培训。34案例1‐4•已知第一批产品均值190,标准差为10.5;第二批产品均值196,标准差为8.5,试问两批产品,哪个变异大?67数据分析的前处理数值的修约四舍六入五考虑,五后非零前进一,五后为零看奇偶,五前奇数则进一,五前偶数应舍去,不论舍去多少位,必须一次修约完。离群值(outlier)是指在数据中有一个或几个数值与其他数值相比差异较大。为什么会出现离群点?1)测量、输入错误或系统运行错误所致2)数据内在特性所决定3)客体的异常行为所致68出现离群值时的处理•当出现离群值的时候,要慎重处理,要将专业知识和统计学方法结合起来。•离群值处理方法包括:剔除离群值,不追加观测值;剔除离群值,追加观测值;或剔除离群值,适宜地插补替代;找到实际原因修正离群值,否则予以保留。692.基本统计概念统计学(Statistics)收集、整理、展示、分析、解析统计资料由样本(sample)推论母体/群体(population)能在不确定情况下作决策是一门科学方法、决策工具抽样7035X推论μxiX=--------36基本统计概念统计量R极差(range)Md中位数(median)Mo众数(mode)σ2方差/变异(variance)σ标准差(standarddeviation)s样组(样本)标准差X(μ)算术平均数(arithmeticmean)71基本统计概念R极差(range)R=Xmax‐XminX(μ)算术平均数(arithmeticmean)ni=1nMd中位数(median顺序数列中的中心项的数值Mo众数(mode)资料中出现最多的数值72n37基本统计概念σ2方差/变异(variance)n(Xi-X)2i=121=——[(x1‐xbar)2+(x2‐xbar)2+…+(xn‐xbar)2]73基本统计概念σ标准差(standarddeviation)n(Xi-X)2i=1σn=————案例1-6三家制药企业的交货时间(天)比较A公司3030303030B公司2025303540=30=30=0=7.9R=0R=20C公司58313274=30=27.61R=6974(xμ)2e2σ,x,正态分布的定义212πσ设连续型随机变量X的概率密度为f(x)其中μ,σ(σ0)为常数,则称X服从参数为μ,σ的正态分布或高斯分布,记为X~N(μ,σ2).75正态分布的图形特点N(,2)决定了图形的中心位置,决定了图形中峰的陡峭程度.7638机会率μ±0.6777σ50.00%μ±1σ68.27%μ±1.96σ95.00%μ±2σ95.45%μ±2.58σ99.00%μ±3σ99.73%3977标准正态分布的正态分布称为标准正态分布,记为N(0,1).当正态分布N(μ,σ2)中的μ0,σ1时,这样78数据特性值的正态分布绝大多数数据特性值服从或近似服从正态分布。4079西格玛相关基础知识80西格玛相关基础知识质量水平(Sigma等级)百分比%不良品率(百万分之)130.23697700269.13308700393.3266810499.37906210599.97670233699.9996603.48141西格玛相关基础知识过程输出质量特性平均值()往往在规格中心点周围漂移,漂移幅度在规格中心点±1.5σ范围内。如果将±1.5σ漂移计算在内,6σ质量特性的不符合规范限产1.5σ1.5σ下限上限12品为0.00034%,即3.4ppm。‐6Ơ‐5Ơ‐4Ơ‐3Ơ‐2Ơ‐1Ơ+1Ơ+2Ơ+3Ơ+4Ơ+5Ơ+6Ơ6σ的诠释不同个数σ的相对严重程度之示意σ6σ5σ4σ3σ2σ1σ以书刊错字校对为例一间小型图书馆全部藏书中有一个错字一部百科全书中有一个错字一册书每30页中有一个错字每页书中有1.5个错字每页书中有25个错字每页书中有170个错字823.抽样检验基本知识抽样分析样本测试数据群体行动结论抽样检验基本流程83抽样检验的风险•抽检检验是由样品的质量状况去推断总体的质量,这是有风险的。•当批质量符合要求却不被接收时生产方承担的风险,称之为生产方风险(或错判概率α)(弃真错误);•当批质量不符合要求却被接收时使用方承担的风险,称之为使用方风险(或漏判概率β)(纳伪错误)。844243错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小8686/45852.质量波动简析Variation变差•没有两件产品或特性是完全相同的,因为任何过程都存在许多引起变差的原因。输入(材料)输出(产品)过程(生产/装配)过程变差材料反馈(测量/检验)测量系统87质量波动简析正常波动是由偶然因素或随机因素(随机原因)引起的产品质量波动。这些偶然因素(随机因素)在生产过程中大量存在,对产品质量经常发生影响,但其所造成的质量特性值波动往往较小。一般情况下这些波动在生产过程中是允许存在的。公差就是承认这种波动的产物。如:原材料的成分和性能上的微小差异、机器设备的轻微振动、温湿度的微小变化、操作方面、测量方面、检测仪器的微小差异等。88444589质量波动简析异常波动是由异常因素或系统因素(系统原因)引起的产品质量波动。这些系统因素一旦存在,对产品质量的影响就比较显著。把有异常波动的生产过程称为过程处于非统计控制状态,简称为失控状态或不稳定状态。由异常因素造成的产品质量波动在生产过程中是不允许存在的,只要有发现产品质量有异常波动,就应尽快找出其异常因素,加以消除,并采取措施使之不再出现。如:原材料的不符合规定要求、机器设备带病运转、操作者违反操作规程、测量工具的系统误差等。90变差(质量波动)的两种主要类型下一个:!下一个:?普通原因特殊原因两种变差(变异)质量波动的因素Person人Sixmajorcausesofprocess过程变异的6大因素Method法Measurement测量Environment环Machine机Material料4M+环境+测量(5M1E)91数据统计分析在GMP实施中的应用---数据统计分析常用工具张新46序号名称作用1折线图直观体现数据的变化趋势2饼分图表示一个系统中各部分所占比率3散点图判断两个质量因素之间的相关性4因果图分析原因和结果的关系,找到问题的原因5树图对主题构成原因进行系统分析展开6排列图寻找影响产品质量的主要问题7控制图判断生产过程是否异常及导致异常的因素4793数据统计分析常用工具1.常用质量分析图2.控制图3.过程能力941.GMP实施中常用的数据分析工具一级种子细胞制备细胞活性批次S1S2S3S4S5S6S7S8P195.796.096.496.397.096.597.998.3P289.990.482.591.691.690.791.393.7P390.789.782.090.591.989.191.491.3P495.592.694.795.294.993.996.094.9P595.595.095.597.196.594.995.797.0P696.493.496.295.996.995.895.997.3P795.095.096.397.195.795.496.695.8P895.595.896.097.296.896.397.296.7P996.596.395.796.296.596.096.796.34895折线图,饼分图96案例2‐14997案例2‐1(样品顺序分析)98案例2‐1(批号顺序分析)P1P2P3P4P5P6P70月99.6099.6099.7099.7099.7099.7099.703月99.8099.8099.6099.8099.7099.6099.606月99.6099.5099.5099.6099.5099.6099.509月99.5099.6099.6099.5099.6099.5099.4012月99.6099.6099.6099.6099.7099.5099.4018月99.5099.6099.5099.5099.6099.5098.8524月99.6099.6099.6099.5099.5099.5098.4536月99.4099.6099.5099.6099.5099.6099.0098.500月3月6月9月12月18月24月36月稳定性OOT,案例2‐2符合性警戒:同一产品的同一(或其他稳定性研究产品的OOT结果显示,在有效期有产生OOS的可能性的情况),如图4100.0099.50P1P2P3P4P5P6P798.0097.5099散点图散点图,又称相关图,是研究成对出现的两组相关数据之间相互有关系的图示技术。用来发现,显示和确认两组相关数据之间的相关关系,确定其预期关系。10050YX6580066810658206683067840678506886068870678906890051102案例2‐3101因果图因果图,又名鱼骨图,是一种发现问题“根本原因”的分析方法人方法机
本文标题:数据统计分析在GMP实施中的应用
链接地址:https://www.777doc.com/doc-6398273 .html