您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 市场营销 > 数据分析--以Minitab为例
DataAnalysisUsingMinitabBrightPang2007.Aug.10为什么要做数据分析为什么要做数据分析通过数据分析来发现问题、找出解决问题的办法•顾客反馈和与顾客有关的信息,目的是了解顾客的满意程度。•产品的质量情况数据(不合格品统计,主要缺陷和不足.....)•过程的绩效数据统计,与目标数据的距离•质量成本统计数据•供应商的业绩数据DQA分析数据的目的•真实反应当前实验状况•为设计部门提供Debug的第一手资料•深入了解产品(可靠性、制程能力…)什么是Minitab?MINITAB=Mini+Tabulator=小型+制图表的人介绍1972年,美国宾夕法尼亚州立大学用来作统计分析、教育用而开发,目前已出版Window用版本Vesion14.20,并且已在工学、社会学等所有领域被广泛使用。特别是与6sigma关联,在GE、AlliedSignal等公司已作为基本的程序而使用。在上个世纪80年代Motolora开始在公司内推行6Sigma,并开始借助Minitab使6Sigma得以最大限度的发挥。优点以菜单的方式构成,所以无需学习高难的命令文,只需拥有基本的统计知识便可使用。图表支持良好,特别是与6sigma有关联的部分陆续地在完善之中。从V14.13开始,加入了6sigma功能。Minitab的基本功能计算功能•计算器功能•生成数据功能•概率分布功能•矩阵运算数据分析功能•基本统计•回归分析•方差分析•实验设计分析•控制图•质量工具•可靠度分析•多变量分析•时间序列•列联表•非参数估计•EDA•概率与样本容量图形分析•直方图•散布图•时间序列图•条形图•箱型图•矩阵图•轮廓图•三维图•点图•饼图•边际图•概率图•茎叶图•特征图Minitab中的Graph•SymmetryPlots对称图•DotPlot点图•BoxPlot箱型图•Histogram直方图•ParetoPlot•ScatterDiagram散布图•MarginalPlot边际图•MatrixPlot矩阵图•MaineffectPlot主效果图•InteractionsPlot交互作用图•TimeSeriesPlot时间序列图•ContourPlot等高线图Graph分析:透过图形了解各要因x与输出y之变化关系Minitab中的GraphGraph用途X,YDATA的分布形态1.Histogram2.DotPlot3.MarginalPlot4.BoxPlot根据X,Y分布比较1.MultipleDotPlot2.MultipleBoxPlotY的时间性变化1.TimeSeriesPlotX对Y影响效果确认1.MaineffectPlot2.InteractionsPlot项目别比较1.ParetoX与Y的关系1.ScatterPlotSymmetryPlots对称图StatÆQualitytoolsÆSymmetryPlots使用Minitab自带的例子做练习:EXH_QC.MTWUpperDistancetoMedianLowerDistancetoMedian3.02.52.01.51.00.50.03.02.52.01.51.00.50.0210-1-220100SymmetryPlotforFaultsSymmetryPlots是用来看数据分布的!注意:作为一个参考指标,样本数量最少要有25~30以上为什么要25~30个样本以上?中央极限定理如果我们重复地从平均数μ,标准差为σ的母群中抽取样本大小为N的许许多多样本,得到许许多多样本平均数,而这些样本平均数将成为常态分配,不管原来母群的各分数之次数分配形状如何,且这些样本平均数的平均数将等於μ,这些样本的标准差将等于σ.BoxPlot箱型图GraphÆBoxPlot使用Minitab自带的例子做练习:PULSE.MTW1.可以比较不同数据间的分散度及分配形状;2.可以判别数据是否有异常点。上限以内最大值Q3第三个四分位数中位数Q1第一个四分位数异常点下界=Q1-1.5×(Q3-Q1)上界=Q1+1.5×(Q3-Q1)BoxPlot箱型图实例Histogram直方图GraphÆHistogram使用Minitab自带的例子做练习:MARKET.MTW直方图是按照组别将数据划分,计算各个组间该数据的出现次数,并生成次数的分配表。一般用直方图来看产品的群体分配形态。来自PS的例子:由左图可以看到一副图像的色阶分布。PS中的Histogram是以0~255色阶为横轴,此色阶上象素点的个数为纵轴。这种Histogram是典型的以频率做纵轴的范例。Histogram直方图Histogram直方图Histogram直方图Histogram直方图Histogram直方图Histogram直方图用不同的方法表示纵轴•纵轴用频率表示--为Minitab缺省设置•纵轴用百分比表示--落在该区域内的观测值占全部资料的百分比•纵轴用密度表示--该区间的面积函数某一区域内的面积等于该区域范围内的积分DotPlot点图GraphÆDotPlotDotPlot是EDA(ExploratoryDataAnalysis)探索性资料分析的一种简单形式,它是一维图形,是将所有观测点沿着一条线制成的图形。使用Minitab自带的例子做练习:AZALEA.MTWData2.452.101.751.401.050.700.350.00A-WEEK-1A-WEEK-2A-WEEK-3A-WEEK-4A-WEEK-5DotplotofA-WEEK-1,A-WEEK-2,A-WEEK-3,A-WEEK-4,A-WEEK-5用于比较不同组数据的分布DotPlot点图实例ParetoPlotStatÆQualitytoolsÆParetoPlot使用Minitab自带的例子做练习:EXH_QC.MTWPareto分析的主要目的是决定改善的方向及先后顺序;通过Pareto可以把握不良原因或品质变异的重点,使用20/80法则ScatterDiagram散布图GraphÆScatterDiagram使用Minitab自带的例子做练习:PULSE.MTW散布图的用途:•可以得到两种数据间是否有相关及其相关程度;•是否有异常点;•两种数据若呈线性变化,可以利用散布图来做预测(简单的回归)有散布图可知,人的身高与脉搏无相关。ScatterDiagram散布图实例由散布图可以看出,体重与身高有正相关性。即体重越大,身高也越高。ScatterDiagram散布图MarginalPlot边际图GraphÆMarginalPlot使用Minitab自带的例子做练习:PULSE.MTW边际图是散布图与直方图(箱型图或点图)的综合,它的作用是:•可以让我们检查两个变数的联合分配,也可以同时检查X,Y轴变量的分配,这样做有助于我们深入认识数据。由边际图可以看到脉搏随身高的分布,可以看到身高的分布,也可以看到脉搏的分布。MarginalPlot边际图很容易发现异常点很容易看出数据之间的关系MarginalPlot边际图MatrixPlot矩阵图GraphÆMatrixPlot使用Minitab自带的例子做练习:PULSE.MTW矩阵图的用途:•可一次呈现多个变量间两两相互散布的关系可以加入简单的回归预测ContourPlot等高线图GraphÆContourPlot使用Minitab自带的例子做练习:EXH_GRPH.MTWDOE中的ResponseSurfaceDesigns经常用到等高线图等高线图的用途:•可以得到参数的取值范围TimeSeriesPlot时间序列图GraphÆTimeSeriesPlot使用Minitab自带的例子做练习:ABCSALES.MTW观察时间变动趋势MainEffectsPlot主效果图StatÆANOVAÆMainEffectsPlot使用Minitab自带的例子做练习:ALFALFA.MTWMainEffectsPlot主效果图斜率越大,影响效果越显著InteractionsPlot交互作用图StatÆANOVAÆInteractionsPlot使用Minitab自带的例子做练习:EXH_AOV.MTWInteractionsPlot交互作用图此图说明:1,2型玻璃的LightOutput与Temp有交互作用此图说明:150度时LightOutput与玻璃类型有交互作用Quiz1.要检查数据的分布,可以用什么图形工具?2.要检查一个因子对另一个因子的影响,可以用什么图形工具?3.要了解输入变量与输出变量相互的影响程度,可用什么图形工具?4.要了解输入变量之间交互的影响程度,可用什么图形工具?Thankyou
本文标题:数据分析--以Minitab为例
链接地址:https://www.777doc.com/doc-6148810 .html