您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 主成份-MINITAB
MINITAB软件与主成份分析1.MINITAB介绍MINITAB特点MINITAB功能MINITAB基本操作(输入输出)2.MINITAB中主成份分析3.MINITAB主成份应用1MINITAB介绍1.1MINITAB特点•小巧精致:MINITAB7.1占用约3MB空间,MINITAB9.2占用约10MB左右空间。MINITAB13.3安装要求40MB硬盘空间,完整安装要求120MB硬盘空间(完整安装包括全部的说明文件)。•使用简便:MINITAB可进行菜单驱动,也提供了一个类似DOS命令行环境的命令解释环境,命令字类同英语单词,易记忆,命令参数少,容易理解。•功能强大:可完成数据处理、统计分析、矩阵运算、绘制统计图形等。1MINITAB介绍1.2MINITAB功能•数据维护管理•编绘图形:散点图、线形图、直方图等•统计分析矩阵运算、检验、方差分析、回归分析主成份分析、聚类分析、因子分析、时间序列分析等1MINITAB介绍1.3MINITAB9基本参数•列变量、存储常量、矩阵是MINITAB中最基本的运算元素。•一个列变量、存储常量和矩阵被定义过之后,任何时候都可以重新定义,但以前存储的内容自动被删除。•变量:MINITAB用C1、C2、…、C100来表示列变量,1个列变量中可以存储多个样本的数据。•常量:用K1、K2、…、K100来表示存储常量•矩阵:用M1、M2、…、M15表示矩阵。1.4MINITAB基本操作启动主界面主菜单输出窗口数据窗口数据信息窗口操作历史窗口数据输入输入方式1.打开文件(固有格式Lotus)2.导入文件数据(文本格式)3.直接拷贝数据(数据窗口)导入文件数据1导入文件数据22MINITAB中主成份分析点击菜单:Stat-Multivariate-PrincipalComponents主成份分析对话框1.文件数据列2.参与分析变量3.输出主成份数4.采用相关或协方差阵5.保存特征向量(列名)6.保存主成份(列名)主成份分析对话框-说明1.计算的主成份数:如果没有确定(采用缺省值),计算的主成份数目与参与分析的变量数相同。2.保存特征向量:确定的列数小于等于计算的主成份数3.保存主成份值:确定的列数小于等于主成份数主成份分析输出特征值特征值百分比特征值累计百分比第1特征向量第2特征向量第3特征向量主成份分析输出1.特征向量(按列)2.主成份值(按列)输出主成份值说明采用相关矩阵计算主成份时,输出的特征向量对应的是标准化数据的特征向量。因此输出主成份值的计算公式:PPPipiiiSxxaSxxaSxxa...y22221111Minitab中主成份分析演示数据文件-练习Trees.xls实际应用实例(张超,1984)对于某区域地貌-水文系统,其57个流域盆地的九项地理要素,原始数据见下表。•x1为流域盆地总高度(m);•x2为流域盆地山口的海拔高度(m);•x3为流域盆地周长(m);•x4为河道总长度(km);•x5为河道总数;•x6为平均分叉率;•x7为河谷最大坡度(度);•x8为河源数;•x9为流域盆地面积(km2)。数据1数据2(1)先将表中原始数据作标准化处理,计算得相关系数矩阵0)(VESS:资料的相关阵或协方差阵λ:S的特征根V:S的特征向量(2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(3)主成份数的确定第1,第2,第3主成分的累计贡献率已高达86.5%;第1,第2主成分特征根大于1,第3主成分特征跟近似等于1(0.997)。确定取前3个主成份。01234560246810主成份特征值(4)对于前3个特征值λ1,λ2,λ3,根据其特征向量e1,e2,e3分别计算各变量x1,x2,……,x9在各主成分上的载荷,得主成分载荷矩阵。jiijialjil称为jx对iy的载(负)荷系数载荷系数:jil表示第j个特种量xj与第i个主成份yi之间的相关系数.哪些相关系数比较大,表明主成份yi主要代表了哪些原特征量的物理意义。PC1PC2PC3对前3个主成份贡献归一化贡献x1盆地总高度0.75-0.38-0.360.83650.11x2盆地山口的海拔高-0.250.82-0.080.74130.09x3流域盆地周长0.890.190.000.82820.11x4河道总长度0.970.14-0.030.96140.12x5河道总数0.910.180.160.88610.11x6平均分叉率0.20-0.360.860.90920.12x7河谷最大坡度0.35-0.80-0.250.8250.11x8河源数0.920.170.160.90090.12x9流域盆地面积0.930.22-0.100.92330.12载荷矩阵0.8365=0.75^2+(-0.38)^2+(-0.36)^2(5)分析1)z1与x1,x3,x4,x5,x8,x9有较大的正相关,因这六个地理要素与流域盆地的规模有关,因此第1主成分被认为是流域盆地规模的代表:2)z2与x2有较大的正相关,与x7有较大的负相关,而这两个地理要素是与流域切割程度有关的,第2主成分被认为是流域侵蚀状况的代表;3)z3与x6有较大的正相关,而地理要素x6是流域比较独立的特性——河系形态的表征,第3主成份被认为是代表河系形态的主成分。(6)结论以上分析结果表明,根据主成分载荷,该区域地貌-水文系统的九项地理要素可以被归为三类:(1)流域盆地的规模.(2)流域侵蚀状况.(3)流域河系形态。如果选取其中相关系数绝对值最大者作为其代表,则流域面积,流域盆地出口的海拔高度和分叉率可分别作为这三类地理要素的代表。利用这三个要素代替原来九个要素进行区域地貌-水文系统分析,可以使问题大大地简化。作业统计方法的应用根据下面的学员分组,试从中英文期刊(或书籍)正式发表的各种文章中,找出一个应用多元统计的例子。内容包括该篇文章中某种统计方法的目的、采用的数据、统计分析的结果、最后解决了什么实际问题等,并说明文章的出处(如果是论文包括期刊名、论文名、作者、卷号、期号,发表年份;如果是书籍包括作者、书名、出版社、出版年份,所在页码),在。(没有分组的学生留待下次类似的作业)每组完成2~3份作业,每份一个PPT文件,在下周的课堂中,给出部分时间上台教授,每份作业时间5分钟。每组上台学生的平均成绩即为该组所有学生的成绩。作业统计方法的应用第1组7人(学号03011024~04291024),一元线性回归。2个PPT。第2组7人(学号04291025~04291049),非线性回归(一元或多元)。2个PPT。第3组12人(学号04291064~04291011),多元线性回归。3个PPT。第4组12人(学号04291018~04291037),聚类分析+判别分析。3个PPT。第5组12人(学号04291044~04301003),主成份分析。3个PPT。End
本文标题:主成份-MINITAB
链接地址:https://www.777doc.com/doc-5923989 .html