您好,欢迎访问三七文档
矩阵论课题论文论文题目:偏最小二乘法在光谱分析中的应用课题名称:腐植酸和木质磺酸盐的光谱分析方法研究导师姓名:焦明星课程名称:矩阵论任课教师:郭文艳专业:光学工程学号:2150220092姓名:王敏成绩:1偏最小二乘法(PLS)在光谱分析中的应用一、摘要磺酸木质素(ligninsulfonate)是水中的一种污染物,可用荧光分光光度法测定。尽管此种方法具有高灵敏度和高选择性,但在磺酸木质素的测试中腐植酸和去污剂中的光白剂(opticalwhitener)对其严重干扰。这三种化合物的发射光谱重叠非常严重,而且在溶液中相互间有影响。但是借助于偏最小二乘法,可以进行单一成分的测试,所得结果尚较满意。二、课题背景偏最小二乘方法(PLS-PartialLeastSquares)是近年来发展起来的一种新的多元统计分析法,现已成功地应用于分析化学,如紫外光谱、气相色谱和电分析化学等等。该种方法,在化合物结构-活性/性质相关性研究中是一种非常有用的手段。如美国Tripos公司用于化合物三维构效关系研究CoMFA(ComparativeMolecularFieldAnalysis)方法。其中,数据统计处理部分主要是PLS。在PLS方法中用的是替潜变量,其数学基础是主成分分析。替潜变量的个数一般少于原自变量的个数,所以PLS特别适用于自变量的个数多于试样个数的情况。在此种情况下,亦可运用主成分回归方法,但不能够运用一般的多元回归分析,因为一般多元回归分析要求试样的个数必须多于自变量的个数。三、偏最小二乘(PLS)3.1基本原理为了叙述上的方便,我们首先引进“因子”的概念。一个因子为原来变量的线性组合,所以矩阵的某一主成分即为一因子,而某矩阵的诸主成分是彼此相互正交的,但因子不一定,因为一因子可由某一成分经坐标旋转而得。在主成分回归中,第一步,在矩阵X的本征矢量或因子数测试中,所处理的仅为X矩阵,而对于矩阵Y中信息并未考虑。事实上,Y中亦可能包含非有用的信息。所以很自然的一种想法是,在矩阵X因子的测试中应同时考虑矩阵Y的作用。偏最小二乘正是基于这种思想的一种回归方法。偏最小二乘和主成分分析很相似,其差别在于用于描述变量Y中因子的同时2也用于描述变量X。为了实现这一点,在数学上是以矩阵Y的列去计算矩阵X的因子,与此同时,矩阵Y的因子则由矩阵X的列去预测。其数学模型为:X=TP′+E(3.1)Y=UQ′+F(3.2)此处,T和U的矩阵元分别为X和Y的得分,而P和Q的矩阵元分别为X和Y的装载,E和F分别为运用偏最小二乘模型法去拟合X和Y所引进的误差。T=XP(主成分分析)(3.3)TP′=XPP′(3.4)PP′=I(3.5)X=TP′(因子分析)(3.6)在理想的情况下,X中误差的来源和Y中的误差的来源完全相同,即影响X与Y的因素相同。但实际上,X中误差与Y中误差并不相关,因而t≠u,但当两个矩阵同时用于确定因子时,则X和Y的因子具有如下关系:u=bt+e(3.7)式中b所表征的即为u和t间的内在关系。为了使因子T既可描述X矩阵,同时又可描述Y矩阵,则需采取折衷方案,即将T进行坐标旋转。显然,坐标旋转后的T因子对于X矩阵的表达已不再是最优的状况。3.2腐植酸和木质磺酸盐的荧光分光光度分析如图3.1所示为水中污染物磺酸木质素及其杂质腐植酸和去污剂中的光白剂这三种化合物的发射光谱。我们发现这三种化合物不仅发射光谱严重重叠,同时在溶液中相互间有影响。若借助于偏最小二乘法,可以进行单一成分的测试,所得结果尚较满意。3图3.1腐植酸,磺酸木质素和去污剂的发射光谱(均由纯物质测试所得)首先,看一下二组分的情况。表3.1所示为腐植酸和磺酸木质素混合样品的浓度测定结果。表8.1腐植酸与磺酸木质素混合物溶液测试结果(ug/ml)试样号腐植酸磺酸木质素非相似度因子实际值预测误差实际值预测误差14.02-0.130.507-0.0620.3622.480.100.266-0.0040.4234.26-1.120.364-0.0050.5440.997-1.110.2030.0490.7952.960.640.116-0.0820.9461.140.00.4040.0870.6575.080.00.209-0.1551.0384.99-0.3400.0751.08900.300.723-0.1195.30标准差0.270.085其中,预测误差为预测浓度与实际浓度之差.如对于小组分磺酸木质素,平均误差为-0.024(ug/ml),相应的标准偏差为0.085(ug/ml)。标准偏差所用公式为:[1/n∑(y真值-y预测)2]1/2(3.8)而非相似度因子(dissimilarityfactor)的表达式为:dis=s2/sa2(ES)(3.9)式中,sa2(Ex)为X阵的主成分模型所引进的残余标准方差。而s2为s2=||e||/(m–a)(3.10)其中,m为X的维,a为主成分数,e为:ei=xi–tipi′(3.11)运用F显著性检验,其自由度为(m-a)/2和(m-a)(n–a–1)/2,显著性水平为α,若s2sa2(Ex)F,则计算值可信。4若试样增加一组分,即去污剂(含光白剂),对于腐植酸和磺酸木质素来说,三组分与二组分浓度预测准确性大体上相当。对于去污剂来说,也得到了较好的结果。因为算法相同,在这里我们就不在赘述。四、结论上述内容主要介绍了矩阵的偏最小二乘算法基本应用与传统多元线性回归模型相比,偏最小二乘回归的特点是:(1)能够在自变量存在严重多重相关性的条件下进行回归建模;(2)允许在样本点个数少于变量个数的条件下进行回归建模;(3)偏最小二乘回归在最终模型中将包含原有的所有自变量;(4)偏最小二乘回归模型更易于辨识系统信息与噪声(甚至一些非随机性的噪声);(5)在偏最小二乘回归模型中,每一个自变量的回归系数将更容易解释。参考文献[1]齐小明,张录达,杜晓林,等.PLS-BP法近红外光谱定量分析研究[J].光谱学与光谱分析,2003,23(5):870-872.[2]陈闽军,程翼宇,刘雪松.用局部拟合主成分回归计算光度分析法测定黄连生物碱[J].化学学报,2003,61(10):1623-1267.[3]潘国锋.基于紫外吸收光谱的水质硝酸盐含量LLE-SVR建模[J].仪器仪表学报.2011(12)[4]粟晖,宋光均,李蒙军.偏最小二乘-分光光度法同时测定染液中直接染料组分的浓度[J].广西工学院学报.2012(02)
本文标题:矩阵论课题论文
链接地址:https://www.777doc.com/doc-2175072 .html