您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > PMF正交矩阵因子分解软件翻译
PMF是一个多变量因素分析工具,它把采样数据矩阵分解成两个矩阵:系数的贡献(G)和因字数(F),这些因子情况需要用户利用测得的源配置文件信息,以及排放或排放清单进行解释,以识别对样品有贡献的的源类型。该方法在这里简要回顾,在其他地方更详细地描述。结果使用约束:没有样品可以有显著负贡献。PMF的使用样品的浓度和用户提供的不确定度进行各个点加权。此功能允许分析人员占信心在测量。例如,检测限下面的数据可以被保留用于该模型中,与相关联的调整的不确定度,以便这些数据点比测量高于检测限的数据点,对解决方案有较小的影响。因子贡献和因字数使PMF模型目标函数Q最小化。Q是PMF的一个关键参数,两个版本的Q显示在模型运行。Q(真)计算是包括所有点的拟合优度参数。Q(鲁棒)是计算排除不符合模型的点(定义为样品的量的不确定度残差大于4)的拟合优度参数。Q(真)和Q(鲁棒)的区别在于测试残差高的数据的影响。这些数据点可能与来自源的峰值影响相关联EPAPMF需要底层多线性多次迭代(ME),以帮助识别最优化的因子贡献和因字数。这是由于在ME算法的性质,用随机生成的因子数开始搜索因子配置文件。这一因素配置文件使用梯度的方法来绘制的到最佳的解决方案的最优路径。在空间方面,该模型利用观察构建多维空间,然后使用梯度的方法来遍历空间沿着这条道路找到最佳解决方案。最佳的解决方案通常是由沿着路径的最低Q(稳健)值(即最小Q)所识别,可以被想象成一个槽的底部在一个多维的空间中。由于起点的随机性(由种子值和它表示的路径来确定),不能保证该梯度方法总能找到多维空间(全球最低)的最深点;它可能找到一个局部的最低水平。为了最大限度地达到全局最小,该模型应为一个开发的解决方案运行20次和100次对一个最终的解决方案,每次以不同的起点。因为Q(鲁棒)不被那些没有被PMF拟合的点影响,它被用作一个关键参数从多个运行选择最佳的运行。此外,可变性Q(稳健)提供了一个指示(初始运行结果是否有显著变化),因为用来启动梯度算法的随机种子在不同的位置。如果数据提供稳定的路径到最小,则间Q(可靠)的值在不同运行之间将会变化很小(判据)。在其他情况下,该起始点和由数据定义的空间的组合会影响到最小值的路径,导致Q(鲁棒)的值变化;最低Q(健壮)值默认使用,因为它代表了最优化的解决方案。应当注意的是Q值的微小的变化并不一定表示该不同的运行具有的小的差异在源成分之间。由于化学成分变化或过程变化引起的变异可能会造成因子配置的显著差异在PMF运行中。提供两个诊断去评估不同运行间的差异:内部运行残差分析和物种分布的因素总结相比那些最低的Q(稳健)运行。用户必须评估PMF中的所有的错误估计去理解模型结果的稳定性;算法和ME输出在Paatero等人进行了描述。(2014年)。PMF的解决方案的差异可以使用三种方法估计:1、自举(BS)分析用于确定是否有一个小的观察组可以不成比例地影响解决方案。BS误差区间包括随机误差和部分包括旋转歧义的影响。旋转歧义是由PMF产生的在许多方面相似的无限的解决方案引起。也就是说,对于任意一对矩阵,可以通过简单的旋转一对矩阵可产生无限变化。只有一个源的贡献非负的约束,不可能限制这个空间旋转。BS错误估计通常是坚固的和不被用户指定的样品的不确定度影响。2、替换(DISP)是一种分析方法,它可以帮助用户了解解决方案的更详细的细节,包括其对微小变化的敏感性。DISP误差区间包括旋转歧义的影响,但不包括数据中的随机误差的影响。数据的不确定度将直接影响DISP误差估计。因此,向下加权的物种的误差区间很可能大3、BS-DISP(混合方式)的误差区间包括随机误差和旋转歧义的影响。BS-DISP结果比DISP结果更加可靠,因为BS-DISP的DISP相不像DISP本身那样强烈的置换。这些方法在三个空气污染数据集中被应用在Brown等人。(2014年)。本文提供了基于环保局误差估计应用的解释。Paatero等人(2014)和布朗等人(2014年)文献是美国环保署的PMF的重要参考,两者都提供了错误估计的详细信息和他们的解释,这只简要介绍在本指南中。1.2多线性发动机如上所述,两种常见的方案解决了PMF的问题,最初,PMF2解决方案(Paatero,1997)被使用。在PMF2,非负约束可能被加在因子元素和最小二乘拟合时,测量将会被单独进行基于不确定度。有了这些功能,PMF2是环境数据的受体模型的显著改进对以前的主成分分析(PCA)技术。然而,PMF2是有局限的,因为它被设计来解决一个非常具体的PMF问题。在20世纪90年代后期,ME,一个更灵活的方案,开发出来(Paatero,1999)。这个方案,目前在它的第二个版本,并称为ME-2中,包括与PMF2许多相同的特征(例如,用户能够进行单独的加权测量,并提供非负约束条件);然而,不像PMF2,ME-2的结构使得它可以用来解决各种多线性问题,包括双线性,三线性和混合模型ME-2是通过将两个单独的步骤结合来解决PMF问题。首先,用户定义感兴趣的PMF模型的表。然后,一个自动化的二次程序读取表格模型参数,并计算该解决方案。当采用EPAPMF解决PMF问题,第一步是通过由所述EPAPMF的用户界面产生的输入文件取得。一旦指定了模型,数据和用户规格由EPAPMF送入二次ME-2程序。ME-2解决了PMF的迭代公式,最小化求和-平方对象函数,Q,通过一系列的步骤,如图1。一个稳定的解决方案已经达到,当额外的迭代用来降低提供的Q值递减。通过以上三个层次的迭代,寻求解决方案从粗到细规模。迭代的第一级识别空间解决方案的整体区域。在这个水平上,Q的变化(DQ)需要小于0.1超过20个连续的步骤且不到800步。第二个水平识别的最终解决方案的附近。这里,dQ的要求小于0.005超过50个连续的步骤且不到2000的步骤。第三级收敛到最佳的Q值(Paatero,2000),其中dQ的应该小于0.0003超过100个连续的步骤且小于5000的步骤。ME-2通常需要小数据集(小于300的观察)的几百次迭代和高达2000对于大型数据集(Paatero,2000)。如果没有找到一个解决方案,满足三个层次任何一个的要求,那么解决方案是不收敛的(Paatero,2000年)。从ME-2的输出由EPAPMF读取,然后格式化由用户解释。此外,EPAPMF具有通过ME-2和EPAPMF实现的三个错误估计方法。ME-2和PMF2模型的结果之间的差异已通过相同的数据集各模型的,其结果的比较应用研究在几个研究中。总的来说,这些研究显示了主要成分的相似的结果,但在PMF2溶液中的更大的不确定度(斋戒等人,2003),并使用ME-2更好。盲源分离(Kim等人,2007)。在最近的两个出版物,要素配置文件限制由ME-2的应用导致了发现的来源数量较多(阿马托等人,2009;阿马托和Hopke,2012)。EPAPMF5版本采用了最新版本的ME-2和PMF的脚本文件,该文件通过PenttiPaatero在赫尔辛基和雪莱埃伯利大学几何被开发工具(2014年3月3日;me2gfP4_1345c4.exePMF_bs_6f8xx_sealed_GUI.ini)2PMF的使用PMF已应用于多种范围的数据,包括24小时分辨率的PM2.5数据,气溶胶粒度分辨,沉降物,有毒气体,高时间分辨率的测量,从气溶胶谱仪(AMS)得到的和挥发性有机化合物(VOC)的数据。参考部分(第9部分)提供了PMF引用的众多参考。关于PMF应用的更多讨论可在多元受体建模工作簿中见到(Brown等,2007)。我们鼓励用户阅读与他们的数据有关的论文以及源解析论文。用于PMF分析的方法已经改变了,例如限制已提供。重要引用总结于表1中。PMF需要一个数据集通过多个样品检测得到的一组参数。例如,PMF常用于100个样品以上包含10〜20个物种的PM2.5数据集。不确定度数据集,分配了每个种类和样品的不确定度值。不确定度计算使用以往的不确定度或其他可用信息例如采样精度。3、PMF5.0安装4、特点通过PMF5.0可获得以下特征1整理数据列在表中可以通过左键点击列标题进行排序。点击一次会以递增顺序对项目进行排序,点击两次将降序排序。如果列已排序,箭头会出现在标题显示在它的排序方向2保存图像所有图形输出可以通过右键单击图像以各种格式保存。可用的格式是.GIF及.BMP,.png和.TIFF。在同一个菜单中,用户可以选择复印或打印图形。一种堆叠图形选项也可以把因子或者时间序列结合在一个页面。当“复制”时,图形将被复制到剪贴板。在“打印”时,图形将自动发送到本地机器上的默认打印机。当保存一个图形,会出现一个对话框,以便用户可以改变文件的路径和文件的输出文件的名称3出图任何图形可以在新窗口中打开通过右键单击图,并选择浮动窗口。根据需要,用户可以打开多个窗口。但是,当模型参数和输出改变时,浮动窗口的图形不更新。4调整表内部分许多标签都用灰线分隔成多个部分(图2,红色箭头指向的灰色条使用户可以调整高度和宽度)。这些部分可以通过点击灰色的线并将其拖动到所需的位置调整大小。5显示选定的数据点当用户移动光标到一个散点图或时间序列图的一个点,点用虚线正方形括住,状态栏上显示的信息是该点的信息。6在列表和表中使用箭头键选择(点击或Tab键)一个菜单或表,键盘上的箭头键可用于改变所选择的行。7访问帮助文件。大多数屏幕的左下角有一个“帮助”快捷方式提供用户访问的帮助文件与当前屏幕有关的主要功能8使用状态栏大多数屏幕都在窗口底部的状态栏提供了额外的信息给用户。根据所选择的选项卡,这些信息在变动。各个选项卡的详细信息将在本指南后面的章节中讨论。浓度屏幕上散点图的状态栏的例子显示在图2的底部。5开始启动每次PMF5.0程序启动时,有关该软件的各种版权的发展信息的闪屏将显示。用户必须单击OK按钮或按空格键或回车键继续。EPAPMF的第一窗口是数据模型选项卡下的数据文件,如图3,在该屏幕上,用户可以提供文件的位置信息,并进行所需的选择。这个屏幕具有三个部分:输入文件(图3,1),输出文件(图3,2),和配置文件(图3,3),每一个在下面有详细描述。EPAPMF5.0可以读取多个站点的数据;物种浓度的时间序列图或源的贡献在将显示以相同的顺序像用户提供数据那样,PMF显示垂直线区别不同的站点。在数据文件屏幕底部的状态栏显示该项目的哪部分已经完成。在数据文件屏幕底部的状态栏显示该项目的部分已经完成。在任何用户输入数据文件之前,屏幕上状态栏红色显示“NO浓度数据,没有不确定度的数据,没有基础的结果,无自举结果,无BSDISP结果,和NODISP结果”。当任务完成后,“否”替换为“有”,颜色变为绿色。在图3的例子中,浓度和不确定度的文件已经提供给程序,所以前两个项目上的状态栏是绿色的。基本运行,BS运行,BS-DISP运行,DISP运行尚未完成,因此最后的四个项目是红色的。巴尔的摩pm文件(数据集巴尔的摩背景和数据set_Baltimore_unc.txt)是安装包的一部分,可以在被发现在“C:\文件\EPAPMF\Data”文件夹,如果用户使用的是默认安装模式安装设置。5.1输入文件PMF所需的两个输入文件:(1)样品的物种的浓度值和(2)样品的物种的不确定度,或用于计算不确定度的参数。EPAPMF接受制表符分隔(.txt),逗号分隔值(CSV),和Excel工作簿(.xls或.XLSX)文件。每个文件可以被加载通过输入路径进入“数据文件”框中输入或浏览到相应的文件。如果文件包含多个工作表或命名区域,用户将被要求选择他们想要使用的一个。浓度的文件具有物种如行所示和日期,样品编号如列所示,都有一个标题(图4)。所有标准的日期和时间被接受,他们被列在日期格式下拉列表中。四个可能的输入选项被接受:(1)只用样本ID,(2)只有日期/时间,(3)样品ID和日期/时间,(4)不带ID或日期/时间。单位可被包括作为浓度文件中的第二标题行,但不做要求,单位不包括在不确定度文件。如果单位是由用户提供的,
本文标题:PMF正交矩阵因子分解软件翻译
链接地址:https://www.777doc.com/doc-4371977 .html