您好,欢迎访问三七文档
欢迎关注新浪微博:BNU-天元PMFv3.0模型运行指南(草稿仅供参考)基础运行模块Input/OutputFiles输入/输出文件设置AnalyzeinputData输入数据分析ModelExecution模型运行BaseModelResults模型运行结果模型检验与优化BootstrapModelResults自助法模型检验FpeakModelResults模型优化内容:1.输入数据的格式2.参数的确定3.运行流程实例欢迎关注新浪微博:BNU-天元1输入数据的格式PMF输入文件主要有浓度文件和不确定度文件,PMF可以输入.xls文件,因此这里只要考虑excel。输入数据时需要注意一下几点:A.第一列或者第一行不能为空B.浓度数据和不确定度文件应当存在不同的sheet中,而且具有一一对应的关系C.如果需要删除sheet中的某一行或者某一列,请点右键点删除删除。如果仅仅使用delete键可能到导致在导入文件时出错。D.输入的数据需要具有统一的单位。E.输入的不确定度数据不能出现0或者负数F.如果需要在第一列进行输入SAMPLE或者日期,注意不要采用字母作为标注。否则会报出双精数转化错误。G.在导入文件时可以导入PM2.5或者PM等总变量的数据,但是需要在analysisinputdata中将其设为totalvariable下图是输入数据格式实例图1输入数据格式实例(摘自PMFUSER’SGUIDE)欢迎关注新浪微博:BNU-天元2参数的确定MDL,uncertainty,理论Q,因子数2.1MDL(检出限)IUPAC提出的检出限测定方法主要是使用空白进行至少7次测量,计算出这七次相关数据的标准偏差s,则检出限即是2倍或者3倍的标准偏差。[1]然而由于数据有限和经费有限,如果没有该数据可以参考相关文献,但要注意文献中提供的采样方法、分析方法以及测试仪器等条件是否与你实验相同。2.2不确定度对于不确定度的计算方法总的来说有一下几个公式A对于样品浓度小于MDL的数据[3]其数据用1/2MDL代替,不确定度=5/6MDLB对于样品浓度大于MDL的数据B.1如果有MDL数据,不确定度=而errorfraction的确定,有文献ICP-AES采用2%,ICP-MS采用3%,离子色谱选用10%,离子选择点击采用2%[4]。有的文献直接采用20%作为errorfraction[5]。如果无法确定可以采用空白样品直接的标准偏差来确定。B.2如果没有MDL数据,可以采用percentage*浓度的方法。如0.1*浓度作为不确定度。[3]2.3理论Q值如果误差的估计比较准确,那么对每一个数据点的拟和都会对Q值贡献一个近似于的值,因此理论Q值应近似等于数据阵列中的数据个数。[6]因此对于Q的理论数值有的人认为应该选用Q(理论)=(样品数*强的物种数)+[(样品数*弱的物种数)/3]-(样品数*因子数)[2]在userguide中提到Q理论值可以通过(样品数*物种数)-(样品数*因子数)来估计。2.4因子数因子数的确定,可以根据多次选择不同的因子书,然后观察Q的是否趋于稳定,且Qr/Qt2,且与Q理论的值较为接近[2,7]欢迎关注新浪微博:BNU-天元3.基本的操作过程3.1进行数据的预处理根据仪器给出的仪器检出限,换算成为为测试条件下的PMF输入所需要的MDL检出限。(可以根据附件中PMF运算.xls进行运算)MDL=仪器检出限*分析时待测溶液体积/(测量膜占总膜的比例*采样气体标况体积)再计算出不确定文件,并将文件整理成PMF需要的输入格式。3.2输入数据分析输入好文件后对输入数据进行分析。如下图,对于S/N2的数据设置成weak,如果有PM2.5等总体的变量需要点Totalvariable图2输入数据分析3.3运行模型输入因子数,因子数目要求大于2小于18。不断尝试合适的因子数,直到Q值稳定且与之前算出的Q理论值较为吻合。欢迎关注新浪微博:BNU-天元图3模型运行界面3.4查看运行结果(BaseModelResults)ResidualAnalysis图4残差分析界面对于residual超过3,-3的他会有所提示。对于较多参数超过这个范围的元素,可以在analysisinputdata步骤中将该元素设置为weak,比如本例中的Cu元素。O/PScatterplot以及O/Ptimeseries可以查看实际值与预测值是否有较好的吻合。Profiles/Contribs欢迎关注新浪微博:BNU-天元图5因子贡献及侧面图上面的图反映了某次运算某个因子各元素的贡献值以及质量浓度。G-spaceplot查看G-Spaceplot可以决定是否进行因子旋转。对于所有散点充满空间,且在xy轴都有相近的点的不需要或者可以轻微进行旋转。如下左图需要进行因子旋转。右图是选择Fpeak=-.2后的旋转结果。图6因子旋转FactorPieChart显示了各个因子对于某种物质的贡献率。3.5BootstrapModelResults和FpeakModelResultsBootstrapModelResults和FpeakModelResults都可以在ModelExecution进行。Bootstrap主要检验模型是否可靠,选择一个需要分析的Run,软件就会对这个Run的数据进行自助法分析。3.6模型的诊断[7]EPA-PMF模型的诊断技术包括以下三个方面(1)信号一噪声比率EPA-PM模型按照信噪比结果将每种化学成分按表4.7分成三类:好、欢迎关注新浪微博:BNU-天元弱和差。信噪比2的数据归类为好可以直接用于模型运算;信噪比在0.2~2之间的数据归类为弱在用于模型之前其不确定度要乘以3以降低权重,信噪比0.2的数据归类为差模型将不会把这种化学组分纳入计算。通过这种方法EPA-PMF模型可以实现异常数据的移除来进行非负限制(2)标准化的残差在-3和3之间:对于如果它的标准残差大于3或小于-3,则这个数据存在异常。如果第/个样品有较多的化学组分异常,那么这个样品将不纳入模型计算;反之,如果有较多样品的第/个化学成分存在异常,那么这种化学组分将不纳入模型计算。(3)物种的线性回归结果:相关系数R20.6;斜率(slope)~1;截距(intercept)~0;误差均方根(rootmeansquarederror)~0。PMF模型运行过程中因子数的选择要求大于2小于18当Qr/Qt2时表明拟合的结果可以接受4参考文献[1]检出限几种常见计算方法的分析和比较[J],李海峰.[2]中国特大城市气溶胶的理化特性_来源及其形成机制[D],徐昶.[3]张俊刚,王跃思,王珊,等.北京市大气中NMHC的来源特征研究[J].环境科学与技术,2009,32(5):35-39.[4]PandolfiM,Gonzalez-CastanedoY,AlastueyA,etal.SourceapportionmentofPM10andPM2.5atmultiplesitesinthestraitofGibraltarbyPMF:impactofshippingemissions[J].EnvironmentalScienceandPollutionResearch,2011,18(2):260-269.[5]GaoB,GuoH,WangXM,etal.Tracer-basedsourceapportionmentofpolycyclicaromatichydrocarbonsinPM2.5inGuangzhou,southernChina,usingpositivematrixfactorization(PMF)[J].EnvironmentalScienceandPollutionResearch,2013,20(4):2398-2409[6]曹雷.北京大气颗粒物的中子活化分析研究[D].中国原子能科学研究院,2002.[7]耿柠波.郑州市高新区大气颗粒物PM_(2.5)中金属元素分析及污染源解析[D].郑州大学,2012.[8]张养梅.京津冀地区亚微米气溶胶特征及其变化的观测分析研究[D].,2010.[9]PMFuser’sguide.由于时间、技术有限很多东西可能不是很完备,不免有所疏漏希望有不足的地方能够提出来大家共同改进,我的联系方式位于页脚处,欢迎一起讨论。
本文标题:PMFv3001
链接地址:https://www.777doc.com/doc-4371504 .html