您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 质谱数据定量分析方法
蛋白质学组中质谱数据定量分析方法研究谢红卫国防科学技术大学机电工程与自动化学院自动控制系2010.5.15主要内容研究背景(我们对定量问题的认识)定量数据分析面对的问题定量数据分析的基本方法已有定量软件和应用情况研究内容和结果定量信息提取方法及问题多批次定量数据的对应及重复实验差异显著性检验计算问题和软件开发未来工作第一部分:研究背景定量数据分析面对的问题大规模Biomarker发现---低丰度蛋白质---信号S/N低+鉴定信息少重复实验数据综合蛋白质和肽段预分离技术策略的数据综合Biomarker验证---靶标分析---靶标挑选(MRM)肽段分析效率预测(绝对定量)生物样本蛋白质表达的随机变化影响临床诊断---直接寻找差异---肽段组学,肽段特征矩阵,LC-MS策略,信号直接对比+有选择鉴定定量数据分析的基本方法不包括MRM、iTRAQ和SC定量标记定量无标定量计算问题图谱定量信息提取---同位素峰簇处理肽段定量指标计算---比值计算,XIC处理,母离子误差校正RT对齐---LC-MS策略和LC-MS/MS策略的不同信号归一化---消除系统误差差异显著性检验---考虑信号强度影响质谱信号与定量无标记:同位素峰标记:配对的同位素峰图谱定量信息提取方法基本方法最大值法,平滑积分法,信号求和,构建3Dpeaks(MaxQuant),函数拟合附加处理小波去噪,同位素分布约束,信噪比过滤结果形式标记定量:比值,定量指标无标定量:定量指标肽段定量指标计算可选步骤去噪处理:小波,平滑滤波XIC峰形拟合:复杂的类高斯函数XIC边界确定:信噪比,连续性,局部最小值母离子匹配误差分布:提高精度?标记定量:比值计算,MaxQuant采用了最小二乘拟合法问题:不同试剂标记的肽段XIC平移,差异越大,表现越明显无标记定量:定量指标计算RT对齐LC-MS策略:寻找共同的肽段信号,建立非线性模型LC-MS/MS策略:利用共同鉴定肽段的RT建立对齐模型对齐模型:3次样条,局部回归,小波,分段线性,偏移向量等作用:对LC-MS/MS策略,可以弥补鉴定信息的不足,提高MS图谱信号利用率信号归一化和差异显著性检验信号归一化目的:针对无标记定量,消除不同实验间的系统误差基本方法:寻找不变量差异显著性检验从肽段到蛋白质的信息综合:平均?筛选?异方差问题:信号越弱,误差分布越宽一个例子XIC定量信息:TGVIVGEDVHNLFTYAK图谱计数SCXIC面积SA(对数)保留时间RT上样量(ug/ul)1268.5453.6616173.0707.5658.1350220.335.1559.1996300.0345.8957.6437970.003AVG_ISO_DISSCCHXCorr∆CnLM(ug/ul)12625.10.623.01432.630.333.07025.580.470.3432.80.400.3324.90.490.03424.30.720.003132.20.340.003鉴定信息数据产生LTQ/FT分析Yeast样品,SEQUEST搜库,Target-decoy过滤(FDR=0.01),取Scannumber最小的记录定量软件Cencus、CRAWDAD、MaxQuant软件在可视化、速度、数据文件格式支持、算法精度和实验策略支持等方面有很大发展空间定量软件-Mascot支持的定量类型多种标记定量,MS/MS图谱定量,emPAI,重复实验Labelfree,选择信号最强的3个肽段数据处理算法特色基于m/z和RT的对齐,多种XIC积分方法,多参数鉴定结果过滤,outliers排除,归一化处理(利用均值)使用方法在搜库前定义修饰和定量的参数(通过修改XML文件实现),搜库,然后使用Distiller定量第二部分:研究内容和结果定量信息的提取:Labelfree去噪方法不去噪Xcalibur默认小波去噪谱峰定量信息最大值平滑积分函数拟合信号加和同位素峰单一最高全部XIC处理小波去噪平滑去噪连续性截断误差分析XIC定量平滑积分函数拟合信号加和XXX图谱水平肽段水平X共3*4*3*4*3=432种计算流程比较原则:重复实验的CV值最小目前结论:(1)不进行去噪处理的信号加和方法最优(2)高信号水平的处理结果CV值都比较小定量信息提取:标记定量图谱水平:非线性拟合算法10,98,76,54,32,1,,,,,***424221422121iiiiiTKTKTKTKTKTCTKTCTCIiiiiiiiiiiiiiii1012iif10102iiiCCf1011102iiiKKf0210122iiiKKf特点可定义一般模式,支持自定义标记方法,支持多重标记能够充分利用同位素分布信息能够直接解决谱峰叠加问题定量信息提取:标记定量肽段水平实现了多种算法:XIC面积比,图谱比值平均,主成分分析,最小二乘回归采用了异常值排除策略实现了基于XIC连续性的截断单一同位素峰最高问题:同位素峰分布测量误差6~1],[/][][][61iiIsoDisiIsoDisiExpIsoiExpIsoERRii-1-0.500.511.522.533.540.20.40.60.811.21.41.61.8DataDensityIso1Iso2Iso3Iso4Iso5Iso6第二同位素峰最高第三同位素峰最高第四同位素峰最高数据:FT_yeast,BPRC,高可信鉴定肽段问题:从质量预测同位素分布经验公式:从IPI.Human3.49酶切肽段中统计(胰酶,2个漏切,肽段长度不超过100)!)()(iebxaxfiibxaiiiixbxeaxf000)(5,4,3,2,1iaibi1.0070.00057920.0006321-0.092120.00056830.022920.00055260.096750.0005680.11380.00057950.1215Bellew,M.,M.Coram,etal.,Bioinformatics,2006.22(15):.重复实验的数据处理RT对齐和交叉搜索P1P2Pn…√XX√√√MS搜索MS搜索信息的充分利用不可逆:需要建立2/)1(2nnCn个RT对齐模型可逆:需要建立n-1个模型工作:实现了基于局部回归(采用线性函数)的可逆模型和算法,大大减小了计算量交叉搜索的效果鉴定次数12345678910020040060080010001200140010987654321定量次数重复实验的数据处理---信息融合问题:一个肽段,多个定量结果,怎样给出最终结果?方法:信号归一化后,求平均值、中值或者最大值结果:对简单重复来说,分组平均后组间差异更小,例如10次重复,分为两组,求5次平均。数据:FT_yeast,BPRC标记定量中比值分布--信号强度H/D(3)标记实验中发现,比值的标准差随着XIC中peaknumber的增大而减小数据:FT,人血浆,BPRC无标记定量中差异分布分段估计方差带有参数的分布模型极大似然估计—直接优化似然函数初始值的选择决定成败baeeyfiiyiybaeiiˆ2)(2)ˆ,(2ˆ2niiniiiniiinyfL11221ln)2ln(2)(21)ˆ,(ln标记定量软件SILVERC++语言GUI交互操作批量数据处理文件格式支持:XML,Mascotdat和html多线程,图谱、XIC导出,多种输出格式,算法优化索引文件和速度提升索引文件和数据结构Scannumber到MS图谱索引:Hash表图谱中Isotopicpeaks定位:二分法查找无标记定量软件LFQuant重复实验支持定量精度和参数优化速度:1s可以定量1000个肽段支持pepXML,protXML,mzXML,mzData,mzML蛋白质组装和未鉴定肽段搜索RT对齐、信号归一化从搜库(SEQUEST)到定量完成的全流程自动化,有GUI界面LC-MS策略支持软件XICFinder不需要鉴定信息,直接从MS图谱中解析同位素峰簇考虑了XIC截断,同位素峰叠加,母离子误差校正等问题提供了信噪比、同位素分布拟合优度等过滤测试:发现采用严格过滤规则,则鉴定肽段也可能不能定量,说明和LC-MS/MS策略可以相互补充第三部分:进一步的思考预分离和信号归一化SDS分离蛋白质多条带分布条带切割的不均匀性不同实验之间信号不可比1D-SDSPAGE和Labelfree定量蛋白质的多条带分布问题没有提及多条带分布的原因:修饰、误切、可变剪接信号归一化“局部效应”仅仅考虑了信号强度因素RPLC和ESI过程中的离子抑制效应和Matrixeffect:信号的局部归一化寻找RT轴上的校正曲线:不变量可能方法仪器加性电子噪声的不变性图谱信号统计不变量小波去噪蛋白质组装与定量Quant:MSIDscore:MS/MSPCP:sequenceQuant:MSPCP:sequence影响图谱质量,从而影响IDScore决定碎裂模式,影响IDscore蛋白质肽段RPLC分离过程中肽段之间相互影响色谱流出曲线与肽段混合物有关MSresponse不仅仅由肽段自身属性决定,还与其它混合在一起的肽段相关肽段检测效率预测问题贝叶斯网络蛋白质肽段肽段肽段酶切模型MS图谱(多张,组成XIC)MS/MS图谱(多张,重复鉴定)母离子误差分布同位素分布匹配XIC形状定量指标序列物理化学属性碎裂模式图谱质量搜库打分重复鉴定次数共享肽段问题:肽段有多个父节点感谢北京蛋白质组研究中心-贺福初,钱小红,朱云平研究员北京蛋白质组研究中心-刘科辉博士,马洁博士团队主要成员:博士---张纪阳,刘伟博士生---孙汉昌,徐长明,张伟,刘辉,唐海琳,王腾蛟硕士生---马海滨谢谢大家!
本文标题:质谱数据定量分析方法
链接地址:https://www.777doc.com/doc-1371638 .html