您好,欢迎访问三七文档
实习5:蛋白质组学数据分析系统生物学平台浙江加州国际纳米技术研究院(ZCNI)邱庆崇刘杰李超刘振1.蛋白质组学质谱分析背景介绍2.蛋白质组学数据库检索软件GPM(X!tandem)3.蛋白质组学数据统计分析软件TPP课程内容:蛋白质组学质谱分析背景介绍TandemMS蛋白质组学质谱分析背景介绍m/z:质量电荷比蛋白质组学质谱分析背景介绍粘贴蛋白序列:PGYRNNVVNTMRLWSAKAPNDFNLKDFNVG选择“Onlythefollowingselectionofenzymesandchemicals”,并选择胰酶Trypsin酶切点击Perform蛋白质组学质谱分析背景介绍APNDFNLK肽段离子碎片示意图v1-lettercodeAveragemassAlanineA71.08ArginineR156.19AsparagineN114.10AsparticacidD115.09AsnorAspBCysteineC103.14GlutamicacidE129.12GlutamineQ128.13GluorGlnZGlycineG57.05HistidineH137.14IsoleucineI113.16LeucineL113.16LysineK128.17MethionineM131.19PhenylalanineF147.18ProlineP97.12SerineS87.08ThreonineT101.10SelenocysteineU150.03TryptophanW186.21TyrosineY163.18ValineV99.13蛋白质组学质谱分析背景介绍具体数值,对应后页中离子质量蛋白质组学质谱分析背景介绍蛋白质组学质谱分析背景介绍蛋白质组学质谱分析背景介绍???面对如此多的质谱谱图和理论图谱我们将如何进行比对目前人类已知蛋白大约有6万8千种平均每种蛋白长度为500个氨基酸平均每种蛋白可以胰切成50个肽段平均每个肽段有10种可能打碎情况每一种可能情况产生1张理论图谱平均一次质谱实验有3000次扫描每一次扫描产生1张质谱谱图蛋白质组学数据库检索软件GPM(X!tandem)蛋白质组学数据库检索软件GPM(X!tandem)SEQUESTMascot类型免费开源软件商业软件商业软件数据输入DTA,PKL,MGF,mzXML,mzDATARAW,DTAMGF,DTA速度快较慢较慢X!Tandem优点:•运算速度快•免费,并行集群计算成本低•开源可自行修改代码缺点:•应用范围尚不广泛•后期统计软件接口尚未成熟蛋白质组学数据库检索软件硬件要求:当前主流电脑配置即可胜任小规模数据检索SlavenodesMasternodeNetworkswitchingDownloadGPMCycloneXE:蛋白质组学数据库检索软件蛋白质组学数据库检索软件数据库、结果程序等核心内容运行程序质谱原始数据解压缩:蛋白质组学数据库检索软件输出结果目录数据库参数工作流程:1.将*.raw文件转变为*.mzXML文件(练习文件为肝癌蛋白质组学数据)2.编辑参数3.运行GPM中的X!Tandem4.查看结果5.使用自己的数据库蛋白质组学数据库检索软件1.将*.raw文件转变为*.mzXML文件开始运行输入“cmd”开启命令行窗口Download:编辑参数双击打开Onespectrum:搜索一个质谱数据Onedirectory:搜索多个质谱数据,放于一个文件夹中,然后压缩成一个rar文件谱Simple:仅简单的设置一级肽指纹图谱相关参数Advanced:设置搜索二级图谱所有参数Upload:查看以前的搜索!!点击advanced选择搜索二级质谱选择程序X!Tandem选择需要搜索的质谱数据DTA,PKL,MGF,mzData,mzXMLorTandemBIOML选择数据库数据检索输出阈值二级谱中片段离子理论与实际差异最大允许值一级谱中片段离子理论与实际差异最大允许值搜索的离子为b离子与y离子(|M-M0|/M0)X106(ppm)M为离子质量的实测值;M0为离子质量的理论值;氨基酸残基的修饰完全修饰潜在的修饰氧化,磷酸化等等快速搜索可能的修饰酶切位点;酶切非特异性3.运行程序点击运行运行界面4.查看结果结果可靠性的统计指标以及强度蛋白的覆盖率蛋白检索号对应肽断总数蛋白分子质量唯一对应肽断数将结果保存为excel查看检索参数,可保存为excel5.替换数据库下载蛋白数据库存放到fasta文件夹(所使用fasta数据库为所研究种属的蛋白数据库,可从下载得到)用记事本打开,编辑文件在GPM界面,数据库的下拉菜单中添加一个名为mydatabase的选项将新数据库的mydatabase.fasta.pro添加到GPM中,保存文件,重新选择数据库运行程序。参考文献:://thegpm.org/GPM/gpm_install_faq.html蛋白质组学数据统计分析软件Trans-ProteomicsPipeline(TPP)Trans-ProteomicPipeline(TPP)是用于LC/MS/MS蛋白质组学数据分析的软件.TPP包含一系列蛋白质鉴定和定量分析的模块,能够对经Sequest数据库搜索引擎得到的结果进行筛选过滤,从而达到蛋白质鉴定和测序的目的.蛋白质组学数据统计分析软件Trans-ProteomicPipeline蛋白质组学数据统计分析软件蛋白质组学数据统计分析软件sp|P02754|LACB_BOVINBETA-LACTOGLOBULINPRECURSOR(BETA-LG)(ALLERGENBOSD5)-Bostaurus(Bovine).MKCLLLALALTCGAQALIVTQTMKGLDIQKVAGTWYSLAMAASDISLLDAQSAPLRVYVEELKPTPEGDLEILLQKWENGECAQKKIIAEKTKIPAVFKIDALNENKLVLDTDYKKYLLFCMENSAEPEQSLACQCLVRTPEVDDEALEKFDKALKALPMHIRLSFNPTQLEEQCHITPEVDDEALEK:p=0.96PTPEGDLEILLQK:p=0.81LSFNPTQLEEQCHI:p=0.65P=1–(1-0.81)(1-0.96)(1-0.65)=0.99蛋白质组学数据统计分析软件TPP的安装与配置从上下载并安装windows版本TPP软件。TPP_Setup_v4.7.1.exe。安装过程中选择附带安装Apache(安装TPP4.2要求系统已安装ActivePerl-5.8.8.*以上版本,可从网站上下载)。安装完成后,将会生成TPP的图标安装完后,桌面上生成了TPP图标使用TPP点击桌面上的TPPWebTools,将会出现TPP的登陆界面.UserName:guestPassword:guestTPPWebInterface的欢迎界面样本数据分析准备工作:1.确保C盘至少1G的空闲的硬盘空间.2.将数据文件ZCNI_No1(含.dta和.out文件)至ZCNI_No6和质谱RAW文件ZCNI_No1.RAW至ZCNI_No6.RAW,以及Sequest参数文件sequest.param放到目录:C:\Inetpub\下3.将数据库文件ipi.HUMAN.fasta放到目录:C:\database中操作流程1.将质谱RAW文件转换成mzXML文件;2.以Sequest结果文件和参数文件转换成xml文件;3.运行PeptideProphet,得到pepXML文件;4.以上步得到的pepXML文件运行ProteinProphet,得到最终结果;1.将RAW转换成mzXML文件•点击AnalysisPipeline选择mzXL/mzMXL,在InputFileFormat中选择ThermoRaw,在SpecifyFiletoconverttomzXML中添加RAW文件选择目录ZCNI_training在ConversionOptions中选择Centroid,然后选择ConcerttomzMXLinsteadofmzML,最后点击ConverttomzML程序运行界面2.由.out文件整合成pepXML文件点击“AnalysisPipeline”,然后点击pepXML,出现如图所示的界面。选择需要转换成pepXML的.out文件夹提交sequest检索时所用参数文件选择所有文件夹选择sequest的参数文件其他参数选择默认,点击ConverttoPepXML,即可以将文件夹中的所有.out文件整合成pepXML文件程序运行界面3.运行PeptideProphet点击AnalysisPipeline,选择AnalyzePeptides选择所有需要运行PeptideProphet的pepXML文件选择RUNPeptideProphet,其他参数为默认.点击RUNXinteract,即可作PeptideProphet分析.PeptideProphet分析运行PeptideProphet的结果可通过IE打开.在IE中打开的PeptideProphet的结果在pickcolumns选项中选中xcorr、deltcan、sprank三个sequest的参数,选择UpdatePage4.运行ProteinProphet点击AnalysisPipeline,选择AnalyzeProteins点击,添加文件选择经PeptideProphet后生成的Interact.pep.xml文件•其他为默认,点击RunProteinProphet!其它参数为默认,点击RunProteinProphet,即可运行ProteinProphet程序运行ProteinProphet完成后生成的interact-prot.shtml文件可由IE打开.在IE中输入看到经ProteinProphet后的结果为:7.数据的过滤筛选和将结果保存成Excel文件在minprobability填上0.9,选择exportToexcel,然后点击Filter/Sort/DiscardCheckedentries,即可将结果过滤并生成Excel文件.过滤筛选后生成的excel文件蛋白可信度结果编号蛋白索引号唯一对应肽段数对应肽段总数肽段的氨基酸序列过滤筛选后生成的excel文件ThankYou!
本文标题:蛋白质组学数据分析
链接地址:https://www.777doc.com/doc-4662823 .html