您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 生物信息学生物网络介绍_SW-20130310
生物网络介绍宋伟目录分类方法分析一、二、三、分类芯片数据二代测序数据差异表达基因GOpathway生物网络PPI网络转录调控网络miRNA靶基因网络小分子数据1.蛋白质与蛋白质相互作用网络(PPI)原理:单个的蛋白质往往不会独自发挥作用,它们可能通过与别的对象互作,共同作用下才能发挥调节作用。方法:a.STRING:一个PPIweb-service,可以通过输入目的基因名称,得到蛋白质互作网络。b.数据库收集:收集人类的蛋白质相互作用网络数据,我们从mint,hprd,grid这3个数据库中整理蛋白质相互作用数据。利用perl将含有目的基因名称的关系对找出,然后cytoscape作图。结果:a.得到PPI网络图b.得到HUB蛋白c.互作网络模块GO、pathway功能富集分析1.蛋白质与蛋白质相互作用网络(PPI)String:KnownandPredictedProtein-ProteinInteractions网络图Hub蛋白的筛选:从已经得到的生物学网络可知,绝大部分生物学网络都服从scale-free(无尺度)网络的属性,即网络中的少数节点具有大量的连接,大部分节点都只有很少的连接,这些少数节点是网络关键性节点(hub)。对得到的相互作用网络进行节点分析,利用互作蛋白网络的无尺度性质,找到网络中的中心蛋白质(hub蛋白)PPI网络图PPI网络模块分析方法:1.String工具;2.Cytoscape插件ClusterONE。2.GENEONTOLOGYANALYSISGO富集分析GO(geneontology)是基因及基因产物的功能分类体系,它从三个方面:生物过程(BiologicalProcess)、分子功能(MolecularFunction)、细胞组分(CellularComponent)来描述基因、基因产物的特性。常用的对基因进行GO分析的软件、工具如下:a.DAVIDb.Gene2goc.Webgestaltd.GeneInfoVize.GeneCodisf.FuncAssociateg.BiNGOh.GOEAST输出GO功能分析结果选择参数阀值物种Pvalue0.05输入差异表达基因选择分析工具GO分析结果展示重点介绍富集基因个数最多的前几个GO,通过引用已实验证明了的该GOterm与疾病有关(参考文献),阐述疾病的发病机理GO分析结果展示CategoryTermdescriptionCountPValueGOTERM_BPGO:0008219celldeath40.001981GOTERM_BPGO:0016265death40.002118GOTERM_CCGO:0005856cytoskeleton50.002456GOTERM_CCGO:0044430cytoskeletalpart40.00865GOTERM_BPGO:0007010cytoskeletonorganization30.017652GOTERM_BPGO:0006915apoptosis30.022067GOTERM_BPGO:0012501programmedcelldeath30.022955GOTERM_CCGO:0043232intracellularnon-membrane-boundedorganelle50.029423GOTERM_CCGO:0043228non-membrane-boundedorganelle50.029423选择阀值:Pvalue0.05且Count2。3.PATHWAYANALYSISPathway是值生物代谢通路,我们最常用的pathway数据都为KEGGpathway数据。常用的基因pathway富集分析工具有a.DAVIDb.Onto-Tool:Pathway-Expressc.Webgestaltd.KEGG数据库选择阀值PATHWAY分析结果展示Thyroidcancer3%Regulationofautophagy3%Tyrosinemetabolism4%IntestinalimmunenetworkforIgAproduction4%Acutemyeloidleukemia4%Melanoma5%ECM-receptorinteraction5%Hypertrophiccardiomyopathy(HCM)5%Hematopoieticcelllineage5%ErbBsignalingpathway6%Leukocytetransendothelialmigration7%Axonguidance9%Celladhesionmolecules(CAMs)9%Regulationofactincytoskeleton13%Pathwaysincancer18%PATHWAY分析结果展示PATHWAY分析结果展示4.转录调控网络分析原理:一个转录因子可以调控多个靶基因,一个靶基因可以被多个转录因子所调控,故此形成网络。方法:a.人类:在TRANSFAC数据库和TRED数据库中获得调控关系原始数据,计算在两个数据库中都出现的调控关系对。b.拟南芥:AGRIS数据库。结果:a.调控网络b.调控模块GO、pathway功能富集分析转录调控网络图模块以及调控它们的转录因子。黄色的代表转录因子,绿色的代表靶基因预测工具1.miRBase2.TargetScan3.mirTarget24.TarBase5.PicTar6.miRanda7.miRecords8.DIANAMicroTest9.…5.miRNA与靶基因调控关系输出miRNA与靶基因关系对筛选同时存在于3个或4个预测结果的关系对输入miRNAgene工具选择在预测时可以选择6个或者8个miRNA预测工具miRfamilydifferentialexpressedtargetsmiR-590-3pODZ2RIMS1FGF7ZNF407SMOC2MYOM3DACT1NDST3SGIP1INATGFAIGF1TRIB2VCAM1ANK3LHX9TSPAN2miR-1821SLC43A2MEF2DSAMD12UNC13AEPHA3SOX6ADCY2EFNB2GDF6SORT1NDST3LDB3ABCD1ANK3COL4A4miR-340-5pPCSK6F3TMEM35HIPK3HS3ST3B1C18orf1SAMD12IGF1TBX5HERC3NOGEPHA3FAM84BPDE4BTMEM132DKRT6ATMEM201POSTNSORT1MLL2LDB3HAPLN1SGIP1FGF7EFNB2miR-124C18orf1NXNGRIN3AFURINSLITRK2DACT1PEG3ACHERYR2PCSK6PDE4BTSPAN15CDH2ABCD1COL4A1KANK4PMEPA1PABPC4LEPHA3SAMD12FAM135BPCDH9HIPK3miR-30HERC3MEF2DFOXD1C3orf64DACT1MLL2PLCB4MXRA5SATB2IGF1TSPAN2SLC7A10DAGLAFRZBPITX1RIMS1ADRA2AmiR-20ab/20b-5pGLDNFRZBSCRT2FURINSLITRK2LYPD6MAPRE3GABBR2SAMD12SMOC2TRIM3RHOF3COL4A1SIPA1L3EFNB2MINK1miR-19abMINK1EFNB2POSTNPMEPA1FZD6MEF2DTHBS1HIPK3PITX1SMOC2SLC24A3IGF1C3orf64ALPK2SOX6UNC13AZPLD1F3FURINmiRNA与靶基因调控关系MIRNA结果分析结果中的十个miRNA,有6个已经被实验验证其与某疾病相关(参考文献)。而对miRNA中剩余的4个未被实验证实的miRNA,我们利用DAVID软件对其调控的差异表达靶基因分别进行GO功能富集分析来考量它们与疾病的相关性。miR-590的差异表达靶基因主要富集在细胞增殖、分化、创伤治愈、组织再生等。miR-340的差异表达靶基因主要富集在凋亡、细胞程序性死亡、细胞增殖、骨骼系统发育等。miR-182的差异表达靶基因主要富集在骨系统发育、骨发育、软骨发育、骨形成等。miR-30的差异表达靶基因主要富集在骨发育、细胞移动、肌肉器官发育、肌细胞分化等。从富集结果可以看出,虽然这4个miRNA还未报道和骨关节炎相关,但其所靶向的基因都是和骨关节炎相关的,所以这几个miRNA均非常可能是重要的调节因子6常用软件工具介绍Cytoscape是一款图形化显示网络并进行分析和编辑的软件,它支持多种网络描述格式,也可以用以Tab制表符分隔的文本文档或MicrosoftExcel文件作为输入,或者利用软件本身的编辑器模块直接构建网络。它还包括许多常用的插件,例如ClusterONE,BiNGO等等,可以直接根据网络进行分析,得到目的结果。PerlPerl是一种能完成任务的语言,它可以很容易操作数字,文本,文件和目录,计算机和网络,特别是程序的语言。我们可以利用perl进行一些实用的数据处理,例如高通量数据的转换、提取、计算等处理,还可以抓取网络数据中的内容,已达到目的要求。另外,还有一些常用的perl包和模块,可以对数据进行直接分析。RR是用于统计分析、绘图的语言和操作环境。R语言有很多的package(包),例如我们常用的limma、VennDiagram、RankPord等等。谢谢观看
本文标题:生物信息学生物网络介绍_SW-20130310
链接地址:https://www.777doc.com/doc-3807107 .html