您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 功能和信号通路方法学说明(中文版)
功能与信号通路方法学说明GCBI版权所有1功能与信号通路方法学说明一、基因功能的显著性分析GO-Analysis是对基因进行显著性功能(GO)的分析。由于GO的条目中包含功能的层级关系,从而GO中包含基因的数目变化较大,通常在一到几百个基因之间。GCBI的功能分析主要采用Fisher精确检验,即利用如下的四格表:差异基因非差异基因总计:落在GO中fnfnnn不落在GO中ffnN)()(ffnnNNnN总计:fNfNNNfn:表示差异基因在GO中的数目;fN:表示差异基因的数目; :表示GO中含有基因的总数目; :表示注释系统中基因的总数目。在给定的边际频率(即GO中基因数目确定)时,四格表中元素服从超几何分布,从而得到Fisher精确检验的p值,即通过求解双尾的累积超几何分布值得到Fisher精确检验的p值,对于2 ≤ ,p值计算公式如下: , , , =2∗ ≤ =2∗∑ .为了控制多重比较检验中犯第一类错误的整体概率,我们通过Benjamini-Hochbergstep-up的方法(详细讨论见文献[1])来控制FDR(判断为显著性的GO中假阳性GO的比例的期望),从而得到具有显著统计学意义的功能。另外,我们通过富集得分(EnrichmentScore)来评估单个功能中基因的富集程度,计算方法如下: = ⁄ ⁄.功能与信号通路方法学说明GCBI版权所有2参考文献:[1]Y.Benjamini,Y.Hochberg(1995).Controllingthefalsediscoveryrate:apracticalandpowerfulapproachtomultipletesting.JournaloftheRoyalStatisticalSociety,SeriesB57(1):289–300.功能与信号通路方法学说明GCBI版权所有3二、Pathway的显著性分析——Pathway-AnalysisPathway-Analysis是对基因参与的所有pathway进行显著性pathway的分析,由于信号通路体现了整个细胞生化过程如代谢、信号传递、细胞周期以及膜运转等信息,从而pathway中包含基因的总数目通常在几百个左右。GCBI主要基于Fisher精确检验进行显著性pathway判断,利用如下的四格表:差异基因非差异基因总计:落在pathway中fnfnnn不落在pathway中ffnN)()(ffnnNNnN总计:fNfNNNfn:表示差异基因在pathway中的数目;fN:表示差异基因的数目; :表示pathway中含有基因的总数目; :表示芯片上检测出来基因的总数目。Fisher精确检验的原假设:0H:1p=2p,备择假设1H:1p2p,其中1p:表示差异基因落在pathway中的概率,2p:表示非差异基因不落在pathway中的概率。在给定的边际频率(即pathway中基因数目确定)时,四格表中元素服从超几何分布,从而得到Fisher精确检验的p值,即通过求解双尾的累积超几何分布值得到Fisher精确检验的p值,对于2 ≤ ,p值计算公式如下: , , , =2∗ ≤ =2∗∑ .为了控制多重比较检验(即对多个pathway的进行显著性判断)中犯第一类错误的整体概率,我们通过Benjamini-Hochbergstep-up的方法(详细讨论见文献[1])来控制FDR(判断为显著性的pathway中假阳性pathway的比例的期望),从而得到具有显著统计学意义的信号通路。另外,我们通过富集得分(EnrichmentScore)来评估单个信号通路中基因的富集程度,计算方法如下:功能与信号通路方法学说明GCBI版权所有4 = ⁄ ⁄.参考文献:[1]Y.Benjamini,Y.Hochberg(1995).Controllingthefalsediscoveryrate:apracticalandpowerfulapproachtomultipletesting.JournaloftheRoyalStatisticalSociety,SeriesB57(1):289–300.GCBI版权所有,GCBI保留一切权利。未经GCBI书面授权许可,任何单位或者个人不得擅自将本文档复制、拷贝、出租、刻录在CDR上,转移、反编译、修改、保存在公共信息系统(如Internet、BBS),更改为他国语言版本,或者任何其它违反著作权法和国际著作权公约的事宜。Copyright©2014-2015GCBI.Allrightsreserved.
本文标题:功能和信号通路方法学说明(中文版)
链接地址:https://www.777doc.com/doc-4736071 .html