您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > DNA序列分析中的马尔科夫模型与隐马尔科夫模型
7.91/7.36/BE.490第四讲2004.3.4马尔柯夫及隐马尔柯夫模型DNA序列分析ChrisBurge课程结构课时主题模型结构相关加权矩阵模型完全独立隐马尔柯夫模型局部相关能量模型,共变模型非局部相关DNA的马尔柯夫及隐马尔柯夫模型剪接位点的马尔柯夫模型隐马尔柯夫模型——在头巾下观看威特比(Viterbi)演算法真实世界中的隐马尔柯夫模型DNA基序构建及发现简介剪接位点的加权矩阵模型(WMMs)模体(motif)代表的信息模体的寻找或发现问题吉布斯采样法模体构建——加权矩阵之上DNA、RNA基序包含的信息信息熵(shannonentropy)信息/位置随机序列中每2m个碱基将产生一个包含m比特信息的模体变量对发现基序的影响L=序列平均长度N=序列编码I=模体包含的信息W=模体宽度怎样识别5’ssRNA热力学I螺旋构型自由能来自于:碱基配对:碱基堆积:DougTurner’s能量规则:RNA热力学很多连续碱基对-好内部环-坏终端碱基对不稳定-坏总的来说,A比B、C更稳定5’ss序列中的条件频率5’ss在+5处含有G5’ss在+5处没有G数据来源:Burge,1998,分子生物学中的计算方法哪一种模型能够表现位置之间的相互关系?马尔柯夫模型专业术语随机变量(RV):可以假定为任意一系列的值,其中每一个值都有一定的出现可能性例如:X=一个骰子滚动的结果两个骰子的过程:X1,X2,X3……连续骰子滚动随机过程:随意过程或是随机变量的序列什么是马尔柯夫模型(aka马尔柯夫链)?传统定义离散地随机过程X1,X2,X3……它拥有马尔柯夫性质:换句话来说就是:它是一个随机过程,具有将来(下一个状态)有条件地与过去存在(现在状态)相互独立的性质。Markov–俄罗斯数学家,ca.1922不同类的一阶马尔柯夫模型马尔柯夫模型的估计参数更长排列相关是什么?——k顺序马尔柯夫模型k顺序马尔柯夫模型大约有4k+1个参数或位置不同类同类人类5’ss序列的加权矩阵模型(WMM)与马尔柯夫一阶模型比较剪接模型I5’剪接点3’剪接点分枝位点剪接模型Ⅱ5‘剪接位点多嘧啶3’剪接位点分枝点序列过渡联合体联合体交叉内含子外显子定义联合体剪接体前体联合体剪接体关于人类Pre-mRNA剪接的一个新近模型ESEs是一些短模体,它提高了在所有构建和选择剪接外显子中邻近剪接位点的识别能力—精确序列需求不能很好地表现。SR=SR蛋白质家族剪接因子成员ESE=外显剪接增强子交叉外显交叉外显交叉内含隐马尔柯夫模型akaHMMs马尔柯夫模型序列比对序列比对的隐马尔柯夫模型配对状态序列比对插入状态删除状态转换可能性马尔柯夫和隐马尔柯夫模型CpG岛CpG岛隐马尔柯夫模型CpG岛隐马尔柯夫模型ⅡCpG岛隐马尔柯夫模型Ⅲ想推断观测但是HMM写在其它方向(依靠隐藏才可见)从可见的推断隐藏部分(贝叶斯法则)条件prob:P(A|B)=P(A,B)/P(B)计算稍微有点困难注意:即因此可将视为常数寻找最佳“分列”(viterbi算法)寻找隐藏状态的顺序连接概率最佳化:解决方案:定义序列最佳”分列“Ri(h)=在以状态h结束情况下,子序列1…i最佳分列的概率递归解答,例如:根据R1(h)确定R2(h)。Viterbi算法“格架”图表序列中的位置层藏隐长度为L的序列k层隐马尔柯夫模型运行时间HMMs的发展有用的HMMs的发展
本文标题:DNA序列分析中的马尔科夫模型与隐马尔科夫模型
链接地址:https://www.777doc.com/doc-3339679 .html