您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 生物信息学复习纲要_20131212
生物信息学复习纲要:1.序列的采集和存储主要有哪些核酸数据库,蛋白数据库,它们的主要特点及相互间的差异。2.序列分析1.Identity,Similarity和homology的概念的异同2.结构比对的方法:点阵法,动态规划算法3.全局比对(Needleman-Wunch)和局部比对(Smith-Waterman)以及end-gapfree算法内容,时间复杂度以及应用范围重点:会用动态规划算法填充序列比对的矩阵3.多序列比对1如何用动态规划算法进行多序列比对,时间复杂度如何?2星号比对的具体算法如何?是否可以达到最优比对?4.进化和系统发生树1.分子进化的几个证据2.生物钟理论是什么?3.什么是直系同源(ortholog),旁系同源(paralog)4.什么是进化分支图和进化树/系统发生树,它们有什么区别(注意:系统发生树为二叉树)5.有根树,无根树,外围群(概念以及如何辨别)6.构建系统发生树的方法:最大简约法,距离法以及极大似然法,需要掌握最大简约法,以及距离法中的FM法,NJ法和UPGMA的具体算法。我们观察到的进化距离是否与实际的进化距离一致5.马尔可夫模型1.马尔可夫性的定义2.PAM矩阵中PAM的含义3.如何构建一个PAM矩阵(需要掌握字符替代矩阵Aij,突变概率矩阵Mij和打分矩阵Sij)注意:字符替代矩阵为沿对角线对称的矩阵,且矩阵中所有元素的和为1突变概率矩阵对应马尔可夫模型中的概率转移矩阵,它沿对角线不对称,每一行的元素之和为1。Mij×qi=Aij,其中qi为氨基酸i的频率。Sij=Aij/qiqj=Mij/qj4.隐马尔可夫模型HMM的基本要素5.HMM的模型解决的三类问题是什么6.给定一个HMM,会计算一个观察序列出现的概率,学会用动态规划算法(Viterbi)计算给定序列对应的隐含序列7.会构建多序列比对的HMM(只要求会构建HMM的状态转换图)。6.BLOSUM矩阵和BLAST算法1BLOSUM矩阵中BLOSUM的含义2BLOSUM矩阵的构建方法3打分矩阵PAM和BLOSUM的熵H的计算公式4Blast算法的基本过程(seedingandextension)7.深度测序1.掌握Illumina和ion-torrent两种测序仪的基本原理2.掌握一代,二代和三代测序仪主要有哪些特点和不同3.什么是Fastq格式的文件8.蛋白质结构预测1.什么是结构基因组计划2.蛋白质结构分类的数据库CATH和SCOP3.什么是α,β,α+β和α/β结构4.什么是PDB文件5.蛋白质中主要有哪些相互作用,维持二级结构的主要是氢键相互作用,维持三级结构的主要是疏水相互作用6.蛋白质的结构比对中RMSD的含义(用公式来表达)其中δi为两个相对应原子间的距离7.蛋白质结构预测的三种途径:HomologyModeling,Foldrecognition和AbinitoPrediction分别是什么意思9.RNA的生物信息学1.RNA的二级结构有哪些?会通过点阵图(2DDotPlot)判断对应哪种二级结构2.什么是miRNA,它的生理学功能和作用机制是什么?3.预测miRNA的靶基因主要要考虑哪两个因素?(1.碱基的互补配对,2.靶基因上被miRNA识别区域在物种间的保守性)4.参考书《生物信息学》清华大学许忠能生物信息课件北大生物信息公开课丹麦科技大学分子进化学
本文标题:生物信息学复习纲要_20131212
链接地址:https://www.777doc.com/doc-2199591 .html