您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 生物信息学试题复习参考(张弓)
2014-2015学年生物信息学期末考试题写在前面:这是我考试时候写的答案的大致内容,具体文字我已经不记得了,给大家一个参考,希望对大家复习有帮助。因为我也是扣了很多分,所以答案也有很多错的,大家不要尽信。祝大家考试顺利。一、实验设计和基础分析以下qPT-PCR实验方案有哪些错误?请标出错误,并说明原因和写出正确方案。目的:比较肺癌细胞迁移前后的X基因转录水平表达量方法:(1)用Trizol法提取细胞总RNA,并用跑胶、OD260/280等方法确认无降解。(2)用poly-dT引物进行反转录(3)设计基因特异性PCR引物,用qPCR仪测定X基因和GAPDH基因的Ct值。GAPDH作为内参。(4)以2^-ΔΔCt方法计算X基因相对于GAPDH的相对含量(5)比较迁移前后的相对表达量,做三个重复,用t-test进行统计检验,P0.05为差异显著1.错误:不能用GAPDH基因作为定量标准;原因:癌症迁移前后GAPDH基因的表达量已经改变了,做定量标准不准确;方案:采用外参(如:其他物种的基因)2.错误:不能用t-test进行统计检验;原因:t-test进行统计检验的前提是数据呈正态分布,基因表达量不一定呈正太分布;方案:将数据取log10,对数化。上述两个是我考试时候写的答案,后来经提醒:还发现了一个错误:不能用poly-dT引物进行反转录;原因:。。。。。。;方案:用Oligodt进行逆转录。二、双序列比对的生物学意义解释两种细菌的同源蛋白质endonucleaseIII,长度都为200氨基酸左右,其功能相同,蛋白质序列使用BLAST可以比对上,同源性高达57%,但其编码DNA序列用BLAST却无法比对上,为了尽可能提高亲缘关系较远的序列的比对效率,比对已经使用BLAST网站上Somewhatsimilarsequence选项,默认参数(见下图):(1)请从BLAST的算法原理出发,解释为什么会出现这种情况。(2)为了能研究这两个蛋白质其DNA基因序列之间的差异,以研究其进化过程,必须对DNA序列进行比对。可以使用什么算法?为什么这种算法能过规避上述BLAST的问题?请从算法原理回答。(3)若一定要使用BLAST算法进行DNA序列比对,为了能够得到比对结果,需要调节什么参数?你估计要设置在多少?有什么副作用?(4)【选做题+10分】为何这两个物种的这个同源基因,DNA序列差异很大,但编码出的蛋白质氨基酸序列却高度相似?这说明在进化中哪种保守选择力对同源基因的变异进行了选择?答(1)blast基于seed-base算法原理,要随机取得seed完美匹配才可以找到相似序列,如果发生错配则没有办法找到序列(2)可采用动态规划算法中的s-w算法。因为这种算法比较精确,能找到局部相似的序列。(3)调节wordsize,改为7,后果是会找到更多不相关的序列(4)因为保留的突变多数是同义突变;保守选择力是氨酰tRNA合成酶,同一物种中氨酰tRNA合成酶保守性比较高,当基因发生突变时候,只有同义突变被翻译成蛋白质的机会大一点,所以最终被保留下来。三、大规模测序策略设计【微生物学、生物医药、遗传学专业】临床耐药菌已经成为人类健康的巨大威胁,随着新抗生素的研制越来越成熟,细菌耐药性的迅速产生已将医生逼到了无药可用的地步,超过90%的耐药菌案例中,分离出的临床耐药菌中并无质粒,或者存在质粒但质粒编码的基因并无耐药作用。因此,推测细菌耐药性很可能存在于基因组的突变中。现在分离了40株耐药的金黄色葡萄球菌,均确认无质粒或质粒无耐药作用因此拟对其全基因组进行分析,希望能找到耐药的可能原因。某测序公司对此给出了如下的方案:对40株耐药菌的全基因组进行Illumina大规模测序,用IlluminaHiSeq-2500测序仪对每个基因组测2G数据量,测序设定为2*125nt,预期有效测序深度500x,由于与其临床耐药菌与标准菌株的基因组差异较大,因此采用Velvet算法进行拼接,然后进行BLAST2GO自动功能注释。通过将拼接出的contigs与标准菌株基因进行比对,可找出突变,进而统计出可能耐药相关的基因和突变。这一测序和分析策略是否有问题?你能否提出更好的方案?为什么你的方案更好?【水生生物学、海洋生物与生物技术专业】水体富营养化极易造成赤潮爆发,传统研究只关注某种条件下的一种优势菌株,但近年来的研究发现在真实赤潮环境中优势菌株并不单一。例如2002年在东海地区发生的赤潮。赤潮开始时的优势菌种有两种:东海原甲藻和塔玛亚历山大藻(均属甲藻),然而后期则发生了种族演变东海原甲藻仍然维持很高的生物量,但塔玛亚历山大藻则被肋骨条藻和红色中缢虫所取代。以上所述几种藻类,其基因组均未测序过,一般藻类的单倍体基因组约为100Mb左右,然而流式细胞染色结果指出,东海原甲藻的单倍体基因组估计为2.2Gb左右,要想测定这些藻类的全基因组所需的经费实在太高,并不现实。然而甲藻属于间核生物,兼具原核生物和真核生物的特点。现要用测序技术来研究藻种演替过程中究竟是什么生物的哪些基因发生了改变,为何东海原甲藻能一直维持很高的生物量,而塔玛亚历山大藻却在后期消亡。请设计测序和分析策略,并简要说明每一步骤为什么这么做(例如为什么选这个测序仪而不选另一种)分析其可行性和效率比。【生科院其他专业】抑郁症已成为现代人类日益严重的健康威胁,现已知神经元细胞突触上的一种膜蛋白5-HT1A(5-羟色胺1A受体)与抑郁症非常相关。5-HT1A可被5-HT(5-羟色胺)结合,通过G蛋白偶联信号转导通路行使功能。5-HT的减少使该信号通路受到抑制,最终导致抑郁症。某新型抗抑郁症的药物被设计成可以与5-HT1A特异性结合,持续激活该信号通路,从而达到抗抑郁的效果,然而,该药物在欧美白种人中抗抑郁的效果很好,但在中国的临床试验中发现大部分病人治疗效果很差。Westernblot发现白种人和黄种人神经元中5-HT1A蛋白质含量无显著差异。目前的dbSNP(单碱基多形性数据库)中,只有关于5-HT1A的两个SNP纪录,一个位于3`-UTR,一个位于编码区中,是同义突变,请提出一个假说,解释这个药物为何对中国人效果很差,并设计一个实验策略来验证你的假说。答:假说:由于位于编码区的同义突变导致蛋白质的三级结构改变,药物不能特异结合上去。实验方案:区中国人抑郁症患者神经细胞,设置三组组一:不做处理,对照组组二:通过点突变进行回复突变,将细胞的DNA变成和欧美患者的DNA信息一样组三:取欧美患者的神经细胞,进行点突变,将位于编码区的的SNP位点突变成和中国患者一样分别对三组细胞进行相同条件培养,并给予药物处理,然后检测下游信号通路的相关信号的表达量。还可以对不同人种患者的细胞的膜蛋白5-HT1A,用核磁共振的方法测定结构域。四、大规模测序数据分析一些中药在肿瘤治疗上有着相当好的效果,但由于中药成分复杂,寻找其有效成分和作用机制一直是一大难题。现用mRNA-seq方法研究某抗癌中药作用前后肝癌细胞Hep3B的转录组变化,寻找中药可能的作用靶点。测序建库和测序送给公司完成,数据分析自己做。FANSe2算法云平台做基础分析完成后,下载基因表达量的表格,含有每个基因的readcount和rpkM数据。(1)Reads过少的基因,定量是不准的,不宜加入差异表达分析。你怎样筛选可定量的基因?其理由原理是什么?(2)由于经费所限,加药组和不加药组分别只能测一次序,如何分析哪些基因显著上调?在edgeR软件中用怎样的命令来表示?其前提条件是什么?(3)两个样品的log10rpkM值做散点图如下图,相关性高达R=0.98。edgeR分析得出差异表达的基因仅有15个。这是什么原因造成的?答(1)利用rpkM进行筛选可定量的基因。因为rpkM的前提是假定两个样本之间的总RNA的表达量是一样的,而进行的基因真正的表达量的衡量。(2)(3)因为中药作用前后,各个基因的表达量本来就是相关性很高的。五、高级统计与数据挖掘为研究影响中国人口出生率的关键因素,从国家统计局网站上获得2004年中国31个省会城市、直辖市的相关数据,选择如下几项指标:Y:人口出生率,即一年内平均每千人所出生的人数X1:居民消费价格指数X2:高等教育比例,为每千人中,大专以上文化程度比例X3:年人均工资,以元/人为单位X4:少年儿童抚养比,即(0~14岁人口总数)/(15~64岁人口总数)X5:老年人口抚养比,即(=65岁人口总数)/(15~64岁人口总数)分析方案一:应用最小二乘法进行多元线性回归,得到回归方程:Y=2993+0.32X1+0.94X2+0.093X3+0.36X4-0.24X5R2=0.87分析方案二:逐次回归,得到回归方程:Y=4.15-0.08X3+0.34X4-0.21X5R2=0.83回答下列问题:(1)你会选择哪个分析方案?方案2(2)你作出选择的依据是什么?(单选)A.能够容纳更全面的指标B.每个指标都对回归显著C.更高的R2D.更加简洁有代表性E.更符合日常生活感受(3)现在中国的总和生育率已跌至1.2,老龄化问题严重,养老系统濒于崩溃,迫切需要提高人口出生率。但即便开放二胎,由于离婚率飙升和抚养成本升高,人们的生育意愿依然低下。以你所选择的分析方案所得出的回归方程,国家采取以下哪些措施,人口出生率会提高?(可多选)A.重拳调控楼市,平抑房价B.大力发展和普及高等教育C.提高人民工资待遇,保障劳动者权益D.提高医疗水平,延长人口寿命E.以上都是馊主意,根据方程,我的高招是:稳定工资,稍稍降低工资;出生奖励;办更多公立幼儿园
本文标题:生物信息学试题复习参考(张弓)
链接地址:https://www.777doc.com/doc-2199621 .html