您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 蛋白质结构与功能的生物信息学研究
实验名称:蛋白质结构与功能的生物信息学研究实验目的:1.掌握运用BLAST工具对指定蛋白质的氨基酸序列同源性搜索的方法。2.掌握用不同的工具分析蛋白质的氨基酸序列的基本性质3掌握蛋白质的氨基酸序列进行三维结构的分析4.熟悉对蛋白质的氨基酸序列所代表蛋白的修饰情况、所参与的代谢途径、相互作用的蛋白,以及与疾病的相关性的分析。实验方法和流程:一、同源性搜索同源性从分子水平讲则是指两个核酸分子的核苷酸序列或两个蛋白质分子的氨基酸序列间的相似程度。BLAST工具能对生物不同蛋白质的氨基酸序列或不同的基因的DNA序列极性比对,并从相应数据库中找到相同或相似序列。对指定的蛋白质的氨基酸序列进行同源性搜索步骤如下:↓登录网址↓输入序列后,运行blast工具↓序列比对的图形结果显示序列比对的图形结果:用相似性区段(Hit)覆盖输入序列的范围判断两个序列的相似性。如果图形中包含低得分的颜色(主要是红色)区段,表明两序列的并非完全匹配。↓匹配序列列表及得分备注:Clustal是一款用来对()的软件。可以用来发现特征序列,进行蛋白分类,证明序列间的同源性,帮助预测新序列二级结构与三级结构,确定PCR引物,以及在分子进化分析方面均有很大帮助。Clustal包括Clustalx和Clustalw(前者是图形化界面版本后者是命令界面),是生物信息学常用的多序列比对工具。该序列的比对结果有100条,按得分降序排列,其中最大得分2373,最小得分分为1195.↓详细的比对序列的排列情况Score表示打分矩阵计算出来的值,由搜索算法决定的,值越大说明匹配程度可选择不同的比对工具各序列得分第一个序列的匹配率为100%第一个匹配序列越大。Expect是输入序列被随机搜索出来的概率,该值越小越好。Identities是相似程度,即匹配率,100%表示序列全部匹配。Method:代表不同的打分矩阵方法,选择不同的打分矩阵会得到不同的打分结果。显示结果按越后面匹配率越低。二、分析蛋白质的氨基酸序列的基本性质ProParam是计算氨基酸理化参数常用的工具,提供计算蛋白质的分子量、理论等电点、氨基酸组成、原子组成、消光系数(extinctioncoefficient)、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)等。↓登录网址:并输入序列号↓↓蛋白质的氨基酸组成、相对分子质量、等电点和原子组成。结果1:该蛋白质序列的氨基酸数为1255个,相对分子质量为137910.5,等电点为5.58,由C、H、N、O、S五种原子组成,共有19180个原子。↓消光系数、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)结果2:消光系数反映了蛋白在特定波长下吸收可见光或不可见光的能力,可用来测蛋白浓度。由上图知,该序列在280nm的波长下,假设所有成对的半胱氨酸残基形成胱氨酸,则该序列的消光系数1.003;假设所有的半胱氨酸残基都减少了,改序列的消光系数为0.976。半衰期为30小时(哺乳动物的网织红细胞,体外);20小时(酵母、体内),10小时(大肠杆菌、体内)。该蛋白不稳定系数为56.13,提示该蛋白质不稳定。脂肪系数是计算球状蛋白脂肪族氨基酸侧链所占相对体积,反映了蛋白质的热稳定性,为82.35.蛋白质的疏水性预测可以根据GRAVY值来预测。GRAVY值的范围在2与-2之间,正值表明此蛋白为疏水性蛋白,负值表明为亲水蛋白。该蛋白的GRAVY值为-0.247,因此预测该蛋白为亲水蛋白。↓利用ProtScale工具对蛋白质进行亲疏水性分析↓登录网址并输入序列号↓↓GFAP亲疏水性分布图,横坐标为序列位置,纵坐标为氨基酸的标度值。Hphob.kyte&Doolittle标度(default)定义疏水性氨基酸较高的打分值(0值表示疏水性,0值表示亲水性。从图可看出,标度值0的区域比0的较为密集,因此,结合上面的GRAVY值为-0.247,预测该蛋白为亲水蛋白。↓利用TMPred工具对该蛋白进行跨膜区结构预测登录网址↓↓用TMHMM预测是否存在跨膜区登录网址↓最优拓扑结构:2种模型都预测有4个蛋白质跨膜区。↓结果三、蛋白质三维结构分析↓登录网址,输入相应的序列号提示有2个蛋白质跨膜区。其跨膜区比TMpred预测的结果少了2个。少了序列前面2个位置的跨膜区。↓↓建模部分结果↓有A、B、C、D四条晶体结构的单链阵线。四、蛋白质序列的修饰情况、所参与的代谢途径、相互作用的蛋白,以及与疾病的相关性分析↓登录在database里面找到string工具。↓↓输入序列号↓结果:由结果可知,该蛋白质序列相互作用的蛋白有10个。所输入序列的代码为相互作用的蛋白网络图所输入序列的代码所输入序列的代码。序列基本信息ERBB2。根据基本信息可知,ERBB2是表皮生长因子受体(EGFR)家族成员之一是白血病病毒致癌基因同族体2。蛋白酪氨酸激酶(ERBB2基因表达产物)是几个细胞表面受体复合物的一部分,但这需要一个coreceptor配体结合。Neuregulin受体复杂的重要组成部分,尽管neuregulin不单独与之交互。GP30是一个潜在的配体受体。调节产物和周边稳定微管(MTs)。总结:该蛋白质序列的比对结果有100条,按得分降序排列,其中最大得分2373,最小得分分为1195.该蛋白质序列的氨基酸数为1255个,相对分子质量为137910.5,等电点为5.58,由C、H、N、O、S五种原子组成,共有19180个原子。该序列在280nm的波长下,假设所有成对的半胱氨酸残基形成胱氨酸,则该序列的消光系数1.003;假设所有的半胱氨酸残基都减少了,改序列的消光系数为0.976。半衰期为30小时(哺乳动物的网织红细胞,体外);20小时(酵母、体内),10小时(大肠杆菌、体内)。该蛋白不稳定系数为56.13,结果提示该蛋白质不稳定。脂肪系数为82.35.该蛋白的GRAVY值为-0.247,通过亲疏水性分析得出该蛋白为亲水蛋白。三级结构分析显示该利用TMPred工具对该蛋白进行跨膜区结构预测得到4个跨膜区,而用TMHMM预测则存在2个跨膜区。该蛋白质序列由4条链构成,通过相互作用分析得,该蛋白质序列相互作用的蛋白有10个,是表皮生长因子受体(EGFR)家族成员之一,参与细胞膜的表面受体的组成,与白血病的发生有关。
本文标题:蛋白质结构与功能的生物信息学研究
链接地址:https://www.777doc.com/doc-2027757 .html