您好,欢迎访问三七文档
课题进展汇报汇报人:张海斌09.23~10.14汇报内容数据整理文献阅读单性状模型的计算1、完成数据的整理和性状的挑选2、单性状基因组选择的计算上个月计划数据整理(基因型填充、系谱校正,性状挑选)杏花鸡X隐性白羽洛克鸡F2代真实数据集GBLUPBLUP|GABayesBBayesA交叉验证试验,结果分析,效果对比多性状模型单性状模型矩阵构建、程序调试矩阵构建、程序调试技术路线数据整理1、完成表型数据的整理生长性状23个、胴体性状31个,对非正态分布的表型记录进行校正,剔除异常值2、对基因型数据质控质控标准:剔除小等位基因频率小于1%、检出率小于95%的SNP标记3、性状间遗传相关的计算是否可以借用文献报道的性状间遗传相关??文献阅读1、关于GBLUP的文献GBLUP中G矩阵的三种构建方法(1)G=ZZ′2pi(1−pi)(2)G=ZDZ′,D=1m[2pi1−pi](3)G=MM′−𝑔0(11′)𝑔1,MM′=𝑔011′+𝑔1A+E文献阅读2、关于BLUP|GA的文献BLUP|GA是在TABLUP的基础上加入了GWAS的信息。单性状模型的计算1、在实验室已有的单性状模型GBLUP程序基础上,修改代码,读入表型数据和基因型数据,进行计算。2、选了鸡的1日龄体重、7日龄体重和14日龄体重3个性状进行计算,初步得到准确性分别是0.685、0.569和0.520。下个月计划1、整理鸡的GWAS信息2、完成单性状BLUP|GA的计算读书报告报告人:张海斌2014.11.03文献汇报内容研究背景研究目的材料方法结果结论1、2001年,Muwissen等提出基因组选择2、基于基因组估计育种值(GEBV)的选择称为基因组选择3、基因组选择的优点:可以缩短世代间隔,加速遗传进展,节约成本,特别有利于低遗传力的性状、限性性状、以及表型难以测定或测定成本较高的性状的选择4、基因组选择的方法优劣许多文献报道Bayes方法胜过GBLUP也有文献报道受大量微效应QTL影响的性状,GBLUP胜过Bayes方法GBLUP的优点是需要的计算时间较Bayes少,这对于实际应用非常重要研究背景5、GEBV预测中,广泛运用的反应变量:EBV:通过表型值和个体间的亲缘关系来对育种值进行估计,由此得到的估计值称为EBVDYD:女儿产量方差是经过固定效应和女儿母亲的遗传贡献率校正后得出来的女儿平均表型值DRP:来源于EBV,是EBV的一种回归6、单性状的基因组选择是目前许多研究的重点7、近来,一些文献报道了基因组选择的多性状模型,并且表明多性状模型的准确性比单性状模型高研究背景研究目的1、对比传统单性状模型与多性状模型估计的EBV的可靠性2、用传统的估计育种值(EBV)作为反应变量比较单性状基因组预测模型(STGM)与多性状基因组预测模型(MTGM)的可靠性性3、模拟不同遗传力、记录缺失以及具有遗传相关的两个性状的数据,对比单性状基因组预测模型(STGM)与多性状基因组预测模型(MTGM)的效果。材料方法1、模拟奶牛数据两个性状:性状1、性状2的遗传力分别为0.3和0.05,遗传相关为0.5数据组成:G1~G4,每个世代1000公牛和200000母牛,5000个SNP标记均匀分布于全基因组,300个QTL随机分布参考群:G1~G3验证群:G4,3组反应变量,一组数据两个性状记录完整,二组数据性状1记录完整、性状2记录随机缺失90%,三组数据性状2记录完整、性状1记录随机缺失90%材料方法2、统计模型单性状模型(STMT)Y是反应变量(本研究用传统EBV);1是n维单位向量;μ是总体均值;z是关系矩阵;g是基因组育种值向量;e是随机残差向量;假设g~N(0,Gσg2),σg2是加性遗传方差,G是标记关系矩阵;e~N(0,σe2),σe2是残差方差,I是单位矩阵。eZg1yμ材料方法多性状模型(MTGM)是性状1和2表型向量,I1和I2是单位向量;是性状1和2总体均值;Z1和Z2性状1、2关系矩阵;是性状1、2基因组育种值向量;是两性状的随机残差向量212121211210μμ00eeggZZΙΙyy21yy21μμ21gg21ee材料方法3、STMT和MTGM分别进行10次重复4、基因组选择评价(1)计算GEBV与真实育种值TBV间的相关系数,代表其准确性,其平方称为可靠性(2)计算TBV对EBV、GEBV的回归系数,评价EBV、GEBV的无偏性(3)t检验判断验证群的GEBV差异结果结论1、结果(1)ReliabilityofEBVandregressioncoefficientofTBVonEBV多性状模型中,性状1的EBV的可靠性没有得到提高,性状2EBV的准确性得到了显著提高。多性状模型提高了性状2EBV的无偏性结果结论(2)ReliabilityofGEBV在相同模型、相同性状中,记录完整准确性比记录缺失的高。记录完整的性状1,EBV_s和EBV_m为反应变量,单性状模型和多性状模型的GEBV可靠性一样;记录完整的性状2,EBV_m为反应变量时,MTGM比STGM的GEBV可靠性高0.007;EBV_s为反应变量,MTGM比STGM的GEBV可靠性高0.033。记录缺失的性状1,EBV_m为反应变量时,MTGM比STGM的GEBV可靠性高0.142;EBV_s为反应变量,MTGM比STGM的GEBV可靠性高0.111;记录缺失的性状1,EBV_m为反应变量时,MTGM比STGM的GEBV可靠性高0.181;EBV_s为反应变量,MTGM比STGM的GEBV可靠性高0.211。结果结论(3)ResultofHotelling-Williamsttest记录缺失的性状中,EBV_m为反应变量估计的GEBV可靠性比EBV_s为反应变量估计的GEBV可靠性高。记录完整的性状中,可靠性没有显著差异。结果结论(4)RegressionofTBVonGEBVGEBV尺度调整之前,回归系数大于1,性状2更突出。GEBV尺度调整之后,EBV_m为反应变量时,回归系数在0.832到1.002之间,平均为0.907;EBV_s为反应变量时,回归系数在0.964到1.069之间,平均为1.021,它们差别不大。结果结论2、讨论MTGM的优势在于能利用遗传相关性状的信息。本研究表明对于低遗传力的性状或者表型数据少的性状,MTGM的GEBV可靠性比STGM的高,这点在实际育种方案中非常重要。对于遗传力高或者表型数据完整的性状,MTGM的GEBV优势不明显。本试验结果显示,GEBV的可靠性明显高于EBV,表明与基于EBV的选择,基因组选择更有益于低遗传力的性状或者表现数据少的性状,更易于改良功能性状和生产性状。结果结论EBV_m为反应变量的GEBV可靠性比EBV_s为反应变量的高,也被认为MTGM比STGM更好,原因是MTGM不单止间接利用了相关性状的信息,还直接通过性状间的协方差利用相关性状的信息。本研究用于估计EBV的表型记录是模拟的、可靠的,并且数据缺失是通过掩盖EBV而产生的数据缺失,而不是直接生成的,且相关性状的数据量大,因此GEBV的可靠性会比现实育种的高。结果结论3、结论MTGM可以提高基因组预测的可靠性,特别是对于低遗传力的性状或者表型数据少的性状。EBV_s和EBV_m为反应变量对数据完整的性状GEBV可靠性影响较小。对于数据缺失的性状,EBV_m为反应变量的GEBV可靠性比EBV_s为反应变量的高。EBV_m为反应变量,MTGM的GEBV可靠性比STGM的高。课题进展汇报汇报人:张海斌10.15~11.28汇报内容数据整理文献阅读单性状模型的计算
本文标题:基因组选择
链接地址:https://www.777doc.com/doc-4489978 .html