您好,欢迎访问三七文档
本科实验报告课程名称:生物统计学与试验设计姓名:陈姝瑶学院:农业与生物技术学院系:应用生物科学系专业:应用生物科学学号:3130100533指导教师:徐海明2015年11月30日浙江大学实验报告课程名称:生物统计与试验设计实验类型:实验项目名称:协方差分析和混合线性模型分析学生姓名:陈姝瑶专业:应用生物科学学号:3130100533同组学生姓名:指导老师:徐海明实验地点:实验日期:2015年11月30日一、实验目的和要求1.掌握协方差分析和混合线性模型分析的方法。2.了解协方差分析与二因素析因分析的差异。3.比较SAS软件和QTModel软件的分析效益。4.QTLNetwork软件分析控制仿真群体表现型值的QTL定位数据。5.比较回归分析、相关分析、方差分析、MCIM的定位分析的优缺点。二、实验内容和原理1.QTModelisuser-friendlycomputersoftwarewhichpackagedwithmodulesformicroarraydataanalysis,dialleledesignanalysisandmixedmodelanalysis.2.Analysisofcovariancesatechniquethatcombinesfeaturesofanalysisofvarianceandregression.3.Themixedlinearmodel:includethefixedeffectsandsomegroupsofrandomvariables.Correlationsbetweenorwithinfactorsareallowed.Canunbiasedlyestimateparametersandtheirvariances,andpredictvaluesofrandomeffects.Effectivelyanalyzeallkindsofcomplexgeneticmodelorunbalanceddata.三、主要仪器设备SAS软件QTModel软件QTLNetwork软件四、操作方法与实验步骤1.二因素协方差分析以2个品种2个水分水平的鲜花产量为依变量,重复6次:(1)以小区面积为x变量,进行二因素协方差分析,分析品种、水分对鲜花产量的影响,对显著的效应进行适当的比较;(2)比较协方差分析与二因素析因分析结果之间的差异。SAS:dataexp3;inputv$w$ys@@;datalines;LPLow9815LPHigh7110LPLow604LPHigh8012LPLow777LPHigh8614LPLow809LPHigh8213LPLow9514LPHigh462LPLow645LPHigh553WBLow554WBHigh7611WBLow605WBHigh6810WBLow758WBHigh432WBLow657WBHigh473WBLow8713WBHigh627WBLow7811WBHigh709;1)procglm;classvw;modely=vwv*w;run;2)procglm;classvw;modely=svwv*w;run;2.水稻品种区域试验分析水稻五个品种在二年和三试点三个区组的品种区域试验数据(删除了二个异常值)储存在数据文件(RiceTrial-2.txt)中。(1)采用SAS软件的ProcGLM,ProcMixed和ProcVarCom分析该数据,并对品种的表现作适宜的推断;(2)采用QTModel软件分析该数据,对品种的表现作适宜的推断;(3)比较SAS软件和QTModel软件的分析效益。SASprogram:dataexp3;InputGenYearLocBlockYield;Datalines;......;procglm;classGenYearLocBlock;modelYield=Gen|Year|LocBlock(Year*Loc);randomYearLocYear*LocGen*YearGen*LocGen*Year*LocBlock(Year*Loc)/test;meansGen/Tukey;run;procmixed;classGenYearLocBlock;modelYield=Gen;randomYearLocYear*LocGen*YearGen*LocGen*Year*LocBlock(Year*Loc)/SOLUTION;LsMeansGen/adjust=Tukey;run;procvarcompmethod=REML;classGenYearLocBlock;modelYield=Gen|Year|LocBlock(Year*Loc)/fixed=1;run;QTModel3、QTL定位分析采用QTLNetwork软件分析控制仿真群体表现型值的QTL定位数据(DHSim.map和DHSim.txt).(1)估算QTL的位置和遗传效应,对群体的QTL位置和遗传效应作统计推断;(2)把QTL定位结果和实验一的分析结果都与仿真的参数真值作比较,比较所采用的四种分析方法(回归分析、相关分析、方差分析、MCIM的定位分析)用于推断群体基因定位的可靠性及统计方法的优缺点。回归分析Dataexp1;Inputenvgenotraitm1-m33;Datalines;数据;Procreg;Modeltrait=envm1-m33/selection=stepwise;Run;相关分析Dataexp2;Inputenvgenotraitm1-m33;Datalines;数据;Proccorr;Vartrait;Withm1-m33;Run;方差分析Dataexp3;Inputenvgenotraitm1-m33;Datalines;数据;Procglm;Classenvm1env*m1;Modeltrait=envm1env*m1;Run;Procglm;Classenvm2env*m2;Modeltrait=envm2env*m2;Run;…………五、实验数据记录和处理1.二因素协方差分析1)2)2.水稻品种区域试验分析(1)采用SAS软件的ProcGLM,ProcMixed和ProcVarCom分析该数据,并对品种的表现作适宜的推断;GLM分析Mixed分析Varcomp模块分析(2)QTModel分析3.QTL定位分析采用QTLNetwork软件分析结果.回归分析相关分析方差分析共33组结果六、实验结果与分析1.二因素协方差分析(1)协方差分析结果显示:v与w的互作PrF0.1267,不显著,因此可以对主效应进行判断。品种PrF0.0009,因此品种对鲜花产量的影响极显著。水分PrF0.0001,因此水分对鲜花产量的影响极显著。同时,又因为品种FValue(v)=15.36FValue(w)=51.50,水分对鲜花产量影响更大。(2)比较协方差分析与二因素析因分析结果之间的差异:析因分析结果:残差效应很大,表示数据有问题或者模型有问题而PrF=0.2268,并未达到5%显著水平。所以,不能科学分析品种、水分对鲜花产量的影响。同时,品种与水分两个因素对鲜花产量影响R-square=0.19,远远小于1。二因素析因分析方法不合适协方差分析结果:该模型PrF0.0001,达到极显著水平。同时,品种与水分两个因素对鲜花产量影响R-square=0.976。面积sPrF0.0001,表明面积s作为协变量存在是合理的。因此,协方差分析适合分析此题数据。2.水稻品种区域试验分析(1)GLM模块分析结果:Gen*Year*Loc显著,表明某品种在某年份某地点显著;同时,Year*LocGen*YearGen*Loc都是不显著的;主效应中,只有Year达到了5%显著水平。品种1-42-41-52-52-3存在5%差异。Mixed模块分析结果:Gen*Year*Loc,Year*LocGen*YearGen*Loc主效应YearLoc都是不显著的,均未达到5%显著水平。VarCom模块分析结果:由第一张表可以得到,各个主效应和交互作用的方差估计值,由第二张表可以得到各个主效应和交互作用之间的协方差估计值。总结:品种主效应不显著。(2)QTModel软件分析结果:该模型P-Value:1.28989e-005,极显著。ANOVATable中,Gen、Year、Loc、Year*Loc、Gen*Year、Gen*Loc、Gen*Year*Loc均达到5%显著水平。Gen的5个水平P-Value都0.001,达到极显著水平,表明结果可信。PairwisedcomparisonsamongdifferentlevelsofGen结果显示,均未达到5%显著水平,表明品种之间是无显著差异的。(3)比较SAS软件和QTModel软件的分析效益:SAS软件的ProcGLM,ProcMixed和ProcVarCom分析该数据,Gen、Year、Loc、Year*Loc、Gen*Year、Gen*Loc、Gen*Year*Loc基本均未达到5%显著水平。未检测到5%显著差异,数据分析结果是不大令人满意的。QTModel软件分析该数据,Gen、Year、Loc、Year*Loc、Gen*Year、Gen*Loc、Gen*Year*Loc均达到5%显著水平。QTModel软件分析该数据Residual也比较小,分析结果较可靠。对于此题数据,QTModel软件更适合。相较于SAS的程序编写,QTModel的命令更加简单QTModel给出的结果剔除了一些在分析中用不到的深层次的结果,从而降低了困难。3.QTL定位分析估算QTL的位置和遗传效应,对群体的QTL位置和遗传效应作统计推断Ch1上MK8和MK9之间的基因本身不具备效应但是与Ch3上的MK25和MK26之间的基因(本身存在效应)存在上位性效应和上位性与环境因素互作的效应。Ch1上MK8和MK9之间的基因还与Ch1上MK3和MK4之间的基因(本身具有加性和加性与环境互作效应)存在上位性效应。Ch1上的MK3和MK4之间的基因存在与Ch2上的MK15和MK16之间的基因(本事具有加性)存在上位性和环境因素互作的效应。区间加性效应是否显著Env1增减是否显著Env2增减是否显著QTL1-3MK3-44.9395极显著4.4308极显著-4.5807极显著QTL2-4MK15-16-4.0013极显著0.0005不显著-0.0005不显著QTL3-6MK28-293,5629极显著-3.3246极显著3.1886极显著互作上位性AA显著性QTL1-3&QTL1-83.1775极显著QTL1-3&QTL2-40.1924极显著QTL1-7&QTL3-3-3.1671极显著QTL3-3是高值基因型。(QQ)相关分析:群体基因定位在m3m16m28m19m32m27附近相关分析:5%显著水平的标记有m1,m2,m3,m26,m27,m20,m24方差分析:m1和m2都达到显著性水平,并且与环境的互作也达到显著性水平。回归分析、相关分析、方差分析无法估计QTL效应,仅能分析哪些标记附近有基因,而无法确定基因的准确位置。方差分析需要分别对每一个标记进行方差分析,这道题目就需要进行33次的方差分析,操作繁琐,工作量大。七、讨论、心得从实际案例出发进行学习这些分析方法更加形象,更加容易理解。
本文标题:生统实验报告3
链接地址:https://www.777doc.com/doc-6332634 .html