您好,欢迎访问三七文档
实验统计方法第一章绪论1、合理地进行调查或试验设计,科学地整理、分析所收集得来的资料是生物统计的根本任务。2、生物统计在植物科学研究中的作用:(1)提供试验或调查设计的方法——合理地收集必要而有代表性资料。(2)提供整理分析资料的方法。①整理资料的基本方法——绘制统计表、统计图;②统计分析最重要的内容——差异显著性检验;③统计分析的另一个重要内容——对试验指标或植物性状间的关系进行研究,即相关回归分析。3、科学研究的一般流程:4、常用分析资料的统计分析:5、生物统计学:用数理统计学的原理来收集、分析、表达和解释生物现象的科学。6、近代描述统计学。英国人高尔登——生物统计学之父。贡献:①首先在生物学研究中应用统计方法;②提出『变异』、『相关』、『回归』等概念和方法。1886年,高尔登在论文中提出『在遗传中身长向中等身长回归』观点,正式提出『回归』概念。7、现代推断统计学。由定性转为定量;变革在农业田间试验中完成。(1)哥塞特的t检验与小样本思想;1908年提出『平均数的概率误差』概念。(2)R·费雪(在统计学的地位非常显赫)提出『抽样分析』、『方差分析』、『随机化原则』等概念和方法。第二章资料的整理一、常用术语1、总体:根据研究目的而确定的研究对象的全体。2、样本:从总体中抽出的用于研究总体的部分个体称为样本。(n>30为大样本,n≤30为小样本)。3、样本容量:样本中所包含的个体数目,记为n,对应总体参数为N。4、随机样本:指总体中的每一个个体都有同等的机会被抽取组成样本。5、参数(总体特征数):μ—总体平均数δ—总体标准差(希腊字母)统计量(样本特征数):x—样本平均数S—样本标准差(拉丁字母)二、资料的分类﹛数量性状资料、质量性状资料、半定量(等级)资料﹜1、数量性状:能够以测量或计数的方式表示其特征的性状。2、数量性状资料:观察测定数量性状而获得的数据。3、连续性变数:量、测手段得到的计量资料;间断性变数:计数方式得到的计数资料。4、质量性状:能观察到而不能直接测量的性状。5、质量性状转化为数量性状的方法:(1)统计次数法;(2)分级法。三、资料的整理1、检查和核对原始资料的目的是保证资料的在正确性和完整性。2、小样本不必分组,大样本宜分组,将观测值分组后,制成次数分布表。①求全距(极差)R=Max(x)-Min(x);②确定组数;③确定组距;④确定组限及组中值;⑤归组划线计数,作次数分布表。四、常用统计表与统计图统计表标题在上方,统计图标题在下方;连续性变数资料采用直方图和折线图;次数分布图一般有间断符号。五、作业1、什么是总体、个体、样本、样本含量、随机样本?统计分析的两个特点是什么?2、什么是参数、统计量?二者有何关系?3、资料可以分为哪几类?它们二者有何区别和联系?4、统计表与统计图有何用途?常用统计图有哪些?常用统计表有哪些?列表绘图应注意什么?第三章变异数1、平均数反应资料的集中性(算术平均数x:直接法、加权法;中位数Md;众数Mo;几何平均数G)。变异数、变异系数反应资料的离散性。2、全距(极差):R=Max(x)-Min(x)3、方差:离均差平方和与自由度的比值。ss/df(样本)SS/DF(总体)离均差(x-x)自由度df=n-1DF=N(样本自由度减1,总体自由度不减1)①样本方差(S2,MS)S2=∑(x-x)2/(n-1);②总体方差(σ2)σ2=∑(x-μ)2/N4、样本标准差1)(2nxxSS2的正平方根。直接法:Nx2μδ矫正数法:5、全距近等于6倍的标准差。6、变异系数:标准差与平均数的比值(相对值)C·V=(S/x)×100%作业1、生物统计中常用的平均数有几种?各在什么情况下应用?算术平均数(正态);中位数(正态);众数(偏态);几何平均数(遗传)2、①15、13、8、9、12Md=?②7、8、15、6、4、12Md=?③13、14、14、15、15、15、15、16、15、15、16、16、16、17、18、20Mo=?3、何谓标准差?方差的正平方值,用于表示资料的变异度。4、何谓变异数?表示数据变异程度的统计值。第四章理论分布和抽样分布一、事件与概率1、Ω必然事件;Φ不可能事件。2、小概率事件:P<0.053、小概率原理:统计学上,一个随机事件概率很小的话(P<0.05),在一次试验中,这个事件被认为实际不可能发生的事件。是显著性测验的基本依据。二、正态分布1、普通:X服从于以μ为平均差,δ2为方差的正态分布2、标准正态分布:3、特征:①曲线是单峰,对称曲线,对称轴x=μ;②πδ(μ)21f。4、P(-1.960≤u<1.960)=0.95;P(-2.576≤u<2.576)=0.99。5、正态离差Uδμ-xU。三、抽样分布1、xδ标准误;xμ样本平均数抽样总体的总体平均数2、xμ=μ;nxδδ;n22xδδ3、设有一个N=3的有限总体,变数为2,4,6。从中抽取n=2的样本。xN=32=9①计算变数X的分布的参数μ=4;δ2=8/3②计算样本平均数x分布总体参数4xnxNμ;34-xn2xxN)μ(δ结论:①若随机变量)(μ,δ2~xN,则由x总体随机抽样的样本统计量)δ(μ,n~x2N。②若x服从(μ,δ2)不是正态分布,则n相当大时逼近正态分布。)δ(μ,n~x2N,中心极限定理。4、中心极限定理告诉我们:不论x变量连续还是离散,也无论x服从何种分布,一般只要n>30,就可认为x的分布是正态的,若x分布不很偏倚,在n>20时,x的分布就近似于正态分布。5、标准化xxx-xδμU;nxδδ;样本标准误nxSS。6、两个正态总体抽出的独立样本平均数差数的分布),δ(μ2111~xN,),δ(μ2222~xN,21x-x-21μμμ)(,222121x-xnn21δδδ)(各理论分布的标准化:δμ-xux;2221212121x-xnn--x-xu21δδ)μ(μ)()(;xxx-xuxδμ。四、分布t分布受自由度的约束,每一个自由度都有一条分布密度曲线。五、作业1、必然事件、不可能事件、随机事件。必然事件:对于一类事件来说,在同一组条件的实现之下必然要发生的事件。不可能事件:在同一组条件的实现之下必然不发生的事件。随机事件:某特定事件只是可能发生的几种事件中的一种的事件。2、小概率事件实际不可能原理3、标准误;标准误与标准差联系与区别。4、样本平均数抽样总体与原始总体的两个参数间的联系。5、t分布与标准正态分布的区别与联系。第五章统计假设检验一、思路1、假设对试验样本所在的总体;2、确定显著水平;3、在H0正确的前提下,计算实际差异由抽样误差造成的概率;4、作接受或否定H0的判断。二、基本步骤例:某地多年种植的早熟品种牛心甘蓝记录亩产3000斤,其标准差为582.9斤;现培育成一新的早熟品种在10个小区的试验结果为亩产3400斤,问两品种在产量上是否存在本质差异?(一)首先对试验样本所在的总体作假设建立无效假设H0:μ=μ0(二)确定显著水平否定H0的概率标准称为显著水平,通常用α表示。在生物学上常用的显著水平是α=0.05/α=0.01(三)在H0正确的前提下,计算实际差异由抽样误差造成的概率我们认为该样本是从已知总体中随机抽取的样本,符合抽样分布的规律正态离差u值:nxδδ=33.184109.582;xxx-xδμU=17.233.1843000-3400(四)作接受或否定H0的判断根据『小样本实际不可能原理』判断,查出p>0.05,则否定H0;P≤0.05,则差异显著;P≤0.01,则差异极显著。∵xU=2.17>U0.05=1.960,∴P<0.05;结论:两品种在产量上差异显著。例:早熟辣椒『矮树早』多年种植的亩产2500斤,先引进一新的早熟辣椒品种『伏地尖』在36个小区种植,平均某产2700斤,其标准差为480斤;问新品种『伏地尖』是否比『矮树早』增产?解:(1)H0:μ=μ0(2)α=0.05/α=0.01(3)∵n=36为大样本,∴认为大样本的标准差为总体的标准差(4)8036480nxxSSδ;5.2802500-2700-xxxxδμU(5)∵xU=2.5>U0.05=1.960;∴P<0.05;差异显著结论:新品种『伏地尖』比『矮树早』增产。五、t测验小样本时,不能用xxδS例:某茄子品种植株高度为75cm,现有一随机抽取10株的样本,其平均株高为70cm,其标准差为8cm,试测定这个平均数能否代替总体平均数?解:(1)H0:μ=μ0=75cm(2)α=0.05/α=0.01(3)53.2108nxSS;976.1-53.275-70-xtxxXSμ(4)查表知r=10-1=9时,P=0.05,t=2.262∵1.976<2.262;∴P≥0.05结论:这个平均数能代替总体平均数。六、显著性检验的计算(一)单样本平均数显著性检验1、若δ2已知,无论样本容量n大小,都用u测验。nxδδ;xxx-xδμU。2、若δ2未知,当样本容量n≥30时,认为xxδS,用u测验。3、若δ2未知,当样本容量n≤30时,不能认为xxδS,用t测验。nxSS;XSxx-xtμ受自由度f影响。七、两个样本显著性检验由于实验设计不同,可分为成组数据(非配对设计)和成对数据(配对设计)(一)成组数据1、若两样本所属总体δ12、δ22已知,无论n大小,都用u测验。222121x-xnn21δδδ)(;)()(δ)μ(μ)(2121x-x2121x-x--x-xu。2、若两样本所属总体δ12、δ22未知,可以假定两个样本来自于同一总体,当n1、n2都为大样本时,用u测验。222121x-xnn21SSS)(;)()()μ(μ)(2121x-x2121x-x--x-xuS。3、若两样本所属总体δ12、δ22未知,且当n1、n2都为小样本时,用t测验。引入新概念:合并均方Se2)()()()(1-n1-nx-xx-xvve21222121212SSSSS矫正数法nx-xx-x222)()(SS2212x-xnene21SSS)(;)()()μ(μ)(2121x-x2121x-x--x-xtS。例:某辣椒品种栽培在甲、乙两地:甲5个小区产量:12.6;13.4;11.9;12.8;13.6(斤)乙7个小区产量:13.1;13.4;12.8;13.5;13.5;12.7;12.4(斤)问该品种在甲、乙两地是否有显著性差异。解:(1)H0:μ1=μ2;(2)α=0.05/α=0.01(3)甲:1x=12.86;1S=0.6768;21x=828.73;1x=64.3;乙:2x=13.06;2S=0.4353;22x=1194.56;2x=91.4。)()()()(1-n1-nx-xx-xe2122212S=1074.91-56.119453.64-73.82822=0.297;2212x-xnene21SSS)(=0.319;)()()μ(μ)(2121x-x2121x-x--x-xtS=-0.6269;推断:查表,当df=10,α=0.05时,10,05.0t=2.228≥0.627即P≥0.05结论:该品种在甲、乙两地没有显著性差异。(二)成对数据的平均数比较1、对大样本:ddddd-duδδμ;21x-xd、21d-μμμ、21x-xd;实际转化为单样本问题。2、对小样本:ddtS;df=n-1;)()()()(1-nnnd-d1-nnd-dn222ddSS;差异标准误。八、习题1、已知红星苹果单株产量为65kg,标准差为12kg,现有一芽变株产量为71kg,调查株数为40株,问芽变株产量与红星苹果株产量的差异是否显著?2、现有两个柑橘品种A、B,A品种调查400株,平均株产为66.7kg,标准差为5.6kg;B品种也调查400株,平均株产为75.2kg,标准差为6
本文标题:试验统计方法
链接地址:https://www.777doc.com/doc-2028190 .html