您好,欢迎访问三七文档
1.请写出两因素随机区组试验方差分析的自由度和平方和分解的公式。设有A和B两个试验因素,各具有a和b个水平,随机区组设计,r次个重复,则该试验有a*b个处理,abr个小区,abr个观察值,其自由度和平方和分解如下:自由度分解:变异来源DF区组间rr-1=2处理间tab-1=8品种Aa-1=2密度Bb-1=2互作A×B(a-1)(b-1)=4误差e(r-1)(ab-1)=16总变异Trab-1=26注意Vt=VA+VB+VA×B,VT=Vr+Vt+Ve同样处理平方和SSt=SSA+SSB+SSA×B,总平方和SST=SSt+SSr+SSe2.写出单因素随机区组试验方差分析的自由度和平方和分解的公式。3.如何确定试验小区的面积?1.简述田间试验的基本要求。小区面积的确定:一般小区面积60~600尺2,示范性试验小区面积大于3000尺2,确定小区面积时需考虑:①试验种类:如耕作方式试验、灌溉试验、农药试验,小区面积宜大些;品种试验小区面积可小些。②作物种类:种植密度大的作物如稻麦品比试验,小区面积一般5~15m2;种植密度小的作物如玉米品比试验,小区一般15~25m2。③试验地面积:地大小区大,地小小区小。④土壤差异程度:差异大,小区面积应大。⑤新品种选育时,对精确度要求从低到高,因此各阶段所采用的小区面积从小到大。⑥考虑试验中取样需要:取样量大,且为无放回取样时,小区面积应大些。⑦考虑作物边缘效应和生长竞争的影响,应适当增大小区面积。4.方差分析中多重比较的LSD法和SSR法有何区别?①LSD要先进行F测验并且在F测验为显著的前提下计算LSDα;而SSR可不必进行F测验而直接进行。②当试验制定了对照处理时,一般采用LSD③当k=2时,LSD与SSR的显著尺度都相同;当k≥3时,LSD的显著尺度都相同;k=3时,最小显著差数的显著尺度低,新复极差法极高。④最小显著差数法在统计推断时犯第一类错误的概率大,新复极差法犯第一类错误的概率小。5.标准差s可以表示资料变异的大小,为什么还需要计算变异系数?它们之间有何关系?标准差s与观察值单位相同,若比较两个样本的变异度,则因单位不同或均数不同不能用标准差s直接进行比较。这时可计算样本的标准差对平均数的百分数,即变异系数。100scvX%6.简述拉丁方设计的特点和主要优缺点。特点:按横直两个方向划分成区组,使重复数=区组数=处理数=直行数=横行数,每一处理在每一直行或横行均只出现一次。优点:可从直行和横行两个方向消除土壤差异,精确度高。缺点:缺令伸缩性,一般限于4~8处理。7.试述田间实验设计的三个基本原则及其作用。重复:试验中同一处理的小区数即为重复次数,与习惯不同。作用:①估计试验误差②降低试验误差③更准确地估计处理效应。但重复不能无偏地估计误差。随机:一个重复中的某一处理,究竟安排到哪一个小区中,不要有主观成见,要通过抽签法或利用随机数字表来安排,使试验中每一处理均有同等机会设置在任何一个试验小区上。作用:与重复相结合,无偏地估计误差。局部控制:分范围分地段地控制非处理因素,使之对各试验处理小区的影响趋向于最大程度的一致,以降低试验误差。作用:有效降低试验误差,特别是土壤肥力不匀所造成的误差。8.试述方差分析的3个基本假定。1)处理效应与环境效应等应该是“可加性”的;即总平方和=处理效应平方和+环境效应平方和+误差平方和。2)试验误差应该是随机的,彼此独立的,具有平均数为0而且作正态分布,简称为“正态性”;可见试验应随机安排,不能顺序设计。3)所有试验处理必须具有共同的误差方差,即误差同质性;因为我们用Se2来代替。试验数据常难符合上面3个假定,除需剔除个别异常数据外,通常还可对数据进行转换。常用的数据转换有4种:1)平方根转换,1xxx或2)对数转换,lgxx或lg(x+1)3)反正弦转换,1sinpp角度制4)取几个观察值的平均数9.有44标准方如下图,横行随机数字为3,1,4,2。直行随机数字为4,1,2,3。品种随机数字为1,2,4,3。请分步骤写出所需拉丁方排列。ABCDBADCCDBADCAB10.试验误差有哪些来源?如何控制?1)试验材料固有的差异:包菜苗子大小、壮弱。2)试验时农事操作和管理技术的不一致性所引起的差异:追肥不匀、浇水不均。3)进行试验的外界条件的差异:如土壤肥力不均。错误决不允许发生,误差不可避免,但可控制和降低。1)选择同质一致的试验材料。挑壮苗或肥瘦搭配。2)改进操作和管理技术,使之标准化。追肥先称,再用小酒杯量;浇水1瓢4蔸。3)控制引起差异的外界主要因素。土壤差异是最主要又最难控制的。11.确定试验方案的要点是什么?①据试验提出的问题多少而决定用简单的或复杂的方案。不是越复杂越显得有水平!②处理的水平应力求简明,水平间差异必须适当,使处理的效应容易表现。N肥5个水平:50、51、52、53、54kg/667m2。③试验方案中应包括作为比较标准的处理,即对照。④所比较的处理间要应用唯一差异的原则。如根外喷施液体P肥(设三水平),空白对照是不喷,清水对照是只喷清水,往往容易漏掉(水也可能有作用)。⑤在某种程度上对预期的试验结果要有一些概念,使方案的一组处理更具科学性和必要性。N肥4个水平:50、100、150、200kg/667m2。12.在二项百分数资料的方差分析中,在何种情况下要进行反正弦转换?为什么要进行这种转换?反正弦转换,1sinpp角度制如果资料是成数或百分数,则它作二项分布,其方差决定于平均数P。如P0.3或P0.7,则需进行反正弦转换,以获得一个比较一致的方差,使之更符合方差分析的基本假定。13.解释并举例说明单因素试验和多因素试验。①单因素试验:在同一试验中只研究某一个因素的若干处理。如品比试验,除品种外其它条件尽量一致,研究单个因素(品种)的效应,但不能了解几个因素间的相互作用。②多因素试验:在同一试验中同时研究两个或两个以上的因素,各个因素分为不同水平,各因素不同水平的组合构成处理。如对某品种,高中低肥,高中低密度,则为二因素三水平试验,共32=9处理,研究不同肥力水平与栽培密度的最优组合。它既可研究一个因素在另一个因素的各个不同水平上的平均效应,又可探索这两个因素间的交互作用。14.试解释成对数据和成组数据。成对数据:试验设计时将性质相同的两个供试单位配成一对,并设多个配对;然后对每一配对的两个供试单位分别随机地给予不同处理,所得观察值为成对数据。例如在条件最为近似的两个小区或盆钵中进行两种不同处理,在同一植株或某器官的对称部位上进行两种不同处理,或在同一供试单位上进行处理前和处理后的对比等,都可得到成对数据。成组数据:完全随机设计的两个处理间(组间),各试验单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据。成对数据假定各个配对的差数来自差数的分布为正态的总体,而每一配对的两个供试单位是彼此相关的;成组数据则假定两个样本皆来自共同或不同方差的正态总体,而两样本的各个供试单位都是彼此独立的。因此,成对数据试验较成组数据试验精确度要高。如将成对数据按成组数据方法比较,易使统计推断发生第二类错误。15.试举例解释必然事件、不可能事件和随机事件。必然事件:在同一组条件的实现下必然要发生的一类事件。如人总是要死的,水在标准大气压下加热到100℃必然化为蒸汽。P(A)=1。不可能事件:在同一组条件的实现下必然不发生的一类事件。如水在标准大气压下温度低于0℃不可能呈气态。P(A)=0。随机事件(偶然事件):在同一组条件的实现下可能发生,也可能不发生的一类事件。如种子可能发芽,也可能不发芽;硬币抛上落下可能正面朝上,也可能反面朝上。P(A)[0,1]。16.何为两尾测验和一尾测验?在假设测验中何时采用一尾测验,何时采用两尾测验?1、两尾测验:当处理可能优于对照也可能劣于对照时,假设测验中所考虑的概率为正态曲线左边一尾概率和右边一尾概率之和,具两个否定区域。2、一尾测验:当处理仅可能优于对照或仅可能劣于对照时,假设测验中所考虑的概率仅为正态曲线左边一尾概率或仅为右边一尾概率,仅具一个否定区域。17.简述正态分布曲线的特性。1)以μ为原点,左右对称。2)在x=μ处,曲线有最大纵高,其算术平均数,中数(左右对称),众数(最大纵高)均等于μ。3)双参数分布:μ确定其在x轴上的位置,σ确定其变异度(纵高)。因为曲线下面积是固定的,σ大,变异度大,大的数值愈大,小的数值愈小,两极分化,曲线趴下,纵高下降。4)多数次数集中在μ附近,离μ愈远,相应次数愈少,且在相等处有相等次数(因为是对称分布),在≥3σ以外次数极少。5)在=1σ处有拐点,x在μ-1σ处急转直上,在μ+1σ处下降减缓,并以x轴为渐近线。6)正态分布曲线与x轴之间的总面积=1(完全事件系概率之和为1)。7)正态曲线任何两个x定值之间面积或概率完全由μ和σ确定。2211()()()xxxNNNxfxdxfxdxfxdx18.试述随机区组设计的特点和主要优缺点。特点:将试验地按与肥力梯度垂直的方向划分等于次数的区组,再将各区组按与肥力梯度平行的方向划分为等于处理数的小区,各处理在区组范围内作完全随机排列,各区组内处理小区的随机安排要独立进行。从而使区组间占有最大的土壤差异,同一区组不同小区间土壤差异尽可能小,有效地降低了试验误差。优点:①设计简单②灵活,单、多、综合性实验均可应用③能有效减少单向肥力差异,降低误差,并提供无偏的误差估计(随机)④对地形要求不严。劣:①不允许处理数太多,最好10个左右。②只能控制一个方向的土壤差异。19.为什么建立直线回归方程后,必须对其回归关系进行假设测验?有哪几种测验方法?若x和y的总体并不存在直线回归关系,则由其中的一个样本亦可算得一个yabx,显然这样的回归方程是靠不住的。因此对由样本算得的回归方程必须进行假设测验,以测定其来自无直线回归关系的总体的概率大小,只有当这种概率小于0.05或小于0.01时,才能冒较小风险或者说有较大把握确认其所代表的总体存在直线回归关系。具体有3种方法,即t测验,F测验和将回归模型当成相关模型测验相关系数的显著性20.三个或三个以上的样本平均数的假设测验为什么必须采用方差分析而不用t测验?因为t测验每次只能测验两个样本。如有k个样本时,需要测验k*(k-1)/2个假设,当样本较多时,显得非常麻烦,而且t测验用于多个样本的测验时,α水平被扩大,差数的显著性有估计过高的可能。T测验的另一个缺点是在比较这两组的平均数时,只利用两组的观察值以估计方差,而不能利用所有组的观察值合并起来估计方差,因为所利用的观察值减少,估计方差的精确度也有损失。所以三个或三个以上样本平均数进行比较时,需要采用方差分析法。K(k=3)个样本平均数的假设测验方法,即方差分析。这种方法的基本特点是:将所有k个样本的观察值和平均数作为一个整体加以考虑,把观察值总差异的自由度和平方和分解为不同变异来源的自由度和平方和,进而获得不同变异来源的总体方差估计值。21.什么叫置信区间、置信限、置信距和置信度?置信区间(置信距):在一定的概率保证之下,估计出参数可能在内的一个范围或区间即接受区域。置信限:置信区间的上下限称之。一般以L1和L2表示其上下限。置信系数(置信度):保证参数在该区间内的概率P=(1-α),α为显著水平。22.何谓简单效应、主效和互作?举例说明。简单效应:同一因素内两种水平间试验指标的差异。主要效应(主效、平均效应):一个因素内各简单效应的平均数。交互作用效应(互作):两个因素简单效应间的平均差异,它反映一个因素的各水平在另一因素的不同水平中反应不一致的现象。23.什么叫抽样分数?抽样方案的3个基本内容是什么?抽样分数:一个样本所包含的抽样单位数与总体所包含的抽样单位数的比值。参数、抽样方法、样本容量
本文标题:统计学简答
链接地址:https://www.777doc.com/doc-2064683 .html