您好,欢迎访问三七文档
试验方案:根据试验目的和要求而设计进行比较与鉴定的全部试验处理的总称。总体:研究对象的某种数量性质的一个数值的集合,或简称为研究对象的总体。二项总体:在实际观测数据中,往往涉及一种计数的数据,是根据总体中各个个体对某一性状的有无决定的。其中每一个体只能产生两种对立的结果:非此即彼。这种由“非此即彼”的事件构成的总体称为二项总体。第一类错误:若客观上认为H0为真,我们的结论却是“拒绝H0”,就会犯第一类错误。犯第一类错误的概率为α。第二类错误:若客观上认为H0为假,我们的结论却是“不拒绝H0”,就会犯第二类错误,由β表示。凡是有利于做出“拒绝H0”结论的准确,都能降低β。显著水平:用来检验假设正确与否的概率标准。固定模型:指实验结果只想比较每一自变项之特定类目或类别间的差异及其与其他自变项之特定类目或类别间交互作用效果,而不想依此推论到同一自变项未包含在内的其他类目或类别的实验设计。随机模型:是经典的线性模型的一种推广,就是把原来(固定)的回归系数看作是随机变量,一般都是假设是来自正态分布。混合模型:如果模型里一部分系数是随机的,另外一些是固定的,一般就叫做混合模型。回归系数:回归分析中度量依变量对自变量的相依程度的指标,它反映当自变量每变化一个单位时,依变量所期望的变化量。偏回归系数:在多元回归分析中,随机因变量对各个自变量的回归系数,表示各自变量对随机变量的影响程度。互作效应:两个因素简单效应间的平均差异称为交互作用效应,简称互作。单因素试验:在同一试验中只研究一个因素的若干水平,每一水平构成一个试验处理。我们把这些试验称为单因素试验。多因素试验:在同一试验中研究两个或两个以上因素不同水平按照一定的组合方式构成的若干处理。生物统计学:是运用书里统计的原理和方法研究生物现象的数量特征及其变异规律的一门学科。生物统计学既是应用数学的分支,也是数量生物学的分支。试验指标:试验观察中用来反映研究对象(处理)特征的标志,也叫观察项目。定性指标:指观察对象的属性,是质的规定。从定性指标观察所获得的资料叫做定性资料(计数资料),无计量单位。定量指标:指观察对象的量,是量的规定。从定量指标观察所获得的资料叫做定量资料(计量资料,测量资料),有计量单位。一般来说计量资料要比技术资料精确。试验因素:在影响试验的因素中,被固定的因子在试验中保持一致,称为试验条件;被变动并设有待比较的一组处理的因子称为试验因素,简称因素、因子,;试验因素量的不同级别或质的不同状态称为水平;试验因素的水平可以是固定的,如不同品种,具有质的区别称为质量水平,也可以使定量的如喷施生长素的不同浓度,具有量的差异,称为数量水平。试验因素效应:由于试验因素的作用对试验指标起的增加或减少的影响称为试验因素效应。简单效应:指在同一因素不同水平下统一试验指标的差异。主效应:一个因素内各简单效应的平均数称平均效应或叫主效应,简称主效个体:组成总体的每个单元(元素)称为个体。误差:试验误差是指试验中观察值与真值之差。真值:指观察次数无限多时求得的平均值,即总体平均值。系统误差:在相同条件下,多次测量同一量时,误差的绝对值和符号保持恒定,在条件改变时,则按某一确定的规律变化的误差。随机误差:在相同条件下,多次测量同一量时,误差的绝对值和符号的变化,时大时小,时正时负,没有确定的规律,也不可预定,但具有抵偿性的误差。重复:试验中同一处理试验的次数(或种植小区数)叫重复。随机:指每个处理都有同等的机会被分配到任一试验单元(小区)。局部控制:按照一定范围控制非处理因素的一种手段。区组:局部相近的区段。变数(随机变数):具有变异的某一性状或特性的一群数据。具有可量性和可数性。观察值:变数中每一个体的具体测定数值。质量性状资料数量化的方法:归类次数法、等级评分法。归类次数法:根据某一质量性状的类别统计其次数,以次数来作为质量性状的数据。等级评分法:用数字级别表示某现象在表现程度上的差别。随机变数分为连续性变数和间断性变数。连续性变数:具有可量性的随机变数,由证整数或小数构成,间断性变数:具有可属性的随机变数。由整数表示。参数:描述总体特征的数值,一般用希腊字母表示。统计数:描述样本的特征数,一般用拉字母表示。反映资料集中趋势方面的特征数有算术平均数、中位数、众数、几何平均数;放映资料离散方面的特征数有极差、方差、标准差、变异系数、反应资料偏离趋势方面的特征数有偏度;放映资料陡峭趋势方面的特征数有峰度。一般刻画随机变数的变量分布有三种函数:概率函数、概率密度函数、概率分布函数。常见的分布抽样类型主要有正态分布、t分布、卡方分布、F分布。统计推断:根据从未知总体中获得已知的随机样本进行分析和推断,从而识别该总体。包括两大部分内容,一是假设检验,二是参数估计(分为点估计和区间估计)。假设检验类型有单尾检验、双尾检验。数据转换方法:平方根转换、对数转换、反正弦转换。二因素试验分为交叉分组和系统分组(巢式设计)。交叉分组:把研究对象分为若干组,每组又分为若干亚组,而每个亚组内又有若干观察值的设计,称为巢式设计或分级随机抽样设计。变量之间的关系分为确定性关系和相关关系。相关关系分为单向依存关系和平行关系。直线相关:用于描述正态分布两个定量变量之间线性关联程度与相关方向,适用于双变量正态分布资料。相关系数:度量两个随机变量间关联程度的量。相关系数的取值范围为(-1,+1)。当相关系数小于0时,称为负相关;大于0时,称为正相关;等于0时,称为零相关。决定系数:相关系数的平方即为决定系数。它表示依变数Y的变异中有多少百分比,可由控制的自变数X来解释(决定)。偏相关:在多元回归分析中,若除指定的两个变数间的相关外,其余变数皆固定,则这种关系叫做偏相关或净相关。你计划做哪方面的毕业论文,可能会用到哪些试验设计与统计分析方法?参考资料:常见的试验设计方法,可分为二类,一类是正交试验设计法,另一类是析因法。正交试验设计法①定义:正交试验设计法是研究与处理多因素试验的一种科学方法。它利用一种规格化的表格——正交表,挑选试验条件,安排试验计划和进行试验,并通过较少次数的试验,找出较好的生产条件,即最优或较优的试验方案。②用途:正交试验设计主要用于调查复杂系统(产品、过程)的某些特性或多个因素对系统(产品、过程)某些特性的影响,识别系统中更有影响的因素、其影响的大小,以及因素间可能存在的相互关系,以促进产品的设计开发和过程的优化、控制或改进现有的产品(或系统)。③表格形式析因法①定义析:因法又称析因试验设计、析因试验等。它是研究变动着的两个或多个因素效应的有效方法。许多试验要求考察两个或多个变动因素的效应。例如,若干因素:对产品质量的效应;对某种机器的效应;对某种材料的性能的效应;对某一过程燃烧消耗的效应等等。将所研究的因素按全部因素的所有水平(位级)的一切组合逐次进行试验,称为析因试验,或称完全析因试验,简称析因法。②用途:用于新产品开发、产品或过程的改进、以及安装服务,通过较少次数的试验,找到优质、高产、低耗的因素组合,达到改进的目的。③表格形式统计分析方法从根本上说有两大类,一是逻辑思维方法,二是数量关系分析方法。数量关系分析方法包括比分析法、平均和变异分析法、综合评价分析法、结构分析法、平衡分析法、动态分析法、因素分析法、相关分析法等。(任选一种简单述说)相关分析要点:①在资料上,相关分析要求两个变量都必须是随机的;而回归分析则要求因变量必须是随机的,自变量则不能是随机的,而是规定的值,这与在回归方程中用给定的自变量值来估计平均的因变量值是一致的。②防止虚假相关和虚假回归。试做一个简单的试验计划,简要写出试验目的、供试因素(水平)、设计方法、主要指标、可能用到的统计分析方法。参考资料:试验设计方法常用的术语定义如下。试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如温度、水分。水平:指试验中因素所处的具体状态或情况,又称为等级。如温度分为10、20、30°C三个等级。常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。正交试验设计:1)确定因素(变量)数2)确定每个因素的水平数3)选择一个合适的正交表,不同的正交表生成的用例数会有很大的差别。需要让正交表尽量和因素数和水平数吻合,因素数肯定是要一致,水平数要考虑出现最多的水平数4)将变量的具体取值映射到正交表中5)将每一行数据的组合抽取出来,形成测试用例6)再次分析(用错误推测法)可能需要测试的数据组合(查漏补缺),添加到测试用例当中。(一个简单图表)
本文标题:生物统计学
链接地址:https://www.777doc.com/doc-2201267 .html