您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 试验设计和数据统计分析
试验设计和数据统计分析(第一部分)技术培训资料徐泽平2011年6月17日试验设计引言•科学研究–调查研究•发现新物种,新机制,发现新原理•达尔文,鸟喙,环境导致变化,生物进化,物竞天择;同一器官不同生物的比较研究,物种起源•比较的是差异•技术系统进化–科学实验•新元素、新物质,居里夫人•新工艺、新装备,航空动力燃料、催化剂•新功能,新用途,阿司匹林试验设计•实验-试验,课题-小项目,大问题-具体内容方法•广义的:研究课题设计–立题依据/目的、研究进展、技术路线、试验方案措施、进度安排(年度计划)、设备材料、经费预算•侠义的:统计设计–试验材料选择–处理的分配:因素、水平–重复数确定–分组方法试验设计•试验设计三阶段–拟定试验设计:合理、周密–按设计实施试验–对试验结果统计分析•设计正确就奠定了基础:–较少的人力物力时间,获得丰富可靠的资料•实验设计的目的–避免系统误差,减少实验误差,提高精确度–不影响结果精确性前提下,减少试验次数。试验设计•试验指标:衡量试验效果的量–数量指标(得率/产量、含量/吸光度)•发酵过程中菌丝体产量/得率•多糖产量/得率–质量:能感觉(颜色、形态、分级指数)•葡聚糖的性状•无定形粉末,晶体•有机溶剂:分析纯、化学纯、色谱纯•食品级、饲料级、肥料级试验设计•试验因素:影响试验指标的条件–物料的粒度–溶剂种类(极性、非极性)–比例(固体液体比例)–提取时间–温度–次数–搅拌速度试验设计•水平:因素根据质或量所处的状态或等级–一个因素取M水平,则该因素为M水平因素–因素A温度:30、40、50,则A为3水平因素–因素B浓度:20%、50%,则B为2水平因素•处理:各因素不同水平间的搭配,即同一条件下所做的试验个数。–如上述,6个处理–单因素试验中处理和水平是一致的试验设计•效应:试验因素对试验指标所起的作用,↗↘–简单效应:某因素在同一水平基础上,比较另一因素不同水平间对试验指标的影响——单因素试验–主效应:各因素的简单效应的平均–互作效应:某因素各水平下对另一因素简单效应的差的平均值试验设计•试验设计的基本要求–代表性:样本数、条件–正确性:准确性、精确性–重演性/重复性:条件、措施试验类型•一般调查:全面调查(总体)、抽样调查•控制试验:一定数量、有代表性、一定试验条件–单因素试验:阐明因素的简单效应,探索适宜水平–多因素试验:可分析简单效应、主效应、互作效应,2-3个因素–正交设计、均匀设计试验设计•试验计划拟定–课题研究目标→试验预期效果→确定试验指标–结合试验条件选择试验设计方法–试验记录项目:表格形式,主要指标辅助指标–结果分析方法:明确采用的统计方法,提出应收集的必要数据–明确试验条件:材料、药品、设备、经费–时间地点人员试验设计•试验方案拟定——试验设计的关键–试验方案是整个试验处理的总称•单因素试验:考察因素的水平•多因素试验:各因素的水平组合–确定试验因素:单因素还是多因素–确定因素水平:间隔恰当;等间隔原则–设置对照组(Control):其他条件一致–空白对照、标准对照、相互对照、自身对照–处理间遵循唯一差异原则:其他条件一致–设置预试验试验设计•试验设计基本原则1–重复:2个以上实验单位,相同条件,实验重复2次以上作用:消除偶然误差,消除实验外条件因素影响意义:通过重复,方差分析时,定量地将误差计算出来,定量的评价误差的大小;重复可使个因素和水平均有机会组合搭配到。试验设计•试验设计基本原则2–随机化:实验配置和顺序,无主观意愿,完全随机安排,包括个方面:–因素水平随即化–实验顺序随机化–随机化方法:抽签、抓阄、随机数表–目的:避免主观偏差,消除系统误差–统计分析的基础,只有随即数据才符合统计分布规律试验设计•试验设计基本原则3–局部控制:实验条件局部一致–按照一定标准将实验对象和实验环境等实验条件,如日期、地区、装置、原材料等分成部分或区、组,以实现局部控制;例:肥效实验,分季节、分地区(土壤)、分作物进行分批实验,几种统计比较,得出结论。试验设计试验设计试验设计方法——调查设计:原料检测•抽样原则:样本来自总体;有代表性•抽样方法:随机、顺序、群组、分层•抽样误差:–抽样得到的样本可计算统计量:平均数、标准差,统计量和参数的差值由抽样产生–抽样误差用“标准误”衡量•样本含量:小样本6,大样本30试验设计试验设计方法•完全随机设计,动物试验–完全随机的分配处理,每一动物具有相等的机会接受任意处理•分组方法:抽签、抓阄、随机数表•试验结果的统计分析方法–单因素试验:2水平,分析2处理平均数的差异显著性—非配对试验t检验;多水平的采用单因素方差分析–两因素试验:每处理1试验单位—无重复方差分析,2个以上实验单位—有重复方差分析–优缺点:处理数与重复数不受限制,统计分析容易;精密度较低,降低了检验灵敏度。试验设计试验设计方法•交叉设计——个体差异难以消除时–大动物,牛,难以找到12个一样的;生产设备,难以同时开3套–试验对象分期接受不同处理•交叉设计成立条件:无互作、无残效、样本一定•统计分析方法:统计假设检验,t检验,F检验试验设计试验设计基本程序•实验目的:深入了解,认真分析•因素水平的确定:首先了解哪些因素可能对试验结果产生影响•指标确定:必须考虑指标对所研究问题提供什么信息,如何测定该指标•实验计划的确定:分辨试验处理间最小差异程度和允许冒多大的风险,以据顶重复次数。如何收集数据,如何随即排列;•试验设计实施:采集数据的过程•数据分析:统计分析,平均差异、统计显著性•结论与应用试验设计试验设计种类•正交试验设计–安排多因素试验、寻求最优水平组合的一种高效率试验设计方法–利用正交表安排与分析多因素试验–特点:部分试验代替全面试验–原理:从优选区挑选有代表性的部分试验点。用正交表进行挑选–L9(34):27个试验点选9个试验设计种类•均匀试验设计–只考虑试验点在试验范围内均匀分布的试验设计方法,适于多因素多水平–5因素31水平,只试验31次,相当于2800万次–与正交设计相比,大幅度减少试验次数–1978年,方开泰、王元–原理:方差分析:均匀分散、整齐可比,均匀设计提高均匀分散,使试验点更具代表性;–回归设计和黑箱原则–均匀设计表,U7*(74)4因素7水平试验设计种类•拉丁方设计•希腊拉丁方设计•回归正交设计–一次回归正交设计、二次回归正交设计•回归旋转设计–二次旋转组合设计、通用旋转组合设计试验设计•正交试验设计–因素水平越多所得结论越可靠。34=81,25=32–正交设计,多因素水平,压缩试验规模•适于多因素水平、误差大、周期长的试验•适于筛选出主要因素及最优水平的试验–正交表,规格化表格,N行k列组合的矩阵•LN(mk),L正交,N试验次数,k因素数,m水平数•L4(23),3因素2水平4次试验•L9(34),4因素3水平9次试验试验设计试验设计•正交表试验设计正交表的性质:•正交性–任一列中不同数字出现次数相等,任意因素不同水平的试验次数相等–任两列间同横行的有序数对出现次数相等,两因素间的水平搭配相等•代表性(均衡分散性)–包括所有因素的所有水平;任意两因素的试验组合为全面试验;–试验点均匀分布•综合可比性:水平次数相等,因素试验条件相等试验设计•正交设计特点–均衡分散性,处理均匀分布,代表性强–整齐可比性,各水平间的比较条件相同–试验次数少试验设计正交表的类别–等水平正交表•水平数相同的正交表•L4(23)、L8(27)——2水平正交表•L9(34)、L27(313)——3水平正交表–混合水平正交表•水平数不完全相同•L8(4x24)表中,有一列的水平数为4,有4列的水平数为2。该表可安排1个4水平因素和4个2水平因素。试验设计正交试验设计步骤–试验目的与要求•本次试验要解决什么问题–确定试验指标•试验结果如何衡量,定出试验指标•定量指标:强度、硬度、产量、得率、成本•定性指标:颜色、口感、光泽•定性指标定量化:相关标准打分;模糊数学处理量化试验设计正交试验设计步骤–确定考察的因素水平•根据预实验、以往经验、前人研究结果设立,影响大的、未试验过的、尚未掌握规律的优先考虑•2-4水平•水平间距合理,尽可能理想水平–列出因素水平表ABCD12试验设计试验设计正交试验设计步骤–选择合适的正交表•选择原则:能够安排下试验的因素和交互作用,尽可能用小表–选择依据:•列:正交表列数c≥因素所占列数+交互作用所占列数+空列•自由度:正交表的总自由度(a-1)≥因素自由度+交互作用自由度+误差自由度•4个3水平因素,可选L9(34)(无交互选),L27(313)(有交互选)试验设计试验设计正交试验设计步骤–做表头设计•把试验因素和亚考察的交互作用安排到正交表各列的过程•不考察交互作用,可随机安排•考察交互作用,按所选交互列表安排–列出试验方案–把正交表中各因素的列(不包含交互作用列)的每个水平数字换成该因素的实际水平值,便形成了试验方案。试验设计试验设计•试验结果统计分析–直观分析、级差分析、多因素方差分析•目的–分清因素主次顺序–判断因素对试验指标影响的显著程度–找出试验最优组合,即什么因素什么水平组合是指标最好–分析因素与指标的关系,因素变化指标如何变化–了解交互作用情况–估计试验误差大小试验设计试验设计•插入程序表试验设计和数据统计分析(第二部分)技术培训资料2011年6月17日数据统计统计术语•计量资料与技术资料•前者用定量方法测定获得的连续性资料,有度量衡单位,如含量;•后者,按属性的不同程度分组计数的等级资料,如疗效数据统计•统计术语•同质与变异:同一观察指标据同质性;同指标的不同观测值有差异–如反应温度,同单位衡量,每次观测值不同•总体和样本:观察对象全部和抽取的部分个体•原料,总量500袋石灰氮;抽取3%袋检查含氮量,15袋为样本数据统计统计术语•随机抽样与随机样本:不参杂主观愿望,样本被抽取的机会均等–粉状料,堆积,1/4量,再1/4……•变量和常数:表现事物差异特征的数据为变量,如体重;代表事物特征的数据为常数,通常由变量计算得来,如样本平均数、标准差、变异系数数据统计统计术语•参数和统计量:从总体中计算所得的特征数值为参数,如总体平均数、总体标准差;从样本中计算所得的特征数值为统计量,是总体参数的估计值。•一般用统计量估计参数值–一个来源于总体,一个来源于样本•准确性与精确性:准确性是测量值对真值的符合程度,如加样回收率;精确性是样本各变异数间的变异程度大小,是多次侧量值的接近程度,如变异系数。数据统计统计的主要内容-按统计分析方法分•描述性统计:原始资料基本分析–3个主要统计量:平均值、标准差、标准误–了解资料的集中趋势和变异程度•显著性检验(假设检验)–平均数间差异的比较:两组数据平均数有无显著性差异,用均数差异显著性检验–属性资料的检验:不能用测量方法衡量-属性形状,如毛色、药物试验的治愈或无效,用X2检验–方差分析:变异量分析,主要进行多个平均数间的比较。数据统计统计的主要内容-按统计分析方法分•相关与回归分析–相关:平行关系的变异量之间的密切程度,相关系数表示–回归:两个以上变量存在从属关系,一个变量(x)变化时引起另一个变量(y)相应变化的估计–从属关系用回归分析方法进行研究,从属关系式称回归方程–用回归方程对指标进行预测和预报数据统计•标准曲线•原理:发现相关,原创–物质反应,颜色;颜色深浅,浓度•设定系列浓度,测出系列光密度•计算回归方程–从样本,到总体–用统计量,估计参数值–用相关系数估计误差•再从标准曲线计算浓度数据统计•描述统计-集中趋势度量-平均数–成组数据的代表,是观察值的中心位置–算术平均数加权平均数–几何平均数G:观测值相乘之积开n次方的方根•用于增长率、药物效价、疾病潜伏期等。邻数成正比,更能代表平均水平。fxfxnfxxnx11212nnnGnxxxxxx1121lglglglgnGnxxx数据统计•平均数–中位数Md,观测值从小到大排列,中间值
本文标题:试验设计和数据统计分析
链接地址:https://www.777doc.com/doc-2069915 .html