您好,欢迎访问三七文档
试验设计与数据处理ExperimentDesign&DataProcessing授课教师:程江峰课程教学平台推荐参考书课堂教学上机实习推荐参考书徐秉玖编著.药物统计学.北京:北京医科大学出版社,1999.杨德编著.试验设计与分析.北京:中国农业出版社,2002.袁志发周静芋主编.试验设计与分析.北京:高等教育出版社,2000.李云雁胡传荣编著.试验设计与数据处理.北京:化学工业出版社,2005.课堂教学目录第一章概述第二章试验设计的概念及原理第三章试验统计基础及EXCEL简介第四章简单试验设计与统计分析第五章方差分析第六章回归与相关分析第七章正交试验设计与分析第一章概述试验设计在科研中的地位与意义科学研究是人类对物质世界和社会现象的一种认识活动。其方法可分为三个层次,即哲学方法;一般研究方法(如科学试验、科学抽象、数学方法等);各门科学中的一些专门化的特殊研究方法。试验设计是属于一般研究方法中的科学试验方法的范畴,它是由试验方法与数学方法,特别是统计方法相互交叉而形成的一门科学。它是研究如何计划安排试验并对结果进行分析的一门科学。科技人员掌握应用各种先进试验设计与结果分析方法,可提高自身的素质及科学试验水平,将加快所从事科学研究的进程。科学研究中不同阶段的试验设计研究初期阶段的探索试验简单设计试验目的是明确某因素的作用。如对照试验、比较试验等。筛选试验目的是在众多因素中明确关键因素或优良水平。如单因素多水平试验(格子设计等);少量水平的多因素试验(如混杂设计、不完全区组设计、均匀设计、正交设计等)。研究中期阶段的析因试验多因素的析因试验,以深入分析主要因素的作用及其相互关系。如拉丁方设计、交替设计、裂区设计、正交设计等。研究后期阶段的优化试验目的是深入研究少数关键因子及相互作用关系并进行优化设计。如回归设计、配方设计、稳健设计等。第二章试验设计的概念及原理2.1试验的基本概念2.1.1总体与样本总体(Population)定义:由具有共同性质的全部个体(Individual)组成。而个体是研究对象中可以单独观测和研究的一个物体或一定量的材料。例如:一个药厂的某一种产品中有效药物含量值;全国采集的某种中药材中总甙含量。样本(Sample)定义:按一定程序从总体中抽取的,数量相对较少的一组个体,称为该总体的一个样本。例如:所选出样品分析后得到的有效药物含量值;选出一定数量的中药材测得的总甙含量。样本容量(Samplesize)样本中所包含的个体(或抽样单元)的数目。一般样本容量在30个以上为大样本。2.1.2试验因子、水平、处理试验因子(Factor)试验中安排的因子,或称试验因素。其实影响科学试验结果的因子往往很多,但进行试验时,仅能挑选少数几个。水平(Level)在安排试验中,每个因子的某种具体措施称为该因子的某种水平。处理(Treatment)多因子试验中,不同因子的不同水平的组合称为处理;而在单因子试验中,该因子的不同水平亦可称为处理。2.1.3试验单元、重复、区组试验单元(Unit)试验中实施试验处理的基本对象。如医药学试验中的小白鼠、医院病人等。重复(Replication)在试验中,每一种处理往往进行一次以上试验,称为处理的重复。区组(Block)某一批处理排列时集中在某一区域(时期、空间等)称为区组。2.1.4试验误差及来源、分类试验误差(Error)在科学试验中,由于受到许多非处理因子的干扰和影响,所观察到的每个处理的测量结果与该处理的真值会产生一定的偏差,这个偏差就是试验误差。试验误差的来源试验单元间的固有差异试验单元上操作方法间的差异试验单元间环境的差异试验误差的分类随机误差(Randomerror)系统误差(Systematicerror)粗大误差(过失误差)(Grosserror)2.1.5精密度、正确度、精确度精密度(Precision)表示试验结果中随机误差大小的程度。它是在试验规定条件下,对处理进行多次相互独立测量所得结果之间符合的程度。精确度(Accuracy)又称准确度。它表示试验处理测量结果与被测量处理真值之间的接近程度。它反映了试验测量结果中系统误差与随机误差的综合。正确度(Correctness)表示试验测量结果中系统误差大小的程度。它反映了试验规定条件下,试验测量中所有系统误差的综合。2.1.6提高试验精确度的主要途径选择试验处理注意试验材料改进试验技术统计方法控制2.2试验设计的原理2.2.1唯一差异原则进行两处理平均值比较时,它们两者之间仅有此两种处理不同而引起的唯一差异,而其它各种试验条件都应保持在同等的背景上。2.2.2试验设计的基本原理为控制干扰因子引起的差异,降低试验误差,在试验设计中要遵循如下三条基本原理:重复随机化区域控制第三章试验统计基础及EXCEL简介3.1试验统计基础3.1.1试验数据的类型数量数据当试验结果显现数量上的变化,由计数或测量所得到的数据资料。计数数据:由计数法得到的数据,是非连续型变量数据。取值时一般为正整数。如人体白细胞计数等。计量数据:由测量所得的数据,是连续型变量数据。不一定是整数,通常有不同的有效数字。如药片的重量等。质量数据当试验结果显现属性变化,只能分门别类处理所得到的数据。称名数据:数据的各种类别并没有顺序大小差别,仅是属性上名称不同。可按属性类别进行分组统计次数,有时也称次数数据。如人的血型等。顺序数据:数据的各种类别存在顺序大小的差别。如疾病治疗的疗效有痊愈、好转、无效等。可按属性类别进行分组统计其次数,有时也可数量化。3.1.2试验数据的初步分析试验数据可采用样本的基本统计参数进行初步分析。平均值(Mean/Average)算术平均值(Arithmeticmean)加权平均值(Weightedmean)nxxiiiwxwx极差(Range):一组数据中最大的与最小的值之间的差。方差(s2、2)和标准偏差(s、)Variance&StandardDeviation样本方差:样本的标准偏差:总体的方差:总体的标准偏差:nxxnxx1nxxs1nxxs2222223.2EXCEL的统计功能简介3.2.1EXCEL界面3.2.2数据、公式及函数数据输入技巧复制数据序列填充公式公式输入公式编辑单元格的引用常用函数及格式求和SUM(number1,number2,…)平均值AVERAGE(number1,number2,…)方差总体:VARP(number1,number2,…)样本:VAR(number1,number2,…)标准偏差总体:STDEVP(number1,number2,…)样本:STDEV(number1,number2,…)相对标准偏差(RelativeStandardDeviation)STDEV(number1,number2,…)/AVERAGE(number1,number2,…)极差MAX(number1,number2,…)-MIN(number1,number2,…)3.2.3随机数函数在抽样中的应用随机数发生函数RAND()随机抽样(Randomsampling)例:从1000瓶中选取10瓶作为样品。采用公式:ROUND(RAND()*1000,0)临床试验中给病人随机指定治疗方法例:对20个病人随机指定服用有效药物和安慰剂。方法一:利用公式:ROUND(RAND()*10,0)方法二:随机数排序法。3.2.4统计分析工具的使用调用统计分析工具的操作EXCEL菜单工具数据分析(19种)找不到此选项时,菜单工具加载宏勾选分析工具库数据分析工具使用举例描述统计第四章简单试验设计与统计分析正态分布与标准正态分布正态分布(Normaldistribution)若总体符合正态分布则记为:X~N(,2)。X的概率密度函数为:222xe21xf标准正态分布Standardnormaldistribution均值为0,标准偏差为1的正态分布。任意正态分布可通过简单的变量变换化为标准正态分布,即令U=(X-)/,则:U~N(0,1)4.1不相关样本的方差比较4.1.1F分布(Fdistribution)两个具有共同方差的独立正态总体。样本容量为n1的一个样本来自第一个总体,来自第二个总体的另一个样本,其样本容量为n2,则:)1n,1n(F~ssF212221F分布可用来检验平均值的差别(方差分析)和检验方差是否相等,即F检验。4.1.2两个方差的假设(显著性)检验例1:比较用两种不同的步骤制备的粉末产品,混合程度是否均匀一致。可采用的试验设计:分别随机取出7个重量一样的粉末混合物样本,分析其中的活性物质的量(mg)。粉剂A粉剂B20.620.220.719.020.921.519.821.820.618.920.420.421.021.0假设检验(Hypothesistesting)步骤:提出假设:H0:12=22H1:1222确定检验水平:预先规定的概率值,一般取0.05(双尾检验)选择检验方法,计算统计量:F=8.33或0.12与临界值比较,作出统计推断结论:利用EXCEL数据分析中的双样本方差的F检验工具(注意:单尾=0.025);临界值计算也可利用FINV函数(其反函数FDIST)。格式:FINV(probability,deg_freedom1,deg_freedom2);FDIST(F,deg_freedom1,deg_freedom2)。结论:FF0.025(6,6)=5.82,P0.025,在=0.05(双尾)水平上,拒绝H0,两种步骤制得的粉末产品混合程度不同。4.2样本平均值的比较4.2.1单样本u检验从正态总体N(,2)中,反复多次随机抽取样本容量为n的样本,则~N(,2/n),进一步变换为标准正态分布,则有:x1,0N~nxu例2:对一种片剂药品的制造工艺进行改造。考察新工艺是否对成品药片平均药物含量产生影响。已知几年中收集的该药片中药物成分分析的大量数据表明平均药物含量为50.3mg,标准偏差为51.348.650.852.748.749.552.752.153.052.11.5mg。试验设计:从采用新工艺制造的一批药片中随机抽取10片,分析其药物含量(mg)。假设检验步骤:提出假设:H0:=50.3H1:50.3确定检验水平:0.05(双尾检验)计算统计量u值:样本平均值可由函数AVERAGE求得;计算统计量u:79.1105.13.5015.51nxu与临界值比较,作出统计推断结论:利用NORMSINV函数(其反函数为NORMSDIST)计算临界值。格式:NORMSINV(probability);NORMSDIST(u)结论:uu0.05=1.96,P0.05,在=0.05水平上,接受H0。新工艺对成品药片平均含量没有显著的影响。4.2.2t分布(学生氏t分布)若从正态总体N(,2)中,反复多次随机抽取样本容量为n的样本,则:)1n(t~nsxtt分布曲线的形状与样本容量(自由度)有关,但都是关于平均值0对称的。样本平均值的比较通常是进行t检验。4.2.3单样本t检验例2:若总体标准偏差未知,则需要进行t检验。51.348.650.852.748.749.552.752.153.052.1假设检验步骤:提出假设:H0:=50.3H1:50.3确定检验水平:0.05(双尾检验)计算统计量t值:样本平均值与标准偏差可分别由函数AVERAGE和STDEV求得;计算统计量t:60.1
本文标题:试验设计与数据处理
链接地址:https://www.777doc.com/doc-3270849 .html