您好,欢迎访问三七文档
试验设计与数据处理DESIGNOFEXPERIMENT试验设计的历史和发展•从20世纪20年代,英国统计学家R.A.Fisher将试验设计方法用于农业、生物学、遗传学等方面,取得了丰硕的成果。在1935年出版了专著《试验设计》,从此开创了一门新的应用技术学科。•20世纪30-40年代,英、美、前苏联将试验设计逐步推广到采矿、冶金、建筑、纺织、机械、医药等。第二次世界大战期间,试验设计技术在工业试验区起了重要的作用。•战后,日本把试验设计作为质量管理技术引入,在他们的生产实践中经过不断地改进,创造了正交试验法,并在日本的工业生产中得到迅速推广。据统计,在推广正交试验设计方法的头十年,试验项目超过100万,其中三分之一的项目效果十分显著,获得了极大的经济效益。•日本电讯研究所“线形弹簧继电器”应用正交试验设计技术,对数十个特性值2000多个变量进行七年的努力研究,制造出比美国更先进的产品。该产品价值几美元,研制费几百万,盈利几十个亿美元中国的贡献•在科学实验的优化设计方面•在20世纪60年代华罗庚提倡与普及“优选法”•数理统计在工业部门积极普及“正交设计”法,产生巨大的社会效益和经济效益•1978年方开泰提出了“均匀设计”试验设计重要意义•使用频率最高的统计方法之一•统计学家G.E.P.Box曾说,假如有10%的工程师使用各种试验设计方法,产品的质量与数量都会有很大提高•质量工程学创始人田口玄一博士说过:不懂试验设计的工程师只能算半个工程师•普及试验设计是重要的战略措施•理、工、医、农各领域科技工作者的一项共同工作是做试验,在工农业生产和高科技的发展中,试验是必不可少的。试验设计就是讲述如何科学有效地安排试验并分析试验数据的学科。一个好的试验设计可以用少量的试验次数就获得最有效的试验信息。•试验设计是对试验进行科学合理的安排,以达到最好的实验结果。即在进行具体的试验之前,要对试验的有关影响因素和环节作出全面的研究和安排,从而制定出行而有效的试验方案。使试验设计能够合理地安排各种试验要素,严格地控制试验误差,并且能够有效地分析试验数据[1]。第一章试验数据的整理与特征数什么是实验•它是目的在于回答一个或几个经过精心构思的问题的实践活动。•一项实验必须要有明确的目的,即就是明确要回答的问题,如•为了提高产品产量或质量而寻找最佳的或满意的工艺参数搭配•为开发新产品而寻找性能稳定和成本低廉的设计设计方案•为控制生产过程而寻求描述过程的数学模型•为了证明一个或几个特定因子对某个重要指标所发挥的作用在统计上是否具有显著性。常用术语•总体与个体•一个统计问题总有它明确的研究对象.•研究对象的全体称为总体•总体中每个成员称为个体•例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.•寿命X可用一概率(指数)分布来刻划•鉴于此,常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).•总体分布一般是未知,或只知道是包含未知参数的分布,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.记为n•通常n≤30为小样本;n30为大样本•最常用的一种抽样叫作“简单随机抽样”,其特点:1.代表性:X1,X2,…,Xn中每一个与所考察的总体有相同的分布.2.独立性:X1,X2,…,Xn是相互独立的随机变量•常用样本统计量:样本均值、样本方差•指标:用于衡量试验结果好坏的特征值•因子与水平:影响试验结果的因素为因子;因子所处的状态称为水平。•试验误差•试验指标除受因子影响外,还受到许多其他非试验因素的干扰,从而产生误差。•试验误差分为两类:随机误差、系统误差•随机误差也叫抽样误差是由无法控制的偶然因素造成;无法消除,只能尽量降低。•统计上的试验误差是指随机误差•系统误差被细致的工作消除2(0,)yN数据资料来源•生产记录•抽样检验----对原料的重要成分和外观形状进行抽样检验•试验研究---用新工艺的设计方案进行试验,并取得数据数据资料种类•连续性资料---对每个观察单位使用仪器或试剂等量测手段来测定其某项指标的数据资料。例如:叶酸含量•间断性资料---用计数方式得到的数据资料。例如:单位容积内细菌个数•分类资料---可自然或人为地分为两个或多个不同类别的资料,只能通过观察、触模和嗅觉获得有关信息而不能直接测量的性状指标。连续性资料的整理•采用组距式分组的方法•基本步骤:先确定全距、组数、组距、组中值及组限;然后将全部观测值计数归组•全距:又称为极差•确定组数:既简化资料又不影响反映资料的规律性•确定组距:每组最大值与最小值之差•确定组中值及组限•各组中最大值称为上限•各组中最小值称为下限•组中值=(组上限+组下限)/2•=组下限+1/2组距=组上限-1/2组距•各组的上限一般不标出•最后,制作次数分布表组限组中值次数合计分类资料整理•一批苹果随机抽取150个果子,按着色程度分成4等等级次数频率特级一级二级三级合计常用统计图•直方图•长条图•圆图•线图•折线图20《常用统计方法》第三章数据的描述华东师范大学统计系2007年3月22日MATH100.095.090.085.080.075.070.065.060.055.050.020100Std.Dev=9.69Mean=75.0N=100.00图3.1直方图21《常用统计方法》第三章数据的描述华东师范大学统计系2007年3月22日zai直方图(histogram)•直方图的解读——直方图的形状为一个个矩形(直方),这也是其名字的由来,见图3.1图的横坐标为变量(数据)的不同取值范围,纵坐标为落在相应范围内的数据个数。•图中还附带有三个数字特征,分别为标准差(Std.Dev.)、均值(Mean)和样本容量N,22《常用统计方法》第三章数据的描述华东师范大学统计系2007年3月22日观点美洲大洋洲欧洲非洲亚洲Count98765432图3.7简单条形图23《常用统计方法》第三章数据的描述华东师范大学统计系2007年3月22日简单条形图(SimpleBarChart)•条形图可分为简单(Simple)条形图和复杂条形图。•简单条形图的解读——定性变量的简单条形图与定量变量的直方图形状相似,区别在于简单条形图的横坐标不是变量的取值范围,而是定量变量的不同取值,而且这些取值可以不是数量,而是代表定性变量性质的不同字符串。见图3.7。24《常用统计方法》第三章数据的描述华东师范大学统计系2007年3月22日CasesweightedbyNUMBERINCOME321Count282624222018161412SEX01图3.8簇条形图25《常用统计方法》第三章数据的描述华东师范大学统计系2007年3月22日复杂条形图•除了前面介绍的简单条形图外,还常用到条形图有簇(Clustered)条形图和累加(Stacked)条形图。•簇条形图的解读——簇条形图与简单条形图的区别在于:对于制作条形图的定性变量的每个不同取值,有一簇条形与之相对应;这一簇条形又按另一个簇(Cluster)变量的取值来加以区分。见图3.8。26《常用统计方法》第三章数据的描述华东师范大学统计系2007年3月22日CasesweightedbyNUMBERINCOME321Count6050403020100SEX10图3.9累加条形图27《常用统计方法》第三章数据的描述华东师范大学统计系2007年3月22日•累加条形图的解读——与簇条形图类似,区别在于同一簇内的不同条形不再是水平区分开,而是垂直累加在一起,并用不同颜色加以区分。见图3.9。28《常用统计方法》第三章数据的描述华东师范大学统计系2007年3月22日美洲大洋洲欧洲非洲亚洲图3.6饼图29《常用统计方法》第三章数据的描述华东师范大学统计系2007年3月22日饼图(PieChart)•饼图的解读——饼图的形状为一圆饼,用不同颜色标出大小不等的扇区,见图3.6。不同扇区代表定性变量的不同取值,这些取值不一定是数值,通常为代表定性变量不同性质的某字符串。扇区的面积大小代表定性变量数据为相应值的个数的多少,相应地,扇区面积占圆面积的百分比即为定性变量取相应值的比率(概率)。1716151413121110987654321Sequencenumber180.0160.0140.0120.0100.0黑色金属材料类•线图:表示事物或现象随时间而变化的情况•单式线图•复式线图•折线图•可根据次数分布表作次数分布折线图•以组中值为横坐标,次数为纵坐标•连接点(组中值,次数)位置统计量描述中心趋势的统计量•样本均值(samplemean),常记为它是所有样本数据的平均值•中位数(midian),它是数据按照大小排列以后位于中间的那个数(如果样本量为奇数),或者中间两个数的平均(如果样本量为偶数)n12nii1xxx1xxnn•样本均值通常受样本数据的极值(最大值和最小值)大小的影响较大,而中位数相对来说基本不受极值大小的影响,因此常称中位数比均值更稳健(robust)。•.众数(mode)——样本中出现次数最多的数•k百分位数(k-pecentile)——样本数据按从大到小顺序排列,处于有k%的观测值小于它的位置。数据的尺度统计量•极差(range)——样本最大值与最小值之间的差。•样本方差(variance)——样本各数据与样本均值的差的平方的平均值。方差一般用S2表示,定义为2n2ii11S(xx)n1•样本标准差:S•变异系数:是标准差相对于平均数的百分比,记为CV。•当数据资料平均值相差较大时,不能直接用标准差来比较样本数据的变异程度。•变异系数消除了不同单位和均值的影响,因此用变异系数来比较样本数据的变异程度•100%SCVx性状果皮厚49.64.99.87角质层厚6.20.812.90x/mS/mCV/%角质层厚的相对变异程度大
本文标题:试验设计概要[1]
链接地址:https://www.777doc.com/doc-3158333 .html