您好,欢迎访问三七文档
第三节正态分布主要内容:一、正态分布概念二、正态分布的特点三、应用一、正态分布概念正态分布又称高斯分布,常态分布,是一种数据的波动规律的表达,主要反映了试验的随机误差。强度分组为横坐标,以频数为纵坐标,绘成强度—频数直方图3752100246810121820222426如将频数-实验次数增到无限大,强度间隔缩到无限小,或做强度、频数的平滑曲线,即得到如下曲线:02468101216182022242628强度(MPa)f(x)频数已知曲线即为正态分布曲线,用函数表示即为式中X—测定值,e自然对数的底e=2.7183μ—曲线最高点的横坐标,即总体平均值,最多的数据出现在此附近.б—总体标准差,表示数据分散的程度.常数=0.398922121uxexf2由公式得当x=u时,当μ变化时,而μ一定时,整个曲线的位置将沿横坐标移动,此时曲线的形状不变,当б发生变化时,曲线形状也随之而变,当б变小时,增大,曲线变得高而瘦,表明数据更集中,反之б↘,曲线变得矮而胖,数据分散。21)(maxxf材料研究信息检索、试验设计与数据处理max)(xf当n=0时,б=1时的正态分布,称之为标准正态分布,此时概率函数如下图所示:(图没画)成轴对称分布,由概率可知,此时曲线与横坐标所图的面积P等于1,即=1dxxf)(2)(221xxe当在[-t,+t]范围内变化时P=书中列出了不同t时的P值,ttxdxe2221当在[-t,+t]见表1-2T0±0.32±0.57±1.00±1.15P00.250.500.680.75T±1.645±2.00±2.58±3.00±∞P0.900.950.990.9971.00当在[-t,+∞]见表1-3T0-0.20-0.524-1.00-1.40P0.50.5790.700.8410.919T-1.645-2.00-3.00∞P0.9500.99170.9991.00当在[-∞,-t]见表1-4T-3-2-10P0.001350.022750.158650.5意义:概率P(axb)=横坐标与曲线f(x)所围成的面积当在[-t,+t],两值间的概率,3σ原则判断疏失误差;当在[-t,+∞],某值t的概率,强度保证率P即指此区间;当在[-∞,-t],-t时的概率,不合格率二、正态分布的特点1.曲线有一个最高峰,是数据分布最多的点,该列数据的平均值2.以平均值u为对称轴,左右两侧对称,即大于和小于平均值得概率相等3.曲线与横坐标围成的面积=1,落在(u-σ,u+σ)的概率为68.27%,落在(u-2σ,u+2σ)的概率为95.45%,落在(u-3σ,u+3σ)的概率为99.73%4.离u越近,概率越大,处在3σ之外的概率仅为0.27%,接近0。5.u±σ处为一拐点,俩拐点间的曲线向下弯曲,拐点以外向上弯曲,σ越小,曲线越瘦,数据越集中,精密度越高。应用1.可疑数据的舍弃;A.莱特准则(3σ原则):由于落在(u-3σ,u+3σ)的概率为99.73%,处在3σ之外的概率(即误差概率)仅为0.27%,接近0,对于常规一般仅进行几十次的测量,如处在3σ之外则说明属于随机误差,应剔除。由于次判据是建立在n趋向于无穷得基础上得,所以当n有限时,尤其是n较小时这一判据并不十分可靠。但是由于其使用方便,故常常被使用。B.肖维纳准则是根据一列n次得等精度测量值,计算得到平均值x和标准差σ,当某次测量值大于下表所列之值,则认为该测量值可疑并将其舍弃。对于测量次数超过200~300次的时候,就有可能遇上超过3σ的随机误差,这时就不应该舍弃,由此可见,对数据的合理误差范围是同测量次数有关的。xxi参考推荐的舍弃标准表次数n345678910111213di/σ1.381.531.651.731.801.861.921.962.002.032.07次数n1415161718192021222324di/σ2.102.132.152.172.202.222.242.262.282.302.31次数n252630405075100200300500di/σ2.332.352.392.492.582.712.813.023.293.30参考推荐的舍弃标准表其中di=f-f(平均),σ为标准差1.强度保证率强度保证率P与不合格率Q的关系P+Q=1在混凝土设计中,混凝土配制强度R配=R标+t×σ一般要求强度保证率≥95%,t=1.645(P=95%)σ随设计标号的不同而不同σ取值表C20C20~C35C35σ(MPa)4.05.06.0如对C30混凝土,试验多次,测定平均值R为31.0MPa,标准差σ=4.5MPa则t=(R-R配)/σ=(31.0-30.0)/4.5=0.22查表1-3得P=58.7%,太低要解决这一问题,可通过1.提高匀质性和密实度2.提高配制强度,降低水灰比3.掺加外掺料。第四节试验设计与分析主要内容:一、正交设计(一)正交设计的基本方法(二)多指标的试验分析前言试验设计是数理统计学的应用之一,已广泛的应用于各个领域,在实验研究中,往往不是单一的进行一些常规试验,而是要不同情况如不同配比、不同工艺参数、不同混合材料等对产品生能的影响等试验,如工厂企业为了提高产品质量,常常需要做各种试验,以改变原料配比或工艺条件或管理方法,来寻求最佳工况;农业生产中,为了提高掺量,要进行品种对比,施肥对比,药物对比等对比试验。在我们的科研试验中,更是通过各种不同的影响因素的对比试验来达到产品的高要求甚至研究出新产品。由于不同的试验因素对试验结果产生的影响是不同的,为了充分了解诸因素对特征值(目标)的影响大小,这时就要求做不同的组合试验,以寻求最佳配合,势必要求做大量的实验,劳动量相当大。在试验过程中,为了达到试验目的,总是人为的选定某些因素,让他们在一定范围内变化,来考察他们对特征值的影响。怎样组织试验,以最小的代价获得最多的信息,这就是试验设计的任务所在。如利用正交设计方法,且用适当的分析方法处理数据,就能大大减少工作量,同时又能找到最佳组合。一、正交设计正交设计在大量实践的基础上总结出来的一种科学试验方法。它是用一套规格化的表格来安排试验,这种表叫正交表。采用均衡分散性,整齐可比性的设计原则,合理安排实验。如研制粉煤灰砼,影响因素有如①水灰比;②粉煤灰掺量;③砂率;④养护方式,如每种方法变化三次,在正常情况下用全面试验方法要做34=81次试验,如果我们利用正交设计,将各因素适当的组合,则仅需做9次实验即可。正交表是一种设计好的固定格式,其表示形成如L8(27)、L16(215)、L9(34)、L27(313)、L16(45)、L16(42×29)等常用正交表,其中L表示正交表的代号,L下面的数字如8、16、9、27、16等均表示试验次数,括号内的指数如7、15、4、13、5等表示试验影响因素的个数,括号内下面的数字如2、3、4等表示最多安排的各个因素的水平数(即取值变化数),如L16(215)表示需做16个实验,最多安排15个因素,每个因素取2个水平,L8(4×24)表示需做8次实验最多安排1个因素的四个水平数和4个水平的因素。(一)正交设计的基本方法试验设计包括三方面的内容:1.因素和水平选择2.误差控制:试验方案的制定3.数据处理:分析试验结果一般来说,为保证结论的可靠性,在选取因素时应把所有影响较大的因素选入试验,某些因素之间可能还有交互作用,所谓交互作用,就是这些因素在同时改变水平时,其效果会超过单独改变某一因素水平时的效果。影响较大的因素还应包括那些单独变化水平时效果可能不太,大与其他因素同时变化时交互作用较大的因素,这样才能保证试验的代表性。因素变化越多越好,取值不能少于3个,这样才能看出曲线,看出其变化的趋势。某一因素取值变化的次数即水平数,为了减少试验次数,往往取两水平(现行工艺水平和新工艺水平)或三水平(低于现行工艺水平或理论值、现行工艺水平、高于现行工艺水平)。水平变化的范围不宜太大。正交表的选用先看水平数,一般遵从水平数与实验水平相同,因素大于实际因素,确定因素水平后再选用合适的正交表。如各因素水平表一样的,如全为2水平的可选用L8(27)、L16(215)等正交表,对水平数不等的可选用L8(4×24)、L16(42×29)、L16(43×36)等正交表,部分正交表列于附表:1.举例说明:如书P14页某研究单位利用工业废料——煤渣制砖(是一种墙体材料)通过实验找到合理的生产工艺,以提高煤渣的抗折强度,首先确定因素,从实践中得知,生产煤渣砖的成型水分的多少,材料碾压时间长短,每次碾压料重这三种要素,都会影响其抗折强度,对于这些因素,哪个因素影响最大,各个因素取值多少最好,如何搭配最好,这些问题可通过正交设计来实现解决.如这个试验即为了因素,了解、确定因素水平。正交表即试验计划表,根据正交表进行试验,如表P15页12-3,试验结果列于表12-4中,K表示同一水平各因素的抗折强度的总和,k表示平均值,如表中K,第一列K1表,因实验为三因素三水平,k=K/3。极差:同一水平各因素中平均值的最大与最小值之差即Kmax-Kmin,如第一例的极差为K3-K1=2.29-1.76=0.53。绘出同一因素不同水平对抗折强度的影响,绘图时水平应按从小到大排列如图12-2:从表12-4\12-2可知,极差大的其因素影响最大,图中点子数散度大的,因素影响也最大。以每个因素中的抗折强度最高值确定最佳值组合,如本例中成型水分为11%,碾压时间为10min,一次碾压料重400kg,该组合在设计表中并未出现,但它是全部27种组合之一,由此可见用L9(34),正交表安排的试验确定具有代表性。且从图12-2还可以看出,按趋势,增加水分与碾压料重、抗折强度,还有可能提高,因此还应扩大试验范围,试探其强度趋势。归纳正交设计过程:①定指标,明确重点应解决的问题;②选因素与水平数必须选择合理,依靠经验;③选正交表;④进行试验,测量结果;⑤分析归纳结果。(二)多指标的试验分析多指标的试验分析与单指标的试验分析方法和原理是基本相同的只是数据处理更复杂,必须分别计算各指标的Ki,ki和极差。如书P17列12-5表对纤维增强材料:指标有抗折、抗冲击、吸水率,前两者是越大越好,后者是越小越好,首先忽略另外两个指标,按单指标的分析方法,分别确定单个指标的影响大小,选出对三个指标影响都很大的因素,确定水平从而确定最佳组合。有交互作用的试验设计在多因素试验中,如一个因素A对指标的影响与另一因素B取什么水平有关,则这两个因素A与B有交互作用,可用A×B表示。1.如何确定两因素之间是否有交互作用‹1›通过作用可大致判断出来,如因素有交互作用,取两水平做四次实验并作图水平一因素图,两直线直接交叉,反之如无交互作用,则两直线基本平行,当然,由于试验误差的存在,两线不可能完全平行,只要大体平行,我们就可判定交互作用很小或基本上没有。见附录二表(5)P86,有交互作用的因素试验按表设计,如A与B有交互作用,则A与B是一种假想因素先起作用:在不知是否存在交互作用时,是否可以将其误为有交互作用设计,如何判定是否有交互作用呢?误为交互作用设计未尝试不可,但是我们从附表二表5与表1可看出,因为三因素两水平数,因交互作用设计的实验次数增多了,这样就加大了实验工作量,如果我们能先判此出是否有交互作用,就不会出现这种情况,我们可以分析一下表12-11,不考虑交互作用,列即A×B、B×C、A×C列,仅考虑A、B、C三列可看出在C1一定的情况下,B1C1→B2C1增大;在C2一定时,B1C2→B2C2减小。其变化的趋势正好相反,所以,B与C有交互作用,且从表中的数据也中以看出B1C2的指标数据大,为最佳搭配,所以即使没有考虑列交互作用,也可以判此是否有交互作用。只是如果单纯从无交互作用分析中所用的极差分析方法,无法明显的看出是否有交互作用而已。有交互作用的试验设计,总的说来,其方法与无交互作用的试验设计方法基本
本文标题:第三节 正态分布
链接地址:https://www.777doc.com/doc-3275529 .html