您好,欢迎访问三七文档
5.遗传算法遗传算法(geneticalgorithms,简称GA)是人工智能的重要分支,是基于达尔文进化论,在微型计算机上模拟生命进化机制而发展起来的一门新学科。它根据适者生存、优胜劣汰等自然进化规则来进行搜索计算和问题求解。对许多用传统数学难以解决或明显失效的非常复杂问题,特别是最优化问题,GA提供了一个行之有效的新途径。近年来,由于遗传算法求解复杂优化问题的巨大潜力及其在工业控制工程领域的成功应用,这种算法受到了广泛的关注。5.1.1基本遗传学基础遗传算法是根据生物进化的模型提出的一种优化算法。自然选择学说是进化论的中心内容,根据进化论,生物的发展进化主要由三个原因,即遗传、变异和选择。遗传是指子代总是和亲代相似。遗传性是一切生物所共有的特性,它使得生物能够把其特性、性状传给后代。遗传是生物进化的基础。变异是指子代和亲代有某些不相似的现象,即子代永远不会和亲代完全一样。它是一切生物所具有的共有特性,是生物个体之间相互区别的基础。引起变异的原因主要是生活环境的影响及杂交等。生物的变异性为生物的进化和发展创造了条件。选择决定生物进化的方向。在进化过程中,有的要保留,有的要被淘汰。自然选择是指生物在自然界的生存环境中适者生存,不适者被淘汰的过程。通过不断的自然选择,有利于生存的变异就会遗传下去,积累起来,使变异越来越大,逐步产生了新的物种。生物就是在遗传、变异和选择三种因素的综合作用过程中,不断地向前发展和进化。选择是通过遗传和变异起作用的,变异为选择提供资料,遗传巩固与积累选择的资料,而选择则能控制变异与遗传的方向,使变异和遗传向着适应环境的方向发展。遗传算法正是吸取了自然生物系统“适者生存、优胜劣汰”的进化原理,从而使它能够提供一个在复杂空间中随机搜索的方法,为解决许多传统的优化方法难以解决的优化问题提供了新的途径。5.1.2遗传算法的原理和特点遗传算法将生物进化原理引入待优化参数形成的编码串群体中,按着一定的适值函数及一系列遗传操作对各个体进行筛选,从而使适值高的个体被保留下来,组成新的群体,新群体包含上一代的大量信息,并且引入了新的优于上一代的个体。这样周而复始,群体中各个体适值不断提高,直至满足一定的极限条件。此时,群体中适值最高的个体即为待优化参数的最优解。正是由于遗传算法独具特色的工作原理,使它能够在复杂空间进行全局优化搜索,并且具有较强的鲁棒性;另外,遗传算法对于搜索空间,基本上不需要什么限制性的假设(如连续、可微及单峰等)。遗传算法的特点同常规优化算法相比,遗传算法有以下特点:①遗传算法是对参数的编码进行操作,而非对参数本身。②遗传算法是从许多点开始并行操作,并非局限于一点,从而可有效防止搜索过程收敛于局部最优解。③遗传算法通过目标函数计算适值,并不需要其它推导和附加信息,因而对问题的依赖性较小。④遗传算法的寻优规则是由概率决定的,而非确定性的。⑤遗传算法在解空间进行高效启发式搜索,而非盲目地穷举或完全随机搜索。⑥遗传算法对所求解的优化问题没有太多的数学要求。⑦遗传算法具有并行计算的特点,因而可通过大规模并行计算来提高计算速度。5.1.3遗传算法的基本操作一般的遗传算法都包含三个基本操作:复制(reproduction)、交叉(crossover)和变异(mutation)。1.复制复制(又称繁殖),是从一个旧种群(oldpopulation)中选择生命力强的字符串(individualstring)产生新种群的过程。或者说,复制是个体位串根据其目标函数f(即适值函数)拷贝自己的过程。直观地讲,可以把目标函数f看作是期望的最大效益的某种量度。根据位串的适值所进行的拷贝,意味着具有较高适值的位串更有可能在下一代中产生一个或多个子孙。显然,在复制操作过程中,目标函数(适值)是该位串被复制或被淘汰的决定因素。复制操作的初始种群(旧种群)的生成往往是随机产生的。例如,通过掷硬币20次产生维数n=4的初始种群如下(正面=1,背面=0):01101110000100010011显然,该初始种群可以看成是一个长度为五位的无符号二进制数,将其编成四个位串,并解码为十进制的数:位串1:0110113位串2:1100024位串3:010008位串4:1001119通过一个5位无符号二进制数,可以得到一个从0到31的数值x,它可以是系统的某个参数。计算目标函数或适值f(x)=x2,其结果如表6-1所示。计算种群中所有个体位串的适值之和,同时,计算种群全体的适值比例,其结果示于表中。转轮法转轮法把种群中所有个体位串适值的总和看作一个轮子的圆周,而每个个体位串按其适值在总和中所占的比例占据轮子的一个扇区。按表5-1可绘制如图的转轮。复制时,只要简单地转动这个按权重划分的转轮4次,从而产生4个下一代的种群。例如对于表5-1中的位串1,其适值为169,为总适值的14.4%。因此,每旋转一次转轮指向该位串的概率为0.144。每当需要下一个后代时,就旋转一下这个按权重划分的转轮,产生一个复制的候选者。这样位串的适值越高,在其下代中产生的后代就越多。图5-1当一个位串被选中时,此位串将被完整地复制,然后将复制位串送入匹配集(缓冲区)中。旋转4次转轮即产生4个位串。这4个位串是上代种群的复制,有的位串可能被复制一次或多次,有的可能被淘汰。在本例中,位串3被淘汰,位串4被复制一次。如表6-2所示,适值最好的有较多的拷贝,即给予适合于生存环境的优良个体更多繁殖后代的机会,从而使优良特性得以遗传,反之,最差的则被淘汰。2.交叉简单的交叉分两步实现。第一步是将新复制产生的位串个体随机两两配对;第二步是随机选择交叉点,对匹配的位串进行交叉繁殖,产生一对新的位串。具体过程如下:设位串的字符长度为l,在[1,l-1]的范围内,随机地选取一个整数值k作为交叉点。将两个配对串从第k位右边部分的所有字符进行交换,从而生成两个新的位串。例如,在表6-2中,已知位串的字符长度l=5,随机选取k=4,对两个初始的位串个体A1和A2进行配对,交叉操作的位置用分隔符“|”表示为:A1=0110|1A2=1100|0交叉操作后产生了两个新的字符串为:A1’=01100A2’=11001一般的交叉操作过程:遗传算法的有效性主要来自于复制和交叉操作。复制虽然能够从旧种群中选择出优秀者,但不能创造新的个体;交叉模拟生物进化过程中的繁殖现象,通过两个个体的交换组合,来创造新的优良个体。表6-3列出了交叉操作之后的结果数据,从中可以看出交叉操作的具体过程。首先,随机配对匹配集中的个体,将位串1、2配对,位串3、4配对;然后,随机选取交叉点,设位串1、2的交叉点为k=4,二者只交换最后一位,从而生成两个新的位串,即图5-2交叉操作211001100110010011011021新串新串:串:串位串3、4的交叉点为k=2,二者交换后三位,生成两个新的位串,即430000111011110000011143新串新串:串:串单点交叉与多点交叉上述例子中交叉的位置是一个,称单点交叉。即指个体切断点有一处,由于进行个体间的组合替换生成两个新个体,位串个体长度为l时,单点交叉可能有l-1个不同的交叉。多点交叉是允许个体的切断点有多个,每个切断点在两个个体间进行个体的交叉,生成两个新个体。3.变异尽管复制和交叉操作很重要,在遗传算法中是第一位的,但不能保证不会遗漏一些重要的遗传信息。在人工遗传系统中,变异用来防止这种遗漏。在简单遗传算法中,变异就是在某个字符串当中把某一位的值偶然的(概率很小的)随机的改变,即在某些特定位置上简单地把1变为0,或反之。当它有节制地和交叉一起使用时,它就是一种防止过度成熟而丢失重要概念的保险策略。例如,随机产生一个种群,如表所示。在该表所列种群中,无论怎样交叉,在第4位上都不可能得到有1的位串。若优化的结果要求该位是1,显然仅靠交叉是不够的,还需要有变异,即特定位置上的0和1之间的转变。变异在遗传算法中的作用是第二位的,但却是必不可少的。变异运算用来模拟生物在自然界的遗传环境中由于各种偶然因素引起的基因突变,它以很小的概率随机改变遗传基因(即位串个体中某一位)的值。通过变异操作,可确保种群中遗传基因类型的多样性,以使搜索能在尽可能大的空间中进行,避免丢失在搜索中有用的遗传信息而陷入局部解。根据统计,变异的概率为0.001,即变异的频率为每千位传送中只变异一位。在表6-3的种群中共有20个字符(每位串的长度为5个字符)。期望变异的字符串位数为20×0.001=0.02(位),所以在此例中无位值的改变。从表6-2和表6-3可以看出,虽然仅进行一代遗传操作,但种群适值的平均值和最大值却比初始种群有了很大的提高,平均适值由293变到439,最大值由576变到729。这说明随着遗传运算的进行,种群正向着优化的方向发展。遗传算法在以下几个方面不同于传统优化方法①遗传算法只对参数集的编码进行操作,而不是参数集本身。②遗传算法的搜索始于解的一个种群,而不是单个解,因而可以有效地防止搜索过程收敛于局部最优解。③遗传算法只使用适值函数,而不使用导数和其它附属信息,从而对问题的依赖性小。④遗传算法采用概率的、而不是确定的状态转移规则,即具有随机操作算子。图5–3遗传算法的工作原理示意图5.2.1目标函数值到适值形式的映射适值是非负的,任何情况下总希望越大越好;而目标函数有正、有负、甚至可能是复数值;且目标函数和适值间的关系也多种多样。如求最大值对应点时,目标函数和适值变化方向相同;求最小值对应点时,变化方向恰好相反;目标函数值越小的点,适值越大。因此,存在目标函数值向适值映射的问题。5.2遗传算法应用中的一些基本问题首先应保证映射后的适值是非负的,其次目标函数的优化方向应对应于适值增大的方向。对最小化问题,一般采用如下适值函数f(x)和目标函数g(x)的映射关系:(5-6)其中:cmax可以是一个输入参数,或是理论上的最大值,或是到目前所有代(或最近的k代)之中见到的g(x)的最大值,此时cmax随着代数会有所变化。其它,0)(),()(maxmaxcxgxgcxf对最大化问题,一般采用下述方法:(5-7)式中:cmin既可以是输入值也可以是当前最小值或最近的k代中的最小值。对指数函数问题,一般采用下述方法:其中:c一般取1.618或2(最大化),0.618(最小化)。这样,既保证了f(x)≥0又使f(x)的增大方向与优化方向一致。其它,0)(,)()(minmincxgcxgxfycxf)()(xgy5.2.2适值的调整为了使遗传算法有效地工作,必须保持种群内位串的多样性和位串之间的竞争机制。现将遗传算法的运行分为开始、中间和结束三个阶段来考虑:在开始阶段,若一个规模不太大的种群内有少数非凡的个体(适值很高的位串),按通常的选择方法(选择复制的概率为fi/Σfi,期望的复制数为fi/),这些个体会被大量地复制,在种群中占有大的比重,这样就会减少种群的多样性,导致过早收敛,从而可能丢失一些有意义的搜索点或最优点,而进入局部最优;在结束阶段,即使种群内保持了很大的多样性,但若所有或大多数个体都有很高的适值,从而种群平均适值和最大适值相差无几,则平均适值附近的个体和具有最高适值的个体,被选中的机会相同,这样选择就成了一个近乎随机的步骤,适值的作用就会消失,从而使搜索性能得不到明显改进。因此,有必要对种群内各位串的适值进行有效调整,既不能相差太大,又要拉开档次,强化位串之间的竞争性。5.2.3编码原则遗传算法参数编码原则有两种:深层意义上的建筑块原则和最小符号表原则。而后者是一种应用广泛的实用原则。最小符号表原则要求选择一个使问题得以自然表达的最小符号编码表。在前面讨论中使用的都是二进制符号编码表{0,1},任何一个长度为l的位串都包含在{0,1}l中。根据遗传算法的模式理论,遗传算法能有效工作的根本原因,在于其能有效的处理种群中的大量模式,尤其是那些定义长度短、确定位数少、适值高
本文标题:遗传算法详解
链接地址:https://www.777doc.com/doc-1543064 .html