您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 机械/模具设计 > 统计推断-第008组(顾婕昱)课程设计报告
1顾婕昱,毕雨来统计推断在数模、模数转换中的应用统计推断在数模、模数转换中的应用第008组顾婕昱5110309388,毕雨来5110309514摘要:本论文在工程实践与科技创新[3A]的实验结果数据的基础上,探究统计推断在数模、模数转换中的应用。报告中利用DC-DC开关电源输出的电压值与PWM信号占空比的53组数据,采用选取7个特征点,运用随机函数和遗传算法并结合退火算法,来寻求满足所有数据的统一形式的函数,并得到满足评价函数的局部最优解。关键词:统计推断,曲线拟合,三次条样插值,模拟退火算法,遗传算法ApplicationofStatisticModelinA/DandD/AConverseSystemABSTRACT:Thepaperistoexploretheapplicationofstatisticmodelinmodule-digital-analogconversionsystemonthebasisoftheexperimentaldatafromtechnologicalinnovation[3A].ThereportusesDC-DCswitchingpowersupplyoutputvoltageandPWMdutycycleof53setsofdatatoandpickssevencharacteristicpointstofindaconsensusfunctionforallgroupsofdatabymeansofrandomselection,geneticalgorithmandsimulatedannealingalgorithmtogetthepartialoptionalresult.Keywords:StatisticModel,CurveFitting,SpineInterpolation,SimulatedAnnealingAlgorithm,GeneticAlgorithm1引言在工程实践与科学实验中通常面对的对象是一个由多个变量组成的一个系统,当我们需要寻找两个变量间的关系时,在理论上我们可以通过计算得出两个变量之间的确定的函数关系,但实际却很难找到非常精确描述两个变量的函数。通常采取的方法是通过多种不同曲线拟合,算出多种不同的方案,并选择某一统计量作为评定优劣标准,从而选出最优的方案。1.1问题的提出本次课题面对的对象是一个含有微处理器智能器件的开关电源(DC—DC系统),通过输出一定的占空比的PWM波来控制输出的电压。电路板的D-U特性关系个体差异较大,实验室中,我们可以逐点测定53个电压设点对应的占空比D值,但是涉及到大批量的工业生产时,逐块测定势必会增加生产成本,降低可行性。那么是否可以通过几组事前观测值来完成对系统的定标?系统定标准确度评价函数定义为:others2015.0ˆ0.10when010.0ˆ0.05henw.4005.0ˆ0.03henw2.103.0ˆ0.01henw8.101.0ˆwhen2jjjjjjjjjjjUUUUUUUUUUA2顾婕昱,毕雨来统计推断在数模、模数转换中的应用)0,2(522hjAMAXA(1-1)说明:(1)j=1对应𝑈1=4.9(V),j=53对应𝑈53=10.1(V),此2点不纳入评价范围(2)式中,增加(-2)项使满分取到100,与百分制习惯相符合(3)限定A的最小取值为01.2数据来源实验课程中制作的可调电源模块,在本报告中视为一个黑盒抽象对象如图所示:图1-1测量对象模型[1]数据来源为实验课程中所有小组的有效数据。每一组数据输出电压从4.9V到10.1V,每隔0.1V取样得到相应的占空比,共53个数据对。总共有544组数据。1.3课程目标限测7点事前观测值,获得平均得分不低于94分的估测方法。2方案设计2.1数据点观察通过观察发现,随着采样点电压的增大,有些图像具有良好的线性性和平滑度,有些图像则分段具有较好的平滑度,但是有明显的分段跳变。另外观察到有一部分的曲线抖动比较厉害,平滑度较差。2.2数学背景给出一组对应的模拟量,要求确定一个函数逼近原函数,要求不要求过所有的点而且尽可能表现数据的趋势,靠近这些点。判断最优的准则可以是最小二乘、加权最小二乘、极大似然等。这里使用最小二乘法,是使观测数据的误差平方和达到最小值的一种预测方法。设𝑑𝑖𝑗为某一占空比的数值,𝑢𝑖𝑗为在该占空比下对应的电压值,当函数表达式确定好后,将某一占空比带入表达式即可得到理论的电压值,但是它与实际测量值之间必定存在一定的误差,用随机误差ε𝑖𝑗来表示。即𝑢𝑖𝑗=𝑓(𝑑𝑖𝑗)+𝜀𝑖𝑗(2-1)样本总得分可依据每个点的𝜀𝑖𝑗对应课程所给的评价函数求取Aij,并加和求取总评分,即∑∑Aij52j=2544i=1(2-2)评判一个数学模型的好坏的方式就是:计算平均得分,即score=∑∑Aij52j=2544i=1−2×544544(2-3)2.3特征点选取观察到第一个和最后一个数据偏差较大,所以舍弃这两个数据,将问题转化外在51个数据点中找到7个特征点。2.3.1非暴力穷举法3顾婕昱,毕雨来统计推断在数模、模数转换中的应用获得全局最优解的方法是将所有可能性进行计算,也就是一共要计算𝐶517=115775100次,假设每次运算用时0.01秒,那么总共需要13.39天得到结果,对笔记本来说不合适。但是考虑到特征点之间不可能分布得很接近并且应该分布得较为均匀,所以在全局范围内选点会有大量的不必要计算,可以对每个点划分范围。为了简化算法,首先选取处于端点的第2和第51个数据,并且规定任意两点之间的间距不能小于5。数据的选择区间如下所示:表2-1观测点选取范围观测点序号选取区间2[6,26]3[11,31]4[16,36]5[21,41]6[26,46]再利用循环来找到使平均得分最高的观测点,总共需要计算32000000次,大大减少了运算的时间。2.3.2遗传算法遗传算法是基于达尔文的生物进化论和孟德尔的遗传学的一种通用的求解优化问题的适应性搜索方法,其基本原理是仿效生物界中物竞天择、适者生存的演化法则。遗传算法把问题参数编码为染色体,再利用迭代的方式进行选择、交叉以及编译等运算来交换种群中染色体的信息,最终生成符合优化目标的染色体。遗传算法流程图如图2-1所示。图2-1遗传算法流程图[2]常用的编码方式有二进制编码、实数编码、矩阵编码、树形编码等等,在这个实验中,我们考虑老师介绍的二进制编码和十进制编码,但二进制编码在与十进制进行转换的时候较为麻烦。而且在交配和变异的时候有较大随机性,因此选择后者。(1)初始群体的生成:随机产生了10组初始种群,每组中为7个点,以这些数据作为初始点开始进化。(2)选择:从群体中选择适应度高的个体,淘汰适应度低的个体。选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。以评价函数得分作为选择依据,得分越高,被选择的概率就越高。(3)交叉:在自然界生物进化过程中起核心作用的是生物遗传基因的重组(和变异)。交叉是指把两个父代个体的部分结构加以替换重组而生成新个体的操作。通过交叉,遗传算4顾婕昱,毕雨来统计推断在数模、模数转换中的应用法的搜索能力得以飞跃提高。本论文采用的是奇偶行进行重组,然后选择一个随机的点断开并分别结合。(4)变异:变异算子的基本内容是对群体中的个体串的某些基因位置上的基因值作变动。变异能够使遗传算法具有局部的随机搜索能力。当遗传算法通过交叉算子已接近最优解邻域时,利用变异算子的这种局部随机搜索能力可以加速向最优解收敛。显然,此种情况下的变异概率应取较小值,否则接近最优解的积木块会因变异而遭到破坏。另外通过变异还可以维持群体多样性,以防止出现未成熟收敛现象。此时收敛概率应取较大值。初步设定初始种群有10个,交配种群10个,变异种群10个,一共30个,分别计算它们的评价值,在其中寻找平均得分最高的10个,作为下一代的初始种群。编码方面,重新采用的十进制算法。参数方面,交叉概率设定为0.9,变异概率设定为0.01。当最优个体的评价值不再上升或者迭代次数达到预设的代数时,算法终止。在本题中,我们没有设中止代数,只是当最高平均得分不再变化时(小于设定的阙值),中止计算。2.4拟合方法图像中观察到的跳变是因为整体系统特性与其电路系统中晶体管元件特的工作特性可分为前后衔接的连续区间:截止区、线性区和饱和区,在跨越区间时物理特性是连续而非跳跃间断的。2.4.1多项式拟合在多项式拟合次数选取中,我们直接对53组数据整体进行拟合,并以残差平方和以及运算时间为参考依据,选择出满足误差控制范围内的可行性拟合次数。表2-2为采用不同多项式拟合所得的最优点、平均得分以及样本得分情况。表2-2多项式拟合所得结果拟合次数最优点平均得分样本得分=94组数样本得分90组数22,7,12,25,36,44,5166.71295739533,8,16,25,36,44,5192.262133111842,6,16,28,40,47,5293.242634710752,8,15,25,37,46,5293.38273699262,7,16,28,40,47,5293.309936199根据表2.2中的数据,我们发现,当拟合次数低于5是,拟合次数越高,平均得分越高,样本得分大于等于94的组数越多,样本得分小于90的组数越少,更贴近于原来的函数关系。但是当拟合多项式的阶数大于5时,Matlab发出Warning,同时由于高次拟合所造成的图像嫉妒扭曲,从而导致平均得分下降,样本得分情况恶化,所以多于多项式拟合方法,选用五次多项式拟合最好,即𝑢𝑖𝑗=𝑎1∗𝑑𝑖𝑗5+𝑎2∗𝑑𝑖𝑗4+𝑎3∗𝑑𝑖𝑗3+𝑎4∗𝑑𝑖𝑗2+𝑎5∗𝑑𝑖𝑗+𝑏+𝜀𝑖𝑗(2-4)但是,鉴于采用五次多项式拟合,得分依然不能达到大于94的要求,故放弃多项式拟合方法,研究三次样条差值法。2.4.2三次样条差值法考虑到中间部分线性关系比较明显,而在两端线性关系比较薄弱,所以在找到特征点之后可以分成三段来拟合D-U关系函数。三次样条插值法的介绍如图2-2、图2-3所示。5顾婕昱,毕雨来统计推断在数模、模数转换中的应用图2.2中间段拟合方式[1]图2.3两端拟合方式[1]我们对随机产生的七个点,按照一下方式进行拟合:用S1,S2,S3进行二次拟合,应用于S1S2段用S1,S2,S3,S4进行三次拟合,用到S2S3段用S2,S3,S4,S5进行三次拟合,用到S3S4段用S3,S4,S5,S6进行三次拟合,用到S4S5段用S4,S5,S6,S7进行三次拟合,用到S5S6段用S5,S6,S7进行二次拟合,用到S6S7段通过这个方法得到的曲线最平滑并且精度高,但缺点是计算量大,耗时比较长。应用三次样条差值作为拟合方式的运算结果如表2-3表2-3遗传算法和三次样条差值运行结果最优点平均得分样本得分=94组数样本得分90组数2,7,16,25,35,43,5194.3074381772,7,14,24,35,43,5194.3419379802,6,15,25,36,44,5194.2415385822,8,15,24,35,43,5194.3463381782,8,16,24,35,43,5294.290136977最终得到的最优解为2,8,15,24,35,43,51。544组数据的平均评价函数值为94.3463,其中,较好的完成了要求。2.4.3关于拟合方式选取的结论6顾婕昱,毕雨来统计推断在数模、模数转换中的应用根据表2-2和表2-3的数据分析可知,虽然三次样条差值分段拟合的方法计算量较大、运算时间更长,但不论是从平均得分或是样本得分情况来看,分段拟合的结果要明显优于多项式拟合,但是所以,我们决定采用三次样条差值分段拟合的方式进行后续研究。3拓展部分一——遗传退火算法结合3.1模拟退火算法模拟
本文标题:统计推断-第008组(顾婕昱)课程设计报告
链接地址:https://www.777doc.com/doc-2138874 .html