一种基于核密度估计和K-L散度的旋转机械故障诊断方法

权利要求书发明名称：一种基于核密度估计和K-L散度的旋转机械故障诊断方法发明人：刘宇（身份证号码：51010619820626511X）、张凡、陈初杰、李彦锋、杨圆鉴、米金华、黄洪钟权利要求书1.基于核密度估计和K-L散度的旋转机械故障诊断方法，如图1所示，其步骤包括：步骤1：采集被监测对象的原始振动数据，并划定训练样本集和测试样本集；步骤2：利用集合经验模态分解方法（EnsembleEmpiricalModeDecomposition，EEMD）和希尔伯特变换等信号处理方法从各样本集中提取指定时频域特征；步骤3：利用基于距离的特征评估方法从步骤2中得到的特征集中选择出少数敏感特征，并且计算这些敏感特征的分类贡献率；步骤4：利用核密度估计计算训练样本中不同故障类别样本集关于步骤3中提取的敏感特征的概率密度函数，并计算加入一个未知故障类别待测样本后各类样本集新的概率密度函数；步骤5：求出在选定的特征描述下，训练样本中各类故障样本集原始概率密度函数和加入一个待测样本后的新概率密度函数两者的K-L散度值；步骤6：计算集成K-L散度，并通过集成K-L散度的大小判断待测样本的故障类别。2.根据权利要求1所示的基于核密度估计和K-L散度的旋转机械故障诊断方法，其特征在于，所述步骤3不但从原始特征集中选择出少量敏感特征，而且将选择出来的敏感特征按照其贡献率区别对待，使特征选择更加合理。对于选择出的第j个特征，其贡献率计算公式为：1jjniiF，(1,2,,)jn（1）其中，ja为在第j个特征描述下，各类样本集类间距离与类内距离的比值，n为选择的敏感特征个数。3.根据权利要求1所示的基于核密度估计和K-L散度的旋转机械故障诊断方法，其特征在于，步骤4中利用核密度估计方法得到每类故障样本集的概率密度函数，在任意点x处的总体密度函数()fx的核密度估计定义为：权利要求书11ˆnihixxfxKnhh（2）其中，()K称为核函数(kernelfunction)，h为窗宽。相比传统的分类器算法，这种算法不但能够考虑到每个样本所带来的个体信息，更重要的是，它很好的考虑到了各类样本集中样本的聚集情况；换句话说，它很好的考虑到了样本间的关联统计信息，这对于处理样本分布的随机性是至关重要的，因此可以更好的实现正确分类。4.根据权利要求1所示的基于核密度估计和K-L散度的旋转机械故障诊断方法，其特征在于，步骤5中使用对称化的K-L散度来量化两个分布的相似性。原始的K-L散度定义不满足距离的对称性，于是在本发明中使用了如下的对称化K-L散度：1,||||2KLKLKLDPQDPQDQP（3）使用该K-L散度来量化分布相似性，可以方便地实现算法的程序化，提高算法的效率。除此之外，在步骤6中定义了集成K-L散度指标，从而将所有敏感特征描述下的散度值归一化，方便分类判断，这样做既考虑了全面性，又考虑了可行性。说明书一种基于核密度估计和K-L散度的旋转机械故障诊断方法技术领域本发明属于机械装备故障智能诊断领域，具体涉及基于核密度估计和K-L散度等统计学工具的故障诊断方法。背景技术旋转机械广泛应用于工业生产实践中，例如风力发电机、数控机床、航空航天发动机等关系到国防民生的重要领域。在生产工作中，滚动轴承、齿轮等旋转机械中的关键部件由于需要承受交变机械应力和偶然冲击，加上本身固有的制造误差，经常会产生一些早期缺陷，例如轻度磨损、点蚀等。这些缺陷如果不及时诊断发现，就会不断恶化，最终导致系统失效，带来很大的财产损失，甚至对国防和人身安全带来巨大威胁。对于现代化大型复杂旋转机械设备而言，尽管可以通过改善设计、制造工艺来提高零部件的质量，但仍难以确保不出故障。所以，有必要利用先进的传感和监测技术，对关键零部件及系统进行有计划、有组织、有针对性的状态监测和故障诊断，尽早发现设备运行过程中的各种隐患，从而防止巨额财产损失和灾难性事故的发生。数据驱动方法是近年来逐渐兴起的一种故障诊断技术，计算机技术的快速发展使得大数据并行高速计算变得非常容易，推动了依靠大量数据分析的故障诊断技术的发展。从应用的角度看，基于数据驱动的故障诊断方法较基于模型的方法更为切实可行，这是由于数据采集通常要比精确建立物理模型更加容易。除此之外，数据驱动的故障诊断方法还有两个明显的优点：一是该类方法更容易实现自动诊断，这与现代工业的智能化发展是切合的；二是该类方法不需要太多参数设置和专家经验知识。一般来说，一种数据驱动的故障诊断方法应包括数据获取、特征提取、特征降维、分类器设计和结果输出等五个步骤，其中分类器设计和选择是该类方法的关键。现有的数据驱动的故障诊断方法大多都是在样本的特征空间寻找一个最优分类超曲面，从而将不同类型的故障样本分开。例如，基于支持向量机（SupportVectorMachine，SVM）的故障诊断方法，基于BP（BackPropagation）神经网络的故障诊断方法等。然而，由于噪声、测量误差等对有效振动信号的污染，使得分类问题存在一定的不确定性，进而导致了分类错误的现象，即很难找到一个说明书恰当的超曲面将所有样本全部归类正确。以上常用方法产生分类错误的现象的原因与它们的分类原理是分不开的。传统的智能故障诊断方法往往忽略了样本间的统计信息和关联信息，而统计信息对于随机信号处理是极为关键的，即对于正确分类很有帮助。目前，国内外从样本统计角度开展的智能故障诊断方法的研究或报道还非常少。发明内容本发明的目的是为了从原始样本中提取更加全面、有效的统计学信息，从而提高分类器的准确率和推广能力，提出一种基于核密度估计（KDE，KernelDensityEstimation）和K-L散度（Kullback-LeiblerDivergence）两种统计学工具的智能故障诊断方法。本发明的技术方案是：一种基于核密度估计和K-L散度的旋转机械故障诊断方法，具体包括如下步骤：步骤1：采集被监测对象的原始振动数据，并划定训练样本集和测试样本集；步骤2：利用集合经验模态分解方法（EnsembleEmpiricalModeDecomposition，EEMD）和希尔伯特变换等信号处理方法，从原始振动数据中提取指定时频域特征；步骤3：利用基于距离的特征评估方法，从步骤2中得到的特征集中选择出少数敏感特征，并且计算这些敏感特征的分类贡献率；改进的基于距离的特征评估方法包括以下四步：（1）计算第j个特征C个类的类内距离的平均值wjd：,,,,,,m111,1,2,,M,,1,2,,,c1,2,,cMcjmcjlcjlcccdqqMMlmlmjJC（1）,11CwjcjcddC（2）式中，Mc表示第c类的样本个数，J表示特征个数，C表示类别个数，qm,c,j表示第c类第m个样本的第j个特征的特征值。（2）计算第j个特征C个类的类间距离的平均值bjd：说明书,,,11cMcjmcjmcuqM（3）,,,111,1,2,,,CbjejcjceduuCCceCce（4）式中，uc,j、ue,j分别表示第c和第e个类第j个特征的平均值。（3）数据集A的类间距离与类内距离的比值j：bjjwjdd（5）j越大表示第j个特征对于类别越敏感，更符合评估原则，也是更应该被选择使用的特征。（4）计算选择的前n个特征的分类贡献率jF：对于第j个特征，定义：1jjniiF，(1,2,,)jn（6）为其分类贡献率。当完成特征选择之后，得到的敏感特征将作为后续分类器的输入，基于核密度估计和K-L散度的分类器是本发明的核心内容，包含步骤4到步骤6。步骤4：利用核密度估计计算训练样本中不同故障类别样本集关于步骤3中提取的敏感特征的概率密度函数，并计算加入一个未知故障类别待测样本后各类样本集新的概率密度函数；核密度估计是概率论中一种用来估计随机变量概率密度函数的非参数方法。设12,,,nXXX是取自一元连续总体X的样本，在任意点x处的总体密度函数()fx的核密度估计定义为：11ˆnihixxfxKnhh（7）其中，()K称为核函数（KernelFunction），h为窗宽。说明书选用高斯函数作为核密度估计方法的核函数。h是核密度估计方法中唯一要优化的参数，根据最小化平均集成平方误差方法，最优化h的取值由（8）式得到：11555ˆ4ˆ1.063hnn（8）式中，ˆ是样本标准差，n为各类样本集所包含的样本数。步骤5：求出在选定的特征描述下，训练样本中各类故障样本集原始概率密度函数，以及加入一个待测样本后的新概率密度函数两者的K-L散度值；K-L散度也称为相对熵或者信息增益。在概率论和信息论中，K-L散度用来计算两个分布的分对称性或者差异性。K-L散度值越小，表明两个分布越相似。原始的K-L散度定义式为：||lnKLiPiDPQPiQi（9）由于其不满足距离的对称性，于是在本发明中定义了下式的对称化K-L散度：1,||||2KLKLKLDPQDPQDQP（10）由步骤4得到各类样本集的原始密度函数和加入测试样本后的新密度函数之后，就可以根据（10）式计算出对应的K-L散度值，即量化原始密度函数和新密度函数的差异性。步骤6：计算集成K-L散度，并通过集成K-L散度的大小判断待测样本的故障类别。由步骤5可知，我们计算得到了前n个特征描述下的K-L散度值，为了便于判断，在这里，我们定义了一个集成K-L散度值iIKL（1,2,,iC）：1njijijIKLFKL（11）式中，jF为步骤3得到的前n个特征分类贡献率。（11）式中通过将第j个特征描述下的K-L散度值与第j个特征的分类贡献率jF加权，可以得到各类样本集的集成K-L散度值。iIKL越小，原始分布和加入待测样本后的新概率密度函数说明书越相似；反之，当集iIKL比较大时，原始概率密度函数与新概率密度函数差别越大。换句话说，待测样本应该归类于K-L散度值最小的类别。附图说明图1为本发明的基于核密度估计和K-L散度的旋转机械故障诊断方法的流程示意图图2为本发明实例所针对的来自凯斯西储大学的滚动轴承故障诊断平台图3数据集A所有特征类间/类内距离比值j图4基于核密度估计和K-L散度的分类器原理示意图图5将本发明用于表1中数据集A的实验结果：四类样本集原始概率密度曲线及对应的加入一个正常样本后新的概率密度函数图6为不同特征数量下，本发明方法在数据集A-E上的分类准确率图7为不同训练样本下，本发明方法在数据集A-E上的分类准确率具体实施方式下面结合附图和具体的实例对本发明做进一步的阐述。附图1所示为基于核密度估计和K-L散度的旋转机械智能故障诊断方法的流程图，如图1所示，其步骤包括：步骤1：采集被监测对象的原始振动数据，并划定训练样本集和测试样本集。本发明以凯斯西储大学的滚动轴承故障诊断平台为例，具体的实验参数如下：如附图2所示，实验平台包括一个2马力的电机（左侧），一个功率计（右侧）和电子控制设备（没有显示）。被测轴承起到支撑电机轴的作用。利用电火花加工技术在驱动端轴承上人为制造了单点故障，故障直径分别为0.007、0.014、0.021和0.028英寸。这些故障单独分布在轴承内圈、滚动体和外圈上。电机转轴上加载了一个冲击力，使用两个加速度传感器测量振动，一个传感器布置在电机壳体上，另一个传感器布置在驱动端轴承外圈上。采样频率为12KHz，单采样样本长度为12000。为了验证上文所提方法的有效性，我们进行了两种实验，第一种是不同故障类型判别实验，第二种是同故障损伤程度判别实验，详细信息如表1和表2所示。数据集A包括轴承4种不同的运行状态（正常、外圈故障、内圈故障、滚动体故障）的280个数据样本，损伤尺寸为0.007英寸。数据集A分为两部分，说明书140个样本用来训练，140个用来测试，很明显这是一个四种不同健康状态的模式识别问

一种基于核密度估计和K-L散度的旋转机械故障诊断方法

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

ch01-3电子商务分类及盈利模式

万科南京金色家园三期业主入住方案

小型泵站设计、施工安装与运行管理(141118)

神木化工高管绩效考核手册（DOC22页）

可爱的汽车

八连城煤矿土地复垦方案报告书

美好海岸项目营销提案XXXX1023

丽思卡尔顿酒店如何打造传奇客户体验

法律风险及案例(4)-机动车、其他动产质押典当业务培训

年高中毕业班第二次省质检质量分析报告(1)

相关文档

相关搜索