第36卷第14期
振动与冲击
JOURNAL OF VIBRATION AND SHOCK Vol.36 No.14 2017
基于正则化核最大边界投影维数约简的滚动轴承故障诊断
赵孝礼,赵荣珍,孙业北,何敬举
(兰州理工大学机电工程学院,兰州730050)
主商要:针对旋转机械故障诊断中故障样本获取困难的现状,提出一种基于正则化核最大边界投影(Regulamed Kernel Maximum Margin Projection, R K M M P)维数约简的滚动轴承故障诊断方法。该方法首先利用R K M M P对小样本、少 标记信息的混合故障样本集进行训练降维,然后将降维后的低维敏感特征子集输人到核极限学习机(Kernel Extreme L e a m m g Machme, K L E M)分类器中进行故障识别。上述方法的特点是所提出的R K M M P能充分利用少量标记样本信息 与大量无标记样本的故障信息,避免过学习的缺陷,同时通过添加正则化项克服小样本问题。滚动轴承故障模拟实验表 明:该方法结合了 R K M M P在维数约简和K L E M在模式识别上的优势,在一定程度上能提升故障诊断的泛化能力与识别 精度。该研究可为解决好故障诊断中样本获取困难的问题,提供理论参考依据。
关键词:故障诊断;正则化核最大边界投影;核极限学习机分类器;维数约简
中图分类号:TP18; TH165 文献标志码:A D0I :10. 13465/j. cnki. j v s.2017.14.016
Fault diagnosis of rolling bearings based on the dimension reduction using the regularized kernel
maximum margin projection
ZHAO Xiaoli,ZHAO Rongzhen,SUN Yebei,HE Jingju
(School of Mechanical and Electronical Engineering, Lanzhou University of Technology, Lanzhou 730050, China) Abstract;In view of the difficulty of fault samples ^acquisition in the fault diagnosis of rotating machinery, a novel fault diagnosis method for rolling bearings based on the dimension reduction using the regularized kernel maximum margin projection (RKMMP) was proposed. In the method, the RKMMP was used to reduce the dimension of the mixed fault data set of small samples and less labeled information. Then the low-dimensional sensitive feature subset was input into a kernel extreme learning machine ( KLEM) classifier for training and fault identification. The characteristics of the method is that the proposed RKMMP can make full use of the labeled information of small samples and the fault information of numerous unlabeled samples, and avoid the problem of over-fitting. At the
same time, a regularization term was added to overcome the disadvantage of small samples. The simulations on rolling bearing fault diagnosis show that the method combines the advantages of RKMMP in dimension reduction and of KLEM in pattern recognition. To a certain extent, it can improve the generalization ability of fault diagnosis and the accuracy of recognition. The study solves the problem of samples’ acquisition and provides a theoretical support to the rolling bearing fault diagnosis.
Key words:dynamic response ;multiaxial random excitation ;vibration fatigue;modal shape
滚动轴承作为旋转机械中应用广泛且容易损坏的 零部件,其运行状态正常与否直接影响到系统的工作 性能,因此对滚动轴承进行故障诊断有着重大的现实 意义[1]。振动信号分析是轴承故障诊断主要手段之 一,从非线性、非平稳振动信号中提取出能综合反映故 障状态的多域量化特征指标的方法,已被广泛应用于
基金项目:国家自然科学基金(51675253);高等学校博士学科点专项科研基金(20136201110004)
收稿日期:2016 -04 -20修改稿收到日期:2016 -06 -12
第一作者赵孝礼男,硕士生,1991年生
通信作者赵荣珍女,博士,教授,博士生导师,I960年生轴承故障诊断中[2]。但多域特征的引入使得多元冗余 信息渗入其中,这将导致特征信息之间的相关性增大、数据的分类能力被严重恶化的问题。因此,需用维数 约简方法对特征数据进行有效的二次特征提取,提取 出低维敏感的主要特征矢量[3]。
故障特征数据的获取是基于维数约简的故障诊断 方法的关键一环,故障数据常常具有“小样本、高维数”的特点[4]。在实际问题中,无标记的监测数据容易获 取,而有标记的监测数据获取困难。若只利用少量有 标记样本则会导致学习系统泛化能力差;若只利用无 标记样本,则会浪费标记样本中有用信息。基于有监 督与无监督降维算法的不足,综合利用少量标记信息
第14期赵孝礼等:基于正则化核最大边界投影维数约简的滚动轴承故障诊断105
和大量无标记信息,“半监督降维算法”逐渐成为解决 此类问题的关键[5]。
最大边界投影(MMP)是He等[6]提出的半监督降 维算法。该算法的特点是:通过有区别的构建不同类 别标签的权重,最小化类内紧凑图的同时最大化类间 分离图;使得高维数据的低维流形嵌入后,同类数据点 更加紧密,异类数据点更稀疏。但MMP本质上是线性 化的降维方法,处理非线性数据比较困难;此外,面对 “小样本问题”仅通过PCA预处理效果不明显,且无监 督模式容易丢失大量有用信息[7]。针对这两点不足,欲通过引入核方法,可将MMP的作用范围引入到非线 性领域;进一步地,通过向目标函数添加正则化项克服 小样本问题[8],提出正则化核最大边界投影(RKMMP)算法,并将其应用到“小样
本、少标记信息”故障数据维 数约简的问题中。
故障诊断另一个核心问题是分类器的构建。核极 限学习机(KELM)是Huang等[9]根据极限学习机(ELM)[w]的随机映射缺陷,提出的一种改进的新型网 络学习方法。与传统分类器相比,KLEM具有学习速度 快、泛化能力强、鲁棒性好等优点,在故障诊断等方面 得到了广泛应用[11]。
鉴于上述分析,本研究拟对RKMMP与KLEM相结 合的维数约简滚动轴承故障诊断方法进行探讨。欲为 “小样本、少标记信息”的滚动轴承故障数据集的维数 约简与类别划分,提供一种理论参考依据。
1正则化核最大边界投影(RKMMP)算法简介设存在高维故障数据集Z = [&,;^],有标签样 本集A =丨'丨!=1 ,无标签样本集4 =丨'匕;+1,' E W ,6?为样本维数丄为样本个数,其中样本^的类别标签为C(x,)E丨1,2,...C丨,C为故障类别个数。1.1 RKMMP算法的原理
MMP是LSDA[12]算法的半监督扩展,半监督学习 的理论依据是根据先验一致性假设:即同类标签的样 本具有相同的流形结构,异类标签的样本具有不同的 流形结构[13]。MMP既可以利用大量无标记样本,避免 过拟合问题;又可利用少量标记样本刻画数据的流形 结构。为解决MMP算法无法有效处理小样本问题与 非线性数据的缺陷,提出全新的RKMMP算法。
所提出的RKMMP算法基本思路为:首先,通过核函 数将数据点映射到高维特征空间F中;然后,充分
利用 有标签与无标签信息,构造有区别的权重矩阵来描述类 内与类间近邻图G'C,即最大化同类标签的数据点间 的权重,最小化不同类别标签的数据点间的权重;通过向 目标函数中添加正则化项并优化,使得映射后的同类样 本间的点距离更近、异类更远。具体描述如下:
将样本点^的近邻集合分为:近邻样本集 中与^同类别的数据子集和近邻样本集中与A不同类别的数据子集妒(以。定义,(以、妒(以分别为:
N'i x.)=Wi I cix/J ^c(x j,1 ^k\(1)
N b(Xl)= N(Xl)
(2)式中:表示x,的类别标签,A表示^的近邻个数。
通过构建类内紧凑图与类间离散图来刻画数据的 几何流形结构和判别结构;分别定义类间与类内近邻 图的权重矩阵^与%:
W b=|1,
if*, e N b(Xj)orX j e N b(x t)⑶
L〇,ortherwise
'y,if and %■ are the same label
1,if x or x is unlabeled
^;= J (4)
but X j g DT (xj) or X j g A^(x-)
L〇,otherwise
式中,y为衡量权值数,参考文献[6]取值50。为使高 维特征空间投影到低维特征空间后,类内近邻图数据 点更加紧凑,同时类间图数据点更加离散,建立两个优 化目标函数,即:
^c^x^x l a - =
aT XD"XT a - aT X ir X T a (5)
m a x y Z\\y. ~y}I I2K=y Z(a l x.= l,j
'Z^x.D^xJa - ^a^x.W^xJa=
aT XD4XT a -a7X W b X7a =
aTX L4X Ta(6)式中分别为类内、类间对角矩阵,i6-w6。对式(5)施加一个约束条件W x i r x T a = i,进一步地将式(5)简化为:
min 1 -XT a = max XT a (7)
a a
综合两目标函数式(6 )、(7 ),得到M M P的优化目标函 数,即:
arg max a1X(/3Lb+ (1 -f3)W)X1a
a
s. t. a1X D w X1a(8)将式(8)转换成求解广义特征值问题见式(9),即
X(f3Lb+(1 -f3)W)X1a =k X D w X1a(9)当训练样本数目小于样本的特征维数时,M M P算 法会出现病态奇异矩阵问题,也就是“小样本问题”。这容易导致M M P无法计算出最佳投影矩阵或计算结 果不稳定。为使奇异矩阵变成正定矩阵,通过添加一 个正则化常数5与单位矩阵/乘积所得常数矩阵5/作
106振动与冲击
2017年第36卷
为正则因子,即将式(9)转变为R M M P 的广义特征值 问题:
X (/3L b  + (1 -/3)Wl ,)XT a  = X (XDW XT  +81) a
(10) R K M M P 则是通过引人式(11)所示的R B F 核函
数,将R M M P 的应用扩展到非线性领域。
<^(%;) ,^(%;)> =exp (- || x -X j  || /t ) (11)
式中#表示非线性函数;〖表示核参数。在Hilbert 空 间F 中式(10)变形为
<p {X )[^Lh  + (1 -p W B ]{X y a v  =
A [<p (X )D u '<p (X )T  +81]^ (12)
式中,\是由F 空间所有向量线性组合而成的解向量, 则存在向量=[%,%,••,〜]满足:
n
= 2 ai (P (y xi ) (13)
i  = l
结合式(12)、(13),对式(12)两边做内积,可得
K R M M P 优化目标式(14):
K [/3L b +(l -/3)Wl,]Ka  = X (KDW K  + SI)a  (14)
1.2
RKMMP 算法的实现流程
R K M M P 算法具体步骤如下:
输人:高维空间数据集I  =彳(A ,q  ),〇2,c 2),• • 〇,,C1
) »
X l + l  I' • • X l + U  \ ■> X i ^
9
输出:低维特征向量I 投影映射矩阵A 。
C  1 )将原始数据集Z 进行数据归一化,得到T 。
(2) 将通过核函数•)映射到高维特征空间
f
中,得到帜r )。(3)
利用有标记样本和未标记样本,根据式(5)、 (6)通过A ;近邻法对数据集构造类内、类间近邻图。
(4) 根据权值矩阵,求解式(14)的广义特征值和特 征向量。得前w 个最小非零特征值对应的特征向量,构 成投影向量彳、%,…,a …」,并将p (Z °)通过a 进 行降维投影,得到映射后的低维特征集r )。
2
核极限学习机(K E L M )算法简介
2.1
KELM 分类器
K E L M 作为E L M 算法的扩展,是由H u a n g 等根据
S V M 与E L M 的优化角度,将核函数引人到极限学习机
中,克服了随机初始值导致的不稳定问题。
对于任意一个数据集E  =彳,~ )丨;\ e 炉为 其输人数据
e
/?为输出目标数据。设L 为隐含层节
点数身于输人样本',则极限学习机的输出模型函数为
L
f (x p ) = yp J ii iX p ) = h {xp)p
i = l
P  = [/^i ,/32,…,]
办U p ) = ["i (\),"2(\),…,] (15)
式中:表7K 输出权重矩阵;A (')表7K 输人' 经隐含 层映射后的输出矩阵;若E L M 的隐含层输出函数
G (w ,%,6)已知,则计算/!(')形式如下h (x p ) ^ [G (wx  • xp  + b x)
,G (wL  • xp  + b L)] (16)
式中^为输人权值,6为偏值;在训练中随机
赋值。
由 Karush -Kuhn-Tucker  ( K K T )定理可知,E L M  的训练学习等效为求解如式(17)的对偶优化问题:
^ELM  = ^ I I  ^ I I  + ^ ^2 ^T p  ~
P = l
N
Y  ap {h {xp)p  -tp  + r
)
(17)
P = l
式中:C 为惩罚系数,用以权衡结构风险和经验风险之 间的比例;&表7K 理论输出&与实际输出/(')的误 差;^为拉格朗日算子,求解式(17)可得:
(3 = HT ^
+正则化长细比超限怎么调整
HHT )j  T  (18)
式中://为隐含层输出矩阵,r  = [^,(2,...,^v ]表t k  输人样本集的目标向量。好7^在求解广义逆过程中, 因数据存在复共线性导致非奇异,容易引起不稳
定现象。故将核函数思想引人E L M 中,根据Mercer 条 件定义核矩阵:
^
HH t . ^^h (Xi) • (^.) = K (Xi,X]) (19)
通过核矩阵[代替™7,由式(18)、( 19)代人式(15) 中得K L E M 输出模型:
f (x p ) = [Kixp ,%^) (20)
(=(去+ ^)_V
(21)
式中,
(即为K E L M 网络的输出权值。由以上过程可知,通过向K E L M 添加偏值常量 1/C ,可増加系统的稳定性与泛化能力;同时K L E M 无 需设置众多参数,只需选择合适的核函数。相对于 E L M ,K E L M 解决分类与回归问题效果更好,具有更强 大的非线性逼近能力。2.2 KELM
分类器故障辨识流程
K L E M 算法故障辨识流程图见图1。它的具体实
现步骤如下:
图1 K E L M 分类器的故障辨识流程图
Fig. 1 The flow chart of fault identification of the K E L M  classifier
(1) 将输人样本分为训练样本集与测试样本集
定核参数及惩罚因子。
(2) 求解出输出权值/3,寄存K E L M 参数,得训学习后的K E L M
分类器。
第14期赵孝礼等:基于正则化核最大边界投影维数约简的滚动轴承故障诊断107
(3)将测试样本与训练样本输人K L E M分类器中 进行故障诊断。
3设计的RKM M P维数约简的故障诊断方法
3.1混合故障数据集、RKMMP与KELM相结合的故障诊断方法的探讨
为解决故障诊断过程中,训练样本与有标记信息 样本较少导致故障诊断困难的现状。拟以轴承故障数 据集为实验对象,提出R K M M P维数约简与K E L M分类 器相结合的故障诊断方法。该方法所提出的R K M M P 半监督降维方法,一方面能综合利用少量有标记故障 样本与大量无标记故障样本,提取出最佳分类的低维 特征子集,另一方面正则化与核方法的引人能有效克 服小样本问题,増强其处理非线性问题的能力。故障 诊断的实质是模式识别,方法中的K E L M分类器能快 速、稳定、精确地实现故障类别的量化表征。
所设计的故障诊断方法主要思路为:首先,以滚动 轴承的振动信号为对象,从时域、频域、时频域等多方 面构建能全面反映故障信息的高维、小样本、少标记信 息的混合故障数据集,然后将数据集输人到R K M M P中降维处理,得到低维敏感的特征子集;最后,将低维特 征子集输人到K E L M分类器中进行
训练学习与故障辨 识,得出故障诊断结果。
3.2故障诊断方法实现的流程与步骤
设计的基于R K M M P维数约简的故障诊断方法流 程,见图2。整个故障诊断方法由如下几个步骤实现:
图2故障诊断方法流程图
Fig. 2 The flow chart of fault diagnosis method
步骤i对机械振动信号进行采集,从时域、频域 和时频域方面做特征提取,得到原始数据特征集叉。
步骤2根据故障数据的具体特性确定核参数
并将特征集经高斯核函数•)映射到高维特征空间 L在此空间进行R M M P降维,得到低维特征集r。
步骤3将低维特征集r输人K E L M进行模式识 别,得到测试样本的故障类型。
4实验结果与分析
4.1实验数据的来源
实验中所采用的实验数据来源于美国凯斯西储大学(C W R U)电气工程实验室的滚动轴承实验数据[14]。实验轴承的型号为6205 - RS J E M S K F深沟球轴承。轴承的具体参数为:内径25 m m,外径52 m m,厚度 15 m m,滚动体直径8.18 m m。实验所选取的数据是在 如下条件下测得:电机负载为2 h p,在采样频率为48 k H Z,转速为1 750 r/m i n情况下,通过驱动端轴承 座上的加速度传感器拾取振动信号。实验中轴承的损 伤是用电火花加工模拟,选取故障尺寸为直径0.53 m m、深度为0.28 m m(故障等级为严重)的三种典 型故障类型:外圈故障、内圈故障、滚动体故障。以2 048个采样点为一组样本,分别截取轴承外圈、轴承内 圈、滚动体故障以及正常四种状态下的振动信号各50 组,以其中每种状态的20组作为训练样本(其中前5 组为有标记故障样本,后15组为无标记样本),余下的 30组作为测试样本。为建立高维、小样本混合故障特 征集,需从时域、频域、时频域多个角度构建如表1的特征集合,共得到108个特征参数(得到4 x20 x108 维的小样本故障数据特征集)。其中,因轴承信号包含 四种故障类型,故E M D最少能分解出4个固有模态函 数(I M F)和一个余项信号,为充分把握原数据的特征信 息,提取前5层I M F分量及复杂度作为能量特征,即35 ~44号特征;同时米用db4小波包函数对振动信号进 行6层正交小波包分解,分解出的各频带的能量特征,即45 ~ 108号特征。
表1特征参数
Tab. 1 Characteristic parameters
序号特征参数序号特征参数序号特征参数
1均值13脉冲指标30 ~1倍到5倍
2均方幅值14裕度指标34频幅值特征
3方根幅值15斜度指标35 ~前5层IMF
4平均幅值16峭度指标分量的能量
5最大值17均值频率特征及对应
6最小值18频率中心的5层复杂度
7峰峰值19标准差频率44特征
8偏斜度20 ~表本频谱
9峭度的分散或45 ~6层小波包分
10方差26集中程度108解频带能量
11波形指标27 ~反映主频特征
12峰值指标29位置的变化
注:1〜16为时域特征;17〜34为频域特征;35〜108为时频
域E M D分解与小波包的能量特征
4.2应用情况与分析
从实验数据中构建高维混合故障特征集,输人到 R K M M P中进行维数约简,再通过K E L M分类器进行故 障识别。根据文献[6],设置参数近邻值A;=5、调节因 子设置为0.5、正则化因子设置为1;为充分涵盖原始 数据集的本质信息,目标维数统一降维到3维(
目标维
108振动与冲费
2017年第36卷
由图3、图4得如下结论:
P C A 是基于二阶统计信息,只能保持数据的最大方差
1) P C A 的降维效果及识别正确率最及,这由f
方向投影,忽略了原始特征空叫的非线性特征结构,故
R 2
R3
R 4
六种降维方法
R5
R6
图4六类算法的故障诊断结果
Fig. 4 Fault diagnosis result of six algorithms
从图3可以看出:R K M M P 降维后的聚类与分类效 果最好,其降维后的各故障类内距离小、类间间距明 显;P C A 的降维后测试样本聚类与分类效果最差;其他 四种算法聚类与分类效果介苄二者之间。除R K M M P  外,其他五种降维方法的故障间都存在着一定程度的 交叉混叠现象,其中外圈与滚子故障降维效果六种算 法都不理想;正常状态的各类算法降维结果都较为 成功。
同时,将降维后的低维特征子集输入E L K M 分类
1.0
器中进行故障模式识别。K L E M 核函数取R B F 型,交 叉优化参数得C  = 100 J  = 40。训练得到六种算法降维 后各类故障的识别准确率,见图4所示(其中,外圈、轴 内圈、滚动体以及正常四类状态分别记为F 1、F 2、F 3、
F 4,而F 5为四类故障的总体平均识别率)。图4中,六
种降维方法的总体平均识别率逐渐上升,平均识别率
R K M M P 最高,P C A 最低;针对单个故障,滚苄故障的识 别率六类算法都未能准确划分出;正常状态识别率最 好,六种算法都能准确识别,出来。
数=故障类别数-1);为验证所提方法的有效性,分别 75、20、60。在降维过程中,半监督算法只利用有标记采用P C A 、K P C A 、K L S D A 、M M P 、K M M P 算法对原始故 故障样本,无监督算法利用所有样本,但不利用故障标障数据集进行维数约简(其中,K L S D A 、M M P 、K M M P 经 签信息;有监督算法只利用有标记样本进行降维学习。过P C A 预处理),作对比试验。为方便后续工作,分别 为评估方法的有效性,实验从以下三个角度进行验证:记六种算法丨P C A ,K P C A ,K L S D A ,M M P ,K M M P ,
4.2.1可视化降维与故障辨识结果对比
R K M M P 卜丨R l ,R 2, R 3, R 4, R 5, R 6}。对核函数参
将故障数据集输人到降维算法中,得六种方法的数选取,采用五折交叉法选取最优高斯核参数,得到
降维后测试样本t 维嵌入图,见图3。
K P C A 、K L S D A 、K M M P 、R K M M P  的核参数分别为 t  = 88、
(a) P C A  (b )K P C A  (c )K L S D A
(d )M M P  (e )K M M P  (f) R K M M P
图3测试样本基于不同方法的降维结果
Fig. 3 The test sample results based on different methods of dimensionality reduction
H  I  II
5
$

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。