第 44 卷第 2 期2024 年 4 月
振动、测试与诊断Vol. 44 No. 2
Apr.2024 Journal of Vibration,Measurement & Diagnosis
多工况直升机附件齿轮箱振动故障诊断∗
万安平1,龚志鹏1,王景霖2,单添敏2,何家波1
(1.浙大城市学院机械系杭州,310015)
(2.故障诊断与健康管理技术航空科技重点实验室上海,201601)
摘要针对直升机附件齿轮箱在有限多工况条件下故障特征提取难度大、识别准确率低等问题,提出一种结合变分模态分解(variational mode decomposition,简称VMD)与多尺度卷积神经网络(multi⁃scale convolutional neural netwo,简称MCNN)的故障诊断方法。首先,对直升机附件齿轮箱进行地面实验和信号采集,对原始信号进行滤波、降噪等预处理;其次,利用VMD将信号分解为若干个固有模态(intrinsic mode functions,简称IMF),依据齿轮副频率特性对分解模态进行重构与归一化,增强微弱的高频故障特征;最后,将重构信号的每个分量视作不同尺度,经多尺度卷积神经网络进行多尺度特征提取
并融合,由指数归一化分类器给出识别的故障类别。实验结果表明,所提方法能够有效增强信号故障特征,挖掘多工况条件下信号的差异性与同一性,在直升机附件齿轮箱振动故障诊断中平均准确率为97.25%。
关键词变分模态分解;多尺度卷积网络;振动故障诊断;附件齿轮箱
中图分类号V240.2;V232
引言
附件齿轮箱(accessary gear box,简称AGB)是直升机起动系统、润滑系统、燃料系统和液压系统等附属系统的动力传输装置,其经过一对与径向传动轴连接的锥齿轮从航空发动机的主轴转子获取动力[1⁃2]。由于轻量化要求,齿轮箱齿轮腹板厚度变薄,重量减轻,在复杂的内外激励下容易产生机械振动,这不仅会产生系统噪声、降低齿轮副的啮合精度与可靠性,而且会使整个传动系统失效,导致严重的系统破坏[3]。齿轮箱振动故障的表现形式是振动幅值在特定频段超标[4],针对振动故障诊断研究的主流方法为采用振动信号分析[5],即采集齿轮箱壳体振动信号,通过传统的人工信号分析,提取故障的时域和频域特征[6]。这些方法都依赖丰富的信号学知识储备,诊断结果受人工的影响较大。
随着人工智能技术的不断发展,基于大数据挖掘的深度学习模型逐渐应用于故障诊断领域。将信号处理与神经网络相结合[7],利用前者进行数据预处理,增强信号的故障特征,利用后者自动提取数据潜藏特征,满足高效、准确的诊断要求。张立智等[8]将经验模态分解(empirical mode decomposition,简称EMD)、奇异值分解和深度卷积网络(convolu⁃tional neural network,简称CNN)结合用于齿轮箱轴承故障诊断与分析,准确率最高达到了88.06%。任学平等[9]采用EMD对原始故障信号进行分解,经自回归模型特征提取后置入前馈神经网中识别,获得了95%的准确率。但是EMD在分解信号时易出现模态混叠、边界效应等问题,而VMD[10]作为一种新型自适应信号处理方法,具有更好的鲁棒性和抗噪性。
CNN[11]在高维特征提取方面能力强大,但其权值共享的特性在处理多传感器数据时,每个传感器数据的权重分布相同,使其无法有效地提取多传感器数据的差异性特征。对此,笔者对不同的传感器采取不同的卷积层,自适应地提取多尺度信号特征并融合,以提高特征提取性能。
针对有限变工况下多传感器信号特征提取与识别问题,本研究提出一种基于VMD⁃MCNN的直升机附件齿轮箱振动故障诊断方法,采用VMD对故障信号进行分解,并基于齿轮副的频率特性对分离模态进行重构,进而增强微弱故障特征。
DOI:10.16450/jki.issn.1004⁃6801.2024.02.006
∗ 航空科学基金资助项目(20183333001);国家自然科学基金资助项目(52372420);中国博士后基金特别资助项目(2018T110587);浙大城市学院科研培育基金资助项目(J⁃202220)
收稿日期:2022⁃10⁃03;修回日期:2023⁃03⁃30
第 2 期万安平,等:多工况直升机附件齿轮箱振动故障诊断
1 VMD‑MCNN 模型
直升机附件齿轮箱受内外激励影响,振动故障模式复杂,诊断模型既要保障对振动信号和故障模式之间的复杂映射关系有较强的学习能力,也要保障在变工况与噪声干扰下具备较强的适应能力。对此,笔者提出一种结合VMD 信号重构与多尺度卷积网络的模型,该模型利用抗噪性能好的VMD 方法对原始信号进行滤波、分解和重构,由MCNN 对重构后的信号进行自适应特征提取,并对提取的不同特征进行融合、学习,以增强模型对不同工况与传感器的适应性。VMD⁃MCNN 网络模型如图1所示。
1.1 变分模态分解原理 
VMD 是一种基于Wiener 滤波的自适应、完全非递归的模态变分和信号处理方法,其将每个IMF 定义为调幅调频信号,表达式为
u k (t )=a k (t )cos (φk (t ))
(1)
其中:a k (t )为IMF 瞬时幅值;φk (t
)为IMF 瞬时相位。将原始振动信号f 分解为K 个有限带宽的模态函数u k (t ),使得各个IMF 的估计带宽之和最小,所有IMF 的和与原始信号相等。分解过程中每个IMF 的中心频率与带宽不断更新,直至满足收敛要求,VMD 分解流程如图2所示。由图可知,选定合适的分解层数K 值对最终结果具有重要影响。1.2 基于频率特性的信号重构 
对于分解后的IMFs ,通过基于齿轮副频率[6]特性筛选不同分量进行重新组合,从而将原本特征混叠的一维信号转换为仅包含单一频率特性的多维信号。其过程如下:
1) 对于分解的K 个IMFs ,计算齿轮副的输入
轴转频f r 和啮合频率f c ;
2) 根据上述计算频率搜索分解后的IMFs 的中心频率,其中频率接近于f r 的分量记为f 1,频率接近于f c 的分量记为f 2;
3) 其余的IMFs 直接求和记为f 3;
4) 对得到的3个信号分量f 1,f 2,f 3进行归一化,最终得到幅值分布在[0,1]区间的三维信号F new 。
VMD 分解后的IMFs 中,低频分量反映了故障信号的宏观特征,如周期性、幅值分布等;高频分量
反映了齿轮啮合引起的各机械部件的高频率细微共振,隐含故障的潜在特征。通过min⁃max 归一化操作能够将其同步到相同的量级,以增强微弱高频分量在神经网络中的权重 ,即
x norm =(x -x min )(x max -x min )
(2)
其中:x norm 为归一化后数据;x min 为对应属性最小值;x max 为对应属性最大值。1.3 多尺度卷积网络 
MCNN 为多输入⁃单输出结构,特征提取层分别对不同通道数据进行提取,提取特征在融合层进行信息融合,不同通道数据包含的故障信息量不同,因此多尺度特征提取的自适应性更高。
笔者提出以齿轮箱外壳体不同采样点位置的传感器作为不同通道,利用MCNN 对经VMD 重构后的信号x  = (x 1, x 2,…, x N )进行特征提取,每个尺度的特征提取模块(卷积⁃池化层)输出提取后的特征为
y i =max i ∈R (f
(
∑m =1
M
W i
⊗x
m
i
+b i
))
(i =1,2,…,N )
(3)
其中:x i 为第i 个传感器对应的重构信号F new ;f  (·)
图1 VMD⁃MCNN 网络模型Fig.1 
Network model of VMD⁃MCNN
图2 VMD 分解流程
Fig.2 VMD decomposition flow chart
247
振动、测试与诊断第 44 卷
非线性激活函数;⊗为互相关运算;R M l为局部感受野;l为提取信号长度(本研究取1 024个样本点);M 为重构信号维度,本研究M = 3;N为传感器数量。
特征融合层对特征进行融合后,得到特征矩阵y = (y1,y2,…,y n),然后由高维卷积层A、卷积层B 对融合后特征进一步提取。
1.4 模型结构及参数 
诊断模型由N个并联的多尺度特征提取层、1个特征融合层、1个高维特征提取层、1个展平层和输出层组成,其中每个多尺度特征提取模块由1个VMD分解模块和2个卷积⁃池化层堆叠,高维特征提取层由2个等宽卷积层和1个池化层组成。
卷积层采用的激活函数为ReLU,为防止参数过大引起过拟合的现象,在每一层卷积层均添加L2正则化优化方法,并且在卷积层与池化层、展平层与输出层之间添加Dropout优化层。特征融合层按照传感器通道方向对提取的多尺度特征进行并联操作。展平层将上层提取的高维特征映射展平为一维,转化为能够输入全连接层的结构。输出层为1个全连接层,其采用softmax激活函数求取每个故障类别的识别概率,
取最大的概率对应的类别标签作为模型诊断结果。
模型的结构参数按照金字塔模式(底部模型核数少,顶部模型核数多)设定参数,以16为基准不断增大网络层核数,直到模型训练的准确率增量小于0.1%时停止调整,选定此时的参数为最终优化模型的结构参数,如表1所示。2 基于VMD‑MCNN的故障诊断方法
采用VMD⁃MCNN模型对直升机附件齿轮箱进行故障诊断,方法流程如图3所示,具体步骤如下。
1)数据采集:在直升机附件齿轮箱外壳体不同位置和方向安装多个加速度传感器,采集不同尺度的振动信号。
2)信号处理:对采集的多传感器信号分别进行VMD分解,并基于齿轮副频率特性进行信号重组,对重组后的信号分量进行归一化。
3)离线训练:将重构信号样本划分为训练集和测试集,初始化卷积神经网络的权重、偏置为接近于0的随机数,设置模型训练的迭代次数、学习率以及优化方法。以小批量的形式输入样本到MCNN网络中,逐层进行前向传播获取故障特征,于输出层获取预测故障类别,计算真实样本类别与预测值的误差,反向传播计算误差梯度,更新网络参数。
4)模型测试:将未经训练的测试样本(类别标签未知)输入模型进行识别诊断,将诊断结果与真实类
别进行比较,计算模型准确率。
表1 模型参数Tab.1 Model parameters
模块名称
多尺度特征提取模块
特征融合
高维特征提取层
故障分类
层名
卷积层
池化层
卷积层
Dropout层
池化层
融合层
全连接层
卷积层A
池化层
卷积层B
展平层
Dropout层
全连接层
核尺寸
正则化 归一化
(3×1,32)×N
(3×2,32)×N
(3×1,64)×N
(1×1,64)×N
(3×2,64)×N
(1×1,320)×1
(1×1,32)×1
(3×1,64)×1
(3×2,64)×1
(3×1,64)×1
(1×1,1)×1
(1×1,1)×1
(1×1,6)×1
输出大小
1 024×32
512×32
512×64
512×64
256×64
256×320
256×32
256×64
128×64
128×64
8 192×1
8 192×1
6×1
图3 方法流程图
Fig.3 Flow chart of method
248
第 2 期万安平,等:多工况直升机附件齿轮箱振动故障诊断
3 实验验证
3.1 数据采集 
数据采集实验台为图4所示的直升机行星传动仿真实验平台,主要由变速驱动电机、2级行星齿轮箱、平行齿轮箱和可编程磁力制动器组成。
实验设置6种齿轮故障模式:正常齿轮、轮齿折断、缺齿、齿面磨损、齿根裂纹和偏心轮。故障齿轮如图5所示。在平行齿轮箱外侧安装加速度传感器来检测振动信号,采样频率为51 200 Hz ,齿轮箱故障测点布置如表2所示。
为模拟直升机附件齿轮箱在翼时转速微弱波动与负载大范围变化的工作状态,对每种故障模式均
设置4种工况,不同工况下的样本配置见表3。
3.2 信号处理 
对实验采集的振动加速度信号进行VMD 分解,根据齿轮副频率特性对分解的模态进行重构,并增强微弱故障特征。
由于分解层数K 对VMD 模态分解的影响很大,分解层数过多,相邻2个分量对应的中心频率相差较小,产生过分解现象;分解层数较少,不同中心频率
对应的分量未能分离,出现欠分解现象。本研究通过逐渐增大K 值,观察分解后各个分量u 之间是否存在过分解与欠分解现象,来确定分解次数[12]。
表4为不同K 值对应的IMF 中心频率,由表可知:当K =5时,频率为118 Hz 的分量没有被分解,存在欠分解现象;当K =7时,u 4与u 5的中心频率与K =6时的u 4频率十分接近,存在过分解现象。因此,确定分解层数K 为6,最终的VMD 分解结果如图6所示。
由图6可知:u 1的中心频率接近于齿轮副输入轴转频(11.398 Hz );u 6的中心频率接近于齿轮副啮合频率(330.540 Hz )。根据1.2节的信号重构流程,得到的信号重构结果如图7所示。3.3 模型训练 
实验中模型训练使用Adam 优化算法更新网络参数并控制网络的学习率,初始学习率设为0.000 1
图4 直升机行星传动仿真实验平台
Fig.4 Helicopter planetary gearboxes transmission platform
表2 齿轮箱故障测点布置
Tab.2 Layout of fault measuring points of gearbox 类型转速计加速度1加速度2加速度3加速度4加速度5
采集仪对应位置NI⁃1NI⁃2(轴向)NI⁃3(水平径向)NI⁃4(垂直径向)NI⁃5NI⁃6
测点位置
驱动电机输出轴平行齿轮箱中间轴轴承端盖
平行齿轮箱右侧箱体承重台面⁃靠平行齿
轮箱
图5 故障齿轮Fig.5 Faulty gear 表3 不同工况下的样本配置
Tab.3 Sample distribution under different conditions 编号1234
转频/Hz 34345757
负载/(N⋅m)
22442244
故障模式6666
样本量18 00018 00018 00018 000
样本点数1 0241 0241 0241 024
表4 不同K 值对应的IMF 中心频率
Tab.4 Central frequencies of IMF with different K
values
K 34567
u 11111121212
u 22523232322
u 318139393939
u 4—182********
u 5——355184125
u 6———358185
u 7————359
249
振 动、 测试与诊断第 44 卷
针对训练回合数选择,采取早停法,当模型的损失函数(误差)下降速率小于1×10-3,且稳定保持5个回合时,提前中止模型训练,保存此刻模型参数。
模型训练在配置NVIDIA GeForce GTX1650和16⁃GB RAM 的计算机上实施。编程语言为Py⁃thon ,集成开发环境为Spyder ,TensorFlow 2.1.1和Keras 2.3.1。采用准确率对诊断模型识别效果进行评价,训练过程损失函数采用交叉熵损失函数。
实验将数据以4∶1划分为训练样本(训练集、验证集)和测试样本,模型训练过程如图8所示。3.4 测试结果分析与讨论 
考虑到实验安装的5个加速度传感器并不都能准确捕捉齿轮故障引起的箱体振动变化,传感器数量及其布置位置对诊断效果会产生很大影响,本研究采用包裹法来确定传感器数量N ,即设定一个空间集合,从1~5依次向该集合中增添传感器数量,比较各个传感器对模型准确率的影响。实验得到的传感器集合对模型效果的影响如图9所示。
结果表明,增大传感器数量N 不仅不会提升模
型的准确率,还可能引入无关信息致使模型复杂度提升,从而降低了诊断精度。由图9可知,NI_346的传感器集合训练集与测试集准确率高,泛化性能最好,这3个传感器均为安装在靠近齿轮箱壳体或直接附着在壳体表面,对于故障信息的采集更为精确,因此以该集合构建模型的输入结构。
以传感器集合为NI_346,建立3个并行多尺度特征提取模块的诊断模型并进行训练,其训练过程损失函数和准确率变化如图10所示。训练集和验证集的损失函数与准确率在训练过程中同时变化,在16回合达到收敛,保存此时的模型参数。
为了验证所提方法的优越性,将该方法与其他
相关诊断方法进行对比,包括决策树(DT )[12]
、支持向量机(SVM )[13]、一维卷积网络(1D⁃CNN )、残差网络(ResNet )[14]、短时傅里叶变换⁃卷积(STFT⁃CNN )[15]、连续小波变换⁃卷积(CWT⁃CNN )[16]以及经验模态分解⁃多尺度卷积(EMD⁃MCNN )[8]。重复实验10次,
所有模型均选择最优设置下的结果作为实验结果,
图6 VMD 分解结果Fig.6 
Result of VMD
图7 信号重构结果
Fig.7 
Results of signal reconstruction
图8 模型训练过程Fig.8 
Model training process
图9 传感器集合对模型效果的影响Fig.9 Effect of sensor set on model
250

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。