基于Preisach模型的深度学习网络迟滞建模
武毅男;方勇纯
【摘 要】针对传统压电扫描器迟滞模型泛化能力较弱的问题,提出了一种基于Preisach模型的深度学习网络来建立迟滞模型,提高了模型的学习能力和泛化能力.具体而言,首先利用深度学习在深度特征提取方面的优势,建立包含卷积层、池化层、展开层以及深度特征层的深度学习层来提取输入电压信号的特征信息;其次,利用傅里叶变换层计算得到输入信号的频率,并将频率输入到非线性层,构造并输出了与输入信号频率相关的非线性项,该非线性项作为权值函数与Preisach模型的迟滞单元输出相乘,并将乘积叠加得到了频率相关的模型输出向量;最后,将深度学习层输出的特征向量与Preisach模型输出向量点乘,即可得到深度学习网络的最终输出位移.同时利用电容位移传感器采集的16组输入输出信号对深度学习网络进行训练,得到了网络中的权值参数,并利用其他8组输入输出数据对深度网络进行测试,训练和测试结果表明,本文所提出的基于Preisach模型的深度学习网络在得到高精度迟滞模型的同时,提高了模型的泛化能力.%Aiming at the weak generalization ability of traditional piezoelectric scanner hysteresis models, a deep learn-ing network based on Preisach model is proposed to establish the hyst
eresis model for piezoelectric scanners, which im-proves the learning and generalization ability of the model. Specifically, first, considering the advantage of deep learning network in feature extraction, a deep learning layer comprising two convolution layers, a pool layer, an expansion layer, and a deep feature layer is established to extract the characteristic information of the input voltage signal. Afterwards, a Fourier transform layer is used to calculate the frequency of input signal, which is then input to the nonlinear layer to output a frequency-dependent nonlinear term, subsequently, the nonlinear term is multiplied by the hysteresis unit of the Preisach model to obtain the frequency-dependent model output vector. Finally, the output displacement of the whole depth learning network is obtained by multiplying the feature vector of the depth learning layer with the output vector of the Preisach model. In the section of network training and testing, 16 groups of input and output signals collected by the capacitance displacement sensor are used to train the deep learning network to get the weight parameters, and the other 8 groups of input and output data are tested on the deep network. The results show that the proposed deep learning network improves the generalization ability of the model while obtaining the high precision hysteresis model.
【期刊名称】《控制理论与应用》
【年(卷),期】2018(000)006
【总页数】9页(P723-731)
【关键词】压电扫描器;迟滞非线性;Preisach模型;深度学习正则化综述
【作 者】武毅男;方勇纯
【作者单位】南开大学机器人与信息自动化研究所,天津300350;天津市智能机器人技术重点实验室,天津300350
【正文语种】中 文
【中图分类】TP273
1 引言(Introduction)
原子力显微镜(atomic force microscopy,AFM)通过测量样品表面与微悬臂探针之间的相互作
用力来绘制样品的表面形貌和进行纳米操作,已经成为纳米科学领域应用最为广泛的工具之一[1],而压电扫描器作为AFM的驱动器,其性能好坏严重影响着AFM的精度和进一步发展.压电扫描器由压电材料制成,由于自身特性可以随着施加电压成比例地膨胀和收缩,并且具有纳米级的精度,因此常作为AFM的驱动部分,负责AFM水平方向和竖直方向的运动[2].然而,铁电效应所引起的迟滞特性导致了压电扫描器的输入电压和输出位移之间存在着非线性关系,进而影响了压电扫描器的定位精度[3].迟滞非线性具有记忆特性,该特性导致了输出位移不仅和当前的输入电压值有关,而且与输入电压的变化情况也密切相关.此外,迟滞非线性还会随着输入电压频率的增大而变得更加明显[4].
针对这一问题,研究人员尝试了多种方式建立压电扫描器的迟滞模型.例如,Jiaqiang E等设计了一种基于Preisach模型和模糊最小二乘支持向量机的迟滞建模方法,利用该方法有效的消除了迟滞现象[5].此外,Antonino Laudani等使用一种称为度量拓扑演化优化的新型混合启发式算法,实验结果验证了该算法能准备辨识出Bouc-Wen迟滞模型的参数[6].Zhi Li等设计了一种使用逆乘法结构Preisach模型的逆补偿方法,通过将Preisach模型由输入信号的隐式形式重新构建为显式表达式,实现了较好的补偿效果[7].
尽管这些方法能够准确建立迟滞模型,但是很多模型都没有考虑迟滞行为的记忆特性和频率相关性,这就导致了模型的泛化能力较弱,即只能对训练过的数据具有很好的效果,而对于未训练的数据却不具有适用性.针对这些问题,Cheng L等人分别设计了基于神经网络和基于自适应Takagi-Sugeno模糊模型的预测控制器,实现了对压电扫描器的良好跟踪[8–9].基于以上分析和思考,本文着手于建立具有较强泛化能力的迟滞模型来更加准确地描述迟滞行为.为了实现这一目标,需要将输入信号的特征以及频率相关项加入现有的模型当中,而深度学习以其在深度特征提取方面的优势,恰好满足建立具有记忆特性迟滞模型的需求,同时深度学习网络还具有强大的学习功能,可以提高模型的泛化能力[10–11].因此,本文提出了一种基于Preisach模型的深度学习网络来建立压电扫描器的迟滞模型.具体说来,输入电压首先通过傅里叶变化层和非线性层的作用产生频率相关的非线性项,该非线性项作为权重作用于Preisach模型中,得到了频率相关的迟滞模型;然后,通过设计包含卷积层和池化层的深度学习层,使得输入信号中的深度特征被提取出来,该特征向量与Preisach模型的输出位移向量点乘,即可得到整个深度学习网络的最终输出位移.最后,通过利用电容位移传感器测得的扫描器输入输出数据对网络进行训练,从而辨识出深度学习网络的权值参数,并通过输入输出数据对网络的建模结果进行测试,测试结果验证了该模型的准确性以及良好的泛化能力.
本文剩余部分组织如下:第2节分析了压电扫描器迟滞非线性的特点,并介绍了Preisach迟滞模型原理及其不足;在第3节中,介绍了深度学习网络的结构及设计流程,详细地给出了网络中各层的数学表达,并具体阐述了网络的训练过程;第4节是本文的实验部分,通过分别给出训练和测试结果,验证了所提出的深度学习网络迟滞建模的良好性能;第5节是本文的总结与展望.
2 问题描述(Problem statement)
2.1 迟滞非线性问题分析(Analysis of hysteresis nonlinear problem)
压电扫描器作为AFM常用的驱动器,在工作时由x方向上的三角波或正弦波电压驱动进行往复移动.由于自身迟滞效应的影响,压电扫描器输出位移和输入电压之间存在着复杂的非线性关系,严重影响了AFM的定位精度和成像质量[12].同时,迟滞行为具有记忆特性,即压电扫描器的输出位移不仅与当前时刻的输入电压有关,更会因为之前时刻输入电压变化过程的不同而产生不同的输出位移[13].
迟滞行为非线性和记忆特性的典型表现是:当输入电压交替增减时,输出位移会形成一个迟滞环,并且迟滞环的宽度会随着输入电压频率的增大而增大.如图1所示:黑线、蓝线和红线分别代
表着频率为1 Hz,25 Hz和50 Hz的迟滞环,横坐标为压电扫描器的输入电压,纵坐标为输出位移.迟滞环的实线部分表示输入电压增大的过程,虚线部分表示输入电压减小的过程,由于迟滞非线性的影响,压电扫描器输出位移和期望位移之间产生了偏差,同时电压增大和减小的过程对应的输出位移轨迹之间也产生了偏差,而且偏差随着输入电压频率的增大而变得更加明显,这将导致扫描得到的样品高度信息与对应的扫描点不匹配,从而导致图像的失真,并且图像失真现象会随着扫描频率的增大而更加明显[14].
图1 不同频率的迟滞环Fig.1 Hysteresis loops with different frequencies
2.2 Preisach迟滞模型(Preisach hysteresis model)
为了精确描述迟滞行为,Ferenc Preisach在1935年提出了Preisach迟滞模型,该模型在随后的发展中成为了被广泛接受的迟滞模型,并被越来越多的研究人员应用在迟滞建模中[15].Preisach模型将迟滞回路概括为独立继电器的并联连接,而在实现过程中采用有权重的迟滞单元来模拟继电器的功能,因此Preisach模型的输出结果可表示为
其中:X(t)和Y(t)分别为模型的输入和输出,µ(α,β)为权重函数,γαβ[X](t)为迟滞单元,每一个迟滞单元的取值都由一对上下切换值α和β决定:
其中:α≤β,(α,β)∈平面P,ξ=1或者-1,其取值取决于输入信号所处的变化过程,这恰恰符合了迟滞行为的记忆特性[16].
尽管Preisach模型能够准确的描述迟滞效应,但是该模型中不包含输入信号的频率相关项,只适用于用来建模的输入输出数据,对于未用来建模的数据效果不佳,因此模型泛化能力较弱,影响了其进一步发展和应用.
3 基于Preisach模型的深度学习网络(Deep learning network based on Preisach model)
为了提高传统Preisach迟滞模型的泛化能力,本文提出了一种基于Preisach模型的深度学习网络来建立压电扫描器的迟滞模型,该网络结构如图2所示.
图2 深度学习网络结构图Fig.2 Structure of deep learning network
图中:输入层选用的是1×100维的输入电压信号进行训练和测试;傅里叶变化层通过分析输入信号,自动获取输入电压的频率,并将频率作为非线性层的输入,通过非线性变换,产生频率相关的非线性项并输入到迟滞模型层中,从而得到了频率相关的Preisach迟滞模型.此外,深度学习层通过对输入电压进行卷积和池化,得到了输入信号的深度特征,并将该特征向量与迟滞模型层
的输出向量点乘,产生了最终1×100维的输出位移.
3.1 深度学习层(Deep learning layer)
深度学习层通过对输入电压进行学习,提取出输入信号的深度特征,并将深度特征与Preisach模型融合,增强了模型的学习能力.其具体结构如图3所示.
图3 深度学习层结构图Fig.3 Structure of deep learning layer
3.1.1 输入变换层(Input transform layer)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论