局部保持偏最小二乘算法的正交改进及应用
偏最小二乘回归分析方法(Partial Least Squares Regression,PLS)是一种多元数据统计方法,广泛应用在质量控制、医药等各方面。传统偏最小二乘方法处理线性数据之间的关系,在实际应用中往往无法取得令人满意的效果,其主要原因在于现象之间的联系往往不是线性的,而是复杂的非线性关系。
目前,非线性偏最小二乘算法也逐渐受到学者关注。然而现有的非线性偏最小二乘方法也各有优劣,从计算效率、复杂程度、应用层面上很难去寻求一种规范的非线性偏最小二乘方法。
局部保持偏最小二乘(Locality-Preserving Partial Least-Squares,LPPLS)是一种全新的非线性偏最小二乘算法,用流形学习局部保持投影算法(Local Preserving Projection,LPP)替换传统最小二乘算法中的主成分提取,通过利用局部线性近似来达到全局非线性映射的思路可以高效地提升系统非线性处理能力。本文基于这种新颖的非线性偏最小二乘算法——局部保持偏最小二乘方法进行深入的理论研究,从该方法的几何结构特性分析入手,提出了正交化的改进算法,在探索正交LPPLS方法在工业过程故障诊断应用的同时,提出了对其逆模型的构建及模型不确定度分析,将该方法用于超高维、强非线性的糖基化过程的操作设计中。
正则化最小二乘问题
本文的主要工作如下:首先,对局部保持偏最小二乘算法(LPPLS)的几何特性进行分析,发现其非正交化的本质,并借鉴正交并行偏最小二乘算法思想,对LPPLS进行正交化,提出了正交C-LPPLS算法,将数据空间分解为联合输入输出子空间(CVS)、输入-主元空间(IPS)、输入残差子空间(IRS)、输出主元子空间(OPS)、输出残差子空间(OR)五个子空间。将正交的C-LPPLS算法应用于TE过程的故障诊断,通过五个子空间同时进行完整的数据监测和故障诊断,验证改进算法的有效性。
其次,C-LPPLS方法在复杂过程操作设计应用的角度,提出针对正交C-LPPLS逆模型的设计思路,避免了传统基于机理模型的操作优化设计,用于指导生产。利用C-LPPLS逆模型分析可以构建复杂系统过程变量、质量变量之间的数据关系,针对每一种期望的产品质量,都能通过逆模型寻求到相应的操作条件。
同时考虑到数据模型本身的不确定性,对逆模型进行不确定度分析,从而得到合理的操作空间。并将上述方法应用到单克隆抗体制药糖基化过程的操作空间设计中,通过与PLS逆模型方法进行对比分析,来验证逆模型在药物制备设计中的有效性。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。