偏最小二乘法推导原理--688IT编程网

偏最小二乘法推导原理

偏最小二乘法（Partial Least Squares，简称PLS）是一种多变量回归方法，主要用于解决多个自变量和一个因变量之间的关系建模问题。它与传统的最小二乘法（Least Squares，简称LS）相比，相对于原始变量空间进行了特征空间的变换，使得建模变量更具有解释性。

PLS方法最早由Herman Wold于1975年提出，并被应用于计量经济学领域。随后，PLS得到了广泛应用，尤其在化学、药物研究、食品科学、环境科学等领域。现如今，PLS被认为是多变量分析和回归分析的核心工具之一。

接下来，我们将详细推导PLS的原理，包括数据预处理、特征提取和模型构建等方面。

1.数据预处理

在使用PLS方法对数据进行建模之前，我们首先需要对原始数据进行预处理。常用的预处理方法包括中心化和标准化。中心化是指将每个变量减去其均值，使得数据的平均值为0。标准化是指将每个变量除以其标准差，使得数据的方差为1。

2.特征提取

PLS的核心思想是通过线性组合构造出新的变量，这些变量被称为潜在变量（Latent Variables）。潜在变量是原始变量对因变量的最佳线性组合，具有最大的协方差和最小的预测误差。

设X为p维自变量矩阵，Y为因变量向量。我们的目标是构造出k个潜在变量t1、t2、...、tk，使得自变量X和因变量Y在潜在变量空间中的协方差最大。正则化最小二乘问题

我们首先构造出第一个潜在变量t1。假设t1是X的线性组合，即t1=Xw1，其中w1为p维权重向量。我们的目标是使得t1和Y的协方差最大，即Max Cov(t1,Y)。

根据最大协方差理论，可以得到w1满足如下方程：

w1=argmax（Cov(Xw1,Y)）

进一步推导可以将Cov(Xw1,Y)写成w1的函数，即：

Cov(Xw1,Y)=w1^T(X^TY)w1

我们的目标是最大化上述函数，进一步得到w1的表达式：

w1=argmax（w1^T(X^TY)w1）

我们可以通过如下的优化问题来求解w1：

max（w1^T(X^TY)w1）

约束条件：||w1||=1

通过求解上述问题，我们可以得到w1的解析解。

3.潜在变量的构造

在得到了第一个潜在变量t1后，我们可以通过以下步骤得到第二个潜在变量t2。

a.构建y的预测模型

利用t1对Y进行回归建模，得到Y的预测值Y_hat1。

Y_hat1=t1p1^T

其中，p1是一个标量，表示t1对Y的线性回归系数。

b.通过残差计算新的X

将X减去t1的投影，得到新的X_new。

X_new=X-t1w1^T

c.构建新的X对t2的回归模型

利用X_new对t2进行回归建模，得到t2。

t2=X_neww2

同样地，我们通过最大化Cov(t2,Y)来获得w2。

依次类推，我们可以构建k个潜在变量t1、t2、...、tk。

4.模型构建

在得到了k个潜在变量后，我们可以用它们构建多元线性回归模型：

Y_hat=b0+t1b1+t2b2+...+tkbk

其中，b0是截距项，而b1、b2、...、bk是对应潜在变量的回归系数。

通过最小二乘法求解上述线性回归模型，我们可以得到回归系数和截距项的估计值。

总结：

偏最小二乘法（PLS）是一种多变量回归方法，用于解决多个自变量和一个因变量之间的关系建模问题。其核心思想是通过潜在变量的构造，使得自变量和因变量在潜在变量空间中的协方差最大。PLS方法的推导原理包括数据预处理、特征提取和模型构建等步骤。通过最大化自变量和因变量之间的协方差，我们可以得到潜在变量的权重向量，并通过潜在变量构建多元线性回归模型。

688IT编程网

偏最小二乘法推导原理

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

偏最小二乘法推导原理

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式