(19)中华人民共和国国家知识产权局
(12)发明专利说明书
正则化可以理解为一种什么法
(10)申请公布号 CN 113902950 A
(43)申请公布日 2022.01.07
(21)申请号 CN202111206294.X
(22)申请日 2021.10.16
(71)申请人 江苏大学
    地址 212013 江苏省镇江市京口区学府路301号
(72)发明人 刘志锋 蔡瑞行 沈项军
(74)专利代理机构
    代理人
(51)Int.CI
      G06V10/764(20220101)
      G06V10/774(20220101)
      G06K9/62(20220101)
      G06F30/27(20200101)
      G06F17/16(20060101)
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      一种基于几何保持双投影的图像多标签分类方法
(57)摘要
      本发明公开了一种基于几何保持双投影的图像多标签分类方法,本方法与传统的多标签分类算法直接从特征空间学习合适的特征维数不同,本发明所提出的方法是同时从输入特征空间和输出特征空间学习双标签和特征空间投影,从而实现标签和特征空间的降维,考虑到标签流形和特征流形中不仅有标签还有特征数据,同时通过构造标签图和特征图来学习标签流形和特征流形的几何结构。本方法通过从标签和特征空间进行几何保持的双重投影学习,最终以同样的方式在标签和特征空间中学习更好的低秩结构。
法律状态
法律状态公告日
法律状态信息
法律状态
2022-01-25
实质审查的生效
实质审查的生效
2022-01-07
公开
公开

权 利 要 求 说 明 书


1.一种基于几何保持双投影的图像多标签分类方法,其特征在于,包括如下步骤:

步骤1、准备待分类的图像样本及图像样本对应的标签,由图像样本构成特征空间表示为X=[x
1
,x
2
,......,x
n
],由标签构成标签空间表示为Y∈{0,1}
q×n
,其中,x
n
为训练实例即图像样本,n是训练实例的数量,q是标签的维度;

步骤2,基于标签空间和特征空间进行几何保持双投影学习,包括如下步骤:

步骤2.1,分别在标签空间和特征空间上对应学习双投影矩阵V和P,将标签空间映射到嵌入空间
从而实现降维;

步骤2.2,构造标签图和特征图来学习标签流形和特征流形的几何结构;

步骤2.3,基于标签流形、特征流形和双投影矩阵V和P,构建了一个几何保持双投影模型;该模型待优化的目标函数表示如下:




s.t.V
T
YY
T
V=I,P=Q

其中,P和V是双投影矩阵,Q是等价矩阵,
是F范数运算;tr(*)是迹运算;α和β表示正则化参数来权衡第二项和第三项;I为单位矩阵;

步骤3,基于所构建的几何保持双投影模型,预测多标签分类结果。



2.根据权利要求1所述的一种基于几何保持双投影的图像多标签分类方法,其特征在于,求解几何保持双投影模型的目标函数中双投影矩阵P、V以及等价矩阵Q的方法为:

求解等价矩阵Q:

对目标函数使用增广拉格朗日函数法,优化问题转化为求解以下增广拉格朗日乘子问题:





其中,Y
1
为拉格朗日乘子,μ为参数;

对上式中的Q进行求偏导得到:

求解投影矩阵P:

对转换为增广拉格朗日乘子问题的目标函数中的P进行求偏导得到:

P=(2βXLX
T
+μI)
-1
(μQ+2XY
T
VV
T
-XX
T
QVV
T
-Y
1
);

求解投影矩阵V:

考虑到上述约束条件V
T
YY
T
V=I,对目标函数使用拉格朗日乘数法,得到下式:




对上式中参数V求偏导得:(YY
T
)
-1
(P
T
XX
T
Q-2P
T
XY
T
+αYLY
T
)V=λV

解上式的特征方程,特征向量即所求投影矩阵V,λ为特征值;

求解参数Y
1
,μ:

Y
1
=Y
1
+μ(P-Q)

μ=min(ρμ,max
μ
)

通过不断更新参数直到目标函数收敛以求得最优投影矩阵P和V;其中,ρ为μ的系数,max
μ
为最大参数。



3.根据权利要求1所述的一种基于几何保持双投影的图像多标签分类方法,其特征在于,步骤3
的预测过程为:

S1、在VV
T
上进行奇异值分解以获得奇异值,由奇异值构成矩阵S,该矩阵除了主对角线上的元素以外全为0,主对角线上的每个元素都称为奇异值,选取最大的奇异值来描述矩阵从而实现降维;

S2、将学习到的双投影矩阵P和V输入到解码矩阵V
T
P
T
X
train
,其中,X
train
=[x
1
,x
2
,......,x
n2
]∈R
p×n1
为训练集,n2为训练集样本数;

S3、将特征空间X分为测试集X
test
和训练集X
train
;其中,测试集表示为X
test
=[x
1
,x
2
,......,x
n1
]∈R
p×n1
,将测试集中的测试实例x
i
输入到解码矩阵V
T
P
T
X
test
,n1为测试集样本数;

S4、基于奇异值学习x
i
和训练集X
train
之间的距离,得到该x
i
基于训练集的K近邻训练样本,获取该训练样本的标签值;

S5、针对x
i
所对应的K近邻序列输出该x
i
的标签值得到预测值Y
test
,完成多标签分类预测。



4.根据权利要求1所述的一种基于几何保持双投影的图像多标签分类方法,其特征在于,构造特征图的方法为:特征图节点对应于{x
1
,x
2
,...x
n
};对于每个训练实例x
i
,如果存在K近邻的第j个训练实例x
j
,则在节点之间构建一条边;为了使得连接点尽可能靠近,优化下述模型:







其中,W
ij
是系数对称矩阵通过热内核法表示连接点的权重;矩阵D是图的度矩阵,L=D-W是特征图的拉普拉斯图。




5.根据权利要求4所述的一种基于几何保持双投影的图像多标签分类方法,其特征在于,构造标签图,如果x
i
和x
j
越近,则V
T
y
i
和V
T
y
i
之间的距离也越近,具体表述如下:




其中,W
ij
是系数对称矩阵通过热内核法表示连接点的权重;矩阵D是图的度矩阵,L=D-W是标签图的拉普拉斯图。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。