(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 103605952 A
(43)申请公布日 2014.02.26
(21)申请号 CN201310517792.5
(22)申请日 2013.10.27
(71)申请人 西安电子科技大学
    地址 710071 陕西省西安市太白南路2号正则化与稀疏
(72)发明人 张向荣 焦李成 贾航华 杨浩 杨淑媛 李阳阳 马文萍 马晶晶
(74)专利代理机构 陕西电子工业专利中心
    代理人 田文英
(51)Int.CI
      G06K9/00
      G06K9/66
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      基于拉普拉斯正则组稀疏的人体行为识别方法
(57)摘要
      本发明公开一种基于拉普拉斯正则组稀疏的人体行为识别方法,主要用于解决现有技术中对特征的编码方法中没有考虑视频内部结构信息且计算效率较低的问题。其实现步骤为:(1)输入人体行为视频序列;(2)提取初级特征;(3)构建初始字典和相似度矩阵;(4)编码初级特征;(5)分类;(6)输出检测结果。本发明在组稀疏编码的基础上,加入了人体行为视频序列内部的结构信息,增强了人体行为视频序列编码的判别性,提高了分类精度,使得对人体行为的识别更加准确。
法律状态
法律状态公告日
法律状态信息
法律状态
2022-10-11
未缴年费专利权终止IPC(主分类):G06K 9/00专利号:ZL2013105177925申请日:20131027授权公告日:20161123
专利权的终止
权 利 要 求 说 明 书
1.一种基于拉普拉斯正则组稀疏的人体行为识别方法,包括以下步骤:       
(1)输入人体行为视频序列;       
(2)提取初级特征:       
2a)采用空时角点检测方法,提取人体行为视频序列兴趣点;       
2b)根据兴趣点,提取人体行为视频序列的初级特征;       
(3)构建初始字典和相似度矩阵:       
3a)根据人体行为视频序列的初级特征,构建初始字典;       
3b)根据人体行为视频序列的初级特征,构建相似度矩阵;       
(4)编码初级特征:       
4a)对人体行为视频序列中,每个视频的初级特征进行拉普拉斯正则的组稀疏编码的目标函数如下:       
其中,B表示编码系数矩阵,y<sub>i</sub>表示人体行为视频序列中每个视频的初级特征中第i个特征向量,M表示人体行为视频序列中每个视频的初级特征中特征向量的个数,表示编码系数矩阵B的第j行第i列元素,d<sub>j</sub>表示初始字典D<sub>0</sub>的第j列,||·||<sup>2</sup>表示l<sub>2</sub>范数的平方和,λ和μ表示平衡编码稀疏矩阵稀疏性和图拉
普拉斯约束的正则参数,取值范围是0~1,||·||<sub>p</sub>表示p范数,tr(BLB<sup>T</sup>)表示矩阵BLB<sup>T</sup>的迹,L表示人体行为视频序列中每个视频的图的拉普拉斯矩阵;       
4b)使用坐标下降的方法,对目标函数进行求解,得到人体行为视频序列中每个视频的初级特征的编码系数矩阵:       
其中,B表示N行M列的编码系数矩阵,N表示初始字典原子的个数,M表 示人体行为视频序列中每个视频的初级特征中特征向量的个数;表示编码系数矩阵B的第j行,j表示编码系数矩阵的行坐标,b<sub>i</sub>表示编码系数矩阵B的第i列,i表示编码系数矩阵B的列坐标;       
4c)对编码系数矩阵B的每一行求l<sub>2</sub>范数,得到人体行为视频序列中每个视频的高级特征Z:       
Z=[z<sub>1</sub>,...z<sub>k</sub>,...,z<sub>N</sub>]<sup>T</sup>
其中,Z表示人体行为视频序列中每个视频的高级特征,z<sub>k</sub>表示人体行为视频序列中每个视频的高级特征Z的第k个元素,z<sub>k</sub>=||B<sub>k</sub>||<sub>2</su
b>,||B<sub>k</sub>||<sub>2</sub>表示对编码系数矩阵B的第k行求2范数,k=1,2,...,N,N表示人体行为视频序列中每个视频的高级特征的维数;       
(5)分类:       
5a)将每一个动作者的人体行为视频的所有高级特征分别作为测试集,其他动作者的人体行为视频的高级特征作为训练集,利用训练集中的所有样本组成N行m列的字典H=[H<sub>1</sub>,...,H<sub>j</sub>,...,H<sub>c</sub>],H<sub>j</sub>表示第j类的字典原子,j表示字典的类别标号,j=1,2,...,c,c表示总类别数,N表示人体行为视频序列中每个视频的高级特征的维数,m表示字典H所有原子个数;       
5b)按照下式,计算每个测试样本的稀疏编码系数向量:       
其中,表示测试集中的测试样本,H是训练集中的所有样本组成的字典,θ表示稀疏编码系数向量,||·||<sub>2</sub><sup>2</sup>表示l<sub>2</sub>范数的平方和,||·||<sub>1</sub>表示向量的l<sub>1</sub>范数,η表示平衡重建误差和编码稀疏性的正则参数,取值范围是0~1。       
5c)按照下式,计算测试样本在每类字典上的残差:       
其中:表示测试样本在每类字典上的残差,表示测试集中的测试样本, θ<sub>j</sub>表示测试样本在第j类字典H<sub>j</sub>上的编码系数向量;       
5d)将最小残差所对应的字典类标赋给测试样本得到测试样本的类标。       
(6)输出检测结果。       
2.根据权利要求1所述的基于拉普拉斯正则组稀疏的人体行为识别方法,其特征在于,步骤2a)中所述空时角点检测方法的具体步骤为:       
第1步,计算人体行为视频序列中图像像素点在水平方向,垂直方向和时间方向的梯度,得到矩阵Q:       
其中,Q表示矩阵,I<sub>x</sub>表示人体行为视频序列中图像像素点在水平方向的梯度,I<sub>y</sub>表示人体行为视频序列中图像像素点在垂直方向的梯度,I<sub>t</sub>表示人体行为视频序列中图像像素点在时间方向的梯度;       
第2步,对矩阵Q进行高斯滤波,得到滤波后的矩阵U:       
其中,U表示滤波后的矩阵,g(x,y,t;σ<sup>2</sup>,τ<sup>2</sup>)表示用来对矩阵Q进行滤波的空时高斯函数,x,y,t分别表示图像像素点的位置坐标,表示卷积,σ表示空域尺度,τ表示时域尺度;       
第3步,计算人体行为视频序列中图像像素点的兴趣值R:       
R=det(U)-ktr<sup>3</sup>(U)       
其中,R表示人体行为视频序列中图像像素点的兴趣值,det(U)表示滤波后 矩阵U的行列式,k表示平衡因子,k的取值是0.04,tr(U)表示滤波后矩阵U的迹;       
第4步,设定一个阈值T=0.03;       
第5步,将大于阈值T的兴趣值的像素点,作为人体行为视频序列中的兴趣点。       
3.根据权利要求1所述的所述的基于拉普拉斯正则组稀疏的人体行为识别方法,其特征在于,步骤2b)中所述提取初级特征方法的具体步骤为:       
在每个兴趣点的邻域内提取梯度直方图,将梯度直方图作为该兴趣点的特征向量,将人体行为视频序列中每个视频的所有兴趣点的特征向量组成矩阵,得到该视频的初级特征;       
Y=[y<sub>1</sub>,...,y<sub>i</sub>,...,y<sub>M</sub>]       
其中,Y表示人体行为视频序列中每个视频的初级特征,y<sub>i</sub>表示人体行为视频序列初级特征Y中第i个特征向量,i=1,...,M,M表示人体行为视频的初级特征Y的特征向量的个数。       
4.根据权利要求1所述的基于拉普拉斯正则组稀疏的人体行为识别方法,其特征在于,步骤3a)中所述构造字典方法的具体步骤如下:       
从提取的人体行为视频初级特征中,随机的选取多个特征向量作为初始字典的原子,得到初始字典:       
D<sub>0</sub>=[d<sub>1</sub>,...,d<sub>i</sub>,...,d<sub>N</sub>]       
其中,D<sub>0</sub>表示初始字典,d<sub>i</sub>表示字典的第i个原子,i=1,...,N,N表示与随机选取的人体行为视频初级特征中特征向量个数相同的初始字典的原子个数。       

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。