收稿日期:3作者简介:孙
锐(6),男,浙江余姚人,副研究员,博士,主要研究方向为多媒体安全,图像处理与理解。
2010年工程图学学报
2010第2期
J OURNAL OF ENG INEERING GRAPHICS
No.2
基于图像正则化的抗几何变换的感知哈希算法
正则化几何因子
锐1,闫晓星2,丁志中1
(1.合肥工业大学计算机与信息学院,安徽合肥230009;2.合肥工业大学光电技术研究院,安徽合肥230009)
摘要:图像哈希在内容认证、数据库搜索和水印等领域有广泛的应用。该文提出
的新的抗几何变换的感知哈希方法包括三个主要阶段:第一阶段通过图像正则化过程获得一个对任意仿射变换具有不变性的正则图像;第二阶段对随机选择的多个子图像进行小波变换产生一个包括图像主要特征的副图像;第三阶段采用奇异值分解捕获图像的局部感知成分并生成最终哈希。仿真实验表明算法有效抵抗了几何变换、压缩等感知保持操作,内容篡改也被正确检测。批量实验也证明算法有较好的稳健性和抗误分类能力。
关键词:计算机应用;感知哈希;图像正则化;几何变换;图像认证中图分类号:TP 391.41文献标识码:A
文章编号:1003-0158(2010)02-0116-07
Robust Perceptual Hashing Algorithm to Geometric Distor tions
Based on Image Normalization
SUN Rui 1,
YAN Xiao-xing 2,
DING Zhi-zhong 1
(1.School of Computer and Information,Hefei Universi ty of Technology,Hefei Anhui 230009,China;2.Academy of Optoelectronic Technology,Hefei Uni versity of Technology,Hefei Anhui 230009,China )
Abstr act:Image hashing functions have extensive applications in content authentication,database search and watermarking,etc.A novel perceptual hashing algorithm is developed which is robust to geometric distortions.The algorithm includes three stages:the first stage obtains the image that is invariant to any affine transforms through a normalization procedure;the second stage applies discrete wavelet transform to pseudo-randomly select sub-images to obtain secondary image including main features;the third stage uses singular value decomposing to capture local perceptual features and to get the final hash.The experiments show the method withstands perceptually preserved manipulations including geometric distortions,compression,and common signal processing operations.The content changes are also can be detected accurately.Thus the proposed method achieves perceptual robustness while avoiding misclassification.
K ey wor ds:computer application;perceptual Hashing;image normalization;geometric distortions;image authentication
2008-10-1197-
图像哈希是图像内容或特征的一种简洁表示,即使两幅感知相近的图像在数值上有不同的表示,感知哈希函数也使它们产生相同或相近的哈希序列,这是感知哈希技术与传统密码学中的哈希的显著区别。传统的哈希算法包括MD5和SHA-1等,它们对每比特的信息变化都非常敏感,这种敏感性比较适合文本或软件数据的要求,而对于多媒体信息,它们可能在传输过程中经历有损压缩、滤波、几何失真、噪声污染等变化,但依然和原始媒体感知一致,因此传统的哈希算法不适合于多媒体信息
[1-2]
感知哈希可用于图像的完整性认证,随着大
量多媒体应用的发展,数字图像增加了被非法操作和篡改的危险。感知哈希技术通过提取表征图像内容的特征产生哈希,这一过程包含一个或若干依赖于密钥的随机化过程,在信息的发送端,哈希可以通过伴随或嵌入多媒体数据方式传输,也可单独传输;在接收端,接收的信息的哈希通过同样的方法提取,并同接收的哈希做比较来完成认证过程。图像哈希除了应用于图像认证之外,还可用于基于内容的数据库提取,将数据库中图像的哈希排列成查表的格式,当需要查某幅图像时,计算待查图像的哈希与查表做比较,可快速实现感知相似的图像匹配。例如,公安部门可利用哈希对罪犯指纹与指纹数据库做快速比对,加快案件的侦破。图像哈希还可作为边信息用于非盲水印的提取和作为依赖图像内容的密
钥。
1感知哈希的设计准则
在设计图像哈希算法时有两个重要的设计标准:稳健性和安全性。稳健性意味在使用相同的密钥的情况下,感知相近的图像应该产生相似或相同的哈希,这里哈希相似性一般用诸如欧几里德和汉明距离来测度。在实际的应用中作者会经常遇到这样的感知相近图像,如图像被多次A/D 和D/A 转换,图像被打印后扫描,图像在传
输中被滤波加噪,图像中被加入水印等。安全性指在没有密钥的情况下,哈希值不容易被伪造或估计,它还必须满足下列两个性质:单向性,即假设已知哈希h 和哈希函数)(H ,很难由
)(I H h =得到原始图像I ;抗共谋性,即假设已知图像I 和哈希函数)(H ,很难生成第二副图
像I 满足)()(I H I H =
。密码学认证算法基本满
足这两个性质,但对于感知图像哈希算法而言,以上稳健性和安全性的要求实际上是相互矛盾和冲突的,如为了稳健性可能要选取图像处理后的不易改变的特征或关系,而对手可利用这些特征进行共谋攻击,所以图像哈希技术实际是在两者之间依据应用的要求寻一个最佳的折中。
综上给出感知哈希的3个期望的性质,设I 为原始图像,ident I 为与原始图像感知相近的图像,di ff I 为与原始图像感知相异的图像,),(k I H 表示密钥为k 的哈希函数,q 为哈希序列的长
度,21,θθ是满足1,021<<θθ的任意值[1]:
(1)感知稳健性
ident 1
{(,)(,)}1P H I k H I k θ=≥(1)(2)哈希的敏感性
diff 2
{(,)(,)}1P H I k H I k θ≠≥(2)
(3)哈希的不可预测性
1{(,)},
{0,1}2
q
q P H I k v v =≈∈(3)
第一条性质对应稳健性的设计要求,而第二、三条性质对应安全性的设计要求。如何设计
满足这三条性质的图像哈希算法是一个开放的问题,有待分析和解决。
2感知哈希发展简述
基于图像内容的感知哈希发展的历程并不
长,从1996年Schneider 在ICIP 发表第一篇文章算起有10年的时间,通过归纳可将图像哈希分为两个主要步骤,如图1所示。
图1图像哈希的主要过程
第2期孙锐等:基于图像正则化的抗几何变换的感知哈希算法117
中间哈希
原始图像
特征提取
压缩最终哈希
第一步特征提取将2D的图像映射成1D的特征矢量(中间哈希),稳健的特征提取必须捕获图像感知内容,使感知相近的图像产生相近的中间哈希。第二步压缩主要功能有两个:一是将中间哈希变为更为紧凑的形式,便于存储或传输;二是通过量化、压缩、信道解码、聚类[3]、分布式源编码[4]等方式进一步减少对内容保持操作的敏感性,增强安全性。各种感知哈希算法的主要不同在于特征提取过程,它们主要分为基于图像统计的方法、基于关系的方法、基于变换域表示的方法、基于图像特征的方法。
1996年Schneider提出了第一个由灰度直方图构成哈希的图像认证方法[5],作者首先将图像分块,然后计算每一块的灰度直方图,并用密钥加密后作为最终哈希。V enkatesan在2000年ICIP 提出了一种基于小波分解后子带的图像统计的哈希算法[6],他发现图像小波分解后形成的子带的均值和方差在经历一些感知保持操作后具有稳健性,算法首先将小波分解后的图像进行随机划分,然后提取每一区域的统计量,然后量化并输入Reed-Muller纠错码的译码器中产生最终哈希,算法具有一定的稳健性,但对于恶意的篡改不太敏感。Fridrich提出了一种DCT域的稳健哈希算法[7],算法利用DCT域中低频系数与图像感知紧密相连的关系,将DCT块映射到一个依赖于密钥的随机模板中,最终的结果与预设门限做比较产生哈希,算法可有效抵抗JPEG、低通滤波等操作,但无抗几何变换的能力。Kozat提出了一种基于图像SVD分解的哈希算法[8],将随机组成特征图像SVD后最强的特征矢量构成哈希,这种算法对几何变换具有一定的稳健性,但是有较高的误分类概率。
提取表征图像内容的特征量作为哈希是感知哈希构成的重要而有效的方法,Monga等提出了一种特征点的感知哈希方法[9],他用Morlet小波捕获图像的特征点(线性结构的拐点),这些特征点表征了重要的视觉感知成分,同时在感知保持操作下保持一定的稳定性,Monga在压缩阶段也做了创新,他分别提出了用概率量化、聚类方法形成的最终哈希,实验结果表明方法对各种非恶意操作(包括几何变化)具有一定的稳健性,算法的缺点是耗时较长,同时对纹理简单的图像性能欠佳。
一种好的感知哈希算法应该对图像的感知保持操作具有稳健性,其中研究的难点在于对不改变图像感知内容的几何变换(如旋转、缩放、平移,简称RST)有较好的稳健性,现有的方法一般利用RST不变域的特征构成哈希,这样的一些变换域包括Radon变换[10]、Fourier-Mellin变换[11]等,总体来说这类算法在理论上具有可行性,在实际应用的稳健性方面还有待进一步测试。为了实现抗几何变换的稳健特征提取,作者的思路是到一种方法在图像生成哈希之前将几何变换对图像的影响去除,这种方法就是图像正则化。
3图像正则化
图像正则化技术[12]广泛应用于计算机视觉和模式识别中,正则化的图像可以通过一个几何变换过程得到[13],这个过程对任意的仿射变换(Affine Transforms)具有不变性,为了进一步描述这个过程,首先引入文中使用的若干概念:设)
,
(y
x
f为N
M×大小的数字图像,它的矩和中心矩定义为pq
m和
pq
,+
∈Z
q
p,
∑∑
==
=
1
1
)
,
(
M
x
N
y
q
p
pq
y
x
f
y
x
m(4)
∑∑
==
=
1
1
)
,
(
)
(
)
(
M
x
N
y
q
p
pq
y
x
f
y
y
x
x(5)
这里1001
0000
,
m m
x y
m m
==(6)
如果存在矩阵1112
2122
a a
a a
=
A和矢量
1
2
d
d
=
d使)
,
(
)
,
(
a
a
y
x
f
y
x
g=,则图像)
,
(y
x
g是)
,
(y
x
f的仿射变换,这里
a
a
x x
y y
=A d(7)前述的RST变换都是仿射变换的特殊形式,仿射变换的其他形式包括:①在x方向的剪切变换
1
01
x
β
=
A;②在y方向的剪切变换
118工程图学学报2010年
10
1y γ=
A ;③在x 和y 方向的尺度变换00
s αδ
=
A 。在110,det()0a ≠≠A 的情况下,任一仿射变换A 都可分解为上述3种变换的乘积s y x =A A A A 。图像正则化过程完成在仿射几何偏移下的不变性,具体的过程如下:
(1)中心化原始图像按照式(4)变换
原始图像,式中1001=
A ,1
2
d d =d 1001120000
,m m d d m m =
=(8)
),(1y x f 为中心化后的图像。
(2)x 方向的剪切变换
按照式(4)变换
),(1y x f ,式中101
x β
=
A ,),(2y x f 为处理
后的图像,参数满足
0)2(30
=,上标表示针对图
像),(2y x f 。
(3)y 方向的剪切变换
按照式(4)变换
),(2y x f ,式中10
1y γ=
A ,),(3y x f 为处理
后的图像,参数满足0)
3(11=。
(4)在x 和y 方向的尺度变换
按照式(4)
变换),(3y x f ,式中00s αδ
=A ,),(4y x f 为
最终的正则化图像,参数满足预设的标准尺寸和
(4)450
05
0,
0>>。
以上四步去除了几何偏移成分,更具体地说第一步消除了仿射攻击中的平移,第二、三步消
除了仿射攻击中的x 和y 方向的剪切,第四步消除了仿射攻击中的缩放,使图像规整到一个标准尺寸。一幅图像与它的仿射变换有相同的正则化图像,参见图2。
下面进一步确定变换的主要参数:(1)剪切变换的参数β参数β满足以下等式
)1(03
3
)
1(12
2
)1(21)
1(20)2(30
33β
ββ+++=
(9)
0)2(30
=时,解式(6)可得β值。参数β保
证了正则化图像的唯一性。
(2)剪切变换的参数γ参数γ满足以下等式
)
2(11
)
2(20)
3(11
γ+
=(10)
0)3(11
=时,解式(7)可得γ值。(3)尺度变换的参数δα,通过预设的标
准尺寸可以确定尺度变换的参数的幅值,它们的符号由
(4)
(4)50
05
0,
0>>
确定。
(a)
原始图像Lena
(b)
旋转45°
的图像
(c)正则化图像
图2图像正则化的结果
4感知哈希算法
以上描述的图像正则化过程产生了一个对任意仿射变换具有不变性的正则化图像,本节对这个图像进一
步处理获得最终哈希。
(1)设正则化图像为nor I ,从中伪随机的
选择
p 个子图像m m
i A ×∈R
,1i p ≤≤。(2)对每个子图像i A 进行L 层离散小波分解,取其低频子带)(DC i A ,并将其转换成一维
矢量{}12,,,i r l l l ="η。
(3)将
p 个矢量i η顺序组合成r p ×
大小的矩阵T ,又称副图像。
(4)对矩阵T 做奇异值分解
T =T USV (11)
这里U 和V 是正交的p p ×和r r ×的左右奇异
第2期孙锐等:基于图像正则化的抗几何变换的感知哈希算法119
值矩阵,S 是非负元素组成的r p ×的对角阵。(5)取前t 个左右奇异值矢量构成最终哈希1212{,,,,,,,}t t h u u u v v v =""。
哈希的整个生成过程可参见图3,算法通过正则化(Normalization ),小波变换(Wavelet ),奇异值分解(SVD )3个阶段产生最终哈希,所
以可以简称为NWS 算法。小波变换获得原始图像的粗略版本,其保留了图像的主要特征,SVD
增强了算法对感知保持操作的稳健性,并进一步降低了哈希的长度。整个算法通过随机选取可重叠的子图像获得安全性,同时可通过在步骤三引入置乱运算进一步增强安全性。
图3最终哈希的生成过程
5实验结果
作者在实验中采用欧氏距离来测度两个图
像哈希之间的差异,这里用ide I 表示与原始图像
I 感知相似的图像,用dif I 表示与原始图像I 感
知不同的图像,他们之间应满足
ide ((),())H D h I h I ε<(12)dif ((),())H D h I h I δ
>(13)
式中
δε,为预设门限。
实验采用256256×的Lena 、bridge 、peppers
作为测试图像,见图4所示。实验参数为36=p ,
64=m ,3=L ,64=r ,2=t ,02.0=ε,03.0=δ,最终形成的哈希长度200=h 。图
5(a)~(d)为4个感知相似的图像,它们分别通过JPEG 压缩(QF=20),旋转15°,随机仿射变换,中值滤波(33×)处理。表1展示了三副测试图像在各种感知保持操作后的欧氏距离(所有操作用Stirmark 测试软件[14]得到),其中许多属于仿射变换处理,可以看出算法对几何变换具有很好的稳健性,对其他感知保持操作也有很好的效果。表中最右一列为Kozat 方法[8]对Lena 测试的结果,对比发现NWS 算法在几何攻击后有明显改善。算法对内容篡改具有敏感性,图6为原始的boats 图和内容篡改后的图像(桅杆等处被改),实验得到的欧氏距离为0.035,大于预设门限0.03
(a)bridge (b)
peppers
图4
原始图像
(a)
JPEG 压缩(QF=20)
(b)
左旋15
°
(c)随机仿射变换
(d)中值滤波
图54种攻击后的图像
密钥
原始图像
图像正则化
随机子图像
小波变换
副图像
奇异值分解
最终哈希
120工程图学学报2010年

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。