1 绪论
1.1 图像分割算法的发展
图像分割问题一直是计算机图像处理中的焦点问题,传统的方法大多把注意力放在使用某种准则对图像中的元素进行聚类的非监督分割算法上,而近年来,全监督图像分割方法由于能够提供用户(或处理人员)影响分割效果的能力而越来越受到人们的重视,并因此产生了大量的分割算法,如使用种子点的区域生长方法[1]等,此类方法的共同特点是通过比较未标记点与种子点的相似程度来判断未标记点的所属类别,但都多少存在判断相似程度的标准单一问题而导致分割方法不理想的问题。
最近,基于图论的图像分割方法在Leo Grady 等人的推动下取得了长足的进步
[2-3],基于图论的算法的核心思想是将整幅图像表示为“像素顶点”和表示各顶点之间的关系的“权重边”的集合结构(图),并在该集合中搜索使某个能量公式最小化的路径来对图像进行分割[4]。目前的基于图论的全监督图像分割的基本算法有Graph Cut 方法,Random Walker 方法以及Watershed 方法,Graph Cut 算法将前景/背景的种子点看做最大流最小割算法中的源/陷结点。使用最大流最小割算法,算法输出一个包含图中最小权重的边的集合作为结果,这个边的集合就作为分割结果的边界,Graph Cut 算法的缺点在于对噪声十分敏感。Random Walker 算法将边权重看作一个“微粒”从某个结点转移到其他结点的转移概率,首先给出种子点,然后通过比较每一个“微粒”从初始像素点第一次转移到前景或背景的种子点上的概率的大
小来确定该“微粒”所对应的标记。
对于各向异性扩散问题,Perona 和Malik 提出了Perona-Malik 模型[18],依据这种构造进行的扩散被称为各向异性扩散,各向异性扩散在直觉上是合理的,实验结果也证明了,与各向同性扩散相比,各向异性扩散方法能够在保留图像边界信息的同时去除图像中的高频噪声信息。遗憾的是Perona-Malik 模型是不适定的,因为其中不仅包括了去除噪声的正向扩散,还包括了造成强度不连续的反向扩散
[13-14]。为了解决这个问题,Catte 等人提出了一种使用正则化方法,正则化方法最初是数学上解决不适定问题的一种方法,Olivier Lezoray,Fan Zhang 等人以解决图
像去噪的问题出发[5-7],将各向异性扩散描述为一个解不适定问题:0Af f =的过程,
并将解抽象成一个离散的正则化扩散框架并应用在图像去噪中,使用正则化扩散方法能够得到一个唯一的平滑结果。Fan Zhang 等人在[6]中,从图谱理论的角度出发,提出了一个离散的各向异性扩散框架,其中,Fan  Zhang 利用拉普拉斯矩阵构造了一个热核:tL t H e −=,并用它完成扩散:tL t t u e I H I −==r r r ,这种构造方法的
优点是完全不需要离散化处理,所以没有之前的正则化方法中离散化过程中产生的离散误差。类似的,Arthur D Szlam 等人在[7]中使用核:1(,)()(,)K x y d x W x y −=,其中()(,)y V
d x W x y ∈=∑,对图像进行正则化扩散:t t u K I =r r 。
1.2 核方法的发展
核方法从理论上为训练学习机提供了一种系统而有原则的方法。粗略地说,在任何一种含有点积的算法中,用核函数来代替点积就可以称作是核方法。
早在1909年,Mercer 就从数学上给出了有关正定核函数和再生核Hilbert 空间的结论,并给出了正定核函数即再生核存在和判定的充分必要条件,这就是著名的Mercer 定理,这些条件现在通称为Mercer 核容许条件[8]。核方法包括再生核和再生核Hilbert 空间的应用十分广泛,它是实函数分析的一个分支,不仅在微分方程求解、微分几何、论、调和分析等许多数学学科中有十分巧妙的应用。
20世纪80年代,模式分析领域经历了一场“非线性革命”,几乎同时引入了后向传播多层神经网络和高效的决策树学习算法[9]。尽管这些方法用到了启发式算法和不完全统计分析,他们第一次使得检测非线性模式成为可能,非线性革命怎么强调都不过分:他激活了诸如数据挖掘和生物信息学的整个领域。然而,这些非线性算法,是建立在梯度下降法或贪婪启发式法的基础上,因而受到局部极小化的限制[9]。由于没有很好地理解他们在统计上的行为[10],人们利用这些算法时还常常遇到过度拟合的问题。
模式分析算法最近的一次革命发生在20世纪90年代,当时出现了基于核的学习方法的模式分析方法[11],
该方法最终使研究人员能高效地分析非线性关系,而这种高效率原先只有线性算法才能达到。该方法在统计分析方面进一步发展之后,在高维特征空间内也能够达到很高的效率,并且避免了过度拟合的危险。从各种角度,计算的、统计的和概念的角度来看,在这个阶段发展起来的模式分析算法,和线性算法一样,高效而富有理论依据。神经网络和决策树中典型的局部极小化问题和过度拟合问题,也已得到解决。
基于核的学习方法,首先以支持向量机的形式出现[11],支持向量机是一种用来摆脱上面提到的计算和统计困难的分类方法。然而很快就产生了基于核的算法,能够解决分类以外的问题。人们越来越清楚地认识到,这种方法引起了模式分析领域的一场革命。全部的新工具和新技术,都有严格的理论分析所推动,在计算效率的保证下发展起来。
1.3 本文的主要工作
本文以图作为算法的数据结构,使用正则化扩散方法,提出一种新的图像分割算法,其优势在于:考虑图像整体的几何特征,加入了边权重的概念,可以灵活的描述像素间相似性。因而抗噪声能力更强;与目前的只考虑单一特征的分割方法相比,本方法对特征选择的控制更加灵活,对边缘的分割效果更好;与传统的分类器(如Fisher,感知机等)相比,采用了类似核的方法在高维可分空间衡量特征相似性,不存在维数灾难的问题。
由于正则化扩散方法最初是应用在图像去噪领域的方法[6],从正则化扩散在图像去噪方面入手,分析使用Morlet小波核为基础的权重构造方法比使用高斯核的权重构造方法能够有效地保留图像的边缘信息,而边缘信息对图像分割至关重要。本文提出的图像分割算法与图像扩散去噪方法存在相似性,因此将Morlet小波核应用在本文提出的图像分割框架上,配合正则化扩散框架中权重构造的需要,改进权重构造,使算法在不同于高斯核对应的的高维空间中衡量特征之间的相似性。实验结果表明,使用Morlet小波核为基础的图像分割算法与使用高斯核的算法相比确实保留了更多的边缘信息。
1.4 论文章节安排
本文从提取图像几何特征的方向入手,以离散的正则化扩散框架为基础,提出了一种全监督彩图像分割方法,并在此基础上使用核方法对算法进行改进,使算法更适合对具有复杂边界的图像进行分割。具体章节安排如下:第一章对图像分割算法和核方法的发展进行简单的介绍;
第二章主要完成包括:算法框架的构建基础以及理论分析,对比实验中选择的对比算法介绍,特征的选择原理和构造方法,以及使用核方法改进算法的原理以及使用的核函数的描述和分析;
第三章给出了基于正则化扩散的彩图像分割算法的算法流程,分析这种各向异性扩散方法在图像分割应用上的合理性,通过模拟实验说明使用这种算法框架可以充分利用图像的几何特征,对复杂纹理区域有很好的分割效果,通过实验验证了算法具有很强抗噪声能力,并通过与当前主流的基于图论的全监督
图像分割算法的对比试验说明了本文所提出的算法的应用意义;
第四章从核方法的角度出发,根据Morlet小波核在扩散去噪试验中能够得到更清晰的边界,使用本文第三章提出的算法,将Morlet小波核的保留图像边界能力强的这个优点推广到图像分割领域,通过实验验证了改进的算法对目标的复杂边界区域具有更好的保留效果;
第五章对本文的工作进行了总结,提出了下一步的研究方向。
哪种正则化方式具有稀疏性1.5 本章小结
本章首先对目前的基于图论的图像分割方法进行了介绍,对图像扩散算法的进行了简单的回顾;对核方法的产生和意义进行了简单的说明。然后叙述了本文的主要工作和文章组织结构。
重庆大学硕士学位论文    2 图上正则化及核方法理论基础
2 图上正则化及核方法理论基础
2.1 图上的扩散算法与图像分割算法的共同特征
2.1.1 基于图论的全监督图像分割算法
Sinop 根据算法要求的“标记”将全监督图像分割算法分为三类 [12]:给出希望分割出的边界的片段,由分割算法补充出完整边界;给出一条接近希望分割出的边界的边界;给出希望分割出的前景和背景上的种子点,本文只考虑第三种“种子标记”的图像分割算法,对于这类方法,需要对小部分希望分割出的目标像素或背景像素进行标记并作为算法的输入,经过算法处理后,算法输出对图像中所有像素进行标记的结果。
目前的基于图论的全监督图像分割的基本算法有Graph Cut 方法,Random Walker 方法以及Watershed 方法,Graph Cut 算法将前景/背景的种子点看做最大流最小割算法中的源/陷结点。使用最大流最小割算法,算法输出一个包含图中最小权重的边的集合作为结果,这个边的集合就作为分割结果的边界,Graph Cut 算法的缺点在于对噪声十分敏感。Random Walker 算法将边权重看作一个“微粒”从某个结点转移到其他结点的转移概率,首先给出种子点,然后通过比较每一个“微粒”从初始像素点第一次转移到前景或背景的种子点上的概率的大小来确定该“微粒”所对应的标记。
Leo Grady 在[12]中将这类算法的本质进行了说明,设F 为标记为前景点的像素集合,B 为标记为背景点的像素集合,Graph Cut 方法和Random Walker 方法可以统一到使能量函数:
1[(||)]q q
ij i j eij E w x x ∈−∑,s.t.  10F B x x ==
(2.1) 最小化的框架之中,即在保证前景/背景正确标记的基础上,寻使能量函数最小化的权重(边)的集合,作为图像分割的结果。对于Graph Cut 方法,1q =;对于Random Walker 方法2q =。使用不同的函数优化方法求以上能量函数的最小值就形成了Graph Cut 方法和Random Walker 方法。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。