一种改进的Zernike正交矩亚像素边缘检测算法--688IT编程网

第29卷第4期2003年7月　

光学技术OPTICAL TECHN IQU E Vol.29No.4

J uly 2003

文章编号:100221582(2003)0420500204一种改进的Zernike 正交矩亚像素边缘检测算法

李金泉1，王建伟1，陈善本2，吴林1

(1.哈尔滨工业大学现代焊接与生产技术国家重点实验室，黑龙江哈尔滨　150001)

(2.上海交通大学焊接工程研究所，上海　200030)

摘　要：在分析Ghosal 提出的基于Zernike 正交矩亚像素边缘检测算法的基础上，对Ghosal 算法进行了改进。指出了Ghosal 算法的两点不足，即没有考虑模板效应和没有考虑边缘梯度方向上的一阶导数模型。针对这种不足提出了改进方法。改进后的算法在计算边缘亚像素坐标时更准确，同时还具有细化边缘的能力，使边缘定位更精确。

关键

词：边缘检测；模板效应；亚像素;Zernike 正交矩

中图分类号:TP391 　文献标识码:A

Improved algorithm of subpixel edge detection using

Zernike orthogonal moments

LI Jin 2quan 1,WANG Jian 2wei 1,CHE N Shan 2ben 2,WU Lin 1

(1.National K ey Laboratory of Advanced Welding and Production Technology ,

Harbin Institute of Technology ,Harbin 150001,China )

(2.Welding Engineering Institute ,ShangHai Jiaotong University ,ShangHai 200030,China )

Abstract :Ghosal algorithm is improved ,which is based on analyzing an algorithm of subpixel edge detection presented by Ghosal.It is pointed that Ghosal algorithm has two the shortcomings :not to consider the model effect and the first derivative model of the edge along the gradient direction of the e

dge.The improved method is presented aiming at the shortcomings.The subpixel coordinates of the edge calculated by the improved algorithm are more precise ,and the improved algorithm has the abil 2ity of the thinning edge and the accurately locating edge.

K ey w ords :edge detection ;model effect ;sub pixel ;Zernike orthogonal moment

1　引　言

边缘检测技术在计算机视觉中占有重要地位。

虽然边缘检测技术的发展已经有了很长一段时间，但至今仍处于不断发展和完善中。在现有的边缘检测算法中,Canny 提出了一种最佳边缘检测算子[1]，并在实践中取得了良好的效果。为了提高检测精度，人们对亚像素边缘检测进行了研究,Ghosal 和Mehrotal 首次提出了利用Zernide 正交矩(Zernike orthogonal moment ———ZOM )来检测亚像素边缘[2]

。在他们的算法中对边缘建立了理想的阶跃灰度模型，通过计算图像的三个不同阶次的ZOM ，首先把理想阶跃灰度模型的4个参数映射到三个ZOM 中，然后再通过这三个ZOM 计算出边缘所在直线的参数，从而确定边缘的亚像素极坐标。本文

在分析Ghosal 算法的基础上，指出了该算法的两点不足，即没有考虑模板效应和没有考虑边缘梯度方向

上的一阶导数模型。针对这种不足提出了改进方法。实验结果表明，改进后的算法在计算边缘的亚像素坐标时会更精确，并且具有细化边缘的能力。

2　G hosal 算法的回顾

2.1　ZOM 的定义

图像f (x ,y )的n 阶m 次ZOM 定义为

Z nm =

n +1

x 2+y 2

≤1

f (x ,y )3V nm (ρ,θ)ρd ρd θ

(1)

式中,3号表示卷积;V nm (ρ,θ

)=R nm (ρ)e jm θ是积分核函数;V nm 表示与V nm 共轭。R nm (ρ

)是多项式:

05Ξ收稿日期:2002212203

基金项目：国家自然科学基金资助项目(59635160,59575057)

作者简介：李金泉(19712)，男，辽宁省鞍山市人，哈尔滨工业大学现代焊接与生产技术国家重点实验室博士研究生，主要从事图像处理

和机器人视觉方面的研究。

R nm (ρ

)=∑

n-|m|

i =0

(-1)i (n -i )!ρn-2i

i !n +|m |2-i !n -|m |2

-i !

(2)

式中,n ≥0,n -|m |为非负偶数。容易证明V nm 是正交的。

如果图像逆时针方向旋转φ角，并设旋转前后图像的ZOM 分别为Z nm 和Z ′nm ，则由定义可以证明两者之间的关系是

Z nm =Z ′nm e jm

φ(3)从式(3)可以看出，图像旋转前后ZOM 的模不变,

只是相角改变，这个性质被称为旋转不变性。　2.2　ZOM 亚像素边缘检测原理

图1　

理想阶跃模型

根据ZOM 的定义，求图像的ZOM 就是用核函数对图像加权，并在单位圆上积分。在Ghosal 的算法中是假设单位圆的圆心在某个像素点上，并且单位圆正好压在某个边缘上，是对边缘建立了理想阶跃灰度模

型的，如图1所示。图中L 是边缘上的直线，其方程为:l =x cos θ+y sin θ，其中(x ,y )是原图像中的某个像素点，也是单位圆圆心，背景的灰度和阴影部分的灰度分别为t 和r +t ，其中r 为阶跃幅度。

Ghosal 在推导亚像素边缘检测的公式时利用了

旋转不变性。将图像顺时针旋转θ角，这时图1中的边缘直线L 垂直于x 轴。设旋转后的图像为

f ′

(x ,y )，则有κ

x 2

+y 2

≤1

f ′(x ,y )y d x d y =0(4)

推导亚像素边缘检测公式只用了三个不同阶次的ZOM ，分别为Z 00,Z 11,Z 20，它们对应的积分核函数

分别为V 00=1,V 11=x +jy ,V 20=2x 2+2y 2+

1。如果用Z ′00,Z ′11,Z ′

20表示图像旋转后的ZOM ，那

么根据旋转不变性，旋转前后ZOM 之间的关系为

Z ′

=Z 00,

Z ′11

=Z 11e j

θ,

Z ′

=Z 20(5)

因为公式(4)是Z ′11的虚部，因此有

Im [Z ′11]=sin θRe [Z 11]-cos θIm [Z 11]=0式中,Re [Z 11],Im [Z 11]分别为Z 11的实部和虚部。因此可以求出θ角，即

θ=tan -1

Im [Z 11]Re [Z 11]

(6)

然后进一步可以推导出

　Z ′00=t π+k π

-r sin -1(l )-rl 1-l 2(7) Z ′

11=

2r (1-l 2)3/23

(8) Z ′

20=

2rl (1-l 2)3/23

(9)具体的推导过程见文献[2]。解方程组(7)、

(8)、(9)，并根据(5)式可得

l =Z 20Z ′11

(10)r =

3Z ′112(1-l 2)3/2

(11)

t =

Z 00-r π2

+r sin -1

(l )+rl

1-l 2

(12)

因此亚像素边缘检测公式为

x s y s

x y

cos θsin θ

(13)

式中,(x s ,y s )是边缘的亚像素坐标。这样利用3

个ZOM 就可以求解理想阶跃模型的4个参数。3个ZOM 是通过3个相应模板在图像上进行卷积计算出来

的。模板系数的计算方法可参见文献[2]。其中Z 11的模板系数分为实部和虚部两部分，这是因为其核函数为虚数的缘故。Z 11的模|Z 11|(|Z 11

Re 2(Z 11)+Im 2(Z 11))表示边缘强度；边缘的

方向也可用Z 11的实部和虚部求出，这与公式(6)是

一致的。Ghosal 在该算法中取了两个阈值：阶跃强

度阈值τ和距离阈值δ。当且仅当|Z 11|≥

τ,l ≤δ=12时，被检测的像素点才是边缘点。

3　G hosal 算法的不足之处和改进方法

在分析Ghosal 算法的过程中，发现了Ghosal 算法存在两点不足之处，并进行了相应的改进。

　3.1　模板效应

在Ghosal 算法中，由于没有考虑模板效应，这就使得边缘的亚像素坐标计算公式(13)不正确。所谓模板效应是指由于选择模板大小的不同而使边缘图2　模板效应

亚像素坐标的计算产生偏差。假设模板为N ×N ，由于上述亚像素边缘公式的推导和模板系数的计算都是在单位圆内

进行的，但在实际应用中模板是在图像上移动，并

与像素进行卷积，这时模

板覆盖的是模板中心周围N 2个像素(见图2)，单位

05第4期

李金泉，等:　一种改进的Zernike 正交矩亚像素边缘检测算法

圆的半径变为N /2，因此需要把在单位圆上计算出来的距离l 放大N /2倍，转变为N ×N 模板所需的形式。因此边缘的亚像素坐标公式应为

x s y s

x y

cos θsin θ(14)

同时距离阈值应修改为

N 2l ≤δ，即l ≤2

δ(15)

　3.2　边缘一阶导数模型

在Ghosal 算法中是将理想阶跃模型作为边缘模型来推导边缘亚像素坐标公式的，但是理想的阶跃模型是不存在的，实际的模型存在中间过渡区。在实际应用中如果只考虑理想阶跃模型，则检测出的边缘较粗，这对边缘定位是不利的。笔者进一步图3　一阶导数模型

(a )沿某一梯度方向上的理想阶跃模型;

(b )沿某一梯度方向上的实际模型;

(c )沿某一梯度上的一阶导数模型。

建立了沿梯度方向的一阶导数模型，如图3所示。在图3(c )中，沿某一梯度方向灰度的一阶导数近似为正态分布，并且正态分布的中心即正态分布的均值是在沿该梯度方向灰度变化最大的地方，也就是边缘所在之处。因此只要估计出正态分布的均值，就可以准确地

定位亚像素边缘坐标，并细化了边缘。因为|Z 11|表示的是边缘强度，所以利用|Z 11

|来估计正态分布的均值。首先取一个阈值T ，并沿梯度方向，也就是沿图1中θ角方向搜索|Z 11|>T 的点，记下该点的|Z 11|和坐标值(x ,y )，从而构成三元组{|Z 11|,x i ,y i }，其中i =0,1,…,n ,n 为搜索到的像素点的数目。例如图3(c )中的阴影部分可用下述公式估计正态分布的均值，也就是边缘所在之处的坐标:

x =

∑n i =1

Z 11|

x i

∑n

i =1|

Z 11|

y =

∑n

i =1

Z 11|i y i ∑

i =1

|Z 11|

(16)

这种估计方法与通过直方图中的每一个方条中心位

置乘以该方条所包含的像素点数，再除以直方图面积来估计具有正态分布直方图均值的方法是一致的。

4　实　验

通过几组对比实验来验证所改进的算法。第一

个试验是为了验证模板效应。用人工做了一幅128×128的二值图像，在图像第31行至第69行和第图4　人造图像

(128×128)

51列至第89列区域内为1，背景为0，如图4所示。

分别用Ghosal 算法和改进的算法进行亚像素边缘检测。因为这个实验只是为了验证模板效应，所以在

实验中在其它条件完全一

致的情况下，在计算亚像

素坐标时只是分别用了

Ghosal 算法中的公式(13)和改进后的公式(14)。边缘强度阈值τ=55。区域上方边缘的行坐标应在第30行和第31行中间，即亚像素坐标为3015。取第55列至第64列，两种算法的检测结果如表1所示。

从表1中可以看出,Ghosal 算法由于没有考虑模板效应，计算出的亚像素坐标有较大的误差，改进算法后计算出的亚像素坐标比Ghosal 的算法更精确。

表1　两种方法求得的亚像素坐标比较

实际亚像素坐标(Row ,Col )改进算法后所得到的

亚像素坐标(Row ,Col )用Ghosal 方法得到的

亚像素坐标(Row ,Col )

30.5,55.030.528719,55.030.151063,55.030.5,56.030.528719,56.030.151063,56.030.5,57.030.528719,57.030.151063,57.030.5,58.030.528719,58.030.151063,58.030.5,59.030.528719,59.030.151063,59.030.5,60.030.528719,60.030.151063,60.030.5,61.030.528719,61.030.151063,61.030.5,62.030.528719,62.030.151063,62.030.5,63.030.528719,63.030.151063,63.030.5,64.0

30.528719,64.0

30.151063,64.0

第二个试验所用的图像是摄像机标定时用的标定板图像的一部分，并将Ghosal 算法与改进后的算法进行了比较。两种算法所用的边缘强度阈值都为35，在改进的算法中沿梯度方向搜索时所用的阈值

为55，模板大小为7×7，原图像和处理的结果如图5所示。图5(a )为128×128的原图像；图5(b )是Ghosal 算法处理的结果；图5(c )是改进算法后的处

理结果，从中可看出改进后的算法细化了边缘，边缘有起伏是由于亚像素取整造成的；图5(d )和图5(g )

05光　学　技　术第29卷

图5　标定板图像的边缘提取是分别对原图像加随

机噪声和胡盐噪声后得到的图像；图5(e )和图5(h )是Ghosal 算法的处理结果；图5(f )和图5(i )是改进算法后

的处理结果。可见改进后的算法不仅保留了原算法的抗干扰性,

而且也细化了边缘。加噪图像Ghosal 算法

的处理结果是飞边较严重。正则化坐标

第三个实验所用的图像是80×80的灰度图像，如图6所示，并将改进后的算法与Ghosal

算法进行

图6　人像边缘检测了比较。图6(a )和图6(b )分别为原图像和加随机噪声的图像；图6(c )和图6(d )分别是用Ghosal 算法处理图6(a )和图6(b )的结果；图6(e )和图6(f )分别是改进算法后处理图6(a )和图6(b )

的结果。两种算法都采用7×7模板。从处理的结果可看出,Ghosal 算法检测出的边缘较粗，而改进后的算法细

化了边缘。在Ghosal 算法和改进后的算法中使用了相同的边缘强度阈值，阈值为35，在改进的算法中沿梯度方向搜索时所用的阈值为55。

5　结　论

本文在分析Ghosal 提出的亚像素边缘算法的基础上，针对Ghosal 算法的不足提出了两点改进:

(1)考虑了模板效应使边缘的亚像素坐标计算更准确;

(2)考虑了边缘梯度方向一阶导数模型，使得算法具有细化能力。

实验证明改进的亚像素边缘算法是行之有效的，对于图像拼接、摄像机标定等精度要求较高的场合有很高的应用价值，同时也可应用于其它的机器视觉中。参考文献:

[1]Canny J.A computational approach to edge[J ].IEEE Trans PA 2

MI ,1986,(8):679—698.

[2]Ghosal S ,Mehrotra R.Orthogonal Moment Operators for Subpixel

Edge Detection[J ].Pattern Recognition ,1993,26(2):295—306.

(上接第499页)

图4　选取视场的示意图为了对系统的成

像质量进行评价，选择

了如图4所示的视场，这些视场都在y 轴的右侧。由于整个系统是关于y 轴对称的，因此

只要分析右侧的视场就可以了。

用这些视场的成像情况基本可以反映整个视场的成像情况。

从传递函数曲线可知，光学设计在整个视场内

具有良好的平衡校正特性。(010°,517°

)表示视场中心,(215°,517°)、(215°,518°)和(215°,516°)表示视场边沿。系统在可见光波段对于所有感兴趣的频

率来说都能够获得接近衍射受限的特性。对于全视场来说，在50对线/mm 的空间频率下,M T F 大于0165。系统存在着彗差，但仍以像散为主。可见光

波段点像的大小在6

μm 以内，小于可见光成像器件的尺寸。

4　结　论

随着科学技术的不断发展，人们对成像光谱仪

的技术指标要求越来越高，主要表现在空间分辨率和光谱分辨率等方面。理论分析表明，文中所设计的离轴三反射系统能够满足宽视场、高分辨率和从可见光到红外光的宽波长覆盖范围的要求，同时也能满足高空间分辨率和高光谱分辨率成像光谱仪前置物镜的要求。此光学系统在扫描方向的窄视场和在垂直于扫描方向的宽视场适合于推扫成像。参考文献:

[1]潘君骅.光学非球面的设计、加工与检验[M ].北京：科学出版

社,1994.

[2]刘琳，等.提高离轴三反射镜系统成像质量的途径[J ].光学技

术,2002,28(2).

[3]kunijiro Tanikawa ,et al.Six band multispectral sensor using off 2

axis three 2mirror reflective optics [J ].Opt Eng ,2000,39(10):2781—2788.

[4]Dietrich K orsch.A Three 2Mirror Space Telescope[J ].Optical En 2

gineering ,1975,14(6):533—535.

05第4期李金泉，等:　一种改进的Zernike 正交矩亚像素边缘检测算法

688IT编程网

一种改进的Zernike正交矩亚像素边缘检测算法

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

一种改进的Zernike正交矩亚像素边缘检测算法

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式