2021年4月第36卷第4期
内江师范学院学报
J o u r n a l o fN e i j i a n g N o r m a lU n i v e r s i t y
A p
r .2021V o l .36N o .4
基于D e n s eU -N e t 的眼底视网膜血管分割
付顺兵, 王朝斌*, 陈 旭, 刘文秀, 张晓倩
*
(西华师范大学计算机学院, 四川 南充 637009
) 摘 要:
针对眼底视网膜血管图像特征信息复杂,现有的血管分割算法对细小血管特征难以采集和血管误分割等
问题,提出一种融合U -N e t 网络和密集网络的分割方法.首先,提取眼底图像的绿通道,通过限制对比度自适应直方图均衡化对图像进行血管增强处理,其次,利用局部自适应G a mm a 校正来调整眼底图像的亮度信息,同时在卷积层之间引入一种动态激活函数,提高网络的特征表达能力,最后输入到改进网络模型中进行分割.该算法在D R I V E (d i g i t a l r e t i n a l i m a g e s f o r v e s s e l e x t r a c t i o n )和S T A R E (s t r u c t u r e da n a l y s i s o f t h e r e t i n a )两个公开数据集上的准确率分别为96.28%和96.85%,特异性分别为98.46%和98.55%,灵敏度分别为80.47%和81.38%.
实验表明所提方法能够准确识别并分割出眼底细微血管,提高了视网膜血管分割的准确率.
关键词:图像处理;眼底图像;血管分割;U -N e t
;密集网络D O I :10.13603/j .c n k i .51-1621/z .2021.04.008中图分类号:T P 391
文献标志码:A
文章编号:1671-1785(2021)04-0040-07
0 引言
眼底视网膜血管形态结构(如直径㊁分支㊁角度等)是衡量人体健康的重要指标,能够反映出人体的
各种疾病,如糖尿病视网膜病变(d i a b e t i c r e t i n o p a -t h y ,D R )㊁青光眼㊁高血压等[1
].因此,进行眼底图像分析,对辅助医生诊断和人体各种系统疾病,具
有重要的临床意义.目前,眼底视网膜图像的血管主要还是通过人工分割获得,然而对眼底图像中的血管进行手动标记费时费力,并且易受主观因素的影响,难以获得高准确的分割结果,视网膜血管辅助诊断疾病未得到广泛的应用,所以迫切需要一种能准确分割视网膜血管的方法来为眼科医生提供有价值的辅助诊断.
近年来,国内外的专家学者针对眼底视网膜血
管提出了很多的分割算法.其分割算法可分为两大类:无监督方法和有监督方法.无监督方法不需要先
验标记信息,而是使用传统的分割方法来提取眼底
血管,如基于模型[2]㊁形态学处理[3]㊁匹配滤波[4]
等
方法.该类方法虽然在分割速度上有优势,但提取到的血管信息粗糙,分割的准确率较低.而有监督的方
法是通过提取图像的各种特征来训练一个能准确区分血管和背景像素的分类器,最终实现血管的分割.该类分割方法需要人工提取的标签用于训练.常用的有监督方法包括基于机器学习的方法和基于深度
学习的方法,基于机器学习的方法首先通过人工提取图像的特征再结合支持向量机㊁贝叶斯分类器等
进行分割.如R i c c i 等[5]
先对眼底图像进行预处理,
提取了图像的绿通道,然后再利用S VM 对血管和非血管进行分割.与无监督的方法相比,基于机器学习的方法在准确率上有所提高,但由于需要人工提取特征,很大程度上增加了因人为因素导致分割结
果错误的概率.为此,人们将基于深度学习的方法引入医学图像分割领域,如W a n g 等[6]
使用卷积神经网络提取眼底图像的特征,并结合随机森林(r a n -
d o mf o r
e s t ,R F )实现了血管的分割.F u 等[7]
先将眼底图像输入到卷积神经网络中生成其概率图,再使
收稿日期:2021-01-20
基金项目:西华师范大学英才科研基金项目(17Y C 498
) 作者简介:付顺兵(1995 )
,男,四川凉山人,硕士研究生,研究方向:医学图像处理*通信作者:王朝斌(1970 )
,男,重庆人,教授,博士,研究方向:网络安全与算法
第4期付顺兵,等:基于D e n s eU-N e t的眼底视网膜血管分割
用全连接条件随机场来获得血管的分割结果.L u 等[8]提出一种包含收缩路径和扩展路径的神经网络架构来对眼底视网膜血管进行分割,捕获了更多的上下文语义信息,分割的准确率得到一定的提升.但目前所提的血管分割算法仍存在细小血管特征难以采集和误分割等问题,因此本文提出一种融合U-N e t网络和密集网络的D e n s eU-N e t模型,并用于视网膜血管分割.
1相关算法原理
1.1 U-N e t模型
U-N e t网络由R o n n e b e r g e r等[9]在2015年提出,是一种基于全卷积神经网络(f u l l y c o n v o l u t i o n a l n e t w o r k s,F C N)[10]改进的全卷积网络,其结构类似于U型,因此得名U-N e t.整个的U-N e t网络主要由两部分构成:收缩路径和扩展路径.其中收缩路径用于获取输入图像的上下文信息,扩展路径用于对输入图像中需要分割的区域进行精确定位.在对医学图像进行分割时,由于器官结构固定和本身的语义信息不是特别丰富,要想达到好的分割效果,图像的深层特征和浅层特征都很重要,U-N e t网络通过使用跳跃连接(s k i p c o n n e c t i o n)融合深层和浅层的特征,能提取到更多的语义信息,所以U-N e t网络常用于医学图像分割任务中.
1.2密集网络
密集网络由H u a n g等[11]在受到以下两点启发后提出.在对残差网络进行改进时,发现训练过程中每一步都随机的D r o p o u t一些层,可以提高网络模型的泛化能力.这就说明神经网络中的某一层不仅仅依赖于前一层的特征,还可以依赖更前面层的特征.其次,在网络训练过程中随机舍弃很多中间层也不会对算法的收敛性造成影响,说明了残差网络具有冗余性.密集网络的主要改进在于任何两层之间都有连接,每一层都会接收来自前面所有层的输出,实现了特征的重复利用.如图1所示,假设某层网络的输入为x,H代表一个非线性的操作,H其公式定义如下:
X l=H l([x0,x1, ,x l-1]).
图1密集连接模块
2视网膜血管分割网络结构
2.1网络结构
针对眼底视网膜图像特征的复杂性及U-N e t 网络对细微血管特征难以采集等问题,本文提出了一种融合U-N e t网络和密集连接模块的D e n s e U-N e t网络架构,整体网络结构如图2所示.传统U-N e t网络使用4次下采样操作和4次上采样操作来提取图像的特征信息,由于眼底图像是小数据集,为了防止在训练过程中因网络层数过多而可能出现的过拟合[12]等问题,因此本文使用3次下采样和3次上采样的网络架构.整体网络架构由收缩路径和扩展路径组成,包含密集模块(d e n s eb l o c k)㊁拼接块(c o n c a t e n a t eb l o c k)㊁下采样㊁上采样等操作.蓝的条形框为密集模块,图中条形框旁的数字代表图像的尺寸大小,黄条形框为拼接块,是对扩展路径中经过上采样操作后的图像与对应收缩路径网络层的特征图进行融合,同时在每个卷积层之间使用一种动态的激活函数,将在后面进行详细介绍
.图2D e n s eU-N e t网络结构
㊃14㊃
内江师范学院学报第36卷2.2 D y n a m i cR e L U激活函数
在卷积神经网络中,激活函数的主要作用是引
入非线性的因素,使网络能够完成非线性映射.常见
的激活函数有:S i g m o i d㊁T a n h㊁R e L U等,然而传统
的激活函数是静态的,即对所有的输入样本都执行
同样的操作.为了改善神经网络中传统激活函数存
在的问题,本文通过引入了一种动态修正单元(d y-
n a m i c r e c t i f i e d l i n e a r u n i t,D y n a m i cR e L U)[13]来提
高本文网络模型的非线性表达能力.
图3动态修正单元流程
如图3所示,对输入向量x进入激活函数之前,
将其分为两个流分别输入θ(x)和fθ(x)(x),θ(x)
用于获得激活函数的参数,即对输入向量x各维度
的上下文信息进行编码,使其参数自适应激活函数,
fθ(x)(x)用于获得激活函数的输出值.D y n a m i cR e-
L U的计算公式如下: y c=fθ(x)x()c=m a x
1ɤkɤK a k c(x)x c+b k
{}
c,
其中,c(1ɤcɤC)为通道数,k(1ɤkɤK)为函数的数目,x c表示第c个通道的输入向量,a k c㊁b k c 是一组由辅助函数θ(x)计算得到的参数,表示如下:
θ(x)=[a11, ,a1C, ,a K1, ,a K C,
b11, ,b1C, ,b K1, ,b K C]T.
辅助函数θ(x)的计算采用的是S E网络(s q u e e z e-a n d-e x c i t a t i o nn e t w o r k s,S E-N e t)中的S E 模块.其主要思想是通过注意力来自动获取每个特征通道的重要程度,然后按照这个重要程度去提
升对特定任务有用的特征信息,抑制用处不大的特征信息,最后将权重加权到每个特征通道上[14].
对于输入向量x,先通过一个全局池化层(g l o b a l a v e r a g e p o o l i n g)压缩空间信息,得到一维向量,然后经过两个全连接层(f u l l y c o n n e c t e d l a y-e r),同时在两个全连接层之间使用一个R e L U函数,增加了更多的非线性操作,可以更好的拟合通道间复杂的相关性,最后通过S i g m o i d函数标准化输出的范围.当完成S E模块中的计算后,最后的输出为:a k c(x)=αk+λaΔa k c(x),b k c(x)=βk+λbΔb k c(x),其中,αk㊁βk分别为a k c㊁b k c的初始值,λa和λb是用于控制范围的标量,也就是在对每个特征通道上所加的权值.
3实验及结果分析
3.1眼底图像数据集
实验使用的数据集来自公开数据库D R I V E[15]和S T A R E[16],目前相关的研究大多采用这两个数据库来验证自己算法的性能.其中D R I V E数据集包含40张彩眼底血管图像,尺寸大小为565ˑ584,如图4(a)所示为一张原始眼底血管图像.每张图像对应2位专家的手动分割结果及眼底掩模,分别如图4(b)㊁图4(c)㊁图4(d)所示.本文使用D R I V E数据库划分好的20张训练图像和20张测试图像进行实验,训练数据包括彩眼底图像㊁来自第一位专家手动分割的结果图和掩模图像,测试时使用来自第一位专家的手动分割结果对模型进行评估,将模型的输出结果与第二位专家的手动分割结果进行比较.
图4数据库部分图像
S T A R E数据集是由M i c h a e l G o l d b a u m在1975年发起的一个项目.其中包含了20张视网膜图像,每张图像对应2个专家的手动分割结果,尺寸大小为700ˑ605,但没有相对应的掩膜,需要手动设置掩膜图像.由于该数据集官方并未划分为训练图像和测试图像,因此本文将前10幅作为训练图像,另外10幅作为测试图像.
由于D R I V E数据集与S T A R E数据集中的图
㊃24㊃
第4期付顺兵,等:基于D e n s eU-N e t的眼底视网膜血管分割
像较少,本文对训练图像进行数据增强处理,将经过预处理后的图像先进行90ʎ㊁180ʎ㊁270ʎ的旋转操作,然后再进行水平㊁垂直和镜像翻转操作,数据集在原来的基础上增加了7倍,D R I V E训练数据图像变为140张,S T A R E训练数据图像变为70张.同时从每张图像中随机提取2000个大小为48p i x e lˑ48 p i x e l的局部样本块用于模型的训练,图5展示了实验中数据的部分局部样本块,其中图5(a)为训练集局部样本块,图5(b)为对应的金标准局部样本块,可以看到图像被裁剪为很多的小块,D R I V E和S T A R E数据集分别提取了280000和140000个局部样本块.
局部直方图均衡化图5局部样本块示例
3.2数据预处理
由于眼底图像存在光照不均㊁血管与背景对比度低等问题,为了易于网络的训练,提高分割的准确率,先对这两个数据集进行预处理.处理步骤如下:
(1)灰度变换
两个数据库的眼底图像都为R G B图像,先对图像进行通道提取,如图6所示.通过实验可以看出,提取绿通道后的眼底图像中血管与背景对比度高,能够较好的显示出血管结构,所以本文使用绿通道的图像进行后续的分割实验.
(2)数据标准化
对绿通道后的图像进行零均值化和单位标准化处理,使其符合正态分布.公式如下:
xᶄ=x-μ
σ
,
其中,x为原始样本数据,μ为原始样本数据的均值,σ为原始样本数据的标准差,xᶄ为标准化后的图像数据.
(3)限制对比度自适应直方图均衡化
对图像进行分块处理,一般划分为8行8
列的
图6眼底彩图及其不同通道图像
64个小块,然后对每一个小块进行直方图均衡化操作,增加图像的对比度.
(4)数据归一化
对图像进行归一化处理,处理后图像的像素值取值范围在[0,1]之间.归一化公式定义如下:
x n o r m=x i-m i n(x)
m a x(x)-m i n(x),
其中,x i为输入图像的像素点值,m i n(x)和m a x(x)分别为图像样本数据中最小像素值和最大像素值,x n o r m为经过归一化处理后的像素值.
(5)局部自适应G a mm a校正
G a mm a校正是一种非线性操作,通过对视网膜图像的背景和血管进行G a mm a校正,用于增强图像中血管较暗部分的亮度信息,并且能够有效保留图像亮度较强部分的质量.
3.3参数设置
本文使用t e n s o r f l o w框架下的k e r a s深度学习库进行实验,输入图像包括原始眼底图像㊁金标准图像及掩模,把输入图像的90%作为训练集,10%作为验证集.训练时,使用A d m a优化器对模型进行优化,初始学习率为0.001,每次训练20个局部样本块,模型的迭代次数为100.
3.4性能评价指标
为了对本文所提算法的分割性能进行评估,采用准确率(a c c u r a c y)㊁特异性(s p e c i f i c i t y)㊁灵敏度(s e n s i t i v i t y)和F1值(f1-s c o r e)作为评价标准.准确率A c c表示被正确分割的血管像素点和背景像素点占整个图像总的像素点的比例;特异性表示被
㊃34㊃
内江师范学院学报第36卷正确分割的背景像素点占金标准背景总的像素点的
比例;灵敏度S n表示被正确分割的血管像素点占金
标准血管总的像素点的比例;F1值用于衡量分割
结果和金标准之间的相似性.相关指标计算公式如
下:
A c c=T N+T P
T N+T P+F N+F P,S p=
T N
T N+F P,
S n=T P
T P+F N,F1-s c o r e=2T P
2T P+F P+F N,其中,T P(真阳性)表示血管像素被正确分类为血管;T N(真阴性)表示背景像素被正确分类为背景;
F P(假阳性)表示背景像素被错误分类为血管;F N (假阴性)表示血管像素被错误分类为背景.
R O C曲线(r e c e i v e r o p e r a t i n g c h a r a c t e r i s t i c c u r v e)也是一种衡量视网膜血管分割标准的重要指标.它反映了不同阈值时灵敏度与特异性之间的关系,其中横轴为假阳性率(f a l s e p o s
i t i v e r a t e,F P R),纵轴为真阳性率(t r u e p o s i t i v e r a t e,T P R),R O C曲线下方的面积(a r e au n d e r t h er o cc u r v e,A U C)更加直观地评估算法的血管分割性能,其值越接近1,表示预测准确率越高,分割效果越好.
3.5实验结果分析
3.5.1分割结果
本文改进模型分别在D R I V E和S T A R E眼底图像数据库上进行实验,其分割结果如图7和图8所示.其中第一列为输入图像,第二列为金标准图像,第三列为本文模型的分割结果.通过与专家手动分割的图像进行比较,本文算法可以将血管与背景区域分开,并成功的检测出细小血管,具有良好的分割性能.
图7在D R I V E数据库上的分割结果
为了更直观的表现出本文算法的分割性能,给出了如图9所示的R O C曲线,从图中可以看出,
在
图8在S T A R E数据库上的分割结果
D R I V E和S T A R E数据库上的R O C曲线下方面积分别为0.9840和0.9746,假阳性率较低,真阳性率高,存在血管误分割的可能性小.
图9不同数据库上的R O C曲线
3.5.2先进算法对比
为了验证本文改进模型在眼底视网膜血管分割上的分割性能,将本文所提算法在D R I V E和S T A R E数据集上的性能评价指标与目前先进的算法进行对比,结果如表1和表2所示.从表1中可看出,本文的分割算法在D R I V E数据集上的A c c,
㊃44㊃
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论