计算机工程与设计
COMPUTER  ENGINEERING  AND  DESIGN
Apr72021Vol.42 No.4
2021年4月第42卷第4期
融合残差模块的Y-Net 肺结节检测算法
马巧梅12,梁昊然12,郎雅琨12
(1中北大学软件学院,山西太原030051;
2.山西省军民融合软件技术工程研究中心,山西太原030051)
摘 要:为解决现有肺结节检测模型精度低、漏诊率和误诊率高等问题,提出融合残差模块的肺结节检测算法。候选结节
检测阶段,提出残差
U-N e t  (r e s i d u a l  U -N e t , RU-N e t )分割网络,将改进的残差网络
(r e s i d u a l  n e t w o r k , Re s N e t )模块与
U-N e t 结构融合,提升模型特征提取能力;加入改进的损失函数解决数据类别不均衡问题,提高检测敏感度&假阳性减少
阶段,采用三维卷积神经网络
(3D  C NN )用于候选结节分类,充分获得结节空间信息,达到降低假阳性的目的。实验结
果表明,该算法能够准确并高效地分割和检测肺结节。
关键词:计算机辅助诊断;CT 图像;肺结节;深度学习;卷积神经网络;残差网络
中图法分类号:T P 391 文献标识号:A  文章编号:100-7024 (2021)
04-1058-07doi :
10. 16208/j . i s n l 00-7024. 2021 04. 023
Lung  nodule  detection  algorithm  combining  U-Net  residual  module
MA  Qiao-mii 12 , LIANG  Hao-ran 12 , LANG  Ya-kun 12
(1 S o f t w a r e  S c h o l , N o r t h  U n i v e r s i t y  o f  C h i n a , T a i y u a n  03051, C h i n a ; 2. S h a n x i  M i l t a r y  a n d  C i v i l a n  I n t e g r a t i o n  S o f t w a r e  T e c h n o l o g y  E n g i n e r i n g  R e s e a r c h  C e n t e r , T a i y u a n  03051, C h i n a )Abstract
: T o  s o l v e  t h e  p r o b l e m s  o f  l o w  a c u r a c y , h i g h  r a t e  o f  m i s e d  d i a g n o s i  a n d  h i g h  r a t e  o f  m i s d i a g n o s i s  o f  e x i s t i n g  l u n g  n o - d u l e d e t e c t i o n m o d e l s "a l u n g n o d u l e d e t e c t i o n a l g o r i t h m c o m b i n i n g a r e s i d u a l m o d u l e w a s p r o p o s e d .I n t h e c a n d i d a t e n o d u l e d e - t e c t i o n  s t a g e , t h e  r e s i d u a l  U -N e t  (R U-N e t ) s e g m e n t a t i o n  n e t w o r k  w a s  p r o p o s e d . T h e  i m p r o v e d  r e s i d u a l  n e t w o r k  (R e s N e t ) mo d u l e  w a s  i n t e g r a t e d  w i t h  t h e  U -N e t  s t r u c t u r e  t o  e n h a n c e  t h e  m o d e l  f e a t u r e  e x t r a c t i o n  a b i l t y . T h e  i m p r o v e d  l o s  f u n c t i o n s o l v e d  t h e  p r o b l e m  o f  i m b a l a n c e d  d a t a  c a t e g o r i e s  t o  o b t a i n  h i g h e r  d e t e c t i o n  s e n s i t v i t y . I n  t h e  f a l s e  p o s i t v e  r e d u c t i o n  s t a g e , a  t h r e -d i m e n s i o n a l  c o n v o l u t i o n a l  n e u r a l  n e t w o r k  (3D  C NN) w a s  u s e d  f o r  c a n d i d a t e  n o d u l e  c l a s i f c a t i o n , w h i c h  f u l y  o b t a i n e d  n o d u l e  s p a t i a l  i n f o r m a t i o n , a n d  a c h i e v e d  t h e  p u r p o s e  o f  r e d u c i n g  f a l s e  p o s i t v e s . E x p e r i m e n t a l  r e s u l t s  s h o w  t h a t  h e  p r o p o s e d  a l ­g o r i t h m  c a n  a c u r a t e l y  a n d  e f i c i e n t l y  s e g m e n t  a n d  d e t e c t  l u n g  n o d u l e s .Key  words
: c o m p u t e r -a i d e d  d i a g n o s i s ; c o m p u t e r  t o m o g r a p h y  i m a g e ; l u n g  n o d u l e ; d e p  l e a r n i n g ; c o n v o l u t i o n a l  n e u r a l  n e t w o r k ;
r e s i d u a l  n e t w o r k 0引言
计算机辅助诊断(computer  aided  detection, CAD)系 统可以帮助医生提高诊断速度和准确率。早期肺结节检测
通过提取图像特征,结合机器学习相关的分类器对结节分 类14。随着医学成像技术的发展,传统的检测方法难以适
应当前大量复杂的数据集,同时手工提取特征的步骤较为 复杂,无法有效挖掘图像中丰富的信息。
随着深度学习的发展,将该方法应用在肺结节检测中
可以获得比浅层学习更好的特征表示能力5 !卷积神经网 络提取的抽象特征对图像分类和物体粗略定位有效,但很 难精细分割物体轮廓。为解决上述问题,相继提出了 Seg-
Net 6和U-Net 7等仅使用卷积层进行语义分割的网络。U-
Net 网络为医学图像精准分割定位提供解决思路,在肺结
节检测中取得了较好的检测效果-。本文针对现有肺结 节检测模型精度低、漏诊率和误诊率高等问题提出了融合
收稿日期:2020-06-22;修订日期:2020-09-21
基金项目:山西省自然科学基金项目(201801D121026);山西省研究生创新基金项目(2020SY398)
作者简介:马巧梅(1969 -),女,山西晋中人,博士,副教授,CCF 会员,研究方向为图形图像处理、算法优化;梁昊然(1994-),女, 山西太原人,硕士研究生,研究方向为图形图像处理、深度学习;郎雅琨(997 -),女,山西运城人,硕士研究生,研究方向为图形图像
处理、深度学习! E-mail : 38O876659@qq
第42卷第4期
马巧梅!梁昊然!郎雅琨:融合残差模块的U-Net 肺结节检测算法
・1059・
深度残差网络[⑴的肺结节检测算法,在LUNA16-2数据集
取得 的 结果。
1本文提出的模型
本文提岀了融合残差模块的肺结节检测算法,主要包 括以下步骤:①候选结节检测阶段:采用提岀的RU-Net
肺部CT 图像,获得 结节;②假阳性减少阶段:采 于3D  CNN 的分类 ,将
结节分类得到
真实肺结节。
1.1候选结节检测模型设计
候选结节检测阶段的主要目的是以较快的检测速度和
较高的敏感度尽可能多的在肺部CT 图像中 到所有候结节。
岀 RU-Net 候选结节
模型,该
空间的利用下提高 精度和敏
感度,模型框架如图1所示。
肺部CT
分割结果候选结节
Conv+Res8
■>| Conv+Res9
肺实质
X Input
Conv+Resl  r
Conv+Res21
-►I  Conv+Res7Conv+Res3Conv+Res4
Conv+Res6
Conv+Res5
]、2x2最大池化层 / 2x2上采样层
…》残差跳转连接
图1 RU-Net 候选结节检测模型框架
1.1.1数据预处理
肺部CT 图像是对整个胸腔区域的扫描图像,包含了 肺部及其之外的其它组织和器官。为提高检测精度和速度,
同时防止检测过程中肺部之外其它组织器官对肺结节检测 的 ,需要对数据进行预处理 ,
肺实质部分。
CT 采集后所得的数值为X 射线衰减值[⑶,单位为亨
氏单位(hounsfield  unit, HU),表示CT 图像上组织结构 的相对密度。根据图像的HU 值可以区分肺、血液、骨骼 其它组
官,HU 值计算公式如下
HU  =冷 _ 〃水 & 1000
(1)
'水—'气
式中:'
为吸收系数或衰减系数,与X 射线强度有关。其 中,CT 图像中肺部区域的HU 值在一500左右,需要过滤 空气、骨骼和其它组
官等像素信息。
本文对LUNA16数据集进行数据预处理,首先提取肺 部感兴趣区域进行二值化,通过像素亮度分布分离图像区
域;结合图像形态学操作的腐蚀和膨胀消除肺部的小空洞 区域;标记连通区域获得肺部掩模,与原始图像进行与操
作;最终通过归一化处理将图像像素强度范 为[ — 1000, 400],并将其标准化为[0, 255.预处理具体步 骤如图2所示。
原始CT 图像卜|二值化卜函学操作卜|赢连通区域卜|获得肺部掩模
图2数据集预处理步骤
1. 1. 2 提岀的RU-Net 网络结构
U-Net 网络是由编码器(encoder )和解码器(decoder )
构成的U 型对称结构,分别用来提取 征和用于精确
定位,网络在结构上包含下采样、上采
连接3个
要特点。编 由卷积 化
构成,通过下采
样逐步提取图像特征获得高层抽象 ;
通过反卷
积层逐级上采样,恢复图像细节和空 度信息;编 :
通过 连 征" 采 结 层
卷积特征获得更多高
率 ,从而 节 恢复
图像并提高 精度。然而原始U-Net 结构存在不足之处,
如 空
丢失、编
F 义鸿
和对特征表达不准确
。针对
学图像分割方
面的缺陷,研究人员提岀了如MultiResUNet [⑷和CE-
Net -5]等改进结构,在不
学图像数据集上都取得了较
好的效果。
对上述问题,融合改进的深度残差模块提岀了
RU-Net 网络:①将下采
采样中的卷积层由残差单元
替代,增强特征提取性能,获得 的结节特征;②
:
连接中加入串联的残差块,减弱低层特征直接同高层特
而产生的 !
残 主要由残差单元构成,当神经网络输入为H ,
输岀特征为HH )时,其学习到的残差为FH ) = HH )—
中增加y e H 的 ,通过跳转连接将FH )
和h 逐元素相加,最终将原函数转换为F(h )+h 构成一个
残差单元如图3 (a )所示。本文采用的残差单元包括两个
3X3的卷积层,在卷积
采 量标准化(batch
normalization, BN)和 ReLU  (rectified  linear  unit)激活函
数处理如图3 (b )所示。残差单元通过跳转连接将梯度自
由传递到较低层, 梯度消失或爆炸, 小为3X3使 参
且计算速度更快有利于提取局部特征。采用BN
的输入保持 布,提升 训练速度,避
免产生梯度消失 。在U-Net  中添加残差单元,使
加一定深度提高
准确率, 缓 度增加
造成梯度消失和梯度爆炸
, 模型
的性能。连接将浅层特征与深层特征
留空 征,
然而 组 征 可 存
, 造 编
器之间产生 ,对 产生不利影响。为弥
差异造成的细节丢失,本文采用残 连接替换原始网
中的 连接,以改进编
的特征映射。
连接中增加串联的残 , 征 的 差
・1060・计算机工程与设计2021年
距,每个残差块都由3X3和1X1的卷积层通过跳转连接相加构成,具体结构如图4所示。
图3残差单元
图4残差跳转连接
由于编码器通过下采样操作不断加深特征提取,编码
征的逐渐减小。因此在
连接的对3条采用残连接,分别串联了3,2和1个残差块,对差距最小的两组特征直接采用跳转连接进行!通过改进连接结构可存浅层细节,结层获得更精确的特征信息,提高对结节的检测性能。
本文提岀的RU-Net网络中,卷积层均由3X3的卷积核构成,每层卷积核的数量为32,64,128,256和512,层排序。层均包含卷积层和残:,该除输岀层外均由ReLU激活函数构成,用于加速训练
过拟合,加BN操作加速训练速度提高-泛化能力。输岀层由Sigmoid激活函数构成公式如下
式中:h为输入,/(h)为输岀。
113改进的损失函数
肺结节的主要针对肺部CT中的小目标图像进行,往往一幅图像中只有的结节,且结节的像素比例较小,这造图像类别不均衡问题
训练较为。学图像的中,性比
性,不均衡数据训练模型可结果向于高精度但低敏感度的。为结节中类度不衡对比不的失函数,高感度。
原始U-Net分割网络使用基于Dice系数的损失函数,采用Dice距离对比两个样本元素之间像素级的相似性,Dice系数公式如下
—ce(P,G)=[PP P|8|⑶式中:P表示预测值,G表示真实标签。
Dice系数可以处理背景和分割区域之间面积对比不均衡问题,基于Dice系数的损失函训练准确度上表但可丢失真实结节,造成训练结果的不可信!
结节中,需要尽可能多地保留真实结节以高感度,因对损失函数进行改进。
为学图像据不平衡,Salehi等-6.提岀了一种基于Tver s ky系数的广义损失函数,其中Tver s ky 系数定义如下
t(,G),#=p n g|+J i P p;G\+#\g-p(4)式中:|p—G|表示假阳性(FP),|g—P|表示假阴性(FN),通过调整/和#两个超参数可以控制FP和FN之间的
权衡,实现高度不平衡数据在准确率和敏感度之间的平衡。
Tversky系数是一种广义系数,当a
=#=0.5时,该系数为Dice系数;当a=#=1时,该系数为Jaccard系数。本为高结节感度可多地获得结节结合Dice系数和Tversky系数特点,将基于Tversky系数的损失函结节中。通过实验对比不超参数取值对像素分类的敏感度,确定最终参数值。本法使模型一定准确率的下,增加【分类的结节,为性供的结节。
1.2假阳性减少网络模型结构
肺结节中结节为高
敏感度往往会岀高的性。为了从大量结节中准确鉴别岀真实结节,需要去除性结节。肺结节形态征是小的、类的、性的不正常组织,具有复杂的空下!由于采卷积往往不能利用三维空下,CT图像中肺结节在连续切片中的变化!因此,构造基于三维卷积(3DCNN)的分类模型,利用结节的空下,获得鉴力的特征,从而准确鉴别岀真实肺结节,结构如图5所示。
本阶段截取以二维候选结节为中心的矩形区域,将该区域切片堆为三维图像,作为训练数据集输入3D CNN 中进行分类。采用的3D CNN通过三维卷积层和三维最化层组合构成,从而充分提取结节的空征最后通过全连接层输岀特征,由Softmax层输岀分类结果。3D卷积层为减少训练参数,均采用3X3X3的卷积核提取结节特征,每层卷积核的数量为64,128,256和512。中每层的输岀特征图与卷积核进行卷积运算,
第42卷第4期马巧梅!梁昊然!郎雅琨:融合残差模块的U-Net肺结节检测算法・1061・
64x(3x3x3)128x(3x3x3)256x(3x3x3)512x(3x3x3)
图5三维卷积神经网络分类模型框架
取更高层的特征表示,卷积的计算过程可以定义为
y)=!
&)++碍6y广1)(5)
式中:K T表示第)层第?征,由)一1层的每个特征y T1与3D卷积核k进行卷积操作,然后与第)层偏置值0)
相加,最后通过!非线性激活函数得到。本文卷积层均采
ReLU激活函数,在卷积层之后连接BN一化输岀。
不同的3D卷积层中,交替采用3D最化层对卷积层提取特征进行下采样,选取内的最大值进行特征抽取,从而训练中的数据和参数量。最后将所有全连接层中的元与相邻层元相连,类别概率进行分类。结构中引入dropout和L2正则化法过,提高模型的泛化能力。在模型中采元交{函数度量分类损失。
2实验与结果
21实验数据
2.1.1数据集
岀的肺结节检测算法实验采用LUNA16数据集 进行,据集来源于最大公共肺结节数据集LIDC-IDRI,包括1018个低剂量的肺部CT影像。LUNA16数据集去除切片厚度大于3mm$切片space不一致和缺失部分切片的CT图像,剩下数据包括888个CT扫描,数据集中的肺结节注释选取4名专业放射科医生中至少3位标注的1186个结节作为参考标准,去除小于3mm肺结节。
2.1.2数据增强
LUNA16数据集为CT扫描图像,标注信息包括肺结节的位置信息和直径大小等,图像大小为512X512像素。
度学习中,比的要大量的参数,而得参数正确工要大量的数据进行训练。采用深度学习方法训练医学图像的主要是数据集,为增加训练过程中的量,防止模型过,提高模型泛化能力,需要对进行数据增强。据增强方法主要采用图像、图像平移和图像。图像旋转通过旋转中心点随机旋转30°到180°,图像翻转通过水平!利用数据增强方法防止模型过拟合,提高肺结节的检测性能。
2.2评估指标
根据给定的标签和预测结果对比,本文采用准确率(Accuracy)$敏感度(Sensitivity)和特异度(Specificity)作为评估指标对性能进行评价,定义如下
'P+TN() Accuracy=丁卩p t n+FP+FN⑹
Sensitivity=tp+fn⑺
Specificity=tn+F p()式中分别表示为真阳性(true positive,TP)、假阳性(false positive,FP)$真阴性(true negative,TN)、假阴性(false negative,FN)。其中,定义阳性(positive,P)为恶性结节,阴性(negative,N)为良性结节,具体预测结果见表1。
表1预测结果
实际标签-
预测结果
P N
P TP FN
N FP TN
针对候选结节检测阶段的评估指标主要采用Dice系数对性能进行评价,评估结果与真签掩模的度;采感度评估模型全结节中真实结节所占比例,反映发人的能力,敏感度越高,漏诊率越低。性的模型有较高的Dice系数和敏感度。在假阳性减少阶段,采用准确率和敏感度对网模型进行评估,分类性的可以获得更高的准确率和敏感度。
2.3实验结果
实验中所有网络模型均使用Python3.6编写,在Keras (tensorflow backend)深度学习框架下搭建,同时
使用GPU加速网络模型的训练。中均采用ReLU作为激活函数,并Adam作为算法优化器(初始学习率为0.0001)。为防止在模型在训练过程中岀现过拟合等问题,
• 1062 *
计算机工程与设计2021 年
在网络中适当加入Dropout 层,并在卷积层中使用L2正则 化。本文所提出的网络模型在候选结节检测阶段和假阳性
减少阶段都进行了独立的训练和测试,获得了较为理想的 实验结果。
2.3.1候选结节检测结果
本文在候选结节检测阶段,针对提出的RU-Net 网络,
在相同数据集LUNA16下设计多组对比实验验证其性能。 实验主要包括模型自身改进效果的对比实验,以及与其它 肺结节检测系统在本阶段的检测性能对比实验。通过所设
计的几组对比实验,验证RU-Net 网络在候选结节检测阶
段的分割性能。
在候选结节检测任务中,为减小训练数据集图像类别 不均衡问题,获取更高的敏感度,引入Tversky 系数作为
损失函数。控制该系数的两个超参数/和P 可以调整假阳
性和假阴性之间的权衡,经过实验验证提高P 的权重可以 获得更高的敏感度,改善模型训练中数据不均衡问题,有
效降低假阴性并提高敏感度。为了对比评估Tversky 损失
函数和Dice 损失函数在候选结节检测方面的性能,本文在 原始U-Net 网络上训练了不同的/和p 取值,见表2。
表2 U-Net 网络上训练Tversky 损失函数不同的+和,值
超参数
Loss
Dice  系
敏感度/%特异度/%
a  = 0. 5,0=0. 50.3756
0.733376.4699. 95
a  = 0. 4, 0=0. 60.3638
0.725179.8499.94a  = 0. 3, 0=0. 70.37310.7241
81.6299.92
a  = 0. 2,0=0. 8
0.3526
0.710886.12
99.89a =0.1
, 0=0.9
0.29890.7082
91.24
99.87
结果表明,敏感度和特异度之间的平衡由损失函数的 参数控制;损失一定的精确度,可以提高像素分类的敏感
度;当超参数取a  = 0.1,0=0. 9时可以获得较低的损失和 较高的敏感度,对比将超参数设置为a
= p =0.
5时的Dice
损失函数检测敏感度更高。为在候选结节检测阶段获得更
高的敏感度,尽可能多地检测到结节,本文将采用a  = 0.1, 0=0. 9的基于Tversky 系数的损失函数进行对比实验。
本文将RU-Net 网络与U-Net 网络进行对比实验,验 证候选结节检测模型改进算法的有效性。首先,在相同的 失函 Dice  系 下对3 模型的 性 进行比 "
验对比了原始U-Net 网络、融合残差单元的ResUNet 改进
结构、融合残差单元和残差跳转连接的RU-Net 改进结构。 另外,对比了这3种结构采用改进的损失函数的分割性能。 实验评估了在相同的数据集下6组不同模型的性能指标,
见表3。
实验结果表明,提出的RU-Net 网络可以获得更高的
Dice  系
度; 采 改进的 失函 一定度的情况下,可以大幅度提高检测模型的敏感度。在算法表3候选结节检测模型性能比较
方法
损失函数
Dice  系
感度/%度/%/s
U-Net
0.7514
76.1999.950.016ResUNet
Dice  系
0.7327
74.2199.95
0.025
RU-Net 0.7659
77.27
99.96
0.030
U-Net
0.7082
91.24
99.870.016ResUNetTversky  系
0.7059
92.57
99.860.025
RU-Net 0.7344
95.21
99.89
0.030
效率方面,实验对比了所提算法在检测单张肺部CT 图像
时所需的平均时间,随着网络的加深及检测敏感度的提升,正则化残差
检测时间也会相应增加。RU-Net 网络检测单张图像平均用 时为0. 030 s ,在时间效率上相对优于其它3D 网络算法。
通过实验验证,本文提出的RU-Net 网络获得了更高的敏 感度 对 的 Dice  系 " 结节 性优于其它模型。
对比
肺结节 法中 的模型
性能,Lao 等-.采用改进的3D  CNN 结构检测可疑候选结 节;Xie 等在候选结节检测阶段采用改进的Faster  R-
CNN 网络;ZNET -2.使用U-Net 网络进行检测;邓忠豪
等-0.改进了 U-Net+ +的网络结构和损失函数检测候选结 节;另外朱辉等18利用多尺度特征结构的U-Net 对肺结节
进行分割。对比实验采用LUNA16数据集,本文提出算法 在Dice 系数和敏感度上均优于其它算法,结果见表4。
表4不同候选结节检测模型性能对比
模型
Dice  系
感度/%
文献3D  CNN —85.62文献-7.
FasterR-CNN
—86.42ZNET
U-Net
—93.30文献-0.U-Net++0.7050
94.30
文献-8.
U-Net
0.7333
RU-Net 0.734495.21
实验结果表明,本文提出的RU-Net 网络取得了
0. 7344的Dice 系数和95. 21%的敏感度,与其它网络结构
比 评估指 有所 高!
图6显示了本文提出的RU-Net 网络在候选结节检测
阶段采用基于Tversky 系数的损失函数(超参数取a  = 0.1,
0=0.9)的分割结果。其中第1行为原始CT 图像,第2行
为采用RU-Net 网络获得的候选结节分割结果,第3行为在
CT 图像上标出的候选结节检测结果。
经过以上几组对比实验,验证了提出的RU-Net 网络 结节
可 获得 高的

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。