基于改进YOLOv3的目标检测方法研究
作者:王继千 刘唤唤 廖涛 朱小东
正则化目的
来源:《现代信息科技》2022年第16期
        摘 要:针对目标检测算法YOLOv3检测精度低、目标识别效果差等问题,从特征提取和特征融合的角度提出一种改进的YOLOv3目标检测算法。采取连续残差结构和深度卷积双路特征提取来扩展感受野,在深度卷积模块中以改进的混合池化来替换最大池化;在特征融合方面,引入CBAM,并在增强残差模块中增加了注意力特征融合模块。实验结果表明,改良后的YOLOv3算法在百度与北京林业大学合作的Insects昆虫数据集上的检测精度达到了71.22%,比原始算法的检测精度提升4.88个百分点,验证了该算法的有效性。
        关键词:目标检测;YOLOv3;注意力机制;昆虫;CBAM
        中图分类号:TP391.4 文献标识码:A 文章编号:2096-4706(2022)16-0071-04
        Research on Target Detection Method Based on Improved YOLOv3
        WANG Jiqian, LIU Huanhuan, LIAO Tao, ZHU Xiaodong
        (Anhui University of Science and Technology, Huainan 232001, China)
        Abstract: Aiming at the problems of low detection accuracy and poor target recogniti
on effect of target detection algorithm YOLOv3, an improved YOLOv3 target detection algorithm is proposed from the perspective of feature extraction and feature fusion. The continuous residual structure and deep convolution two-way feature extraction are adopted to expand the receptive field, and the improved mixed pooling is used to replace the maximum pooling in the deep convolution module; in the aspect of feature fusion, CBAM is introduced, and the attention feature fusion module is added to the enhanced residual module. The experimental results show that the detection accuracy of the improved YOLOv3 algorithm on the Insects insect data set cooperated by Baidu and Beijing Forestry University reaches 71.22%, which is 4.88% higher than the detection accuracy of the original algorithm, which verifies the effectiveness of the algorithm.
        Keywords: target detection; YOLOv3; attention mechanism; insect; CBAM
        0 引 言
        目标检测是当前的研究热点,其主要目标是确定物体在图像中的位置,并分辨出当前目标的类别,是模式识别中的重要算法。目前已应用于行人检测[1]、医学图像检测[2]、人脸检
测[3]等领域,由此可以看出目标检测具有重要的研究价值与现实意义。目标检测在农业领域也有不错的应用前景。随着农业生产中不断引入科学技术,农作物的产量及质量都有了显著的提高。伴随着农业生产和科学技术的快速融合,虽然很多农业问题已经得以解决,但是农业昆虫灾害依然是农业生产中科学技术无法完全攻克的一大难题,例如,昆虫啃食对农作物的数量和质量造成较为严重的影响。因此,如何快速检测出农业昆虫的种类和数量,并保证较高的检测精准度就成为农业生产中的一项重要工作。随着科学技术的快速发展,昆虫的检测方式也发生了改变。昆虫检测大致可以分为传统方法和非传统方法,比如人工方法、诱捕法[4]可以归为传统的昆虫检测方法,而正是由于科学技术的迅速发展,传统的昆虫检测方法逐渐发展为成声检测[5]、图像识别和深度学习图像处理等非传统方法。传统的昆虫图像识别策略是针对不同昆虫外部特征的差异性进行精准设计,之后送入分类器,最终确定昆虫种类。正是由于技术理论的疾速发展以及深度学习理论形成了较好的理论体系,结合这种理论基础的目标检测技术也在农业生产中逐渐盛行起來。这种新型检测技术的优越性简化了手工设计环节,提高了对昆虫特征的自动学习能力。这种新型的昆虫检测技术无论在速度上,还是在检测精度上都具有很大的优越性,同时也在很大程度上减少了人力物力的投入比。这种检测技术不仅具有极高的现实价值,还有着良好的发展前景。随着各种理论技术的普及,Y
OLO算法的应用也逐渐增多,并慢慢进入人类的生产生活中。例如文献[1]中改进的YOLOv3-my-prune方法,在甘蔗环境下取得了不错的行人检测效果;文献[2]中通过替换不同层级的特征检测模块并引入Boosting思想,提出了新的Multi branch YOLO检测算法,并且在肺炎数据集上有着优秀的表现;文献[3]中的YOLOv3算法使用Mobile Net网络代替YOLOv3中的特征提取网络,并融合了Self-attention机制,该算法在公开数据集上也取得了不错的准确率并在一定程度上满足实时性要求;深度学习技术的快速发展使得它在图像处理领域也发挥了重要作用,比如文献[6]中提出的基于门控通道注意力机制的优化YOLOv3算法,结合自适应模块后,在小目标检测上取得了良好的成效。从YOLO算法模型的应用来看,深度学习理论的应用比较成熟。虽然目标检测方法已经应用于现实生活中的很多方面,但是有一些领域还是鲜少涉及的,比如在农业昆虫领域就运用得较少。YOLO算法的输入模块用于获取一张完整的图像,因为一张完整的图片所涵盖的信息属于全局特征信息,可以在很大程度上降低目标的误检率,也可以实现实时检测。算法最后输出不同大小的特征图,可以用来融合深、浅双层特征,同时又加入了对目标特征信息具有良好提取效果的Darknet-53特征提取网络,使得目标检测能力得到明显提升,例如文献[7]的mAP为91.7%。但当所要进行目标检测的背景复杂、多尺度且姿态多样时,由于图像本身的像素小、特征不显著等原因,容易造成小目标的漏检和误检,检测能力尚需提高。
        本文针对YOLOv3模型算法的不足之处,并且基于农业昆虫领域的目标检测任务,提出一种改进特征提取和特征融合并融入CBAM模块的YOLOv3目标检测算法。相较于其他深度学习框架,Tensflow深度学习框架没有灵活性差、拓展性差以及健壮性不强等方面的缺陷。因此将优秀的Tensflow应用到该模型中,之后再引入连续的残差结构和深度卷积双路特征提取模型,在增加模型深度的同时提高感受野,提高锚框的定位准确性;另一方面引入改进的卷积注意力模块继续提高目标检测和物体分类的精度,从而提高网络的性能。最终各项指标在改进的模型上表现良好。
        1 典型的YOLOv3算法
        如图1所示,YOLOv3模型结构可以分为3个主要模块:图片输入、基础网络Darknet-53和YOLOv3。其中,Input模块输入图像大小为416×416×3,Darknet-53骨干网络进行特征提取,其中的DBL模块是卷积、BN算法、线性激活函数LeakyRelu的总称,是YOLOv3算法的基本组件;res借鉴了ResNet残差结构的思想,进一步加深了网络结构,res1中的数字1表示当前模块使用1次,其中的1、2、8、8、4表示五种尺度,总共进行了32倍的下采样,残差模块中1×1卷积降维,然后3×3卷积升维,残差组件结构如图2所示;Concat用来完成张量拼接
操作,将darknet中间层和之后的某一个上采样层拼接,扩充了张量的维度;y1、y2、y3表示三个不同尺度的输出分支。
        2 改进的YOLOv3算法
        改进的YOLOv3网络结构图如图3所示,该网络结构图对经典网络结构的Darknet-53骨干網络做了调整,将原有的res残差结构替换为twostream_block和cbam_block模块。图中的数字3表示经过了3次循环的twostream_block和cbam_block模块特征提取。整体的网络结构经过5次twostream_block和cbam_block模块的特征提取后,之后经过三种不同的Scale,再分别使用Convs卷积一次,最后进入Detection检测模块,获取不同尺度的目标检测结果。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。