科技创新导报 Science and Technology Innovation Herald
4
信息化工业
DOI:10.16660/jki.1674-098X.2020.10.004
基于改进Tiny-YOLOv3的人数统计方法
成玉荣  胡海洋
(江苏理工学院  江苏常州  213001)
摘  要:卷积神经网络已经成为了计算机视觉处理最为广泛的技术方法,基于卷积神经网络的目标检测技术也是一个热门的研究话题。本文通过引入通道注意力机制,对目标检测算法Tiny-YOLOv3进行改进,训练人体头部的目标检测模型,从而统计当前监控环境下的人数。实验结果表明该方法能取得较好的头部检
测效果,人数统计准确率高。关键词:卷积神经网络  Tiny-YOLOv3  头部检测  人数统计中图分类号:TP391                                文献标识码:A                        文章编号:1674-098X(2020)04(a)-0004-03Abstract: Convolutional neural networks have become the most widespread technical method for computer vision processing. Object detection technology based on convolutional neural networks is also a hot research topic. This paper introduces the channel attention mechanism to improve the object detection algorithm Tiny-YOLOv3, and trains head detection model to count the number of people in the current monitoring environment. The experimental results show that this method can achieve a good head detection effect, and the people counting accuracy is high.Key Words: Convolutional neural networks; Tiny-YOLOv3; Head detection; People counting
①作者简介:成玉荣(1999—),男,汉族,江苏盐城人,本科在读,研究方向:目标检测与语义分割。
胡海洋(1999—),男,汉族,浙江丽水人,本科在读,研究方向:机器学习。
人数统计问题是近年来计算机视觉领域研究热点之一,在现实生活中具有广泛应用。如政府管理部门根据旅客流量对交通资源进行合理分配;医院门诊流量有助于总结病人就诊规律,合理分配医护资源;对人数密集情况进行预警,能够有效减少踩踏等公共安全事故的发生。公共场所的人数统计分析对于公共
资源分配以及商业决策具有重要的参考价值。在人数统计的众多方法中,计算机视觉处理方案在已有监控系统资源实现再挖掘利用,不需要安装专门检测设备, 具有成本低、实时性高等优势。本文基于深度卷积神经网络构建的具有通道注意力机制的Tiny-YOLOv3目标检测算法,在SCUT-HEAD公开数据集上训练人体头部检测模型,实现公共场合的人数统计。
1  卷积神经网络
卷积神经网络是受生物学上感受野的机制而提出的,
感受野主要是指视觉、听觉等神经系统中一些神经元的
特性,即神经元只接受其支配的刺激区域内的信号。卷积神经网络一般包括输入层、卷积层、激活层、池化层,其中卷积层是卷积神经网络的核心组件,它的作用是对输入数据进行特征提取,利用卷积核矩阵对原始数据中的隐含关联性进行抽象。激活层负责对卷积层抽取的特征进行激活,由于卷积操作是把输入图像和卷积核进行相应的线性变换,需要引入非线性函数对其进行非线性映射。池化层就是对特征图进行子采样,负责对感受域内的特征进行筛选,提取区域内最具代表性的特征,能够有效地降低输出特征的尺度,进而减少模型所需要的参数量。卷积神经网络具有三个特性:局部连接、权重共享以及子采样,这些特性使得卷积神经网络具有一定程度上的平移、缩放和旋转不变性,符合人的视觉特点,和一般的前馈神经网络相比,卷积神经网络的稀疏连接及权值共享模式,具有正则化可以产生稀疏权值
图1  Tiny-YOLOv3模型结构图
信息化工业
科技创新导报 Science and Technology Innovation Herald
5
更少的参数量,能够有效提高训练速度。
2  目标检测算法
2.1 YOLO模型
YOLO系列算法是单阶段目标检测算法的主要代表算法之一,经历了三个版本的变更,YOLOv1提出通过网格划分做检测,目标中心点在哪个网格,该网格就负责检测这个目标,显著提升了检测速度。YOLOv2在网格约束的基础上应用了anchor机制,通过预设不同尺度的先验框使目标检测器专注于检测与先验框形状相近的物体,同时采用了批标准化作为正则化、加速收敛和避免过拟合的方法。YOLOv3采用了深层卷积神经网络作为特征提取的主干网络,在YOLOv2的基础上,借鉴特征金字塔网络的多尺度思想,设计了三个不同尺度的检测层,并为每个检测层分配3个先验框,YOLOv3通过边框回归预测的方式预测物体位置,解决了先验框机制线性回归不稳定的问题。2.2 Tiny-YOLOv3模型
Tiny-YOLOv3是轻量化的YOLOv3,Tiny-YOLOv3主要是由卷积层和池化层拼接而成,其模型结构如图1所示。模型输入图像分辨率为416×416×3,经过一系列的卷积与池化操作对图像进行特征提取,图中长方体为提取到的特征
图,下方数字为当前特征图的宽高与通道数,它同样融合了
特征金字塔网络的多尺度思想,在26×26、13×13两个尺度的特征图上进行预测,通过对两个检测层上所有的预测框进行非极大值抑制去除冗余框,获取最终有效的预测框。Tiny-YOLOv3模型结构简单,检测精度高,速度快。2.3 对 Tiny-YOLOv3改进
因特征图不同通道信息对检测结果贡献度不同,本文引入通道注意力模块对特征图各个通道间的依赖性
进行建模,其结构如图2所示,首先对卷积得到的特征图进行全局池化得到一个与通道数一致的一维向量,接着通过全连接层与激活层实现维度的变换与数值的非线性变换,再利用一个全连接层使其维度恢复,这个过程相当于一次编解码操作,最后利用sigmoid函数激活使其范围在0-1之间,该一维向量作为每个通道的评价分数,用来衡量每个通道的重要性,将该分数分别施加到输入特征图的各个通道上,得到具有通道注意力的特征图。在Tiny-YOLOv3所有的卷积层后,添加通道注意力模块,使其关注重要特征并抑制不必要的特征,从而提高目标检测的准确率。
3  实验
3.1 数据准备
训练数据采用的是SCUT-HEAD公开数据集,共计4340张图片,为了提高训练模型的鲁棒性,对数据集进行了如下的数据增广:(1)旋转角度;(2)随机裁剪;(3)曝光度调整;(4)饱和度调整。采用以上四种方式丰富数据集,生成更多的训练样本,从而使网络学习到更多的信息。3.2 K-means聚类
在训练网络时,需要预设先验框的初始大小和个数,使用接近真实框的先验框,更容易加快网络收敛的速度,提高头部检测的定位精度。K-means聚类算法采用欧氏距离来衡量两点之间的距离,本文对数据集中目标框宽高利用K-means算法进行聚类,到接近数据样本的先验框。3.3 模型训练
实验软件环境:P y t h o n 3.6.8;O p e n C V
3.4.1;
图2  通道注意力模块
图4  头部检测计数
图3  训练过程可视化
(下转8页)
航空航天科学技术
科技创新导报 Science and Technology Innovation Herald
8
主要完成两个方面建设:一是要不断总结完善体系文件,形成制度规范,否则技术和管理过程“无章可依、无规可循”,将导致整个流程实施混乱,质量监管效率减低;二是要搭建数字化集成装备研制应用管理组织架构,明确岗位分工,避免因职责落实不到位造成的执行不力问题,发挥体系作用,促进质量提
升。
(1)完善体系文件。
在翼盒数字化装配系统应用过程中,研究团队对数字化集成装备管理体系文件进行不断完善优化,并严格按照文件体系规定实施开展各项工作,实现了整个系统从立项、验证、应用到定检的全流程规范化,做到了各环节有制度可遵循,有标准可参照,如图3所示。
(2)搭建组织架构。
针对翼盒数字装配系统研制应用过程,企业建立了一套完整的数字化装配系统应用管理组织架构,见图4,对数字化装配系统从立项到应用全流程的各项工作进行分解,明确组织内部人员的职责、工作规范及流程,实现人力资源与业务流程的匹配。通过这种组织架构的搭建,保证了资源和信息流通的有序性,从而稳定提升整个组织在实现数字化装配应用环节上的效率和作用。
2  结语
飞机数字化装备的应用大幅缩短了产品的生产装配周期,提高了产品质量,保证了飞机的飞行安全和飞行寿命,同时飞机数字化集成装备的研制应用过程中也存在着诸多风险,本文以某型机翼盒数字化装配系统的研制应用过程为例,详细阐述了飞机数字化集成装备研制应用过程中的“四控”法,通过全流程的
实践验证,“四控”法有效地规避了新型数字集成装备研制应用过程中的各种风险,形成了各类标准规范和体系构架,保证了新型数
字集成装备按期顺利投产并形成稳定可靠的加工能力,同时“四控”法也可为同行业或其他行业的新型数字化装备及新技术的应用提供参考及借鉴。
参考文献
[1] 陈文亮,潘国威,丁力平.飞机数字化装配技术发展现状[J].航空制造技术,2016, 59(8):26-30.
[2] 王玥.装备制造企业的数字化转型之路[J].现代制造技术与装备, 2019(5).
[3] 刘芳芳.工业4.0背景下产业融合对装备制造业转型升级影响研究[D].合肥工业大学,2017.[4] 王仲奇,杨元.飞机装配的数字化与智能化[J].航空制造技术,2016,59(5):36-41.[5] 梅中义,黄超,范玉青.飞机数字化装配技术发展与展望[J].航空制造技术, 2015(18):19-24.[6] 陈雪梅,刘顺涛.飞机数字化装配技术发展与应用[J].航空制造技术,2014, 445(1-2):58-65.
[7] 岩石,依然.大飞机数字化装配技术[J ].航空制造技术,2010(18):32-33.[8] 朱三山,梅中义.飞机数字化装配测量系统研究[J].现代制造工程,2011(8):103-107.
[9] 葛长健.数字化装配工艺技术在电子设备生产中的应用[J].机械设计与制造工程,2019(4).[10]周养萍,亓江文.飞机部件数字化装配技术研究现状与思考[J].机械制造,2013(8):50-53.
(上接5页)
Pytorch1.1。硬件环境:CPU:***********************GHz六核;内存: DDR4 64G;GPU: Nvidia GeForce GTX TITAN X。将增广后的数据集以7:3随机分为训练集与验证集,利用添加了通道注意力机制的Tiny-YOlOv3进行交叉验证训练273个epoch,训练过程如图3所示,损失最低在0.6左右,平均检测精度高达80%,实际检测效果如图4所示,头部检测精准人数统计准确率高。
4  结语
添加了通道注意力机制的Tiny-YOLOv3在人体头部检测上取得了较高的准确率,对于公共场所进行人数统计具有较高的应用价值。在接下来的工作中将着重倾向于将注意力机制引入更多的目标检测算法,测试其在小目标检测方面的有效性。
参考文献
[1] 周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251.
[2] Re d mon  J, Fa r h a d i  A. Yolov3: A n  i ncr ement a l improvement[J]. arXiv preprint arXiv:1804.02767, 2018.[3] Hu  Jie ,S h e n  L i ,A l b a n ie  S a m u e l ,S u n  G a n g , e t a l. S queeze-a nd-Excitation Net works.[J ]. I EEE t r a n s a ct io n s  o n  p a t t er n  a n a lysis  a n d  m a ch i n e
intelligence,2019.
[4] 王小鹏,渠燕红,马鹏,等.基于头部图像特征的人流计数方法[J].铁道学报,2019,41(2):82-87.
[5] 鞠默然,罗海波,王仲博,等.改进的YOLO V3算法及其在小目标检测中的应用[J].光学学报,2019,39(7).

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。