^mmmm2021年第05期
(总第221期)基于ResNet算法的垃圾图像识别分类研宄
李妍
(广东白云学院,广东广州510000)
摘要:伴随着社会发展和生活质量稳步提高,垃圾如何处理问题显得尤为重要。该研究采用深度神经网络算法对实际生 活场景中的40种垃圾图片进行识别分类,通过优化ResNet算法提升识别精度,识别率为99.4%。为合理解决垃圾分类 的难题,有效提升资源利用率,减少环境污染提供一定的理论依据。
关键词:垃圾分类;ResNet算法;图像识别
中图分类号:TP391.4 文献标识码:A文章编号:2096-9759(2021 )05-0025-03
Research on garbage image recognition and classification based on RESNET algorithm
LiYan
(Guangdong Baiyun University,Guangzhou,Guangdong510000)
Abstract: w ith the development o f society,the quality o f people’s life has been steadily improved,and the problem o f garbage disposal has become increasingly apparent.In this study,the deep neural network algorithm is used to recognize and classify40 kinds o f garbage images in real life scenes.The recognition accuracy is improved by optim izing RESNET algorithm,and the recognition rate is99.4%. In order to solve the problem o f waste classification,improve the utilization rate o f resources and reduce environmental pollution,a certain theoretical basis is provided.
Keywords: garbage classification;RESNET algorithm;image recognition
〇引言
根据有关部门的统计分析,我国每年产生生活垃圾逾4亿 吨,成为世界垃圾大国之一。就当前形势而言,不管是焚烧、填埋或者生物处理都存在着很多困难。2019年6月,习总书 记就垃圾分类工作做出明确指示,着重强调实施垃圾分类是 社会文明水平的一个主要体现。国内各个地方生活垃圾分类标准虽然不同,但一般可以分成以下四类,分别是可回收垃圾、有害垃圾、厨余垃圾和其他垃圾,而且每个类别下又包含若干 子类别,种类繁多且十分复杂[1]。因此,如何实现垃圾自动识 别分类己然变成急于解决的首要问题。
早期,国内外学者们只是将经典的图像分类算法应用于 垃圾图像分类中,但是这种方法需要手动获取图像的部分特
收稿曰期:2021-03-20
基金项目:广东白云学院校级自然科学类面上项目(项目编号:2020BYKY14)。
作者简介:李妍(1992-),女,吉林榆树人,助教,硕士,从事计算机应用、模式识别机器视觉。
R S R P R S R P占比大于-llOdBm占比^-70
d B m0.11%
^-80
d B m231%
^-90
d B m48.24%
^-98
d B m90.03%
正则匹配一张图片^-lOldBm9239%96.84%
^-(03
d B m92.71%
H05d B m93.05%
96.84%
^-H5d B m99.50%
(2)RS-SINR仿真
R S-S IN R RSRP占比大丁-3dBm占比彡20d B0.55%
^15
d B4.11%
彡6d B46.73%
多O d B97.65%
在-3d B100.00%
^-5
d B100.00%
根据仿真结果可以看出,在R S R P方面,隧道部分大于-llO d B m的比例为96.84%,优于RSRP>-110dB m长度占比
大于95%的要求;在RS-SINR方面,隧道部分大于-3d B部分
占比为100%,优于SINR>-3d B线路长度占比大于95%,可实
现TD-LTE信号的良好覆盖以及保证用户感知。
5结语
本文从粗浅的理论角度介绍了隧道中实现4G覆盖的方
式以及相关的技术要点,在实际的规划设计过程还需要针对
不同的现场做针对性分析。
另外,出于节约投资等目的,隧道内的分析系统一般为多
运营商共用。在解决无线连续覆盖基础上还需对运营商之间
共用分布系统所产生的相互干扰问题进行解决,需要对不同
运营商系统之间的隔离度进行深入分析。
参考文献:
[1]程敏,刘天立.L T E系统链路预算分析[J].广东通信技术,
2012, 32(1):49-52,
[2]郭省力,方俊利,张跃虎.LTE F D D链路预算及覆盖估算
方法研宄[J].邮电设计技术,2012(7):56-60.
[3]俞涛,胡虹,周京胜,等.多山、多隧道地形下的TD-SCDMA
高铁覆盖方案[J].通信与信息技术,2014(2):53-56.
25
征,例如:形状、颜、纹理等,再利用分类器识别。随着卷积神经网络的迅速发展,深度学习的相关算法被应用于机器视觉、模式识别等领域。在国内,郑海龙等人使用SVM方法对建筑垃圾识别分类做了大量研究;向伟等利用分类网络Caffe-Net*通过改变卷积核的大小和网络层数,令它应用在采集的1500张水面垃圾数据集上识别,最后正识率为95.75%。2019年,华为通过举办垃圾图像分类竟赛组建了容量为一万多张的数据集,进而加快此领域的发展速度。国外方面,2012年,AlexNet121获得了 ImageNet图像分类竞赛的第一名,这也表示深度学习在图像领域的迅猛发展。随后,GoogleNet、VGGNet、算法提高了图像识别分类的准确度,同时在人脸识别、车辆检测等多个领域取得了很好的应用效果,而垃圾识别分类在深度学习算法的帮助下也获得了很大的突破。美国斯坦福大学的Yang等人构建了 Trash Net Dataset公开数据集,其中包括6个类别共2527张图片。Odcayar a等利用将不同CNN 网络的分类效果进行比较,然后构建神经网络模型并对相关参数优化,最后在数据集TreshNet Dataset上进行实验,识别率为97.86%,是目前这一数据集上最佳分类网络。在非公开数据集方面,Mittal15^采集了 2561张的垃圾图片数据集GENI,利用GarbNet模型获得了 87.69%的正识率#
就我国发展情况而言还处于初期阶段,目前使用的图像分
深度残差网络[7l(deq»residual networks,Res-Net)是一神基于卷积的、通过加深网络层次来提高精度的网络模型结构,通过采用几个小的卷积核替换一个大的卷积核的方法来减少ResNet模型参数,同时增加ResNet网络模型非线性激活函数
的数量,这使得ResNet模型的计算量减少,进而提高计算效率。如果卷积层中输入与输出特征图的大小一致,那么滤波器数量是保持不变的;如果特征图大小变为原来一半时,滤波器的数量会加倍,特征图的池化层步长设置成2。深度不同的ResNet模型的主要区别表现在卷积层的层次数量,—些图像识别分类项目能够获得很髙的识别精度都因为其网络模型具有较深的网络结构。网络结构通过増多卷积层数量来提取到的更加丰富的特征,这样识别效果也会更好。但是如果只是简单的堆叠网络会造成梯度消失,为了解决这个问题,深度残差网络采用标准初始化(nor-malized initialization)和正则化(intermediate nor-malization)来保留所有的特征变量,使网络模型不会损失精度。当网络结构层次更深时,会出现过拟合现象导致识别效果变得不好。就以上问题,ResNet 网络结构采取与残差学习方法相结合并优化深度网络来提高识别精度和学习速度。从公式来看,初始的最优映射为H(x),通过令非线性层与其他映射F(x)=H(x)-x整合后最优映射变成H(x)=F(x)+x。如果原映射的效果不及残差映射好,那
类算法还没有很好的应用于垃圾处理相关领域,一些应用的算法还存在很多问題,如识别精度不高、泛化性能较差、处理速率低下等〇面对以上问题,应该在网络结构中融合注意力机制模块和特征融合模块用于提髙垃圾图像分类的精准性与鲁棒性。本文提出一种基于Re^Net50网络结构的深度卷积神经网络算法来对40种垃圾图片进行分类,从而提髙垃圾分类的效率。1数据预处理
1.1数据来源
本研究所采用的训练和测试图片都来源于实际生活垃圾,共有40个类别,图片中垃圾的类别格式为“一级类别/二级类别'其
中二级类别为具体的垃圾物体类别,即训练数据集里标注的类别,例如一次性快餐盒、果皮果肉、旧衣服等。一级类别有四种类别:可回收物、厨余垃圾、有害垃圾和其他垃圾。垃圾数据集中包括训练集(有标注)和测试集(无标注),训练集的所有图片被存储在tra in文件夹下面的0~39个文件夹内,文件的名称就是类别标签,测试集内共有仰〇张待分类的垃圾图片在te st文件夹里。
1.2预处理
在数据处理上,采用了麵増强的策略,以一定的概率(0.5) 对图片进行数据增强处理,具体的増强策略包括:颜增强、随机角度、裁剪、水平翻转等,还采取了中值滤波方法进行降噪。
中值滤波法1(3作为一神非线性平滑技术,它的作用是采用排序统计理论降低图片中的噪声。它把每一个像素点相邻区域的全部像素点灰度值的中值作为这个点的灰度值,即把中心像素的值用全部像素值的中间值(不是平均值)替代。中值滤波采用选取中间值的方式来减轻图像孤立噪声点的干扰,对图像中的噪声有很好的的降低效果,与此同时,中值滤波不仅降低了噪声还能够使图像中的目标便捷更加清晰。以上优势是线性滤波方法所不能实现的,而且中值滤波方法实现过程相对简单,对硬件环境的要求也不髙。
2算法描述
2.1ResNet算法处于特殊情况下残差有可能设置为0,这样比较容易将映射逼近另一个映射。如下图。F(x)+x还可以通过
其他方法表示,比如在前馈网络中增加一个能够实现恒等映射的物体。这样的话网络参数的数量会不发生变化,计算也不会繁琐,网络模型仍然能够采用SGD与反向传播来进行端到端的训练。
identity
图1残差网络示意图
ResNet算法把残差网络映射的每一组网络看作是一个构造块(residual block),定义为⑴,公式中x表示输入向量,y表示输出向量;F(x,{Wi})作为待训练的残差映射对公式中x与F的维度存在一定的要求,需要二者相同,否则需要增加线性投影来修改配维度,表示如下:
y=F(x,{Wi})+Wsx(1)传统的卷积神经网络和ResNet算法存在着一些区别,Res~ Net算法为了能让网络层更好的进行学习残差,它将网络输入与其它层直接连接有。传统卷积神经网络卷积在进行训练时会出损失等情况,造成识别精度下降;针对这神情况,Net算法为了保证数据完整性,在卷积层把输入信息绕道传给输出,减少了一些繁琐的工作,提高算法的准确度。ResNet算法具有如下网络设计原则:①特征图大小一致的层具有相同的卷积核;②当进入池化层后,特征图大小变为原来的一半。在残差网络中,用虚线和实线的连接方式来区别网络维度是否匹配。如果网络出现维度不匹配的情况,有两种可选的方案:第一种为直接采用零填充来増添维度,第二神为乘以W矩阵投影到新的空间。ResNet算法提高了基础网络结构的性能,特别是在机器视觉领域的应用,深度卷积神经网络表现出极大的优势。
26
100000
200000
300000 400000 500000
Iter
图2准确率、误差图
4结语
本研宄通过阅读大量的文献,总结多个相关的实验经验, 结合深度卷积神经网络在模式识别中的突出表现,提出了一 种基于ResNet 算法的垃圾图像识别分类算法。本研宄的Res - N e t 网络由5部分组成,分别是卷积层、池化层、全连接层以及 softm ax 层。该模型与传统的卷积神经网络相比,具有以下优 点:避免过拟合,收敛速度快,残差学习网络使深度网络训练 变得容易。垃圾图像正识率为99.4%, ResNet 算法具备较好 的识别效果和鲁棒性,在其他机器视觉的应用领域具有一定 的推广作用。虽然ResNet 算法达到了预期的分类识别效果, 但仍有不足之处,比如实验所用到的图像都是自己拍摄的,目 的性明确,所以喜好片相对噪声较少,而且数据量不是很大。 后续会继续采集图像,加大噪声干扰,以求做出更加精准和更 具实用效果的网络模型。
参考文献:
[1]
董子源,韩卫光.基于卷积神经网络的垃圾图像分类算法
[J ].计算机系统应用,2020,29(08):199-204.
[2] Krizhevsky A , Sutskever I , Hinton GE . Image Net classiil -
cation w ith deep convolutional neural networks.Advances in Neural Inform ation Processing Systems . Lake Tahoe , NV , USA .2012.1106-1114.
[3] He KMjZhang XY,Ren SQ,et al.Deep residual learning for im
age recognition.Proceedings o f 2016 IEEE Conference on Com puter Vision and Pattern Recognition.Las Vegas ^W ,USA .
2016.770-778.
[4] Ozkaya U,Seyfi L .Fine-tuning models comparisons on gar
bage classification for recyclability.ar X iv : 1908.04393,2019.
[5] M ittal G,Yagnik KB,Garg M,et al.Spot Garbage:Smartphone
app to detect garbage using deep learning . Proceedings o f
2016 ACM International Joint Conference .Heidelberg ,Ger - many .2016.940-945.
[6] 邹倩,陆安江,李春红.一种中值滤波和改进阈值函数的图像
去噪算法[J ].智能计算机与应用;2020,10(08):124-126+130.
[7] 朱超平,杨艺.基于Y 0L 02和ResNet 算法的监控视频中
的人脸检测与识别[J ].重庆理工大学学报(自然科学),
2018,32(08):170-175,
[8] 陈玉洁.基于神经网络的手势识别算法的设计与实现[D ].
湖南大学,2019.
2_2 softmax 分类器
本文研宄的是多个类别的分类实验,所以采用了 softmax 分类器'该分类器与全连接层完全连接,输出输入目标所对 应的每个种类的概率值。假设有N 个输入目标{Xt • yi 纪,,每个 目标的标记.V, e 仏2...4k 为模型输出类别的种类数(设2)。本 文做的是垃圾图像的分类工作,共分为40个类别,k 的取值为 40。对于给定的输入xi ,用假设函数估计出其对应类别
j 的概率值吒,,巧>,)。8是so to a x 分类器的参数,为保证概率
和为1,使用土#进行归一化。Soflmax 分类器的损失函数为:
J {x ,y ,0)=-N
I
⑵
公式中1 (;y ,=y )表示指示性函数,函数的取值与括号内的 真值相同,当;y ,=/成立时函数值为1 ,不成立时函数值为0,最
后通过adamoptimizer 优化器最小化误差函数。
3实验结果与分析 3.1数据集的选用
本研宄的工作是在基于垃圾识别分类中两个数据集上来 进行实验的,两个数据集分别是:训练集train 和测试集test 。训 练集包含了 40个类别,共1000张垃圾图像,测试集包含了 40 个类别,共400张垃圾图像。此次实验采用1000张采集到的图 片对ResNet 网络进行训练。首先对图像进行预处理,考虑到网 络模型结构把图像裁剪为224*224,然后对图像进行中值滤波 操作,按批训练样本数对数据进行划分,为网络训练奠定基础。 3.2实验结果与分析
ResNet 算法中网络模型的训练性能和识别效果的好坏影 响因素之一就是超参数。试验中将网络模型中的学习率设置 为0.002,批训练样本数设置为4,训练集图片数量设置为 1000,验证集数据量设置为400,迭代次数设置为6000次,结 果显示在验证集上的正确率为98.9%,实验结果表明该模型 整体识别效果很好。无论是训练集还是验证集,ResNet 算法 都具有收敛速度快、正识率高的优点;同时在验证集上的识别 效果比训练集上好,说明网络避免了过拟合现象。当设定学 习率为固定值0.0002时在验证集上正识率为99.4%, Res -
Net 50模型在不同学习率不同时的准确率、误差如图2所示。
training
1500000
2000000
2S O O O O O
iter
9
in
i n i ai t r 8
6 4
2
0 00.0.y e /
s
l n o l
27
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论