2021⁃02⁃10
计算机应用,Journal of Computer Applications 2021,41(2):517-522ISSN 1001⁃9081
CODEN JYIIDU http ://www.joca
基于单点多盒检测器的全局-局部层级的域适应目标检测
蒋
宁1,2
,方景龙1*,杨
庆3
(1.杭州电子科技大学计算机学院,杭州310018;2.宁波城市职业技术学院信息与智能工程学院,浙江宁波315110;
3.南京工程学院计算机工程学院,南京211167)
(∗通信作者fjl@hdu.edu )
摘要:在目标检测领域里通常希望在拥有大量标记的场景中训练好的模型能够应用在无标记的其他场景中,但
是不同的域分布往往是不同的,这样往往导致域迁移时模型性能的急剧下降。为了提高域迁移时模型的目标检测性能,通过两个层级来解决域迁移问题,包括全局层级迁移和局部层级迁移。这两种层级迁移分别对应不同的特征对齐方式,即全局层级采用选择性对齐方式,局部层级采用完全对齐方式。所提域迁移框架基于单点多盒检测器(SSD )模型,在全局和局部层级分别配置相应的域适配器以减少域间差异,通过对抗网络算法实现具体训练,再通过一致性正则化来进一步提高模型的域迁移性能。通过大量实验验证了提出的域迁移模型的有效性,结果表明同目前常见的域适应-快速区域卷积(DA -FRCNN )模型、对抗识别域适应(ADDA )模型以及动态对抗适应网络(DAAN )模型等三种域迁移模型相比,该模型在不同数据集上的均值平均精度(mAP )可以提高5%~10%。
关键词:目标检测;域适配器;域迁移;对抗训练;特征对齐;卷积层;损失函数;单点多盒检测器中图分类号:TP391.9
文献标志码:A
Global -local domain adaptive object detection based on single shot multibox detector
JIANG Ning 1,2
,FANG Jinglong 1*,YANG Qing 3
(1.School of Computer Science and Technology ,Hangzhou Dianzi University ,Hangzhou Zhejiang 310018,China ;
2.School of Information and Intelligent Engineering ,Ningbo City College of Vocational Technology ,Ningbo Zhejiang 315110,China ;
3.School of Computer Engineering ,Nanjing Institute of Technology ,Nanjing Jiangsu 211167,China )
Abstract:In the field of object detection ,it is hoped that the model trained in the domain with a lot of labels can be
applied to other domains without labels ,but different domain distributions are always different to each other ,such difference will result in a sharp decline of model performance in domain transfer.To improve the model performance of object detection in domain transfer ,the domain transfer was addressed on two levels ,including the global -level transfer and the local -level transfer ,which were corresponding to different feature alignment methods ,that is ,the global -level adopted selecti
ve alignment and the local -level adopted full alignment.The proposed domain transfer framework was constructed based on Single Shot MultiBox Detector (SSD )model and was disposed of two domain adaptors corresponding to global and local level respectively for the purpose of alleviating the domain difference.The specific training was implemented by the adversarial network algorithm ,and the consistency regularization was used to further improve the domain transfer performance of the model.The effectiveness of the proposed domain transfer model was verified by many experiments.Experimental results show that on various datasets ,the proposed model outperforms the existing common domain transfer models such as Domain Adaptation -Faster Region -based Convolutional Neural Network (DA -FRCNN ),Adversarial Discriminative Domain Adaptation (ADDA ),Dynamic Adversarial Adaptation Network (DAAN )by 5%-10%in term of mean Average Precision (mAP ).
Key words:object detection;domain adaptor;domain transfer;adversarial training;feature alignment;convolution
layer;loss function;Single Shot MultiBox Detector (SSD)
0引言
目标检测是机器学习中一个热点问题,它包括对图像进
行分类和定位两种检测。近年来,基于深度卷积网络(Deep Convolutional Neural Network ,DCNN )的鉴别分类器在目标检测方面取得了很大的进展[1],但同一模型在不同场景中的目
标检测性能经常大相径庭,因为不同场景的样本实际不服从同样的分布。虽然基于卷积神经网络(Convolutional Neural Network ,CNN )的方法在目标检测方面取得了显著的进展,但它仍然依赖于大量标记的训练数据。当将上述方法应用于具有未标记数据的不同场景时,在域迁移中会发生显著的性能下降。虽然收集更多训练数据可能会减轻域迁移的影响,但
文章编号:1001-9081(2021)02-0517-06
DOI :10.11772/j.issn.1001-9081.2020050622
收稿日期:2020⁃05⁃23;修回日期:2020⁃08⁃03;录用日期:2020⁃08⁃04。
基金项目:浙江省教育厅科研项目(Y201533716);江苏省科技计划项目(BY2016008-02)。作者简介:蒋宁(1974—),男,浙江宁波人,高级系统分析师,博士研究生,主要研究方向:人工智能、虚拟现实;方景龙(1964—),男,江西景德镇人,教授,博士,主要研究方向:人工智能、机器学习;杨庆(1976—),女,江苏南京人,副教授,博士,主要研究方向:虚拟仿真、图形图像。
第41卷计算机应用
获取足够标记数据和注释边界框通常是耗时和昂贵的,因此,需要改进算法,使目标检测模型适合于训练域视觉上不同的新域[2]。
为解决跨域目标检测中的域迁移问题,本文提出了一种新的域自适应方法,以减轻域迁移的负面影响,并应用于以下场景:在源域中实施完全的监督,而在目标域中则没有监督,注释成本很低。构建基于单点多盒探测器(Single Shot
MultiBox Detector,SSD)模型端到端的深度学习模型[3],称为域自适应全局-局部SSD(Global-Local-SSD,GL-SSD)。尝试利用这种新方法来最小化域差异,域迁移既可以发生在全局层次也可以发生在局部层次的级别上,全局层次所代表的特征包括噪点、分辨率、颜等基于整个图像层面的特征;而局部层次所代表的特征就是指诸如纹理、材质以及大小等能代表某一个实例对象的特性,它是基于实例层面的。目前流行的源域与目标域的对齐方式采用的就是所谓强制性对齐方式[4],即要对齐所有的图像要素,包括背景、场景布局等无关因素,这种方式对于域之间的差异较小时还是有效的,但是对于域间差异较大的情况,则会造成检测性能的急剧下降,因为强制性对齐不同域的背景或者布局是没有太多意义的,因此强制性的对齐方式最适合针对局部特征的对齐,而对于全局层面的对齐方式,可以采用选择性的对齐方式。基于上述研究,为了解决域迁移问题,本文分别将基于全局和局部层面的两
个域适配器组装入SSD模型以最小化两域之间的差异,衡量差异的指标采用的是交叉熵距离。通过训练这两个域适配器,并利用对抗训练策略[5]取每个适配器中健壮且域不变的特性,结合不同层次域适配器之间的一致性正则化来进一步学习SSD模型中的域不变特性。
本文主要工作如下:
1)设计两个域适配器,分别在全局和局部层面两个级别上解决域差异。
2)针对全局层和局部层,分别采用不同的对齐方式,全局层采用选择对齐方式,局部层采用全对齐方式。
3)提出一种一致性正则化方法将全局和局部两个层面的域适配器进行调整。
4)将提出的适配器组装入SSD模型,使得整个系统可以进行端到端的训练。
最后使用多个数据集(包括Sim10k、Kitti、Cityscapes等)进行了大量的实验,以评估本文提出的领域自适应SSD(以下简称GL-SSD)算法。实验结果表明本文提出的解决目标检测领域转移的方法在性能上要明显优于其他基于SSD的目标检测方法。
1相关工作
目标检测的任务是到图像中的所有对象并获取它们的位置和大小。由于各种物体具有不同的形状、大小和数量,并且相互遮挡,目标检测一直是机器视觉领域最具挑战性的问题之一。在现有方法中,单点多盒探测器(SSD)因其有效性和实时性而获得了显著的优势。SSD使用每个阶段的多层功能图生成锚。结果表明,SSD法不仅精度高,而且实时性也非常好。SSD非常灵活,可以扩展到其他任务,例如对象分割。然而,这些工作集中在常规设置上,没有考虑对象检测的域自适应问题。本文以SSD作为基本检测器,提高了它在新目标域中的目标检测泛化能力。
在计算机视觉中,领域适应已经被广泛研究用于目标检测,为了解决域适应问题,最基本的思路就是测量不同域特征分布之间的距离,这个距离可以采用多种度量方式,最终通过不断迭代训练特征提取器最小化域之间的距离。在过去几年中,域适应性已经被包括文献[6-8]在内的深层神经网络广泛使用。传统的方法包括:子空间对齐[9]通过映射矩阵对齐源数据和目标数据;传递分量分析(Transfer Component
Analysis,TCA)[10]方法通过主分量分析(Principal Component Analysis,PCA)学习一个潜在子空间,以减轻跨域间的分布偏移;混合异类传输学习[11]旨在以多层映射矩阵的形式对齐数据;最大独立域自适应[12]试图通过学习与域特征具有最大独立性的特征来研究分布中的跨域移动;转移子空间学习[13]试图将不独立且分布在选定子空间中的不同域之间的布里格曼发散最小化,联合分布自适应(Joint Distributed Adaption,JDA)[14]可以构造一种有效的、鲁棒的新特征表示,即在一个主要
降维过程中,通过同时适应边际分布和条件分布,得到了实质性分布差。与这些工作不同的是,本文关注的是目标检测问题,这是一个更具挑战性的问题,因为目标定位和分类都需要预测。目前常用的方法是通过域分类器来度量域之间的差异值,本文采用生成对抗算法来训练域分类器。
2对象检测的域适应
本章将详细介绍本文提出的基于SSD全局-局部域适应方法。由于目标域是无标签以及无包围盒标记的,因此必须通过无监督训练实现源域到目标域的迁移,本文在SSD基础模型中引入了两个域适配器,分别是基于全局以及局部的域适配器。这两种适配器本质上属于域识别器,通过对抗学习算法能够促使这两种识别器学习到域不变特征,进而形成域适配器,对于这两种分类器拟采用不同的对齐方式来对齐源域与目标域。
2.1总的框架
在SSD框架的基础上新增两个域适应组件(基于全局-局部的域适应组件),构成基于SSD的域适应模型。定义基于源域的目标检测损失函数为L det,则总的损失函数定义如下:L()
G
min,D max
=L det+λ(L L+L G+L REG)(1)其中参数λ是一个调参参数,用来控制SSD目标检测损失和对抗损失的比例,平衡目标检测损失和对抗训练损失。通过生成对抗网络(Generative Adversarial Network,GAN)算法以端到端的方式训练网络,在传播过程中能够自动反转梯度符号。SSD域适应整体架构如图1所示:基于全局和局部层级在第6个卷积层到第11个卷积层分别添加域分类器,每一个域分类器都采用对抗训练模式。在此基础上添加连续正则器以便进一步学习域不变特征。
2.2基于全局层级的域适配
基于全局层的自适应:所谓全局层差异是指源域和目标域之间基于整个图片的差异,包括噪点、分辨率、颜等信息,SSD算法是基于VGG16(Visual Geometry Group Network16)结构的,不同之处在于将VGG16最后的2个全连接层改成卷积层,并且又增加4个卷积层。我们使用了一系列基于多尺度的域分类器,即针对这6个卷积层分别添加域分类器,在每个添加的特征层上训练每个域分类器,域分类器实际上预测每个添加特征层的域标签,这种基于多尺度的设计有助于增
518
第2期
蒋宁等:基于单点多盒检测器的全局-局部层级的域适应目标检测
加域分类器训练样本的数量。
本文采用对抗训练方法来匹配两个领域之间的特征分布,生成器首先利用神经网络把数据映射为高层特征,使生成的特征尽可能地迷惑判别器,使之难以判别特征来源于哪一个领域;领域判别器的目标是尽可能准确地判别生成器产生的特征来源于哪一个领域,二者相互对抗优化,最终在达到平衡时,两个领域的特征分布足够接近。在基于SSD 的域适应领域中,为了更好地训练域分类器,需要将样本区分为易分类样本和难分类样本。所谓易分类样本就是源域和目标域相对应区域的样本差异很明显,难分类样本则是针对源域和目标域相对应区域很难区分的样本。采取的策略是将注意力集中于难分类样本,提高难分类样本的权重,降低易分类样本的权重,形式化表示为:
X s ={i s n ,b s n }m
n =0
其中:X s 代表源域中包含了m 个图片的集合,它包括两部分元
素,分别是i s n (表示带标签的源域图片)和b s
n
(表示带包围盒标记的源域实例)。
X t ={i t n }m n =0
其中:X t 代表目标域中包含了m 个图片的集合,目标域没有标
签;i t n 表示目标域图片;领域判别器由D 表示。设源域的域标
签值为0,目标域的域标签值为1,样本域分类的概率越大,则对损失函数的影响越小,因此可以采用FOCAL LOSS :
FL (p )=-f (p )log (p )(2)f (p )=(1-p )γ
(3)
其中:γ是调制系数,目的是通过控制系数大小来减少易分类
样本的权重,从而使得模型在训练时更专注于难分类的样本,定义全局层的源域分类损失函数为L GS ,目标域的损失函数为L GT ,两者的平均值构成了全域的损失函数L G ,这里G j
(j ∈[1,6])表示分别对SSD 中6个卷积层调用特征提取。
L GS =-1n s ∑i =1n
s ∑j =1616
(D (G j (x s i ))γlog (1-D (G j (x s
i )))(4)L GT
=-1n t ∑i =1n
t ∑j =161
6
(1-D (G j (x t i ))γlog (D (G j (x t i )))
(5)
L G =
1
2(L GS
+L GT )(6)其中:
n s 和n t 分别为源域和目标域样本的数量;G j ()(j ∈[1,6])表示分别对SSD 中6个卷积层调用特征提取。
2.3
基于局部层级的域适配
基于局部层面的自适应是针对实例检测的,局部域分类
器更多关注的是本地局部特征而不是全局特征,基于局部层面的域分类器由三层卷积神经网络构成,核
大小设为1,输出激活函数设置为Sigmoid 函数,基于SSD 的最后6个卷积神经网络通过生成器分别输出6个特征图,这6个特征图作为输入分别传给对应的6个域分类器,损失函数采用的是最小二乘法对域分类器进行训练。这种类型的损失函数有助于提高域分类的鲁棒性,并且在实验中也得到了验证,证明其对于局部排列是非常有效的。基于局部层面的损失函数L L 由两部分组成:源域的损失函数L LS 和目标域的损失函数L LT 。它们的
表达式如下:
L LS =1n s wh ∑i =1n s ∑w =1W ∑h =1H
∑j =1616
(1-D l (G j (x s i ))wh )2
(7)L LT
=1n t wh ∑i =1n
t ∑w =1W ∑h =1H
∑j =1616
(D l (G j (x t i ))wh )2(8)
L L =
1
2(L LS
+L LT )(9)其中:
D l (G j (x t i ))wh )表示在特征图中的每一个位置处输出的域分类值,w 和h 分别表示特征图的宽和高
2.4
一致的正则化
通过实施一致的正则化技术来提高模型的性能,当采用
对抗学习训练模型时经常会造成训练不稳定的情况发生,尤其是如果训练的数据不足,则会造成严重的过适应现象,即使采用微调的方式也还是会造成过拟合现象,因此本文采取一致正则的方式来提高训练的稳定性,正则距离采用L2距离,表达式如下所示:
L REG =
L G -L L 2
(10)
3实验结果与分析
3.1
数据集和基准配置
将本文算法应用在两个域迁移场景中,分别由3个数据集组成:
1)Sim10k 数据集。Sim10k 包含了10000张图片以及相应的58701个包围盒标记,这些图片都是由游戏引擎渲染出来的合成图片,标记物包括小汽车、摩托车和人。
2)Cityscapes 数据集。Cityscapes 包含50个城市在春夏秋三个季节不同时间段不同场景、背景的街景图,提供5000张精细标注的图像、20000张粗略标注的图像和30类标注物体[15]。用PASCAL VOC
标准的两个区域重叠的部分除以两个
图1SSD 域适应架构
Fig.1Architecture of SSD domain adaption
519
第41卷
计算机应用区域的集合部分(Intersection -Over -Union ,IoU )的得分来对算法性能进行评价。
3)KITTI 数据集。该数据集中每张图像最多显示15辆汽
车和30名行人,各自有不同程度的遮挡。数据集共包含200000张以上的3D 标注物体的图像,涵盖了市区、乡村和高
速公路等场景,包括图片、视频、雷达数据等数据类型
[16]
。
本文所涉及到的域迁移场景包括:A 场景:Sim10k to KITTI (S→K );B 场景:KITTI to Cityscapes (K→C )。
实验的基准配置如下:将GL -SSD 算法同其他四种域适应算法作性能比较,这四种算法分别是:1)基于源域训练模型,即将只针对源域进行训练的模型直接应用于目标域,并没有采用域适应算法;2)域适应-快速区域卷积神经网络(Domain Adaptation -Faster Region -based Convolutional Neural Network ,DA -FRCNN )模型[17],该模型基于Faster CNN 的域适应模型算法,也是第一个针对目标检测的域适应方法;3)对抗识别域适应(Adversarial Discriminative Domain Adaptation ,ADDA )模型[18],该模型主要用于解决基于非监督的对抗域适应;4)动态对抗适应网络(Dynamic Adversarial Adaptation Network ,DAAN )模型[19],该模型采用动态对抗思想来解决域
适应问题。3.2
量化结果
为了验证本文的GL -SSD 方法,在这两个域迁移场景中实
施了大量实验,对于每一轮实验,都采用如下四个步骤:1)随机取样固定数量的目标域图片,数量取决于用于比较的类个数;2)逐步组合GL -SSD 方法里的几个适配器,运行后计算基于平均精确值(Av
erage Precision ,AP )和各类别AP 的平均值(mean Average Precision ,mAP )的性能[20];3)在相同的样本图片上运行其他目前流行的域迁移方法,计算出AP 和mAP 性能;4)分别比较这几种方法的AP 和mAP 性能,推演出最终结论[21]。
场景A 检测结果:首先评估从Sim10k 到KITTI 域适应的性能。这两个域都是有关交通工具的场景,因此具有一定的相似性。正如表1所描述的,GL -SSD 在15种类别的目标检测
AP 明显优于SSD 模型的,与ADDA 、DA -FRCNN 和DAAN 模型
相比,GL -SSD 除了fence 和pole 类别精确度小于这三个模型,其他种类的AP 都高于上述三个模型。表3显示了不同方法的最终性能效果(用mAP 值表示),G 表示全局,L 表示局部,R 表示正则。具体性能比较包括以下几个方面:1)与其他四个模型算法进行比较,单独采用全局或者局部SSD 域适应方法的目标检测(mAP )在性能上明显优于基于源域训练模型,与其他三种模型在性能上差别不大,但是如果将这两种域适应算法组合起来,性能就会明显优于其他三种训练模型,表明基于不同层次的对齐可以起到互补的效果。
进一步分析发现单独采用全局SSD 域适应方法提高的mAP 要高于单独采用局部SSD 域适应方法提高的mAP ,可以认为这是因为Sim10k 是虚拟场景而KITTI 是真实场景,两个
场景的差别还是明显的,易分类样本较多,所以采用全局域适应效果更加明显。将两种域适应结合则mAP 值可以提高更多,说明这两种域适应可以起到互补的作用。如果再将一致性正则应用到场景中,则GL -SSD 相比ADDA 、DA -FRCNN 、DAAN 的mAP 值分别提高了5.97、8.05、5.4个百分点,达到了45.62%。
场景B 的检测结果:场景B 指的是KITTI to Cityscapes (K→C ),如表2所示,检测结果与场景A 类似,GL -SSD 在15种类别的目标检测AP 也是明显优于SSD 模型的,与另外三个模型相比,GL -SSD 除了Bldg 和Sign 类别准确度小于三个模型,其他种类的AP 都高于这三个模型。如表3所示,同其他三种模型比较,分别单独采用全局域适应方法、局部域适应方法以及将这两种方法组合起来都能提高域迁移检测性能,但是同场景A 的检测结果还是有一个明显的区别,就是采用全局域适应方法提高的mAP 值要小于采用局部域适应方法,本文认为这是因为Cityscapes 和KITTI 都是有关交通方面的场景,其相似程度要高于场景A ,易分类样本较少,所以采用局部域适应效果会更好些。当然将一致性正则继续应用到场景B 中也能提高mAP 值,达到了43.28%,相比ADDA 提高了2.94个百分点。
表1Sim10k→KITTI 域迁移AP 定量结果
单位:%Tab.1
AP quantitative results for Sim10k→KITTI domain transfer unit :%模型SSD
[3]
ADDA [18]
DA -FRCNN [17]DAAN [19]GL -SSD (G+L+R )
目标类别road 30.640.638.639.545.3sidewalk 28.441.642.740.642.5bldg 34.737.643.642.647.4
wall
35.638.935.946.848.9fence 30.443.743.640.642.8
pole 28.943.842.843.542.4
light 33.636.835.736.435.8sign 31.839.838.535.434.6
sky 32.540.638.941.640.7
person 35.642.737.840.550.5
rider 31.641.640.641.952.4
car 32.842.745.848.556.3
bus 35.738.534.640.751.4
mbike 34.639.635.342.643.4
bike
31.440.438.745.646.2表2
KITTI→Cityscapes 域迁移AP 定量结果
单位:%Tab.2
AP quantitative results for KITTI→Cityscapes domain transfer unit :%模型SSD [3]ADDA [18]
DA -FRCNN [17]DAAN [19]GL -SSD (G+L+R )
目标类别road
31.440.641.840.543.3
sidewalk 27.542.640.141.245.3
bldg 33.745.645.743.643.6
wall 34.638.936.845.845.9
fence 32.446.545.647.544.8
pole 26.945.644.846.643.4
light 32.640.336.741.441.8sign 32.838.434.535.832.7
sky 33.538.937.941.641.7
person 32.641.740.539.548.5
rider 33.643.642.641.251.6
car 31.838.643.546.557.3
bus 34.737.836.639.750.6
mbike 32.640.734.341.641.2
bike 29.437.835.742.846.8
520
第2期蒋宁等:基于单点多盒检测器的全局-局部层级的域适应目标检测
3.3
定性结果
基于场景A (Sim10k→KITTY )的实验结果如图2所示,可
以非常清楚观察到采用GL -SSD 方法模型能够形成更加紧密的包围盒,尤其是针对那些不易辨认的小目标,GL -SSD 的查正确率要高于其他三种模型(如图2(a )基于DA -FRCNN 的目标检测中远处的一辆小白车没有检测出来)。3.4
排名前列的检测错误分析
上述实验结果表明,全局和局部域适应方法都有助于提高域迁移的能力,接下来将通过分析检测错误指
标来进一步验证全局和局部域适应方法的有效性。将场景A (Sim10k→KITTI )作为分析案例,分别选择前1000个可信度最高的检测应用于每个域适应方法,包括基准SSD 、ADDA 、DA -FRCNN 以及GL -SSD 域适应方法,参考文献[22],将检测结果分为三类:
正确率检测、错误定位检测以及背景错误检测。
正确率检测指的是IoU 的值大于0.5[23],即认为是正确的分类;错误定位检测指的是虽然分类是正确的,但是IoU 值介于0.1和0.5之间;背景错误检测指的是分类是错误的或者虽然分类是正确的,但是IoU 值小于0.1。从表4可以看出采用GL -SSD 域适应方法比其他三种方法的正确率都要高,并且背
景错误率也低于其他三种模型。
4
结语
本文提出了一种新的无监督域自适应方法,该方法在
SSD 模型基础进行改进,分别从全局和局部层面采用不同的
域对齐方式:全局层面通过强化难分类样本实现选择性对齐,局部层面则采取完全对齐的方式。本文分别使用两种域适配
器来对应这两个层面的训练,在SSD 模型最后6个卷积层分别添加一个域适配器,有助于增加域分类器训练样本的数量,并进一步应用一致性正则化来学习域不变量特征。域适配器采用基于交叉熵的对抗训练算法进行端到端的训练,它是一种有效的跨域目标检测方法,能够最小化域之间的差异。本文方法在不同域适应情况下得到了验证,基于多个数据集的实验结果表明,GL -SSD 模型在域迁移性能上明显超过了基准SSD 模型,并且也比ADDA 、DA -FRCNN 、DAAN 等常见域适应算法的性能要好,今后将考虑采用深度更深的VGG19取代VGG16网络结构,并在此基础上尝试与2020年最新的域适应
模型作比较,以便更好验证GL -SSD 模型目标检测的有效性。参考文献(References )
[1]BEN -DAVID S ,BLITZER J ,CRAMMER K ,et al.A theory of learning from different domains [J ].Machine Learning ,2010,79(1/2):151-175.
[2]
BILEN H ,VEDALDI H.Weakly supervised deep detection
networks [C ]//Proceedings of the 2016IEEE Conference on
Computer Vision and Pattern Recognition.Piscataway :IEEE ,2016:2846-2854.
[3]
LIU W ,ANGUELOV D ,ERHAN D ,et al.SSD :single shot multibox detector [C ]//Proceedings of the 2016European Conference on Computer Vision ,LNCS 9905.Cham :Springer ,2016:21-37.
[4]
BEN -DAVID S ,BLITZER J ,CRAMMER K ,et al.Analysis ofrepresentations for domain adaptation
[C ]//Proceedings of the 19th International Conference on Neural Information Processing Systems.Cambridge :MIT Press ,2006:134-147.
[5]BUSTO P P ,GALL J.
Open set domain adaptation [C ]//
Proceedings of the 2017IEEE International Conference on Computer Vision.Piscataway :IEEE ,2017:754-763.
[6]
GOODFELLOW I J ,POUGET -ABADIE J ,MIRZA M ,et al.Generative adversarial nets [C ]//Proceedings of the 27th International Conference on Neural Information Processing Systems.
Cambridge :MIT Press ,2014:2672-2680.[7]DENG J ,DONG W ,SOCHER R ,et al.ImageNet :a large -scale hierarchical image database [C ]//Proceedings of the 2009IEEE Conference
on
Computer
Vision
and
Pattern
Recognition.
Piscataway :IEEE ,2009:248-255.
[8]
JIA Y ,SHELHAMER E ,DONAHUE J ,et al.Caffe :convolutional architecture for fast feature embedding [C ]//Proceedings of the 22nd ACM International Conference on Multimedia.New York :
ACM ,2014:675-678.
[9]
蔡国永,贺歆灏,储阳阳.图像整体与局部区域嵌入的视觉情感分析[J ].计算机应用,2019,39(8):
2181-2185.(CAI G Y ,HE X H ,CHU Y Y.Visual sentiment analysis by combining global and
local regions of image [J ].Journal of Computer Applications ,
2019,39(8):2181-2185.)
[10]PAN S J ,TSANG I W ,KWORK J T ,et al.Domain adaptation via transfer component analysis [J ].IEEE Transactions on Neural Networks ,2011,22(2):199-210.[11]GANIN Y ,USTINOVA E ,AJAKAN H ,et al.Domain adversarial training of neural networks [J ].Journal of Machine Learning
Research ,2016,17(59):1-35.
[12]
HE K ,GKIOXARI G ,DOLL´P ,et al.Maximum independent domain adaptive [C ]//Proceedings of the 2014IEEE International Conference on Computer Vision.
Piscataway :IEEE ,2014:
表3
域迁移mAP 定量结果
单位:%Tab.3mAP quantitative results for domain transfer
unit :%
方法SSD [3]
ADDA [18]
DA -FRCNN [17]DAAN [19]GL -SSD
G
√√
√
L
√√√
R
√
S→K
33.9239.6537.5740.2238.6237.4243.7245.62K→C 32.6840.3438.5840.6836.4539.1242.5643.
28
图2
基于DA -FRCNN 和GL -SSD 的检测结果对比
Fig.2
Detection results comparison of DA -FRCNN and GL -SSD
表4
检测错误分析
单位:%Tab.4
Detection error analysis
unit :%
检测模型SSD [3]
ADDA [18]
DA -FRCNN [17]GL -SSD
正确率检测
30.2
46.745.650.4正则化是最小化策略的实现
错误定位检测
33.4
31.230.729.8
背景错误检测
36.422.123.719.8
521
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论