• 15
针对目前3D点云分类方法在场景语义理解中点云密度信息利用不足的问题,提出一种集成的3D点云场景语义分类方法,该方法由基于Mean-shift 提取特征的语义分类方法与基于最优邻域提取特征的语义分类方法集成。使之适用于一般场景语义分析。实验以大型电力走廊场景数据集为研究对象,首先使用基于Mean-shift提取特征的语义分类方法对点云分割得到分类结果,在此基础上利用一平面分离出电力线这一类别,与基于最优邻域提取特征的语义分类方法得到的结果进行合成。在合成前,还采用基于Cut-Pursuit 正则化框架进行平滑,以提高整体的分类精度。实验结果表明,本文所提出的3D点云分类方法的总体精度为97.96%,在Oakland公开数据集实验中,所提出的方法的总体精度为97.54%。在电力线类别精度最为显著,能和目前最新的方法相比,能推广到其他数字场景3D点云分类工作中。
随着无人驾驶、高精地图、智慧城市等新概念的提出,以及高性能的传感器不断推陈出新,为大规模三维
场景语义分析与理解提供了良好的发展机遇,但同时也面临新的挑战。而语义分类作为三维场景语义分析和理解的基础,已经成为计算机、测绘、导航等领域的研究热点,具有重要的研究价值和广阔的应用前景。
在现有的点云语义分割技术中,场景语义分割效果不佳,特别是电力线类别分割效果较差,且只能在特定场景中应用,算法的泛化能力不强。且只考虑点和点之间的邻域关系,对点云密度信息利用有待挖掘,针对此问题提出采用均值漂移技术,挖掘点云中点的密度关系。综上所述,本文针对点云语义分割技术不足,特别是在场景语义理解中,利用均值漂移算法对电力线聚类作为点云邻域选取,融合了基于最优邻域特征选取,实验数据集选用了实验室本身收集电力走廊场景数据集测试和目前所知道点云分类效果最新的数据集进行测试,根据结果可以看到极大改善整体点云和电力线类别的分类效果及提高整体分类精度,在不同场景语义分割都取得良好效果,算法有一定的鲁棒性。还利用Cut-Pursuit进行正则化,对点云平滑处理以提高分类精度。
1  提出的方法
对于点云分类,本文提出一种新的方法,包括采用Mean-shift算法聚类提取特征结合随机森林分类得到其中一路的分类标签,我们称为标签Ⅰ,而采用搜索最优邻域基础上提取特征使用分类器分类得到另一路的分类标签,称为标签Ⅱ。然后把标签Ⅰ、标签Ⅱ输入到基于Cut-Pursuit 正则化框架进行正则化,最
后,在标签Ⅰ上采用一个平面划分出电力线类,利用电力线类点的序号修正标签Ⅱ电力线类的标注。本文算法流程如图1所示。
其主要处理步骤为:
(1)对数据集进行划分为训练集和测试集,由于数据集可能存在不平衡的现象,我们对数据进行增强,包括翻转、延长等技术处理。
(2)先对点云数据分别采用Kd搜索邻域及选择最优邻域、Mean-shift聚类。
(3)在此基础上分别提取包括21个2D和3D几何特征向量和点邻域上的xy、yz、xz平面的的平均值、方差、开平方、中间值等,一共33
个维度特征。
正则化 归一化图1 本文提出的算法流程图
(4)在得到33维特征下,对其进行归一化,选择RF分类器,利用整体的精确度指标轮询,寻出最优特征组合,使得各个类别的整体精确度、召回率达到最好,同时得到一个粗分类的标签。
(5)采用一个基于 Cut-Pursuit正则化框架来平滑点云分类标签,进一步提升整体的分类准确度。
(6)使用基于Mean-shift聚类提取特征的语义分类方法得到的结果,利用一个平面分割出的电力线类别,切割平面可以根据空间上三个点确定一个平面,计算公式如下Ax+By +Cz+D=0,这样就可以利用待定公式求解了,而且很容易到空间上任意三个点划分出电力线,使用基于最优邻域提取特征的三维点云分类方法剔除电力线类别得到剩余的类别相融合,得到最终的语义标签。
1.1  Mean-shift聚类算法实现
假设在一个三维空间中有很多数据点需要进行聚类,Mean-shift聚类算法实现如下:
输入:n × 3矩阵,代表点的个数。
输出:m × 1向量,m <n代表存储的是每个点的聚类标号。
(1)在未被标记的数据点中随机选择一个点作为中心O;
(2)出离O距离在r之内的所有点,记做集合I k(x),认为这些点属于簇c i。同时,把这些求内点属于这个类的频率加1,这
个参数将用于最后步骤的分类。
(3)以O为中心点,计算从O开始到集合I k(x)中每个元素的向量的M k(x),我们引入了高斯核M k(x)改写为:
一种集成的3D点云场景语义分类方法广东工业大学自动化学院  韦昌勇  寇小东
• 16
,其中:
。(4),即O 沿着M k (x )的方向移动,移动距
离是
(5)重复步骤(2)(3)(4),直到M k (x )的大小很小(就是迭代到收敛),记下此时的O 。同时把这个迭代过程中遇到的点都应该归类到簇c i 。
(6)如果收敛时当前簇c i 的O 与其它已经存在的簇c j 中心的距离小于阈值,那么把c i 和c j 合并。否则,把c i 作为新的类。
(7)重复(1)(2)(3)(4)(5)直到所有的点都被标记访问。
(8)分类:根据每个类,对每个点的访问频率,取访问频率最大的那个类,作为当前点集的所属类。1.2  特征的提取
在计算好点的最优邻域基础上,利用协方差C 的特征值提取几何特征。包括21个2D 和3D 几何特征向量,
还有点邻域上的xy 、yz 、xz 平面的的平均值、方差、开平方、中间值等,一共33个特征值。而使用Mean-shift 聚类则在每一类聚类标号提取33维特征。输出的特征为n × 33,n 代表点的个数。特征之间可能存在正相关或者负相关,还可以通过分类评判指标轮寻最优特征降低特征维度,减少训练时间,提高分类精度。1.3  分类器选择
对于分类器的选择,我们关注的是对数据的适用性和结果的可重复性,因此选择的分类器应该是易于使用,而不需要进行太多参数的选择,并且能在不同平台上可用。为了处理巨大的点云数据,必须采用一个强大且计算高效,特别是面对大型数据集的可伸缩性,随机森林就是一个经典的方法,通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树。通过随机抽取完整训练集得到的子集,对每一个子训练集训练得到一个同类型的弱分类器,从而获得多样性。在输入的训练集大的情况下,还能保持较高的效率包括简单性和高度的并行性,从而产生快速的分类方案,此外还提供对异常值、噪声和丢失数据的鲁棒性。采用随机森林分类器来训练点云数据,我们使用包含100棵树的随机森林,树的深度选择为
,d 代表特征维度。
1.4  基于Cut-Pursuit的正则化
Cut-Pursuit 算法是一个快速学习阶跃常函数算法,可以快速有效解决分别受到总变差和主动轮廓边界惩
罚影响的凸优化问题,广泛应用于图像处理研究。在用随机森林分类后得到了粗分类的标签,考虑到粗分类在某一类标签存在一些噪声点及误分类,采用基于Cut-Pursuit 的正则化对分类标签进行平滑,其思想是根据附近邻域空间周围在这一点的置信度高低决定点的标签。
2  实验数据集与结果
2.1  实验数据集
(1)在实验中,我们使用Oakland 三维点云数据集,它是一个已经通用使用的基准数据集,包括五个语义标签分别是植被、电力线、杆塔、地面和立面。总共数据集合包
含130多万个点。数据分布训练集中植被14441个点,电力线2571个点,
杆塔1086个点,地面14121个点,立面4713个点,总计36932个点,测试集中植被267325个点,电力线3794个点,杆塔7933个点,地面934146个点,立面111112个点,总计1324310个点。
(2)此外,为了方便研究,我们收集了一个大型电力走廊场景的三维数据集,原始点云数据由激光扫描仪获取,利用CloudCompare 软件手动标记这些点云,为了应用研究需要,我们将数据集简单分为杆塔、电力线与其他(包括地面和植被等)三类,包含数据集接近1000多万个点。数据集中各个类别信息分布训练集中电力线3153个点,杆塔18108个点,其他34639个点,总计55900个点,测试集中电力线2
3219个点,杆塔16557个点,其他9692834个点,总计9732610个点。2.2  实验结果
本文使用MATLAB 语言发开,实验平台采用Intel(R)CPU E5-2620 v2@2.10GHz 处理器,48G 内存,Ubuntu16.04操作系统。我们选取Oakland 和电力走廊场景分别做实验,分类器选择随机森林,得到结果如下:
表1 本文所提出的方法在Oakland的  表2 本文所提出的方法在电力走廊场景中的
分类结果                                                        分类结果
从表1及表2数据看出,本文所提出的3D 点云分类方法的总体精度为97.96%,在Oakland 公开数据集实验中,所提出的方法的总体精度为97.54%。所提出的方法的一个巨大优点增加一路通道用于专门检测电力线类别,它弥补了现有语义分割方法中对电力线类别分类,在点云语义分类中很难到一个通用的特征向量,能够对所有类别分类得到较好的分类结果。基于Mean-shift 提取特征的语义分类方法能够解决这一问题,因为电力线相对其他类别点的个数较少,对其提取特征不易,而Mean-shift 对其聚类再提取特征是一个有效方法,而且不像kmean 聚类那样要预设聚类个数,电力线类别在精度上和召回率有显著提高。
3  结论
针对3D 点云数据提出了一种新的分类方法,该方法分别根据Mean-shift 聚类、使用Kd 搜索并计算最优邻域,然后在此基础上提取33维特征向量,使用RF 分类器分类得到粗分类结果,使用Cut-Pursuit 进行正则化,进一步提高整体的分类精度,最后使用一个平面划分出电力线类再融合这两种方法,使之适用于一般场景分类。本文方法能有效提高电力线类别的分类精度和整体的分类效果。明显改善分类过程中对电力线的错分现象,取得了良好的分类结果。
作者简介:
韦昌勇(1992—),男,广西南宁人,硕士研究生,研究方向:机器视觉,无人驾驶。
寇小东(1993—),男,四川达州人,硕士研究生,研究方向:数据挖掘,数据分析。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。