基于深度双向长短时记忆网络的集装箱港口卡车轨迹预测
◎ 夏喻义1 庞铖2 高明琪3
1.上海沪东集装箱码头有限公司;
2.上海沪东集装箱码头有限公司;
3.上海海洋大学
摘 要:车辆轨迹预测是交通工程和人工智能领域中的一个关键研究议题,具有广泛的应用前景,包括自动驾驶、交通管理和智能交通系统等。在本研究中,着重解决港口区域内用于搬运集装箱的卡车在遭受遮挡时出现的瞬时定位误差。为此,本文设计了一种数据驱动的车辆轨迹预测框架。该框架通过先行处理大规模GPS数据集,并采用深度双向长短时记忆网络(DeepBiLSTM)进行模型训练。针对从实际港口内收集而来的轨迹数据,使用DeepBiLSTM网络与传统算法(如卡尔曼滤波器)、机器学习技术(如支持向量回归)进行了对比。实验结果显示,DeepBiLSTM在均方根误差(RMSE)、平均绝对误差(MAE)、F1分数以及轨迹重构误差(TRE)等多个评价指标上均表现出,相对于传统方法,性能提升约为70%。因此,本文所提出的这一基于数据驱动的目标轨迹预测方法在准确度和实用性方面均具有明显优势,为港口内集装箱卡车的精准定位提供了有效的解决方案。
关键词:数据驱动;轨迹预测;长短时记忆网络
1.引言
1.1背景问题
车辆轨迹的时间序列预测在港口内具有显著的研究价值和应用前景。港口作为全球贸易和物流的重要节点,其内部交通流动性和效率不仅直接影响着港口的整体运营效能,还关系到更广泛的供应链管理和全球贸易平衡。集装箱卡车作为港口内部物流的关键组成部分,其行驶轨迹的精准与高效预测成为一个至关重要的问题。提高集装箱卡车行驶轨迹预测的准确性,不仅可以提高物流效率,减少拥堵和延误,还可以优化资源分配,降低运营成本,从而提高港口的竞争力。此外,这一预测模型还能够为港口安全提供有力地数据支持,比如防范潜在的安全风险和减少事故发生的可能性。因此,该领域的深入研究不仅具有理论上的重要性,更有广泛的实用价值和商业应用潜力。
为了突破传统技术的限制,并
最大限度地发挥数据驱动技术的
潜能,本文提出了一种新的轨迹预
测方法:深度双向长短时记忆网络(DeepBiLSTM)。该方法汇集了深
度学习、注意力机制和高级优化策略
的优势,能够精确预测港口内集装箱
卡车的行驶轨迹。
1.2相关工作
近年来,车辆轨迹预测任务备受
关注,许多学者已经通过不同的方法
进行探索。轨迹预测方法中,基于运
动学模型的方法主要聚焦于对车辆
运动状态的建模,常见的模型包括高
斯混合模型[1],卡尔曼滤波[2]等。
早年,乔少杰[1]等人提出的基于
高斯混合模型的轨迹预测方法,主
要通过高斯混合模型对车辆运动模
式进行建模,统计各个运动模式的
概率分布,然后将轨迹划分为不同的
高斯过程分量。杨兆升[3]等人提出了
使用卡尔曼滤波器估计运动物体轨
迹的方法;王晓龙[4]等人开发了长期
预测方法,结合基于轨迹分类和粒子
滤波框架;潘迪夫[6]等人使用了一种
基于粒子滤波器的定位方法,使用固
定地标的距离和方位信息;张学工[8]
等人将基于模型的方法和数据驱动
的方法相结合,使用卡尔曼滤波器来
预测车辆轨迹。然而,传统的目标预
测模型存在局限性,难以处理嘈杂和
易变轨迹,不能完全捕捉目标动力学
的复杂性和不确定性。
随着硬件算力的不断提升,各种
传统机器学习算法也不断出现。范
昕炜[9]等人使用的支持向量机算法在
轨迹预测领域展现出一定的优势。同
时基于数据驱动的长短时记忆网络
(LSTM)算法对轨迹预测领域产生
了重大影响。权波[10]等人基于LSTM
对船舶航迹进行预测,得到了不错的
效果。徐先峰[11]等人基于卷积神经
网络与双向长短时记忆网络组合模
型进行了短时交通流预测。但这些模
型的可解释性通常较差,从理论层面无法保证预测的安全性,并且可能这些方法并未充分利用场景信息。为解决以上问题,本文提出了一种新的方法,即采用基于DeepBiLST M 网络进行水平运转车辆的轨迹预测。该方法可以有效预测港口内集装箱卡车的后续轨迹,从而对异常定位数据进行修正处理。因此,修正后的轨迹数据能够有效地弥补集装箱卡车GPS定位暂时由于遮挡等因素而引起的误差。
2.方法论
在这项研究中,利用DeepBiLSTM 网络来预测港口内集装箱卡车的轨迹。研究方法的网络结构及流程如图1所示。首先收集了大量的实际港口内集装箱卡车的轨迹数据,并从
中提取了包括经纬度、速度和航向角在内的重要特征。在数据收集与特征提取的基础上,对数据进行了去噪、插值等一系列的预处理工作,以消除可能影响模型预测精度的无关因素和噪声。接着,利用所提出的DeepBiLSTM模型对预处理后的数据进行轨迹预测,并与其他模型进行了详细对比与评估,旨在全面分析其性能和优越性。为了验证所采用模型的可行性和有效性,将预测得到的轨迹与原始轨迹进行了深入的对比与评估。在本节中,将深入探讨数据预处理过程以及DeepBiLSTM模型的详细设计与实现。为了确保模型的性能和预测的准确性,数据预处理和模型设计都至关重要。
2.1数据预处理
为了高效地实施轨迹预测,收集了在多日内港口区域集装箱卡车的GPS位置数据,并进行了一系列预处理操作。包括数据整合、时间序列排序、提取特征(如时间戳、经度、纬度、速率和航向角)并进行数据过滤以及异常值处理。所有数据处理活
初步
卡车的N
据,
和航
响,
训练和预
度、
输入,
高预测的
[0,1]内。
2.2
的LSTM单元,其内部计算如下:
(1)
(2)
(3)
(4)
(5)
其中σ函数和
(7) L S T M通过加入多个阈值门在记忆和遗忘之间取得平衡,从而在基于原始递归神经网络(R N N)
的通用时间序列建模和预测方面表现出卓越的能力。因此,LSTM被认为是解决时间序列预测问题最先进的方法。每个LSTM块由一个记忆单元和三个门组成:输入门i t、遗忘门f t和输出门o t,如图三所示。LST M的关键是存储记忆单元状态C t,如图三顶部的水平线所示。另外,x t和h t分别为LSTM的输入和输出。
由于LSTM对于时间序列预测问题的有效性,使用存储记忆单元状态C t的本质特征有助于作为状态信息的累加器。当接收到新的输入时,遗忘门f t决定在记忆单元状态中丢弃哪些信息。接下来,输入门决定需要更新的值,然后Ta nh层生成一个新的候选值向量C t,可以将其添加到记忆单元状态中。这些结果被组合在一起以进行状态更新。最后,输出门o t和
C t生成最终状态h t。
2.2.2DeepBiLSTM
为了更全面地解析长序列轨迹预测问题,本研究采用了深度双向长短时记忆(DeepBiLST M)的架构以替代单向LSTM。DeepBiLSTM 的特点在于其不仅能够捕捉到输入序列的前向信息,还能获取输入序列的反向信息,使用了多个双向长短时记忆网络(Bi-LSTM)堆叠,以捕捉数据更深层次的语义信息。每个Bi-LSTM单元都包括一个前向LSTM和一个反向LSTM,它们分别负责从不同的方向对输入序列进行学习。这种双向的特性能够使模型更加准确地把握序列数据的上下文依赖性。在该模型中,多个Bi-L S T
M层被堆叠起来,以实现对复杂轨迹序列特性的更深层次的捕捉。与单向L ST M相似,每一个Bi-L ST M层都会接收上一层(或输入层)的隐藏
状态作为输入,并在层内部进行门
控单元的计算。每一层都包含一个
前向L S T M和一个后向L S T M。前
向L ST M处理输入序列从开始到结
束,而后向L S T M处理输入序列从
结束到开始。两者的输出会在每一
个时间步被拼接或平均,形成该层
的最终输出。
在每一个时间步t,前向L S T M
和后向LSTM分别读取当前输入x t和
对应的反向输入x T-t,其中T是序列长
度。每个LSTM单元通过门控机制更
新其内部状态h该机制包括遗忘门、
输入门和输出门。
在前向和后向L S T M网络完
成整个序列的处理后,它们的输出
h t for ward和h t back ward被拼接或平均以生
成当前时间步的隐藏状态h t。
前向LSTM的隐藏状态h t forward可
由以下公式表示:
(8)
后向LST M的隐藏状态h t back ward
可由以下公式表示:
(9)
最终的隐藏状态h t通常由h t forward
和h t backward 的拼接或平均得出。
(10)
综上所述,DeepBiLST M与注
意力机制的综合应用,加上特征融合
和正则化技巧,使得模型在处理长序
列轨迹预测任务时展现出更优越的
性能和更高的泛化能力。该模型的多
层双向结构使其能够更准确地捕捉
输入序列中的长期依赖和上下文信
息。在未来的研究中,还将进一步优
化超参数以实现更高的预测精度。
3.实验设计
本节旨在通过实验性研究,
采用真实集装箱码头数据集,对
DeepBiLSTM算法的预测能力进行
评估。首先,本文详细描述了实验场
景与数据来源,以构建一个可靠和
具有代表性的评估环境。其次,构建
了一系列实验设计,目的在于评估各
种机器学习与序列模型在港口内集
装箱卡车轨迹预测任务中的性能,
包括卡尔曼滤波器、支持向量回归、
DeepBiLSTM。
3.1数据来源
为了完成传统集装箱港口的自动
化改进工程,必须在港口内所有集装
箱卡车上装配GPS导航系统。在本研
究的多日连续数据采集过程中,积累
了大量遵循NMEA-0183标准的GPS
定位信息。经过数据预处理步骤,获
得了本研究所需的有效实验数据。
3.2实验方法及参数
在本节中,将详细讨论两种传统
基于模型驱动的传统时间序列预测
方法:卡尔曼滤波和支持向量回归。
这两种方法都具有在特定应用场景
下处理数据和进行预测的独特优势。
同时也将介绍DeepBiLSTM超参数
设置,在基于数据驱动的模型中,超
参数的选择极为重要,因为它们直接
影响到模型的性能和学习能力。
3.2.1卡尔曼滤波
卡尔曼滤波是基于概率论的一
种滤波方法,可处理测量数据并估计
状态变量值。在本研究中,本文测量
更新步骤和预测步骤交替进行。在测
量更新步骤中,通过计算测量残差y
和更新状态量x来更新状态估计。然
后,在预测步骤中,通过使用状态转
移矩阵A和过程噪声协方差矩阵Q来
预测下一个时间步长的状态。
3.2.2支持向量回归
支持向量回归是一种机器学习
算法,用于预测连续型变量的值。它
是基于支持向量机算法的回归扩展。
支持向量回归通过寻一个最优的
超平面,使得训练数据点与该超平面
之间的平均距离最小化。本文根据这
些特征和已知的经纬度数据进行训
练。训练完成后,使用该模型来对未
知位置的车辆进行经纬度的预测。
算法训练集数据量
LSTM第一层神经元个数
LSTM第二层神经元个数
LSTM第三层神经元个数
优化器迭代批量大小DeepBiLSTM
729000
128
256
256
Adam
200
3600
表1 超参数设置
表2 不同模型预测轨迹的RMSE、MAE、F1、TRE实验结果
模型测试集1
测试集2
测试集3
评估
RMSE MAE
F1
TRE RMSE MAE
F1
TRE RMSE MAE
F1
TRE
卡尔曼滤波
0.2280.2040.86314.6480.216
0.202
0.74
13.8750.2290.214
0.816
14.751支持向量回归
0.0620.0520.956  4.017
0.0640.0560.95
4.147
0.0710.0650.892  4.553DeepBiLSTM
0.016
0.0120.993  1.0580.0150.0110.990.9690.016
0.0120.995  1.026模型测试集4
测试集5
测试集6
评估
RMSE MAE
F1
TRE RMSE MAE
F1
TRE RMSE MAE
F1
TRE
卡尔曼滤波
0.2530.2340.90616.2630.231
0.2250.96714.8670.237
0.2280.81715.239支持向量回归
0.0510.0420.932
3.2960.0530.0430.974
3.4380.0560.0450.947
3.594DeepBiLSTM
0.019
0.014
0.996  1.2
0.0150.0120.9960.9740.0160.0130.934  1.059模型测试集7
测试集8
测试集9
评估
RMSE MAE
F1TRE RMSE MAE F1TRE
RMSE MAE
F1正则化是结构风险最小化策略的实现
TRE
卡尔曼滤波
0.23
0.2190.81914.7970.18
0.149
0.96711.5660.199
0.172
0.92812.79支持向量回归
0.0680.0620.853  4.3970.0590.053
0.981
3.785
0.0580.0440.985  3.713
DeepBiLSTM
0.0150.012
0.894
0.951
0.010.008
0.9950.6510.0130.009
0.995
0.808图2 经度预测对比图3 纬度预测对比
3.2.3DeepBiLSTM超参数设置本实验中超参数的设置如表1所示,算法的训练集数据量为729000。Deep
BiLSTM模型由三层LSTM单元组成,第一层神经元个数为128,第二层和第三层神经元个数均为256。此外,本研究采用Ada m 优化器,设定了200次迭代和3600的批量大小。Adam优化器适合处理大规模的数据,因为它能够动态调整学习率,使得模型更加稳定。这些超参数在实验中都经过了多轮调整和优化,以确保模型能够更准确和高效地学习到数据中的特征。
4.结果分析
在本节中,使用了港口内集装箱卡车真实数据对D e e pB i L S T M 网络的性能进行实验评估,使用卡尔曼滤波和支持向量机回归及DeepBiLST M网络这3种轨迹预测方法分别对港口内集装箱卡车轨迹的经度、纬度的进行预测,预测结果如图2及图3所示。
相比于基于模型驱动的卡尔曼滤波和支持向量机,DeepBiLSTM 其经度、纬度的预测上均优于前两种算法。在预测轨迹的形状和曲线上,基于数据驱动的DeepBiLSTM网络算法也更符合实际情况。
在测试集上,本文对3种轨迹
预测方法进行了比较,如图4所示。
从图中可以看出,DeepBiL ST M网
络表现出最高的预测准确率,相比
其他方法具有更好的表现。这表明
DeepBiLSTM网络在解决港口内集
装箱卡车轨迹预测问题中是一种有
效的方法。
最后,对轨迹的预测结果进行
了精度的对比分析。将预测值与真
实值进行比较,得到了各个方法的均
方根误差(R MSE)、平均绝对误差
(M A E)、F1得分和轨迹重建误差
(T R E)。实验结果如表2所示,结
果表明DeepBiLSTM网络在轨迹预
测任务中的精度表现最佳。
5.结论
本研究通过深入分析多天采集
的港口内集装箱卡车的GP S定位数
据,对其进行了一系列精细化的数据
预处理工作。在对比分析了多种轨迹
预测算法后,发现DeepBiLSTM网
络在预测精度和稳定性方面表现出
,显著优于基于模型驱动的卡尔曼
滤波和支持向量回归等算法。并且,
该研究不仅仅停留在算法性能的定
量评估阶段。通过将DeepBiLSTM
网络应用于港口内集装箱卡车的轨
迹预测,本研究成功地解决了港口车
辆GPS定位在遮挡环境下易产生的
定位误差问题。这一成果不仅提高了
港口内部集装箱水平运转的运输效
率,而且进一步提升了运输过程的安
全性。
[1]乔少杰,
模型的轨迹预测算法[J].软件学报,2015,26
(05):1048-1063.
[2]彭丁聪.卡尔曼滤波的基本原理及应用[J].
软件导刊,2009,8(11):32-34.
[3]杨兆升,朱中.基于卡尔曼滤波理论的
交通流量实时预测模型[J].中国公路学
报,1999(03):63-67.
[4]王晓龙.基于目标运动轨迹及空间分布的行
为分析研究[D].中南大学,2009.
[5]刘静,关伟.交通流预测方法综述[J].公路交
通科技,2004(03):82-85.
[6]潘迪夫,刘辉,李燕飞.基于时间序列分析和
卡尔曼滤波算法的风电场风速预测优化模型
[J].电网技术,2008(07):82-86.
[7]乔少杰,韩楠,朱新文,等.基于卡尔曼滤波
的动态轨迹预测算法[J].电子学报,2018,46
(02):418-423.
[8]张学工.关于统计学习理论与支持向量机[J].
自动化学报,2000(01):36-46.
[9]范昕炜.支持向量机算法的研究及其应用
[D].浙江大学,2003.
[10]权波,杨博辰,胡可奇,等.基于LSTM的船舶
航迹预测模型[J].计算机科学,2018,45(S2):
126-131.
[11]徐先峰,黄刘洋,龚美.基于卷积神经网络与
双向长短时记忆网络组合模型的短时交通流预
测[J].工业仪表与自动化装置,2020(01):13-18.
[12]韩昭蓉,黄廷磊,任文娟,等.基于Bi-
LSTM模型的轨迹异常点检测算法[J].雷达学
报,2019,8(01):36-43.
图4 原始轨迹与预测轨迹对比

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。