一种基于多头注意力机制的生成对抗网络模型
图 2 为 MAGAM 模型 的整体框架 模型采用生成对抗网络结构包括一个生成器和一个判别器 。生成器以行人的观测轨迹序列 T作为输入 ,学习各行 人之间 的复杂交互关系 并生成 预测 轨 迹 判别 器T^。学习判断某 一 轨迹是真实轨迹还是由生成器生成的轨迹 。其中
本模块对每个行人的历史轨迹迸行编码,利用 LSTM 对每个行人的历史轨迹序列进行建模,得到当前时刻的状态
本模块旨在利用多头注意力机制深度捕捉行人之间 的交互模式。
图3描述了利用多头注意力机制提取行人交互特征的过程。其交互状态为MHA_ i
图4:本文对行人的相对位置编码
本模块利用基于 LSTM 的解码器来预测行人的未来轨迹。
在解码之前:
表二:
表三:模型结构越复杂,模型训练时
所消耗的时 间越多模型达到收敛状态的平均耗时越长
针对复杂场景 中 行人轨迹 的多样性与行人之间 复杂 的交互关系 本文提 出 了 基于多 头 注意力 对抗 机制 的行人轨迹 预测模型 首先 利 用 LSTM 提取每个行人的轨迹特征 然后通过多头 注意力 机制从, 融合 了 行人相 对位移信息 的 位 移 状态矩 阵 中 学 习 多个行人之间 的交互关系 , 再对加人 了 噪声 的 特征 向量进行解码得到预测轨迹 MAGAM 模型基于对抗生成机制 和高斯噪声来拟合生成多种可行 的行人 轨迹 . 为验证 MAGAM 模型 的性 能 本文不仅进行 了行人轨迹预测实验 还将模型应用 于道路车辆轨迹的预测任务 中 均得到 了 合理的预测路径 但相 比GAN模型 MAGAM的 , 于s o c i a l LSTM和s o c i a l , 计算成本较高 未来我 们将探索优化方法降低计算消耗 的 时长 此外 在实 际应用 中 需 要 根据具体 的 场景 以 及 目 标物体移动轨迹 的 特征 对模型 的 局 部 算法结构进行改进和 优化 从而实 现对复杂场景 中 的预测 目 标更全面的特征挖掘 。