摘 要 地图匹配是轨迹数据挖掘的基本操作,在许多空间数据智能场景中都非常有用.基于隐马尔可夫模型(hidden Markov model, HMM)的地图匹配算法具有较高的准确率,应用最为广泛,但其计算效率较低,难以应对实时性要求较高的大规模轨迹情形.提出了一个基于路网层次收缩的分布式地图匹配框架CHMM,能够对大规模的轨迹数据实现快速地图匹配.具体而言,提出了一个简单但有效的分区方案,能够解决分布式场景下轨迹数据分布不平衡的问题;提出了一个基于路网层次收缩的多对多最短路径查询算法,能够保证结果不变的情况下,显著提升基于HMM的地图匹配算法的效率.采用真实的路网数据和轨迹数据做了充分的实验,实验结果表明:CHMM算法具有更快的计算效率和更强的可扩展性.CHMM算法落回到了真实的产品中,支持了多个项目的落地.我们也开源了核心代码,并提供了一个在线演示系统.
关键词 地图匹配;轨迹数据;分布式计算;层次收缩;城市计算
受益于GPS(global position system)定位技术的发展及普及,大量轨迹数据在源源不断地产生.这些轨迹数据中,车辆轨迹是非常重要的一部分.一方面,车辆沿着道路