码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 滴滴 - dispatching


    这里写目录标题

      • 1 2017 - 《A Taxi Order Dispatch Model based On Combinatorial Optimization》
      • 2 2018 - 《Large‑Scale Order Dispatch in On‑Demand Ride‑Hailing Platforms: A Learning and Planning Approach》
      • 3 2019 - 《A Deep Value-networkBased Approach for Multi-Driver Order Dispatching》
      • 4 2019 - 《Efficient Collaborative Multi-Agent Deep Reinforcement Learning for Large-Scale Fleet Management》

    1 2017 - 《A Taxi Order Dispatch Model based On Combinatorial Optimization》

    资料:
    论文详解:滴滴大数据预测用户目的地,准确率超90% | KDD 2017 | 雷峰网

    论文总结:
    Dispathing system 派发系统: 就是多对多司机和乘客匹配,使得司机赚钱更多,乘客满意度更高。

    1. 传统的方法是:对每个订单,最大化司机的接单率. 缺点:整体成功率可能不高。
    2. 新方法:使用的基于组合优化的分单模型,最大化整体的接单成功率,最大化整体的效率,从而提升用户体验。

    算法细节如下:

    1. 分单时优化整体成交率
      模型的数学形式即:
      在这里插入图片描述

    其中,max(E) 为整个模型的优化目标,即成交率;g(a)≤0 为模型必须要满足的约束条件,在这里可能是一些业务规则,比如一个司机同一时刻只能分配一个订单等;a 为模型的解,即如何对整体的订单和整体的司机进行分配。

    1. Logistics Regression模型计算司机接受概率
      根据订单的价值、接驾距离、方向夹角、行驶方向等特征,使用logistics regression模型来进行计算司机接受订单的概率。
      [图片]
      因为一个订单会同事派发给m个司机,所以第i个订单的成交概率即为:
      [图片]

    这样整个组合优化模型即为:
    其中N是当前的订单总数,M是一单通知的司机个数。优化的是当前时刻所有订单的成功率之和。
    [图片]

    2 2018 - 《Large‑Scale Order Dispatch in On‑Demand Ride‑Hailing Platforms: A Learning and Planning Approach》

    资料:
    滴滴 KDD 2018 论文详解:基于强化学习技术的智能派单模型 | 雷峰网

    1. 传统方法:关注的是即时的乘客满意度。
    2. 新方法:更关注全局和长远角度下的资源利用率和用户体验。

    整体架构:

    1. 离线训练价值函数,这里使用的是强化学习,MAP状态空间转移的方法
    2. 在线推理的时候根据当前收益,和未来状态下的收益综合判断
      在这里插入图片描述

    3 2019 - 《A Deep Value-networkBased Approach for Multi-Driver Order Dispatching》

    滴滴KDD 2019 论文详解:基于深度价值网络的多司机智能派单模型

    1. 本文是在上篇文章的基础上,使用了深度强化学习+半马尔可夫决策过程(带有时间延展性)。
    2. 状态空间中增加情景式特征,上一篇论文中,状态空间只跟时间地点有关。当前修改为:状态 (时间、地点、情景式特征 - 热区,冷区等)。
    3. 价值函数更新中增加时延递减信息
      [图片]
    4. 且不同城市间使用迁移学习,对数据比较少的城市就比较友好,不用从0开始。

    4 2019 - 《Efficient Collaborative Multi-Agent Deep Reinforcement Learning for Large-Scale Fleet Management》

    多智能体,强化学习
    是滴滴的新的玩法,增加了车队的概念,就是这个车队是一个团队,车队和车队之间,是竞争关系。这样一方面司机不会无聊,车队成员之间,会有一个归属感。另一方面,车队之间的竞争关系,会激发司机的工作热情。使用的也是强化学习的方法。没有细看,相关性不大。

  • 相关阅读:
    木犀草素修饰人血清白蛋白(Luteolin-HSA),山柰酚修饰人血清白蛋白(Kaempferol-HSA)
    JavaScript 模块导入导出(export与import)用法
    【Android笔记29】Android中的数据存储技术之内部存储、外部存储
    【C# 7.0 in a Nutshell】第4章 C#的高级特性——委托
    阿里云安全中心需要购买吗?功能及价格告诉你值不值!
    设计模式-观察者模式
    mysql redis的区别
    Linux中间件之redis的淘汰策略和持久化
    卡码网语言基础课 |链表的基础操作III
    SpringBoot @InitBinder注解实现Bean国际化校验
  • 原文地址:https://blog.csdn.net/weixin_38502514/article/details/125553620
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号