码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Talk预告 | 北京大学人工智能研究院杨耀东:一个合作博弈的通用求解框架


    本期为TechBeat人工智能社区第441期线上Talk。

    北京时间9月21日(周三)20:00,北京大学人工智能研究院研究员——杨耀东的Talk将准时在TechBeat人工智能社区开播!

    他与大家分享的主题是: “一个合作博弈的通用求解框架”,届时将介绍一个通用的基于多智能体强化学习技术的合作博弈求解框架:多智能体镜像学习(Heterogeneosu Multi-Agent Mirror Learning)。

     

    Talk·信息

    ▼

    主题:一个合作博弈的通用求解框架

    嘉宾:北京大学人工智能研究院研究员 杨耀东

    时间:北京时间 9月21日 (周三) 20:00

    地点:TechBeat人工智能社区

    http://www.techbeat.net/

     点击下方链接,即可观看视频 

    TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=715

    Talk·介绍

    ▼

    通过强化学习方法求解多智能体博弈合作问题具有众多的现实应用,例如灵巧双手操纵、无人机群编队等。在本次分享中,我将会介绍一个通用的基于多智能体强化学习技术的合作博弈求解框架:多智能体镜像学习(Heterogeneosu Multi-Agent Mirror Learning)。

    HAML提供了一个通用的算法设计范式,它可以催生出一系列的有效的合作博弈求解算法例如HAPPO, HATRPO, MACPO, Mutli-agent Transformer等,并且HAML算法框架中的成员都天然具有严格的单调递增性的保证。此外,HAML框架还提供了一系列新的多智能体算法,例如HADDPG, HADQN, HAA3C。在一系列合作博弈场景,例如星际争霸,灵巧双手操作上,他们都达到了SOTA水平。

    Talk·提问交流

    ▼

    通过以下两种方式提问都将获得微信现金红包奖励哦!

    方式 ①

    在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

    你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

    方式 ②

    在本文留言区直接提出你的问题!

    Talk·嘉宾介绍

    ▼

    杨耀东

    北京大学人工智能研究院研究员

    杨耀东,北京大学人工智能研究院研究员、博导,伦敦国王大学客座助理教授。科研领域包括强化学习、博弈论和多智能体系统,重点关注基于强化学习技术的群体智能涌现。在加入北京大学以前,他曾任伦敦国王大学助理教授,华为英国研究所主任研究员,美国国际集团科学部高级经理。杨耀东本科毕业于于中国科学技术大学,硕士毕业于英国帝国理工大学,博士毕业于英国伦敦大学。

    个人主页:

    www.yangyaodong.com

     

    -The End-

    关于TechBeat人工智能社区

    ▼

    TechBeat(TechBeat)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

    我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

    期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

    更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

  • 相关阅读:
    mysql存储地理信息的方法
    书生·浦语大模型开源体系(七)作业
    OPENAI 开发者大会_观后感_231107
    井下特种兵——智能管网监测终端
    Python海洋专题七之Cartopy画地形水深图的陆地填充
    移动跨平台技术方案浅析
    “轻松解决Linux应用程序无法访问的难题:关闭SELinux就对了!“
    软件测试技术复习
    CSS(四)盒子模型+圆角边框+盒子阴影+文字阴影
    Layui快速入门之第十五节 表格
  • 原文地址:https://blog.csdn.net/hanseywho/article/details/126948720
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号