码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 强化学习实践(一)Gym介绍


          学了一段时间强化学习的理论,近期准备进行一些算法实践。应用算法的前提是要创建一个合适的仿真环境,目前Openai的Gym(https://gym.openai.com) 是主流的强化学习实验环境库。

          Gym已经集成许多开发好的环境,让RL的研究者们可以直接上手使用,而不需要按照论文中的描述重建环境,当然也可以在Gym中构建自己需要的环境。

    总的来说,Gym可提供的环境可以归为以下几类:

    1. 经典控制

    ​ 主要是经典强化学习文献中的控制理论问题,像平衡车的控制。

    2. Atari游戏

    注意,游戏环境需要单独安装下。

    3.Robotics机器人模拟

    基于Gym开发的机器人3D模拟环境,通过控制机器臂完成一些特定任务。地址

    4..开放的Gym

    Gym除了提供如此多的环境外,还提供二次开发的接口,让你可以基于Gym搭建自己想要的环境。例子

    注意:Github上也有许多基于Gym开发的强化学习环境

    参考文献

    1.Openai Gym与强化学习_基于gym的强化学习_李子树_的博客-CSDN博客

    2.强化学习Openai Gym基础环境搭建_强化学习环境-CSDN博客 

    3. Gym安装Atari环境(Windows,Linux适用)_gym atari-CSDN博客

  • 相关阅读:
    最优链表&&链表与顺序表的优缺点.
    第六节:如何解决@ComponentScan只能扫描当前包及子包(自学Spring boot 3.x的第一天)
    解决QT中文乱码
    JSON.stringify() 、JSON. parse()方法详解
    深度学习实战(1):花的分类任务
    08-Express路由详解
    [LeetCode]-队列&优先队列/堆
    力扣每日一题:1620. 网络信号最好的坐标【思维题暴力题】
    MMLAB系列:mmdetection的使用
    【Spring】快速入门Spring Web MVC
  • 原文地址:https://blog.csdn.net/weixin_48878618/article/details/133563439
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号