Welcome to RL Study

强化你的强化学习

数学基础看一点就可以去编写代码! 应用不太需要数学基础,创新才需要.

数学基础

编程

编程基础

如果有对应的基础,请直接跳过 - numpy pandas 必须学习 数据处理 - matplotlib 可以学习 展示误差曲线

强化学习

推荐先学一点编程的示例,感受大致的结构以及原理到编程的映射. 强化学习可以分为环境和智能体(训练方法)。环境是对于问题的描述,而智能体是对环境的抽象解答。因此一种智能体可以解决多种环境的问题,同样的,一个环境也可以由多种(多个)智能体(独立/共同)解决。

下面是推荐的中文入门教程,比较适合从编程入手。

  • 莫凡python教程: https://www.bilibili.com/video/BV13W411Y75P/
  • tensorflow 可以学习,后面实现神经网络与强化学习结合的时候用到
  • openai gym 官网 可学,提供了很多现成的模拟环境

    • 可以很好的替代tkinter 科学 用它来编写模拟环境
  • 看文献 尝试复现

Github

论坛

  • http://www.deeprlhub.com/

开源图书

  • https://datawhalechina.github.io/easy-rl/#/

其他推荐

  • https://blog.csdn.net/CoderPai/article/details/80174113
  • https://www.bilibili.com/video/BV1h64y1c7Fo/

Q-Learning

  • https://blog.csdn.net/itplus/article/details/9361915