Welcome to RL Study
强化你的强化学习
数学基础看一点就可以去编写代码! 应用不太需要数学基础,创新才需要.
数学基础
- 强化学习的数学原理
- 对应的mooc(主要是问答,视频还是在B站) https://www.icourse163.org/course/XHUN-1470436188
- 其他教程欢迎推荐。
编程
编程基础
如果有对应的基础,请直接跳过 - numpy pandas 必须学习 数据处理 - matplotlib 可以学习 展示误差曲线
强化学习
推荐先学一点编程的示例,感受大致的结构以及原理到编程的映射. 强化学习可以分为环境和智能体(训练方法)。环境是对于问题的描述,而智能体是对环境的抽象解答。因此一种智能体可以解决多种环境的问题,同样的,一个环境也可以由多种(多个)智能体(独立/共同)解决。
下面是推荐的中文入门教程,比较适合从编程入手。
- 莫凡python教程: https://www.bilibili.com/video/BV13W411Y75P/
- tensorflow 可以学习,后面实现神经网络与强化学习结合的时候用到
-
openai gym 官网 可学,提供了很多现成的模拟环境
- 可以很好的替代tkinter 科学 用它来编写模拟环境
-
看文献 尝试复现
Github
论坛
- http://www.deeprlhub.com/
开源图书
- https://datawhalechina.github.io/easy-rl/#/
其他推荐
- https://blog.csdn.net/CoderPai/article/details/80174113
- https://www.bilibili.com/video/BV1h64y1c7Fo/
Q-Learning
- https://blog.csdn.net/itplus/article/details/9361915