This commit is contained in:
quantumiracle
2022-05-22 23:32:57 -04:00
51 changed files with 1328 additions and 109 deletions

View File

@@ -28,7 +28,7 @@
Ray :cite:`moritz2018ray`是由伯克利大学几名研究人员发起的一个分布式计算框架基于Ray之上构建了一个专门针对强化学习的系统RLlib :cite:`liang2017ray`。RLlib是一个面向工业级应用的开源强化学习框架同时包含了强化学习的算法库它对非强化学习专家使用也很方便。
![RLlib分布式训练](../img/ch12/ch12-rllib-distributed.png)
![RLlib分布式训练](../img/ch12/ch12-rllib-distributed.svg)
:width:`600px`

View File

@@ -1,3 +1,7 @@
## 小结
在这一章我们简单介绍了强化学习的基本概念包括单智能体和多智能体强化学习算法、单节点和分布式强化学习系统等给读者对强化学习问题的基本认识。当前强化学习是一个快速发展的深度学习分支许多实际问题都有可能通过强化学习算法的进一步发展得到解决。另一方面由于强化学习问题设置的特殊性如需要与环境交互进行采样等也使得相应算法对计算系统的要求更高如何更好地平衡样本采集和策略训练过程如何均衡CPU和GPU等不同计算硬件的能力如何在大规模分布式系统上有效部署强化学习智能体等等都需要对计算机系统的设计和使用有更好的理解。
在这一章我们简单介绍了强化学习的基本概念包括单智能体和多智能体强化学习算法、单节点和分布式强化学习系统等给读者对强化学习问题的基本认识。当前强化学习是一个快速发展的深度学习分支许多实际问题都有可能通过强化学习算法的进一步发展得到解决。另一方面由于强化学习问题设置的特殊性如需要与环境交互进行采样等也使得相应算法对计算系统的要求更高如何更好地平衡样本采集和策略训练过程如何均衡CPU和GPU等不同计算硬件的能力如何在大规模分布式系统上有效部署强化学习智能体等等都需要对计算机系统的设计和使用有更好的理解。
## 参考文献
:bibliography:`../references/reinforcement.bib`