Merge branch 'main' of https://github.com/openmlsys/openmlsys-zh into main

2026-05-11 10:41:17 +08:00 · 2022-05-22 23:32:57 -04:00
parent 8728a8a0a4 2c5996eecd
commit aacabe79e7
51 changed files with 1328 additions and 109 deletions
--- a/chapter_reinforcement_learning/distributed_node_rl.md
+++ b/chapter_reinforcement_learning/distributed_node_rl.md
@@ -28,7 +28,7 @@

 Ray :cite:`moritz2018ray`是由伯克利大学几名研究人员发起的一个分布式计算框架，基于Ray之上构建了一个专门针对强化学习的系统RLlib :cite:`liang2017ray`。RLlib是一个面向工业级应用的开源强化学习框架，同时包含了强化学习的算法库，它对非强化学习专家使用也很方便。

-![RLlib分布式训练](../img/ch12/ch12-rllib-distributed.png)
+![RLlib分布式训练](../img/ch12/ch12-rllib-distributed.svg)

 :width:`600px`

--- a/chapter_reinforcement_learning/summary.md
+++ b/chapter_reinforcement_learning/summary.md
@@ -1,3 +1,7 @@
 ## 小结

-在这一章，我们简单介绍了强化学习的基本概念，包括单智能体和多智能体强化学习算法、单节点和分布式强化学习系统等，给读者对强化学习问题的基本认识。当前，强化学习是一个快速发展的深度学习分支，许多实际问题都有可能通过强化学习算法的进一步发展得到解决。另一方面，由于强化学习问题设置的特殊性（如需要与环境交互进行采样等），也使得相应算法对计算系统的要求更高：如何更好地平衡样本采集和策略训练过程？如何均衡CPU和GPU等不同计算硬件的能力？如何在大规模分布式系统上有效部署强化学习智能体？等等，都需要对计算机系统的设计和使用有更好的理解。
+在这一章，我们简单介绍了强化学习的基本概念，包括单智能体和多智能体强化学习算法、单节点和分布式强化学习系统等，给读者对强化学习问题的基本认识。当前，强化学习是一个快速发展的深度学习分支，许多实际问题都有可能通过强化学习算法的进一步发展得到解决。另一方面，由于强化学习问题设置的特殊性（如需要与环境交互进行采样等），也使得相应算法对计算系统的要求更高：如何更好地平衡样本采集和策略训练过程？如何均衡CPU和GPU等不同计算硬件的能力？如何在大规模分布式系统上有效部署强化学习智能体？等等，都需要对计算机系统的设计和使用有更好的理解。
+
+## 参考文献
+
+:bibliography:`../references/reinforcement.bib`