mirror of
https://github.com/openmlsys/openmlsys-zh.git
synced 2026-05-11 10:41:17 +08:00
Merge branch 'main' of https://github.com/openmlsys/openmlsys-zh into main
This commit is contained in:
@@ -28,7 +28,7 @@
|
||||
|
||||
Ray :cite:`moritz2018ray`是由伯克利大学几名研究人员发起的一个分布式计算框架,基于Ray之上构建了一个专门针对强化学习的系统RLlib :cite:`liang2017ray`。RLlib是一个面向工业级应用的开源强化学习框架,同时包含了强化学习的算法库,它对非强化学习专家使用也很方便。
|
||||
|
||||

|
||||

|
||||
|
||||
:width:`600px`
|
||||
|
||||
|
||||
@@ -1,3 +1,7 @@
|
||||
## 小结
|
||||
|
||||
在这一章,我们简单介绍了强化学习的基本概念,包括单智能体和多智能体强化学习算法、单节点和分布式强化学习系统等,给读者对强化学习问题的基本认识。当前,强化学习是一个快速发展的深度学习分支,许多实际问题都有可能通过强化学习算法的进一步发展得到解决。另一方面,由于强化学习问题设置的特殊性(如需要与环境交互进行采样等),也使得相应算法对计算系统的要求更高:如何更好地平衡样本采集和策略训练过程?如何均衡CPU和GPU等不同计算硬件的能力?如何在大规模分布式系统上有效部署强化学习智能体?等等,都需要对计算机系统的设计和使用有更好的理解。
|
||||
在这一章,我们简单介绍了强化学习的基本概念,包括单智能体和多智能体强化学习算法、单节点和分布式强化学习系统等,给读者对强化学习问题的基本认识。当前,强化学习是一个快速发展的深度学习分支,许多实际问题都有可能通过强化学习算法的进一步发展得到解决。另一方面,由于强化学习问题设置的特殊性(如需要与环境交互进行采样等),也使得相应算法对计算系统的要求更高:如何更好地平衡样本采集和策略训练过程?如何均衡CPU和GPU等不同计算硬件的能力?如何在大规模分布式系统上有效部署强化学习智能体?等等,都需要对计算机系统的设计和使用有更好的理解。
|
||||
|
||||
## 参考文献
|
||||
|
||||
:bibliography:`../references/reinforcement.bib`
|
||||
Reference in New Issue
Block a user