Merge pull request #490 from BalajiAI/patch-1

Update variance-problem.mdx
2026-06-17 07:27:26 +08:00 · 2024-03-01 15:53:29 +01:00
parent c8e9422622 87fcfeb9bb
commit 1b09e7cbac
1 changed files with 1 additions and 0 deletions
--- a/units/en/unit6/variance-problem.mdx
+++ b/units/en/unit6/variance-problem.mdx
@@ -27,4 +27,5 @@ However, increasing the batch size significantly **reduces sample efficiency**.
 If you want to dive deeper into the question of variance and bias tradeoff in Deep Reinforcement Learning, you can check out these two articles:
 - [Making Sense of the Bias / Variance Trade-off in (Deep) Reinforcement Learning](https://blog.mlreview.com/making-sense-of-the-bias-variance-trade-off-in-deep-reinforcement-learning-79cf1e83d565)
 - [Bias-variance Tradeoff in Reinforcement Learning](https://www.endtoend.ai/blog/bias-variance-tradeoff-in-reinforcement-learning/)
+- [High Variance in Policy gradients](https://balajiai.github.io/high_variance_in_policy_gradients)
 ---