deep-rl-class

mirror of https://github.com/huggingface/deep-rl-class.git synced 2026-06-28 08:46:16 +08:00

Files

Balaji Varatharajan 87fcfeb9bb Update variance-problem.mdx

Hi, I've a blog titled [High Variance in Policy gradients](https://balajiai.github.io/high_variance_in_policy_gradients) which also explains about the variance problem in policy gradient and techniques for variance reduction such as baseline and actor-critics method.
I think, it would be valuable to this course readers. So I'm adding it to the reading-list.

Thanks!

2024-02-17 15:16:29 +05:30

additional-readings.mdx

Typos Unit6

2023-04-19 10:21:13 -05:00

advantage-actor-critic.mdx

Typos Unit6

2023-04-19 10:21:13 -05:00

conclusion.mdx

Typos Unit6

2023-04-19 10:21:13 -05:00

hands-on.mdx

Update hands-on.mdx

2023-08-18 08:43:54 +02:00

introduction.mdx

Update introduction.mdx

2023-08-06 18:10:42 +02:00

quiz.mdx

Unit 5 quiz and rewording of unit 6

2023-12-06 18:30:51 +00:00

variance-problem.mdx

Update variance-problem.mdx

2024-02-17 15:16:29 +05:30