课程信息

102,206 次近期查看
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
第 2 门课程(共 4 门)
可灵活调整截止日期
根据您的日程表重置截止日期。
中级

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

完成时间大约为24 小时
英语(English)

您将获得的技能

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
第 2 门课程(共 4 门)
可灵活调整截止日期
根据您的日程表重置截止日期。
中级

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

完成时间大约为24 小时
英语(English)

提供方

Placeholder

阿尔伯塔大学

Placeholder

Alberta Machine Intelligence Institute

教学大纲 - 您将从这门课程中学到什么

内容评分Thumbs Up92%(2,458 个评分)Info
1

1

完成时间为 1 小时

Welcome to the Course!

完成时间为 1 小时
2 个视频 (总计 10 分钟), 2 个阅读材料
2 个视频
Meet your instructors!8分钟
2 个阅读材料
Reinforcement Learning Textbook10分钟
Read Me: Pre-requisites and Learning Objectives10分钟
2

2

完成时间为 6 小时

Monte Carlo Methods for Prediction & Control

完成时间为 6 小时
11 个视频 (总计 58 分钟), 3 个阅读材料, 2 个测验
11 个视频
Using Monte Carlo for Prediction6分钟
Using Monte Carlo for Action Values2分钟
Using Monte Carlo methods for generalized policy iteration2分钟
Solving the Blackjack Example3分钟
Epsilon-soft policies5分钟
Why does off-policy learning matter?4分钟
Importance Sampling4分钟
Off-Policy Monte Carlo Prediction5分钟
Emma Brunskill: Batch Reinforcement Learning12分钟
Week 1 Summary3分钟
3 个阅读材料
Module 1 Learning Objectives10分钟
Weekly Reading40分钟
Chapter Summary40分钟
1 个练习
Graded Quiz30分钟
3

3

完成时间为 5 小时

Temporal Difference Learning Methods for Prediction

完成时间为 5 小时
6 个视频 (总计 37 分钟), 2 个阅读材料, 2 个测验
6 个视频
Rich Sutton: The Importance of TD Learning6分钟
The advantages of temporal difference learning5分钟
Comparing TD and Monte Carlo5分钟
Andy Barto and Rich Sutton: More on the History of RL12分钟
Week 2 Summary2分钟
2 个阅读材料
Module 2 Learning Objectives10分钟
Weekly Reading40分钟
1 个练习
Practice Quiz30分钟
4

4

完成时间为 6 小时

Temporal Difference Learning Methods for Control

完成时间为 6 小时
9 个视频 (总计 30 分钟), 3 个阅读材料, 2 个测验
9 个视频
Sarsa in the Windy Grid World3分钟
What is Q-learning?3分钟
Q-learning in the Windy Grid World3分钟
How is Q-learning off-policy?4分钟
Expected Sarsa3分钟
Expected Sarsa in the Cliff World3分钟
Generality of Expected Sarsa1分钟
Week 3 Summary2分钟
3 个阅读材料
Module 3 Learning Objectives10分钟
Weekly Reading40分钟
Chapter summary40分钟
1 个练习
Practice Quiz30分钟

审阅

来自SAMPLE-BASED LEARNING METHODS的热门评论

查看所有评论

关于 强化学习 专项课程

强化学习

常见问题

还有其他问题吗?请访问 学生帮助中心