课程信息

109,847 次近期查看

可分享的证书

完成后获得证书

100% 在线

立即开始,按照自己的计划学习。

第 2 门课程(共 4 门)

可灵活调整截止日期

根据您的日程表重置截止日期。

中级

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

完成时间大约为28 小时

英语(English)

字幕:英语(English)

您将获得的技能

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

可分享的证书

完成后获得证书

100% 在线

立即开始,按照自己的计划学习。

第 2 门课程(共 4 门)

可灵活调整截止日期

根据您的日程表重置截止日期。

中级

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

完成时间大约为28 小时

英语(English)

字幕:英语(English)

提供方

阿尔伯塔大学 徽标

阿尔伯塔大学

Alberta Machine Intelligence Institute 徽标

Alberta Machine Intelligence Institute

教学大纲 - 您将从这门课程中学到什么

内容评分Thumbs Up92%(1,806 个评分)Info
1

1

完成时间为 1 小时

Welcome to the Course!

完成时间为 1 小时
2 个视频 (总计 10 分钟), 2 个阅读材料
2 个视频
Meet your instructors!8分钟
2 个阅读材料
Reinforcement Learning Textbook10分钟
Read Me: Pre-requisites and Learning Objectives10分钟
2

2

完成时间为 4 小时

Monte Carlo Methods for Prediction & Control

完成时间为 4 小时
11 个视频 (总计 58 分钟), 2 个阅读材料, 1 个测验
11 个视频
Using Monte Carlo for Prediction6分钟
Using Monte Carlo for Action Values2分钟
Using Monte Carlo methods for generalized policy iteration2分钟
Solving the Blackjack Example3分钟
Epsilon-soft policies5分钟
Why does off-policy learning matter?4分钟
Importance Sampling4分钟
Off-Policy Monte Carlo Prediction5分钟
Emma Brunskill: Batch Reinforcement Learning12分钟
Week 1 Summary3分钟
2 个阅读材料
Weekly Reading40分钟
Chapter Summary40分钟
1 个练习
Graded Quiz30分钟
3

3

完成时间为 6 小时

Temporal Difference Learning Methods for Prediction

完成时间为 6 小时
6 个视频 (总计 37 分钟), 1 个阅读材料, 2 个测验
6 个视频
Rich Sutton: The Importance of TD Learning6分钟
The advantages of temporal difference learning5分钟
Comparing TD and Monte Carlo5分钟
Andy Barto and Rich Sutton: More on the History of RL12分钟
Week 2 Summary2分钟
1 个阅读材料
Weekly Reading40分钟
1 个练习
Practice Quiz30分钟
4

4

完成时间为 8 小时

Temporal Difference Learning Methods for Control

完成时间为 8 小时
9 个视频 (总计 30 分钟), 2 个阅读材料, 2 个测验
9 个视频
Sarsa in the Windy Grid World3分钟
What is Q-learning?3分钟
Q-learning in the Windy Grid World3分钟
How is Q-learning off-policy?4分钟
Expected Sarsa3分钟
Expected Sarsa in the Cliff World3分钟
Generality of Expected Sarsa1分钟
Week 3 Summary2分钟
2 个阅读材料
Weekly Reading40分钟
Chapter summary40分钟
1 个练习
Practice Quiz30分钟

关于 强化学习 专项课程

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
强化学习

常见问题

  • 注册以便获得证书后,您将有权访问所有视频、测验和编程作业(如果适用)。只有在您的班次开课之后,才可以提交和审阅同学互评作业。如果您选择在不购买的情况下浏览课程,可能无法访问某些作业。

  • 您注册课程后,将有权访问专项课程中的所有课程,并且会在完成课程后获得证书。您的电子课程证书将添加到您的成就页中,您可以通过该页打印您的课程证书或将其添加到您的领英档案中。如果您只想阅读和查看课程内容,可以免费旁听课程。

  • 如果订阅,您可以获得 7 天免费试听,在此期间,您可以取消课程,无需支付任何罚金。在此之后,我们不会退款,但您可以随时取消订阅。请阅读我们完整的退款政策

  • 是的,Coursera 可以为无法承担费用的学生提供助学金。通过点击左侧“注册”按钮下的“助学金”链接可以申请助学金。您可以根据屏幕提示完成申请,申请获批后会收到通知。您需要针对专项课程中的每一门课程完成上述步骤,包括毕业项目。了解更多

还有其他问题吗?请访问 学生帮助中心