课程信息

125,956 次近期查看
可灵活调整截止日期
根据您的日程表重置截止日期。
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
第 1 门课程(共 4 门)
中级

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

完成时间大约为15 小时
英语(English)

您将学到的内容有

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

您将获得的技能

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
可灵活调整截止日期
根据您的日程表重置截止日期。
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
第 1 门课程(共 4 门)
中级

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

完成时间大约为15 小时
英语(English)

提供方

Placeholder

阿尔伯塔大学

Placeholder

Alberta Machine Intelligence Institute

教学大纲 - 您将从这门课程中学到什么

内容评分Thumbs Up93%(14,738 个评分)Info
1

1

完成时间为 1 小时

Welcome to the Course!

完成时间为 1 小时
4 个视频 (总计 20 分钟), 2 个阅读材料
完成时间为 4 小时

An Introduction to Sequential Decision-Making

完成时间为 4 小时
8 个视频 (总计 46 分钟), 3 个阅读材料, 2 个测验
2

2

完成时间为 3 小时

Markov Decision Processes

完成时间为 3 小时
7 个视频 (总计 36 分钟), 2 个阅读材料, 2 个测验
3

3

完成时间为 3 小时

Value Functions & Bellman Equations

完成时间为 3 小时
9 个视频 (总计 56 分钟), 3 个阅读材料, 2 个测验
4

4

完成时间为 4 小时

Dynamic Programming

完成时间为 4 小时
10 个视频 (总计 72 分钟), 3 个阅读材料, 2 个测验

审阅

来自FUNDAMENTALS OF REINFORCEMENT LEARNING的热门评论

查看所有评论

关于 强化学习 专项课程

强化学习

常见问题

还有其他问题吗?请访问 学生帮助中心