课程信息

90,241 次近期查看

学生职业成果

33%

完成这些课程后已开始新的职业生涯

56%

通过此课程获得实实在在的工作福利

33%

加薪或升职
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
第 4 门课程(共 7 门)
可灵活调整截止日期
根据您的日程表重置截止日期。
高级
完成时间大约为26 小时
英语(English)
字幕:英语(English), 韩语

学生职业成果

33%

完成这些课程后已开始新的职业生涯

56%

通过此课程获得实实在在的工作福利

33%

加薪或升职
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
第 4 门课程(共 7 门)
可灵活调整截止日期
根据您的日程表重置截止日期。
高级
完成时间大约为26 小时
英语(English)
字幕:英语(English), 韩语

提供方

国立高等经济大学 徽标

国立高等经济大学

教学大纲 - 您将从这门课程中学到什么

内容评分Thumbs Up81%(2,103 个评分)Info
1

1

完成时间为 5 小时

Intro: why should I care?

完成时间为 5 小时
14 个视频 (总计 85 分钟), 5 个阅读材料, 3 个测验
14 个视频
Why should you care9分钟
Reinforcement learning vs all3分钟
Multi-armed bandit4分钟
Decision process & applications6分钟
Markov Decision Process5分钟
Crossentropy method9分钟
Approximate crossentropy method5分钟
More on approximate crossentropy method6分钟
Evolution strategies: core idea6分钟
Evolution strategies: math problems5分钟
Evolution strategies: log-derivative trick8分钟
Evolution strategies: duct tape6分钟
Blackbox optimization: drawbacks4分钟
5 个阅读材料
About the University10分钟
FAQ10分钟
Primers1小时
About honors track1分钟
Extras10分钟
2

2

完成时间为 3 小时

At the heart of RL: Dynamic Programming

完成时间为 3 小时
5 个视频 (总计 54 分钟), 3 个阅读材料, 4 个测验
5 个视频
State and Action Value Functions13分钟
Measuring Policy Optimality6分钟
Policy: evaluation & improvement10分钟
Policy and value iteration8分钟
3 个阅读材料
Optional: Reward discounting from a mathematical perspective10分钟
External links: Reward Design10分钟
Discrete Stochastic Dynamic Programming10分钟
3 个练习
Reward design8分钟
Optimality in RL30分钟
Policy Iteration30分钟
3

3

完成时间为 3 小时

Model-free methods

完成时间为 3 小时
6 个视频 (总计 47 分钟), 1 个阅读材料, 4 个测验
6 个视频
Monte-Carlo & Temporal Difference; Q-learning8分钟
Exploration vs Exploitation8分钟
Footnote: Monte-Carlo vs Temporal Difference2分钟
Accounting for exploration. Expected Value SARSA11分钟
On-policy vs off-policy; Experience replay7分钟
1 个阅读材料
Extras10分钟
1 个练习
Model-free reinforcement learning30分钟
4

4

完成时间为 3 小时

Approximate Value Based Methods

完成时间为 3 小时
9 个视频 (总计 104 分钟), 3 个阅读材料, 5 个测验
9 个视频
Loss functions in value based RL11分钟
Difficulties with Approximate Methods15分钟
DQN – bird's eye view9分钟
DQN – the internals9分钟
DQN: statistical issues6分钟
Double Q-learning6分钟
More DQN tricks10分钟
Partial observability17分钟
3 个阅读材料
TD vs MC10分钟
Extras10分钟
DQN follow-ups10分钟
3 个练习
MC & TD10分钟
SARSA and Q-learning10分钟
DQN30分钟

审阅

来自PRACTICAL REINFORCEMENT LEARNING的热门评论

查看所有评论

关于 高级机器学习 专项课程

This specialization gives an introduction to deep learning, reinforcement learning, natural language understanding, computer vision and Bayesian methods. Top Kaggle machine learning practitioners and CERN scientists will share their experience of solving real-world problems and help you to fill the gaps between theory and practice. Upon completion of 7 courses you will be able to apply modern machine learning methods in enterprise and understand the caveats of real-world data and settings....
高级机器学习

常见问题

  • Access to lectures and assignments depends on your type of enrollment. If you take a course in audit mode, you will be able to see most course materials for free. To access graded assignments and to earn a Certificate, you will need to purchase the Certificate experience, during or after your audit. If you don't see the audit option:

    • The course may not offer an audit option. You can try a Free Trial instead, or apply for Financial Aid.
    • The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.
  • 您注册课程后,将有权访问专项课程中的所有课程,并且会在完成课程后获得证书。您的电子课程证书将添加到您的成就页中,您可以通过该页打印您的课程证书或将其添加到您的领英档案中。如果您只想阅读和查看课程内容,可以免费旁听课程。

  • 如果订阅,您可以获得 7 天免费试听,在此期间,您可以取消课程,无需支付任何罚金。在此之后,我们不会退款,但您可以随时取消订阅。请阅读我们完整的退款政策

  • 是的,Coursera 可以为无法承担费用的学生提供助学金。通过点击左侧“注册”按钮下的“助学金”链接可以申请助学金。您可以根据屏幕提示完成申请,申请获批后会收到通知。您需要针对专项课程中的每一门课程完成上述步骤,包括毕业项目。了解更多

  • 此课程不提供大学学分,但部分大学可能会选择接受课程证书作为学分。查看您的合作院校,了解详情。Coursera 上的在线学位Mastertrack™ 证书提供获得大学学分的机会。

还有其他问题吗?请访问 学生帮助中心