课程信息
4.8
1,510 个评分
220 个审阅
100% 在线

100% 在线

立即开始,按照自己的计划学习。
可灵活调整截止日期

可灵活调整截止日期

根据您的日程表重置截止日期。
中级

中级

完成时间(小时)

完成时间大约为44 小时

建议:8 hours/week...
可选语言

俄语(Russian)

字幕:俄语(Russian)

您将获得的技能

Random ForestPython ProgrammingMachine LearningSupervised Learning
100% 在线

100% 在线

立即开始,按照自己的计划学习。
可灵活调整截止日期

可灵活调整截止日期

根据您的日程表重置截止日期。
中级

中级

完成时间(小时)

完成时间大约为44 小时

建议:8 hours/week...
可选语言

俄语(Russian)

字幕:俄语(Russian)

教学大纲 - 您将从这门课程中学到什么

1
完成时间(小时)
完成时间为 9 小时

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей....
Reading
13 个视频 (总计 82 分钟), 8 个阅读材料, 8 个测验
Video13 个视频
Как устроена специализация, и зачем ее проходить3分钟
МФТИ1分钟
Знакомство с машинным обучением11分钟
Обучение на размеченных данных5分钟
Обучение без учителя5分钟
Признаки в машинном обучении8分钟
Линейные модели в задачах регрессии9分钟
Обучение линейной регрессии6分钟
Градиентный спуск для линейной регрессии7分钟
Стохастический градиентный спуск4分钟
Линейная классификация6分钟
Функции потерь в задачах классификации6分钟
Reading8 个阅读材料
Формат специализации и получение сертификата10分钟
Немного о Yandex10分钟
МФТИ10分钟
Forum&Chat10分钟
Слайды к лекциям10分钟
Конспект10分钟
Слайды к лекциям10分钟
Конспект10分钟
Quiz6 个练习
Основные термины в машинном обучении6分钟
Типы задач в машинном обучении6分钟
Машинное обучение: задачи и признаки12分钟
Линейная регрессия4分钟
Градиентный спуск4分钟
Линейные модели8分钟
2
完成时间(小时)
完成时间为 9 小时

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных....
Reading
14 个视频 (总计 126 分钟), 9 个阅读材料, 8 个测验
Video14 个视频
Регуляризация7分钟
Оценивание качества алгоритмов7分钟
Сравнение алгоритмов и выбор гиперпараметров4分钟
Метрики качества в задачах регрессии10分钟
Метрики качества классификации4分钟
Точность и полнота8分钟
Объединение точности и полноты5分钟
Качество оценок принадлежности классу12分钟
Встроенные датасеты. Sklearn.datasets15分钟
Кросс-валидация. Sklearn.cross_validation9分钟
Линейные модели. Sklearn.linear_model. Классификация10分钟
Линейные модели. Sklearn.linear_model. Регрессия7分钟
Метрики качества. Sklearn.metrics13分钟
Reading9 个阅读材料
Слайды к лекциям10分钟
Конспект10分钟
Слайды к лекциям10分钟
Конспект10分钟
Встроенные датасеты. Sklearn.datasets (ipython notebook)10分钟
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10分钟
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10分钟
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10分钟
Метрики качества. Sklearn.metrics (ipython notebook)10分钟
Quiz6 个练习
Проблема переобучения6分钟
Проблема переобучения и борьба с ней10分钟
Как измерить качество алгоритма?6分钟
Метрики качества10分钟
Встроенные датасеты и кросс-валидация8分钟
Введение в scikit-learn10分钟
3
完成时间(小时)
完成时间为 7 小时

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn....
Reading
14 个视频 (总计 97 分钟), 8 个阅读材料, 7 个测验
Video14 个视频
Метод максимального правдоподобия4分钟
Регрессия как максимизация правдоподобия2分钟
Регрессия как оценка среднего4分钟
Регуляризация8分钟
Задача оценивания вероятностей и логистическая регрессия8分钟
Масштабирование признаков6分钟
Спрямляющие пространства5分钟
Работа с категориальными признаками4分钟
Несбалансированные данные5分钟
Многоклассовая классификация4分钟
Подбор параметров по сетке. Sklearn.grid_search9分钟
Задача: bike sharing demand15分钟
Задача: bike sharing demand. Продолжение13分钟
Reading8 个阅读材料
Слайды к лекциям10分钟
Конспект10分钟
Слайды к лекциям10分钟
Конспект10分钟
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10分钟
Задача Bike Sharing Demand (ipython notebook)10分钟
Задача Bike Sharing Demand. Продолжение (ipython notebook)10分钟
Практика Machine Learning10分钟
Quiz6 个练习
Метод максимального правдоподобия6分钟
Линейные модели: статистический взгляд14分钟
Линейные модели: подготовка признаков6分钟
Линейные модели: практические аспекты6分钟
Подбор параметров по сетке6分钟
Анализ данных в scikit-learn12分钟
4
完成时间(小时)
完成时间为 10 小时

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе....
Reading
17 个视频 (总计 114 分钟), 10 个阅读材料, 8 个测验
Video17 个视频
Обучение решающих деревьев6分钟
Критерии информативности7分钟
Критерии останова и стрижка деревьев4分钟
Решающие деревья и категориальные признаки8分钟
Решающие деревья в sklearn10分钟
Композиции деревьев6分钟
Смещение и разброс9分钟
Случайные леса6分钟
Трюки со случайными лесами4分钟
Случайные леса в sklearn7分钟
Композиции простых алгоритмов5分钟
Градиентный бустинг7分钟
Борьба с переобучением в градиентном бустинге6分钟
Градиентный бустинг для регрессии и классификации4分钟
Градиентный бустинг над решающими деревьями5分钟
Градиентный бустинг в XGBoost5分钟
Reading10 个阅读材料
Решающие деревья в sklearn (ipython notebook)10分钟
Слайды к лекциям10分钟
Конспект10分钟
Случайные леса в sklearn (ipython notebook)10分钟
Слайды к лекциям10分钟
Конспект10分钟
XGBoost10分钟
Градиентный бустинг в XGBoost (ipython notebook)10分钟
Слайды к лекциям10分钟
Конспект10分钟
Quiz6 个练习
Построение решающих деревьев8分钟
Решающие деревья14分钟
Бэггинг6分钟
Композиции и случайные леса8分钟
Обучение композиций и градиентный бустинг4分钟
Градиентный бустинг: обучение и практические аспекты8分钟
4.8
220 个审阅Chevron Right
职业方向

71%

完成这些课程后已开始新的职业生涯
工作福利

83%

通过此课程获得实实在在的工作福利
职业晋升

33%

加薪或升职

热门审阅

创建者 ADDec 2nd 2018

Курс очень живой и интересный, очень доволен. Продолжу проходить специализацию.\n\n5-ая неделя этого курса, как известно, не очень удачная, так что, просто примите ее такой, какая она есть :)

创建者 ZAJul 21st 2017

Курс просто фантастика. Отличное преподавание, много нового. Столько что еще переваривать и переваривать. Немного сжата последняя неделя и на нейронные сети нужно больше времени. Спасибо.

讲师

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

关于 Moscow Institute of Physics and Technology

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

关于 Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

关于 Машинное обучение и анализ данных 专项课程

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

常见问题

  • 注册以便获得证书后,您将有权访问所有视频、测验和编程作业(如果适用)。只有在您的班次开课之后,才可以提交和审阅同学互评作业。如果您选择在不购买的情况下浏览课程,可能无法访问某些作业。

  • 您注册课程后,将有权访问专项课程中的所有课程,并且会在完成课程后获得证书。您的电子课程证书将添加到您的成就页中,您可以通过该页打印您的课程证书或将其添加到您的领英档案中。如果您只想阅读和查看课程内容,可以免费旁听课程。

还有其他问题吗?请访问 学生帮助中心