课程信息
95,673 次近期查看

第 2 门课程(共 6 门)

100% 在线

立即开始,按照自己的计划学习。

可灵活调整截止日期

根据您的日程表重置截止日期。

中级

完成时间大约为43 小时

建议:8 hours/week...

俄语(Russian)

字幕:俄语(Russian)

您将获得的技能

Random ForestPython ProgrammingMachine LearningSupervised Learning

第 2 门课程(共 6 门)

100% 在线

立即开始,按照自己的计划学习。

可灵活调整截止日期

根据您的日程表重置截止日期。

中级

完成时间大约为43 小时

建议:8 hours/week...

俄语(Russian)

字幕:俄语(Russian)

教学大纲 - 您将从这门课程中学到什么

1
完成时间为 9 小时

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей.

...
13 个视频 (总计 82 分钟), 8 个阅读材料, 8 个测验
13 个视频
Как устроена специализация, и зачем ее проходить3分钟
МФТИ1分钟
Знакомство с машинным обучением11分钟
Обучение на размеченных данных5分钟
Обучение без учителя5分钟
Признаки в машинном обучении8分钟
Линейные модели в задачах регрессии9分钟
Обучение линейной регрессии6分钟
Градиентный спуск для линейной регрессии7分钟
Стохастический градиентный спуск4分钟
Линейная классификация6分钟
Функции потерь в задачах классификации6分钟
8 个阅读材料
Формат специализации и получение сертификата10分钟
Немного о Yandex10分钟
МФТИ10分钟
Forum&Chat10分钟
Слайды к лекциям10分钟
Конспект10分钟
Слайды к лекциям10分钟
Конспект10分钟
6 个练习
Основные термины в машинном обучении6分钟
Типы задач в машинном обучении6分钟
Машинное обучение: задачи и признаки12分钟
Линейная регрессия4分钟
Градиентный спуск4分钟
Линейные модели8分钟
2
完成时间为 9 小时

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных.

...
14 个视频 (总计 126 分钟), 9 个阅读材料, 8 个测验
14 个视频
Регуляризация7分钟
Оценивание качества алгоритмов7分钟
Сравнение алгоритмов и выбор гиперпараметров4分钟
Метрики качества в задачах регрессии10分钟
Метрики качества классификации4分钟
Точность и полнота8分钟
Объединение точности и полноты5分钟
Качество оценок принадлежности классу12分钟
Встроенные датасеты. Sklearn.datasets15分钟
Кросс-валидация. Sklearn.cross_validation9分钟
Линейные модели. Sklearn.linear_model. Классификация10分钟
Линейные модели. Sklearn.linear_model. Регрессия7分钟
Метрики качества. Sklearn.metrics13分钟
9 个阅读材料
Слайды к лекциям10分钟
Конспект10分钟
Слайды к лекциям10分钟
Конспект10分钟
Встроенные датасеты. Sklearn.datasets (ipython notebook)10分钟
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10分钟
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10分钟
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10分钟
Метрики качества. Sklearn.metrics (ipython notebook)10分钟
6 个练习
Проблема переобучения6分钟
Проблема переобучения и борьба с ней10分钟
Как измерить качество алгоритма?6分钟
Метрики качества10分钟
Встроенные датасеты и кросс-валидация8分钟
Введение в scikit-learn10分钟
3
完成时间为 7 小时

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn.

...
14 个视频 (总计 97 分钟), 7 个阅读材料, 7 个测验
14 个视频
Метод максимального правдоподобия4分钟
Регрессия как максимизация правдоподобия2分钟
Регрессия как оценка среднего4分钟
Регуляризация8分钟
Задача оценивания вероятностей и логистическая регрессия8分钟
Масштабирование признаков6分钟
Спрямляющие пространства5分钟
Работа с категориальными признаками4分钟
Несбалансированные данные5分钟
Многоклассовая классификация4分钟
Подбор параметров по сетке. Sklearn.grid_search9分钟
Задача: bike sharing demand15分钟
Задача: bike sharing demand. Продолжение13分钟
7 个阅读材料
Слайды к лекциям10分钟
Конспект10分钟
Слайды к лекциям10分钟
Конспект10分钟
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10分钟
Задача Bike Sharing Demand (ipython notebook)10分钟
Задача Bike Sharing Demand. Продолжение (ipython notebook)10分钟
6 个练习
Метод максимального правдоподобия6分钟
Линейные модели: статистический взгляд14分钟
Линейные модели: подготовка признаков6分钟
Линейные модели: практические аспекты6分钟
Подбор параметров по сетке6分钟
Анализ данных в scikit-learn12分钟
4
完成时间为 10 小时

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе.

...
17 个视频 (总计 114 分钟), 10 个阅读材料, 8 个测验
17 个视频
Обучение решающих деревьев6分钟
Критерии информативности7分钟
Критерии останова и стрижка деревьев4分钟
Решающие деревья и категориальные признаки8分钟
Решающие деревья в sklearn10分钟
Композиции деревьев6分钟
Смещение и разброс9分钟
Случайные леса6分钟
Трюки со случайными лесами4分钟
Случайные леса в sklearn7分钟
Композиции простых алгоритмов5分钟
Градиентный бустинг7分钟
Борьба с переобучением в градиентном бустинге6分钟
Градиентный бустинг для регрессии и классификации4分钟
Градиентный бустинг над решающими деревьями5分钟
Градиентный бустинг в XGBoost5分钟
10 个阅读材料
Решающие деревья в sklearn (ipython notebook)10分钟
Слайды к лекциям10分钟
Конспект10分钟
Случайные леса в sklearn (ipython notebook)10分钟
Слайды к лекциям10分钟
Конспект10分钟
XGBoost10分钟
Градиентный бустинг в XGBoost (ipython notebook)10分钟
Слайды к лекциям10分钟
Конспект10分钟
6 个练习
Построение решающих деревьев8分钟
Решающие деревья14分钟
Бэггинг6分钟
Композиции и случайные леса8分钟
Обучение композиций и градиентный бустинг4分钟
Градиентный бустинг: обучение и практические аспекты8分钟
4.8
252 个审阅Chevron Right

50%

完成这些课程后已开始新的职业生涯

58%

通过此课程获得实实在在的工作福利

33%

加薪或升职

来自Обучение на размеченных данных的热门评论

创建者 RNJan 21st 2017

Один из лучших курсов по обучению на размеченных данных. Немного расстраивали несбалансированность сложности домашних заданий и промежуточных проверок правильности подготовки данных в заданиях.

创建者 YDAug 8th 2018

Отличный курс. Меньше чем за месяц появилось базовое понимание обучения на размеченных данных и принципов ML.\n\nМного практики, грамотные преподаватели и качественные pdf сделали своё дело.

讲师

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

关于 莫斯科物理科学与技术学院

Московский физико-технический институт (Физтех) является одним из ведущих вузов страны и входит в основные рейтинги лучших университетов мира. Институт обладает не только богатой историей – основателями и профессорами института были Нобелевские лауреаты Пётр Капица, Лев Ландау и Николай Семенов – но и большой научно-исследовательской базой. Основой образования в МФТИ является уникальная «система Физтеха», сформулированная Петром Капицей: кропотливый отбор одаренных и склонных к творческой работе абитуриентов; участие в обучении ведущих научных работников; индивидуальный подход к отдельным студентам с целью развития их творческих задатков; воспитание с первых шагов в атмосфере технических исследований и конструктивного творчества с использованием потенциала лучших лабораторий страны. Среди выпускников МФТИ — нобелевские лауреаты Андрей Гейм и Константин Новоселов, основатель компании ABBYY Давид Ян, один из авторов архитектурных принципов построения вычислительных комплексов Борис Бабаян и др....

关于 Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

关于 机器学习和数据分析 专项课程

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
机器学习和数据分析

常见问题

  • 注册以便获得证书后,您将有权访问所有视频、测验和编程作业(如果适用)。只有在您的班次开课之后,才可以提交和审阅同学互评作业。如果您选择在不购买的情况下浏览课程,可能无法访问某些作业。

  • 您注册课程后,将有权访问专项课程中的所有课程,并且会在完成课程后获得证书。您的电子课程证书将添加到您的成就页中,您可以通过该页打印您的课程证书或将其添加到您的领英档案中。如果您只想阅读和查看课程内容,可以免费旁听课程。

还有其他问题吗?请访问 学生帮助中心