课程信息
4.7
869 个评分
95 个审阅
专项课程
100% 在线

100% 在线

立即开始,按照自己的计划学习。
可灵活调整截止日期

可灵活调整截止日期

根据您的日程表重置截止日期。
中级

中级

完成时间(小时)

完成时间大约为25 小时

建议:4 недели обучения, через 3-5 часа / неделю...
可选语言

俄语(Russian)

字幕:俄语(Russian)...

您将获得的技能

Topic ModelData Clustering AlgorithmsMachine LearningData Visualization (DataViz)
专项课程
100% 在线

100% 在线

立即开始,按照自己的计划学习。
可灵活调整截止日期

可灵活调整截止日期

根据您的日程表重置截止日期。
中级

中级

完成时间(小时)

完成时间大约为25 小时

建议:4 недели обучения, через 3-5 часа / неделю...
可选语言

俄语(Russian)

字幕:俄语(Russian)...

教学大纲 - 您将从这门课程中学到什么

1
完成时间(小时)
完成时间为 7 小时

Кластеризация

Добро пожаловать на курс "Поиск структуры в данных"! В этом курсе вы узнаете про задачи машинного обучения, в которых требуется не предсказать целевую переменную, а найти некоторые внутренние закономерности в данных — например, сгруппировать объекты по схожести, или определить наиболее важные признаки. В первом модуле мы изучим задачу кластеризации, направленную на поиск групп близких объектов. Вы узнаете про основные подходы к её решению, а также узнаете, как можно выбрать хороший алгоритм кластеризации, не имея правильных ответов....
Reading
15 个视频(共 109 分钟), 8 个阅读材料, 5 个测验
Video15 个视频
Как устроена специализация, и зачем ее проходить3分钟
Структура уроков1分钟
Задача кластеризации4分钟
Примеры задач кластеризации5分钟
Знакомство с методами кластеризации9分钟
Пример: кластеризация текстов по теме13分钟
Выбор метода кластеризации7分钟
МФТИ1分钟
Метод K средних (K-Means)10分钟
Expectation Maximization (EM-алгоритм)9分钟
Агломеративная иерархическая кластеризация12分钟
Графовые методы кластеризации4分钟
Методы, основанные на плотности6分钟
Оценка качества и рекомендации по решению задачи кластеризации13分钟
Reading8 个阅读材料
Блокнот из примера кластеризации текстов20分钟
Слайды к лекциям10分钟
Конспект10分钟
Немного о Yandex10分钟
МФТИ10分钟
Forum&Chat10分钟
Слайды к лекциям10分钟
Конспект10分钟
Quiz4 个练习
Знакомство с кластеризацией6分钟
Введение в кластеризацию8分钟
Некоторые методы кластеризации8分钟
Подробнее о методах кластеризации12分钟
2
完成时间(小时)
完成时间为 6 小时

Понижение размерности и матричные разложения

В предыдущем модуле мы обсуждали, как кластеризовать объекты, а в этом модуле займёмся признаками. Нередко возникают ситуации, в которых далеко не все признаки нужны для решения задачи — или же нужны все, но при этом их слишком много. В этом случае нужно перейти в новое признаковое пространство меньшей размерности. Для этого можно либо отбирать наиболее важные признаки, либо порождать новые на основе исходных — мы обсудим оба подхода. В частности, мы разберёмся с методом главных компонент, который используется в самых разных задачах машинного обучения. Затем мы перейдём к матричным разложениям — мы изучим несколько методов, позволяющих получить приближение исходной матрицы в виде произведения нескольких матриц меньшей размерности. Такая аппроксимация часто используется в задачах машинного обучения, например, для понижения размерности данных, восстановления пропущенных значений в матрицах и построения рекомендательных систем....
Reading
15 个视频(共 108 分钟), 4 个阅读材料, 5 个测验
Video15 个视频
Одномерный отбор признаков8分钟
Жадные методы отбора признаков6分钟
Отбор признаков на основе моделей6分钟
Понижение размерности4分钟
Метод главных компонент: постановка задачи7分钟
Метод главных компонент: решение6分钟
Матричные разложения13分钟
SGD и ALS5分钟
Прогнозирование неизвестных значений в матрице6分钟
Проблема отсутствия негативных примеров и implicit методы6分钟
Вероятностный взгляд на матричные разложения5分钟
Неотрицательные матричные разложения: постановка и решение10分钟
Неотрицательные матричные разложения: функционалы и инициализация5分钟
Обработка пропусков8分钟
Reading4 个阅读材料
Слайды к лекциям10分钟
Конспект10分钟
Слайды к лекциям10分钟
Конспект10分钟
Quiz4 个练习
Отбор признаков6分钟
Понижение размерности и отбор признаков14分钟
Матричные разложения8分钟
Неотрицательные матричные разложения10分钟
3
完成时间(小时)
完成时间为 4 小时

Визуализация и поиск аномалий

Добро пожаловать на третью неделю курса! В ней мы обсудим две задачи: обнаружение аномалий и визуализация данных. Обнаружение аномалий направлено на поиск объектов, которые являются особенными в некотором смысле. Например, это могут объекты с такими значениями признаков, которые далеки от имеющихся в обучающей выборке — вполне ожидаемо, что на таких объектах модель выдаст очень плохие прогнозы. Вы узнаете, как можно формально дать определение аномалий и с помощью каких методов можно решать задачу их поиска. Вторая задача, о которой мы поговорим — это визуализация, то есть отображение многомерной выборки в пространство размерности два или три. В теории визуализация близка к понижению размерности — но за счёт того, что нам нужно найти всего два или три признака, можно использовать очень сложные нелинейные методы....
Reading
8 个视频(共 57 分钟), 5 个阅读材料, 5 个测验
Video8 个视频
Параметрическое восстановление плотности9分钟
Непараметрическое восстановление плотности8分钟
Одноклассовый SVM5分钟
Задача визуализации5分钟
Многомерное шкалирование4分钟
Метод t-SNE6分钟
Визуализация данных в sklearn12分钟
Reading5 个阅读材料
Слайды к лекциям10分钟
Конспект10分钟
Визуализация данных в sklearn10分钟
Слайды к лекциям10分钟
Конспект10分钟
Quiz4 个练习
Восстановление плотности6分钟
Поиск аномалий4分钟
Методы SNE и t-SNE6分钟
Визуализация14分钟
4
完成时间(小时)
完成时间为 9 小时

Тематическое моделирование

Люди уже много веков сохраняют свои знания в виде книг, а крупнейшая на сегодняшний день коллекция информации — Интернет — состоит из огромного количества текстов. Тексты, по сути, являются наиболее популярным видом данных, и поэтому очень важно уметь искать в них закономерности. Тематическое моделирование — это способ семантического анализа коллекции текстовых документов. Тематическая модель позволяет для каждого документа найти темы, которые его описывают, и кроме того показывает, какие слова характеризуют ту или иную тему. Другими словами, мы находим более компактное представление большого набора текстов в виде нескольких тем. С математической точки зрения тематическая модель — это еще один вид матричного разложения, где в качестве исходной матрицы выступает матрица частот слов в документах. На четвертой неделе мы поговорим о том, где применяют тематические модели, какие они бывают, как их строить и как оценивать. ...
Reading
14 个视频(共 151 分钟), 7 个阅读材料, 6 个测验
Video14 个视频
Постановка задачи тематического моделирования12分钟
Базовые тематические модели и EM-алгоритм14分钟
Регуляризация тематических моделей10分钟
Мультимодальные тематические модели9分钟
Внутренние критерии качества тематических моделей9分钟
Внешние критерии качества тематических моделей16分钟
Визуализация тематических моделей10分钟
Тематические модели на практике11分钟
Пример использования библиотеки gensim для построения тематической модели10分钟
Установка BigARTM в Windows3分钟
Установка BigARTM в Linux Mint2分钟
Установка BigARTM в Mac OS-X3分钟
Пример использования библиотеки BigARTM для построения тематической модели19分钟
Reading7 个阅读材料
Слайды к лекциям10分钟
Конспект10分钟
Ноутбук из демонстрации использования gensim10分钟
Ноутбук из демонстрации использования BigARTM10分钟
Слайды к лекциям10分钟
Конспект10分钟
Финальные титры10分钟
Quiz4 个练习
Постановка задачи и базовые понятия6分钟
Тематическое моделирование-18分钟
Критерии качества тематических моделей6分钟
Тематическое моделирование-26分钟
4.7
职业方向

50%

完成这些课程后已开始新的职业生涯
工作福利

83%

通过此课程获得实实在在的工作福利
职业晋升

33%

加薪或升职

热门审阅

创建者 KTJun 1st 2016

Отличны курс! Спасибо большое создателям! Отличная подача материала, хорошие практические примеры и вообще всё просто классно! Категорически рекомендую, в том числе начинающим :)

创建者 TYMar 16th 2017

Последняя неделя этого курса была значительно сложнее всего, что было раньше, но это того стоило. Пока лучший курс из всех, что я знаю на эту тему.

讲师

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

关于 Moscow Institute of Physics and Technology

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

关于 Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

关于 Машинное обучение и анализ данных 专项课程

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

常见问题

  • 注册以便获得证书后,您将有权访问所有视频、测验和编程作业(如果适用)。只有在您的班次开课之后,才可以提交和审阅同学互评作业。如果您选择在不购买的情况下浏览课程,可能无法访问某些作业。

  • 您注册课程后,将有权访问专项课程中的所有课程,并且会在完成课程后获得证书。您的电子课程证书将添加到您的成就页中,您可以通过该页打印您的课程证书或将其添加到您的领英档案中。如果您只想阅读和查看课程内容,可以免费旁听课程。

还有其他问题吗?请访问 学生帮助中心