课程信息
100% 在线

100% 在线

立即开始,按照自己的计划学习。
可灵活调整截止日期

可灵活调整截止日期

根据您的日程表重置截止日期。
中级

中级

完成时间(小时)

完成时间大约为23 小时

建议:6 недель обучения, 6-8 часов в неделю...
可选语言

俄语(Russian)

字幕:俄语(Russian)
100% 在线

100% 在线

立即开始,按照自己的计划学习。
可灵活调整截止日期

可灵活调整截止日期

根据您的日程表重置截止日期。
中级

中级

完成时间(小时)

完成时间大约为23 小时

建议:6 недель обучения, 6-8 часов в неделю...
可选语言

俄语(Russian)

字幕:俄语(Russian)

教学大纲 - 您将从这门课程中学到什么

1
完成时间(小时)
完成时间为 5 小时

Введение, булев поиск

Этим занятием открывается цикл лекций, посвященных информационному поиску. Мы начнем с небольшого экскурса в историю возникновения вэб-поиска, изучим базовые понятия и узнаем, как можно классифицировать разные поисковые системы. Базовый вид поиска – это булев поиск. Мы рассмотрим, как он устроен и как можно исполнять запросы пользователей к такому поиску. Но недостаточно использовать оригинальный текст – чтобы учесть разные морфологические формы одного и того же слова, применяются различные этапы нормализации текста. Это применимо не только к документам, но и к запросам. Отдельно стоит рассмотреть такие важные усовершенствования булева поиска, как координатный поиск, которые учитывает, где именно в тексте находятся конкретные слова, и обработку полноценных фразовых запросов....
Reading
13 个视频 (总计 68 分钟), 1 个阅读材料, 5 个测验
Video13 个视频
История поисковых систем5分钟
Базовые понятия4分钟
Классификация поисковых систем4分钟
Основы булева поиска. Логические операции3分钟
Матрица инцидентности и переход к обратному индексу3分钟
Обработка запросов с обратным индексом4分钟
Зачем нужна нормализация18分钟
Определение языка3分钟
Стемминг2分钟
Лемматизация текста4分钟
Фразовые запросы4分钟
Координатный индекс3分钟
Reading1 个阅读材料
Решение10分钟
Quiz4 个练习
Базовые понятия информационного поиска8分钟
Булев поиск и матрица инцидентности14分钟
Нормализация текста. Стемминг. Лемматизация10分钟
Фразовые запросы. Координатный индекс6分钟
2
完成时间(小时)
完成时间为 4 小时

Поисковый индекс

В основе текстового информационного поиска лежит концепция обратного индекса. Эта неделя посвящена разным методам его построения, расширения за счет дополнительной информации и улучшения работы с ним благодаря сжатию словаря и ускорению работы с обратным индексом....
Reading
9 个视频 (总计 48 分钟), 1 个阅读材料, 3 个测验
Video9 个视频
Построение индекса на реальной коллекции документов8分钟
Блочное индексирование. Распределенное индексирование6分钟
Инкрементальная индексация3分钟
Параметрические индексы и зонные индексы2分钟
Сокращение индекса, стоп-слова5分钟
Сжатие словаря6分钟
Сжатие инвертированного файла7分钟
Skip-листы2分钟
Reading1 个阅读材料
Решение10分钟
Quiz2 个练习
Обратный индекс, индексация10分钟
Сжатие индекса12分钟
3
完成时间(小时)
完成时间为 5 小时

Нечёткий поиск

Эта неделя посвящена двум большим темам, связанным между собой: исправление опечаток в запросах пользователей и выполнение неточных запросов, в которых пользователь сознательно скрывает часть слова за специальным знаком – "*"....
Reading
9 个视频 (总计 54 分钟), 1 个阅读材料, 4 个测验
Video9 个视频
Структуры для словарей. Деревья8分钟
Нечёткий поиск5分钟
Перестановочный индекс3分钟
K-граммный индекс5分钟
Расстояние редактирования10分钟
Динамический алгоритм нахождения расстояние между словами3分钟
Фонетические исправления3分钟
Исправления в контексте4分钟
Reading1 个阅读材料
Решение10分钟
Quiz3 个练习
Структуры данных8分钟
Нечеткий поиск8分钟
Исправление ошибок14分钟
4
完成时间(小时)
完成时间为 4 小时

Ранжирование

Выполнение запросов пользователей на большом корпусе документов часто приводит к тому, что запросу удовлетворяет слишком много документов. Для того, чтобы пользователю не пришлось просматривать все найденные документы, поисковая система может отобрать из них только лучшие и показать пользователю в порядке "полезности". Этим занимается ранжирование, о котором и пойдет речь в этой неделе....
Reading
8 个视频 (总计 41 分钟), 1 个阅读材料, 3 个测验
Video8 个视频
Текстовое ранжирование5分钟
Модель мешка слов6分钟
Представление документов в виде векторов. Расстояние между документами3分钟
Tf-Idf4分钟
Принцип вероятностного ранжирования3分钟
Бинарная модель независимости6分钟
Переход от BIM к BM258分钟
Reading1 个阅读材料
Решение10分钟
Quiz2 个练习
Текстовое ранжирование10分钟
Вероятностная модель ранжирования14分钟

关于 Moscow Institute of Physics and Technology

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

常见问题

  • Once you enroll for a Certificate, you’ll have access to all videos, quizzes, and programming assignments (if applicable). Peer review assignments can only be submitted and reviewed once your session has begun. If you choose to explore the course without purchasing, you may not be able to access certain assignments.

  • When you purchase a Certificate you get access to all course materials, including graded assignments. Upon completing the course, your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile. If you only want to read and view the course content, you can audit the course for free.

还有其他问题吗?请访问 学生帮助中心