[МУЗЫКА] [МУЗЫКА] Здравствуйте, уважаемые слушатели. Меня зовут Блеканов Иван Станиславович. Я являюсь заведующим кафедрой технологии программирования Санкт-Петербургского государственного университета. Тематика нашего курса — то, что по-английски называется Data science, а в русском переводе чаще всего носит название «Наука о данных». Эта дисциплина очень молода. Можно считать, что она появилась в самом конце XX столетия, но уже успела привлечь к себе пристальное внимание всех тех, кто так или иначе связан с областью обработки данных. Давайте с вами разберемся, что же такое Data science. Начало XXI века ознаменовалось явным переходом человеческого общества от индустриальной формации к информационной, где основным фактором развития является: производство, обработка и хранение информации. За последние десятилетия наблюдается экспоненциальный рост количества накопленных данных, сгенерированных в различных сферах человеческой деятельности, и доступных для анализа. Сегодня объем таких данных оценивается огромными числами — зеттабайтами. Неудивительно, что растет и потребность в использовании и эффективном извлечении скрытых в данных закономерностей и обусловленностей. Инженерно-научное направление, которое, с одной стороны, занимается проблемами сбора и обработки неструктурированных данных, а с другой, применением методов машинного обучения для поиска ответов на вопросы, сформулированных в конкретных терминах предметной области, называется «Наука о данных». В настоящее время инструменты и методы Data science все чаще используются в государственных и коммерческих сферах, например, таких как банки и финансовый рынок, торговля и реклама, медицина, спорт, образование и других. При подготовке материалов данного курса мы стремились выбрать из внушительного объема прикладных методов Data science самые показательные и полезные для понимания принципов исследования данных. Мы сосредоточимся на обзоре того материала современной науки о данных, который будет максимально полезен для всех, кто только начинает осваивать данную область знаний. Поэтому в названии нашего курса первым идет слово «Введение». В подготовке материалов данного курса принимали участие девять авторов, которые являются выпускниками и сотрудниками Санкт-Петербургского государственного университета. Структура курса включает в себя пять недель. На первой неделе мы с вами поговорим о прикладных задачах науки о данных, поговорим с вами о типах и форматах данных, системах их хранения, а также о базовых моделях данных. Вторая и третья недели призваны познакомить вас с необходимым математическим и программным инструментарием, востребованным в нашем курсе. На четвертой и пятой неделе подробно разобраны задачи машинного обучения с учителем и без учителя соответственно. Отдельно хочется пожелать вам всем удачи в изучении и освоении материалов нашего курса.