<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_1%2F2021_2022</id>
	<title>Машинное обучение 1/2021 2022 - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_1%2F2021_2022"/>
	<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_1/2021_2022&amp;action=history"/>
	<updated>2026-06-06T12:33:51Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wikicshse.ru/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_1/2021_2022&amp;diff=1421&amp;oldid=prev</id>
		<title>imported&gt;Esokolov: Новая страница: «== О курсе ==  left  Курс читается для студентов 3-го курса [https://cs.hse.ru/…»</title>
		<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_1/2021_2022&amp;diff=1421&amp;oldid=prev"/>
		<updated>2022-09-01T20:59:33Z</updated>

		<summary type="html">&lt;p&gt;Новая страница: «== О курсе ==  &lt;a href=&quot;/%D0%A4%D0%B0%D0%B9%D0%BB:ML_surfaces.png&quot; title=&quot;Файл:ML surfaces.png&quot;&gt;280px|borderless|left&lt;/a&gt;  Курс читается для студентов 3-го курса [https://cs.hse.ru/…»&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;== О курсе ==&lt;br /&gt;
&lt;br /&gt;
[[Файл:ML_surfaces.png|280px|borderless|left]]&lt;br /&gt;
&lt;br /&gt;
Курс читается для студентов 3-го курса [https://cs.hse.ru/ami ПМИ ФКН ВШЭ] в 1-2 модулях.&lt;br /&gt;
&lt;br /&gt;
Проводится с 2016 года.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лектор:&amp;#039;&amp;#039;&amp;#039; [http://www.hse.ru/staff/esokolov Соколов Евгений Андреевич]&lt;br /&gt;
&lt;br /&gt;
Лекции проходят по пятницам, 11:10 - 12:30, в zoom (https://zoom.us/j/98499384799?pwd=OC9GcFd5QlJkZlA5Uk85SHNVTGxSdz09).&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
=== Полезные ссылки ===&lt;br /&gt;
&lt;br /&gt;
[https://www.hse.ru/ba/ami/courses/450802413.html Карточка курса и программа]&lt;br /&gt;
&lt;br /&gt;
[https://github.com/esokolov/ml-course-hse Репозиторий с материалами на GitHub]&lt;br /&gt;
&lt;br /&gt;
[https://www.youtube.com/watch?v=OBG6EUSRC9g&amp;amp;list=PLEqoHzpnmTfDwuwrFHWVHdr1-qJsfqCUX Видеозаписи лекций 18/19 года]&lt;br /&gt;
&lt;br /&gt;
Почта для сдачи домашних заданий (на самом деле задания сдаются в AnyTask, но если он не работает, то присылайте на почту): hse.cs.ml+&amp;lt;номер группы&amp;gt;@gmail.com (например, hse.cs.ml+171@gmail.com)&lt;br /&gt;
&lt;br /&gt;
Канал в telegram для объявлений: https://t.me/joinchat/G2T6pB1CgF82NTMy&lt;br /&gt;
&lt;br /&gt;
Чат в telegram для обсуждений (предназначение чата до конца не ясно, вопросы может быть правильнее задавать в чатах групп): https://t.me/joinchat/NRpKJ09prtRlMTli&lt;br /&gt;
&lt;br /&gt;
Ссылка на курс в Anytask: https://anytask.org/course/856&lt;br /&gt;
&lt;br /&gt;
[https://docs.google.com/spreadsheets/d/1_qMPqgcJZEJaiXZpMbjKM0trw_aGkkulrZG7Lq7kjU8/edit?usp=sharing Таблица с оценками]&lt;br /&gt;
&lt;br /&gt;
Оставить отзыв на курс: [https://goo.gl/forms/5CddG0gc75VZvqi52 форма]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Вопросы&amp;#039;&amp;#039;&amp;#039; по курсу можно задавать в телеграм лектору (esokolov@) или семинаристу.&lt;br /&gt;
Вопросы по материалам лекций/семинаров и по заданиям лучше всего задавать на [https://github.com/esokolov/ml-course-hse/discussions форуме].&lt;br /&gt;
&lt;br /&gt;
=== Семинары ===&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Группа !! Преподаватель&lt;br /&gt;
|-&lt;br /&gt;
| 191 (МОП) || Хрушков Павел Вадимович&lt;br /&gt;
|-&lt;br /&gt;
| 192 (МОП) || [https://www.hse.ru/staff/esokolov Соколов Евгений Андреевич]&lt;br /&gt;
|-&lt;br /&gt;
| 193 (МОП) || [https://www.hse.ru/org/persons/208522505 Садртдинов Ильдус Рустемович]&lt;br /&gt;
|-&lt;br /&gt;
| 194 (АДИС)|| [https://www.hse.ru/staff/atsvigun Цвигун Аким Олегович]&lt;br /&gt;
|-&lt;br /&gt;
| 195 (РС) || Каюмов Эмиль Марселевич&lt;br /&gt;
|-&lt;br /&gt;
| 196 (РС) || Шабалин Александр Михайлович&lt;br /&gt;
|-&lt;br /&gt;
| 197 (АПР) || [https://www.hse.ru/org/persons/160961881 Глазкова Екатерина Васильевна]&lt;br /&gt;
|-&lt;br /&gt;
| 198 (ТИ) || [https://www.hse.ru/org/persons/218009880 Ульянкин Филипп] [https://t.me/ppilif @ppilif]&lt;br /&gt;
|-&lt;br /&gt;
| 199 (МИ) || [https://www.hse.ru/org/persons/160995848/ Семенкин Антон Александрович]&lt;br /&gt;
|-&lt;br /&gt;
| 1910 (ПР) || [https://www.hse.ru/org/persons/208488544 Биршерт Алексей Дмитриевич]&lt;br /&gt;
|-&lt;br /&gt;
| ФЭН || [https://www.hse.ru/org/persons/190889495 Зехов Матвей Сергеевич]&lt;br /&gt;
|-&lt;br /&gt;
| Пермь (БИ) || [https://www.hse.ru/org/persons/343120018 Собянин Кирилл Валентинович]&lt;br /&gt;
|-&lt;br /&gt;
| Пермь (ПИ) || [https://www.hse.ru/org/persons/343120018 Собянин Кирилл Валентинович]&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
=== Консультации ===&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Учебные ассистенты&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/treacker Евгений Шабалин - 191]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/madn_boi Никита Морозов - 192]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/artiloid Щербинин Артём - 193]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/sibsonya Сибагатова Софья - 193]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/khaykingleb Хайкин Глеб - 194]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/sol_arch Никита Андреев - 195]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/sabinadayanova Сабина Даянова - 195]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/ainmukh Айнур Мухамбетова - 196]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/daviddramb Драмбян Давид - 198]  &lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/fdrose Абрахам Максим - 199]  &lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/naumovanast Наумова Настя - 1910]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/horror_in_black Коган Саша - 197]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/cherepasska Баранов Михаил - ФЭН]&lt;br /&gt;
|-&lt;br /&gt;
| [https://t.me/lena_rus_21 Русакова Елена]&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
=== Правила выставления оценок ===&lt;br /&gt;
&lt;br /&gt;
В курсе предусмотрено несколько форм контроля знания:&lt;br /&gt;
* Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций и семинаров&lt;br /&gt;
* Практические домашние работы на Python&lt;br /&gt;
* Письменная контрольная работа&lt;br /&gt;
* Письменный экзамен&lt;br /&gt;
&lt;br /&gt;
Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:&lt;br /&gt;
&lt;br /&gt;
Итог = Округление(0.15 * ПР + 0.4 * ДЗ + 0.15 * КР + 0.3 * Э)&lt;br /&gt;
&lt;br /&gt;
ПР — средняя оценка за самостоятельные работы на семинарах&lt;br /&gt;
&lt;br /&gt;
ДЗ — средняя оценка за практические домашние работы на Python&lt;br /&gt;
&lt;br /&gt;
КР — оценка за контрольную работу&lt;br /&gt;
&lt;br /&gt;
Э — оценка за экзамен&lt;br /&gt;
&lt;br /&gt;
Округление арифметическое.&lt;br /&gt;
&lt;br /&gt;
=== Правила сдачи заданий ===&lt;br /&gt;
&lt;br /&gt;
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее. Есть исключение: в течение семестра каждый студент может не более 2 раз сдать задание после жёсткого дедлайна — в этом случае за каждый день просрочки продолжает вычитаться по одному баллу (если не оговорено иное).&lt;br /&gt;
&lt;br /&gt;
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.&lt;br /&gt;
&lt;br /&gt;
При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.&lt;br /&gt;
&lt;br /&gt;
== Лекции ==&lt;br /&gt;
&lt;br /&gt;
Ко всем конспектам на GitHub есть исходники. Исправления и дополнения всячески приветствуются!&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 1&amp;#039;&amp;#039;&amp;#039; (3 сентября). Введение в машинное обучение. Основные термины, постановки задач и примеры применения. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture01-intro.pdf Конспект]] [[https://youtu.be/HLg4EpeqZP0 Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 2&amp;#039;&amp;#039;&amp;#039; (10 сентября). Модель линейной регрессии. Подготовка данных для линейных моделей. Измерение ошибки в задачах регрессии. Устойчивые к выбросам функции потерь. Относительные функции потерь. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture02-linregr.pdf Конспект]] [[https://youtu.be/0YugAdKXfdY Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 3&amp;#039;&amp;#039;&amp;#039; (17 сентября). Переобучение. Отложенная выборка и кросс-валидация. Аналитическое решение для линейной регрессии и MSE. Градиентный спуск. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture03-linregr.pdf Конспект]] [[https://youtu.be/Sio_aNIxnaA Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 4&amp;#039;&amp;#039;&amp;#039; (24 сентября). Стохастический градиентный спуск. SAG, Momentum, AdaGrad, Adam. Регуляризация линейных моделей. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture04-linregr.pdf Конспект]] [[https://www.youtube.com/watch?v=7ODlUv9W7p4 Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 5&amp;#039;&amp;#039;&amp;#039; (1 октября). Разреженные линейные модели. Линейные классификаторы. Обучение линейных классификаторов через верхние оценки на пороговую функцию потерь. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture05-linclass.pdf Конспект]] [[https://www.youtube.com/watch?v=YtOWnaZGh7E Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 6&amp;#039;&amp;#039;&amp;#039; (8 октября). Метрики качества классификации. Доля верных ответов. Точность, полнота, F-мера и другие способы усреднения. ROC-кривая и PR-кривая, площади под ними. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture05-linclass.pdf Конспект]] [[https://www.youtube.com/watch?v=mwUrBQoHdQM Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 7&amp;#039;&amp;#039;&amp;#039; (15 октября). Оценивание вероятностей. Логистическая регрессия. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture06-linclass.pdf Конспект]] [[https://www.youtube.com/watch?v=2-wWxLeVd1U Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 8&amp;#039;&amp;#039;&amp;#039; (29 октября). Метод опорных векторов. Многоклассовая классификация. Метрики качества многоклассовой классификации. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture06-linclass.pdf Конспект по SVM]] [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture07-linclass.pdf Конспект по многоклассовой классификации]] [[https://youtu.be/OsfuADBOCZY Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 9&amp;#039;&amp;#039;&amp;#039; (5 ноября). Решающие деревья. Жадный алгоритм обучения дерева. Функционалы качества предикатов. Связь решающих деревьев и линейных моделей. Разложение ошибки на смещение и разброс. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture08-trees.pdf Конспект по деревьям]] [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture09-ensembles.pdf Конспект по BVD]] [[https://youtu.be/biDD-wAZrDQ Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 10&amp;#039;&amp;#039;&amp;#039; (12 ноября). Бэггинг и случайные леса. Out-of-bag оценка. Градиентный бустинг. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture09-ensembles.pdf Конспект по бэггингу и RF]] [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture10-ensembles.pdf Конспект по бустингу]] [[https://youtu.be/TGevGT8qbQw Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 11&amp;#039;&amp;#039;&amp;#039; (19 ноября). Градиентный бустинг. Сокращение шага. Стохастический градиентный бустинг. Бустинг над деревьями, дообучение прогнозов в листьях. Бустинг второго порядка. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture10-ensembles.pdf Конспект по бустингу]] [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture11-ensembles.pdf Продолжение конспекта по бустингу]] [[https://www.youtube.com/watch?v=pfT2nqR_Q24 Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 12&amp;#039;&amp;#039;&amp;#039; (26 ноября). Бустинг второго порядка. Регуляризация деревьев в бустинге. Выбор предикатов под функционал бустинга. Разное. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture11-ensembles.pdf Конспект]] [[https://youtu.be/aoCbsALAdSU Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 13&amp;#039;&amp;#039;&amp;#039; (10 декабря). Разбор контрольной работы. Обучение без учителя. Кластеризация. Метрики качества кластеризации. Метод K-Means. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture12-unsupervised.pdf Конспект]] [[https://youtu.be/sh3xKM4OMdw Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Лекция 14&amp;#039;&amp;#039;&amp;#039; (17 декабря). Кластеризация. Метод DBSCAN. Визуализация и t-SNE. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture12-unsupervised.pdf Конспект]] [[https://youtu.be/U5EGXyp-G2Q Запись лекции]]&lt;br /&gt;
&lt;br /&gt;
== Семинары ==&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 1&amp;#039;&amp;#039;&amp;#039;. Типы данных и виды задач машинного обучения [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem01-data.ipynb Ноутбук]]. Библиотека pandas [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem01-pandas.ipynb Ноутбук]].&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 2&amp;#039;&amp;#039;&amp;#039;. Исследование данных. Библиотека scikit-learn. Подготовка данных для линейных моделей. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem02-sklearn-linregr.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 3&amp;#039;&amp;#039;&amp;#039;. Векторное дифференцирование [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem03-vector-diff.pdf Конспект]]. Градиентный спуск [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem03-gd.ipynb Ноутбук]]. А также: [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem03-numpy.ipynb Ноутбук про numpy для самостоятельного изучения]].&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 4&amp;#039;&amp;#039;&amp;#039;. Обработка данных. Работа с категориальными и текстовыми данными. Mean-target encoding. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem04-features.pdf Конспект]] [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem04-features.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 5&amp;#039;&amp;#039;&amp;#039;. Метрики качества классификации. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem05-linclass-metrics.pdf Конспект]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 6&amp;#039;&amp;#039;&amp;#039;. Оценивание вероятностей классов. Калибровка вероятностей. Квантильная регрессия. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem06-probs-quantile.pdf Конспект]] [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem06-calibration.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 7&amp;#039;&amp;#039;&amp;#039;. Решающие деревья. Критерии информативности. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem07-trees.pdf Конспект]] [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem07-trees.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 8&amp;#039;&amp;#039;&amp;#039;. Разложение ошибки на смещение и разброс. [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem08-bvd.pdf Конспект]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 9&amp;#039;&amp;#039;&amp;#039;. Почему градиентный бустинг так устроен? [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem09-gbm-part1.pdf Конспект]] [[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/seminars/sem09-gbm-part2.ipynb Ноутбук]]&lt;br /&gt;
&lt;br /&gt;
== Практические задания ==&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Задание 1.&amp;#039;&amp;#039;&amp;#039; Pandas и распределение студентов ПМИ по элективам.&lt;br /&gt;
 &lt;br /&gt;
Мягкий дедлайн: 25.09.2021 23:59 MSK. &lt;br /&gt;
&lt;br /&gt;
Жесткий дедлайн: 28.09.2021 23:59 MSK.&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/homeworks-practice/homework-practice-01-pandas.ipynb Ноутбук с заданием]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Задание 2.&amp;#039;&amp;#039;&amp;#039; Разведочный анализ данных, линейная регрессия и разработка признаков.&lt;br /&gt;
 &lt;br /&gt;
Мягкий дедлайн: 11.10.2021 23:59 MSK. &lt;br /&gt;
&lt;br /&gt;
Жесткий дедлайн: 14.10.2021 23:59 MSK.&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/homeworks-practice/homework-practice-02-linregr.ipynb Ноутбук с заданием]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Задание 3.&amp;#039;&amp;#039;&amp;#039; Градиентный спуск своими руками.&lt;br /&gt;
 &lt;br /&gt;
Мягкий дедлайн: 27.10.2021 23:59 MSK. &lt;br /&gt;
&lt;br /&gt;
Жесткий дедлайн: 29.10.2021 23:59 MSK.&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/homeworks-practice/homework-practice-03-gd/homework-practice-03-gd.ipynb Ноутбук с заданием]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Задание 4.&amp;#039;&amp;#039;&amp;#039; Классификация.&lt;br /&gt;
 &lt;br /&gt;
Мягкий дедлайн: 10.11.2021 23:59 MSK. &lt;br /&gt;
&lt;br /&gt;
Жесткий дедлайн: 13.11.2021 23:59 MSK.&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/homeworks-practice/homework-practice-04-classification.ipynb Ноутбук с заданием]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Задание 5.&amp;#039;&amp;#039;&amp;#039; Решающие деревья.&lt;br /&gt;
 &lt;br /&gt;
Мягий дедлайн: 26.11.2021 23:59 MSK.&lt;br /&gt;
&lt;br /&gt;
Жестокий дедлайн: 26.11.2021 23:59 MSK.&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/homeworks-practice/homework-practice-05-trees/homework-practice-05-trees.ipynb Ноутбук с заданием]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Задание 6.&amp;#039;&amp;#039;&amp;#039; Разложение ошибки на смещение и разброс.&lt;br /&gt;
 &lt;br /&gt;
Мягкий дедлайн: 23:59MSK 07.12.2021&lt;br /&gt;
&lt;br /&gt;
Жесткий дедлайн: 23:59MSK 10.12.2021&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/homeworks-practice/homework-practice-06-bvd.ipynb Ноутбук с заданием]]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Задание 7.&amp;#039;&amp;#039;&amp;#039; Обучение бустингов&lt;br /&gt;
 &lt;br /&gt;
Мягкий дедлайн: 23:59MSK 18.12.2021&lt;br /&gt;
&lt;br /&gt;
Жесткий дедлайн: 23:59MSK 19.12.2021&lt;br /&gt;
&lt;br /&gt;
[[https://github.com/esokolov/ml-course-hse/tree/master/2021-fall/homeworks-practice/homework-practice-07-boosting Ноутбук с заданием]]&lt;br /&gt;
&lt;br /&gt;
==Теоретические домашние задания==&lt;br /&gt;
&lt;br /&gt;
[https://github.com/esokolov/ml-course-hse/tree/master/2021-fall/homeworks-theory Теоретические ДЗ] не проверяются, но задачи из них могут войти в проверочные работы на семинарах.&lt;br /&gt;
&lt;br /&gt;
== Соревнования ==&lt;br /&gt;
&lt;br /&gt;
===Правила участия и оценивания===&lt;br /&gt;
В соревновании по анализу данных вам предлагается по имеющимся данным решить некоторую задачу, оптимизируя указанную метрику, и отправить ответы для заданного тестового множества. Максимальное количество посылок в сутки ограничено (как правило, разрешается сделать 2 посылки), ближе к концу соревнования вам будем необходимо выбрать 2 посылки, которые вы считаете лучшими. Тестовые данные делятся на публичные и приватные в некотором соотношении, на основе которых строятся публичный и приватный лидерборды соответственно, при этом публичный лидерборд доступен в течение всего соревнования, а приватный строится после его окончания для выбранных вами посылок.&lt;br /&gt;
&lt;br /&gt;
В лидербордах каждого из соревнований присутствуют несколько базовых решений (бейзлайнов), каждое из которых соответствует определённой оценке. Например, для получения оценки не ниже 8 баллов необходимо, чтобы ваше решение на &amp;#039;&amp;#039;&amp;#039;приватном&amp;#039;&amp;#039;&amp;#039; лидерборде оказалось лучше соответствующего бейзлайна. Далее для студента, преодолевшего бейзлайн на N_1 баллов, но не преодолевшего бейзлайн на N_2 балла, итоговая оценка за соревнование рассчитывается по равномерной сетке среди всех таких студентов в зависимости от места в приватном лидерборде среди них; если быть точными, то по следующей формуле:&lt;br /&gt;
&lt;br /&gt;
N_2 - (N_2 - N_1) * i  / M,&lt;br /&gt;
&lt;br /&gt;
где M — количество студентов (из всех студентов, изучающих курс), преодолевших бейзлайн на N_1 баллов, но не преодолевших бейзлайн на N_2 балла;&lt;br /&gt;
&lt;br /&gt;
i — место (начиная с 1) студента в приватном лидерборде среди всех таких студентов. &lt;br /&gt;
&lt;br /&gt;
Единственное исключение из формулы — студенты, преодолевшие самый сильный бейзлайн, получают прибавку 1/M к своей оценке.&lt;br /&gt;
&lt;br /&gt;
Чтобы вас не пропустили при проверке решений соревнования, &amp;#039;&amp;#039;&amp;#039;необходимо&amp;#039;&amp;#039;&amp;#039; использовать следующий формат для имени команды (вкладка Team): &lt;br /&gt;
&lt;br /&gt;
«[ПМИ] Имя Фамилия номер_группы»&lt;br /&gt;
&lt;br /&gt;
В течение 3 суток после окончания соревнования в соответствующее задание на anytask необходимо прислать код, воспроизводящий ответы для посылки, фигурирующей в приватном лидерборде. При оформлении кода предполагайте, что данные лежат рядом с ним в папке data, а в результате выполнения кода ответы должны быть записаны в файл solution-N-Username.csv, где N — номер соревнования, Username — ваша фамилия. У нас должна быть возможность запустить код и получить те же ответы, что и в вашей посылке, — в частности, это означает, что:&lt;br /&gt;
&lt;br /&gt;
1. Если вы отправляете файл *.py, мы будем запускать его при помощи команды python *.py в вышеуказанном предположении о местонахождении данных.&lt;br /&gt;
&lt;br /&gt;
2. Если вы отправляете ноутбук *.ipynb, мы последовательно запустим все ячейки ноутбука и будем ожидать в результате его работы формирование файла с ответами.&lt;br /&gt;
&lt;br /&gt;
3. Если вы отправляете код с использованием другого языка программирования, в том же письме направьте нам инструкцию по его запуску с тем, чтобы получить тот же файл с ответами. &lt;br /&gt;
&lt;br /&gt;
В случае отсутствия кода, воспроизводящего результат, в установленный срок студенту выставляется 0 в качестве оценки за соревнование. Студенты, попавшие в топ-3 согласно приватному лидерборду, смогут получить бонусные баллы, если в течение недели после окончания соревнования сдадут в anytask отчет о получении решения, фигурирующего в приватном лидерборде. Если не оговорено иное, использовать любые внешние данные в соревнованиях &amp;#039;&amp;#039;&amp;#039;запрещено&amp;#039;&amp;#039;&amp;#039;. Под внешними данными понимаются размеченные данные, где разметка имеет прямое отношение к решаемой задаче. Грубо говоря, сборник текстов с википедии не считается внешними данными.&lt;br /&gt;
&lt;br /&gt;
В некоторых соревнованиях данные взяты из завершившегося соревнования на Kaggle.&lt;br /&gt;
Категорически запрещено использовать данные из оригинального соревнования для восстановления целевой переменной на тестовой выборке.&lt;br /&gt;
&lt;br /&gt;
=== Соревнование 1 ===&lt;br /&gt;
&lt;br /&gt;
Задача: выявление мошеннических тразнакций&lt;br /&gt;
&lt;br /&gt;
Это соревнование на бонусные баллы, оно не является обязательным.&lt;br /&gt;
&lt;br /&gt;
Ссылка для участия: https://www.kaggle.com/t/bbc6f629ab1a4e4b9a79900f94dea96b&lt;br /&gt;
&lt;br /&gt;
Дедлайн: 13.12.2021 23:59MSK&lt;br /&gt;
&lt;br /&gt;
В задании всего один бейзлайн (lightgbm), ненулевые баллы получают решения, преодолевшие его на приватном лидерборде.&lt;br /&gt;
Все решения выше этого бейзлайна оцениваются по равномерной шкале от 0 до 5.&lt;br /&gt;
&lt;br /&gt;
Обратите внимание на раздел Baselines на Kaggle — там можно найти много полезного.&lt;br /&gt;
&lt;br /&gt;
== Бонусы за соревнования ==&lt;br /&gt;
&lt;br /&gt;
За успешное участие в соревнованиях по анализу данных могут быть выставлены бонусные баллы, которые можно прибавить к оценке за любое практическое или теоретическое домашнее задание, а также за самостоятельную работу. Под успешным участием понимается попадание в топ-10% мест; если соревнование особо сложное и крупное, может рассматриваться и попадание в топ-20% мест. Конкретное число баллов определяется преподавателями и зависит от сложности соревнования и занятого места. За одно соревнование можно получить не более 5 баллов. Для получения оценки необходимо предоставить краткий отчёт о решении задачи.&lt;br /&gt;
&lt;br /&gt;
== Контрольная работа ==&lt;br /&gt;
&lt;br /&gt;
Контрольная работа состоится 3 декабря на лекции. Продолжительность — 80 минут. Проходит в zoom, студенты должны будут писать работу с включенным камерами и расшаренным экраном. На фотографирование и сдачу листочков дополнительно даётся 5 минут.&lt;br /&gt;
&lt;br /&gt;
[https://docs.google.com/document/d/1I40EZqslLoj10CSQ0LbsW17cB5uHVHooJ86kcThKewE/edit?usp=sharing Вопросы для подготовки]&lt;br /&gt;
&lt;br /&gt;
[https://github.com/esokolov/ml-course-hse/blob/master/2020-fall/midterm-fall-2020-example.pdf Нулевой вариант]&lt;br /&gt;
&lt;br /&gt;
== Экзамен ==&lt;br /&gt;
&lt;br /&gt;
[https://docs.google.com/document/d/1hMY0QxbU4qMpGuC8aZr1sWd5qrPdPiOl97FJU0fdpSk/edit?usp=sharing Вопросы для подготовки]&lt;br /&gt;
&lt;br /&gt;
== Полезные материалы ==&lt;br /&gt;
===Книги===&lt;br /&gt;
* Hastie T., Tibshirani R, Friedman J. The Elements of Statistical Learning (2nd edition). Springer, 2009.&lt;br /&gt;
* Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006.&lt;br /&gt;
* Mohri M., Rostamizadeh A., Talwalkar A. Foundations of Machine Learning. MIT Press, 2012.&lt;br /&gt;
* Murphy K. Machine Learning: A Probabilistic Perspective. MIT Press, 2012.&lt;br /&gt;
* Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.&lt;br /&gt;
* Willi Richert, Luis Pedro Coelho. Building Machine Learning Systems with Python. Packt Publishing, 2013.&lt;br /&gt;
&lt;br /&gt;
===Курсы по машинному обучению и анализу данных===&lt;br /&gt;
* [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 Курс по машинному обучению К.В. Воронцова]&lt;br /&gt;
* [https://yandexdataschool.ru/edu-process/courses/machine-learning Видеозаписи лекций курса Школы Анализа Данных, К.В. Воронцов]&lt;br /&gt;
* [https://www.coursera.org/specializations/machine-learning-from-statistics-to-neural-networks Coursera: Машинное обучение от статистики до нейросетей (специализация)]&lt;br /&gt;
* [https://www.coursera.org/specializations/machine-learning-data-analysis Coursera: Машинное обучение и анализ данных (специализация)]&lt;br /&gt;
* [https://www.coursera.org/learn/introduction-machine-learning Coursera: Введение в машинное обучение, К.В. Воронцов]&lt;br /&gt;
* [https://openedu.ru/course/hse/INTRML/ Введение в машинное обучение (онлайн-курс НИУ ВШЭ)]&lt;br /&gt;
&lt;br /&gt;
== Страницы предыдущих лет ==&lt;br /&gt;
&lt;br /&gt;
[[Машинное_обучение_1/2020_2021 | 2020/2021 учебный год]]&lt;br /&gt;
&lt;br /&gt;
[[Машинное_обучение_1/2019_2020 | 2019/2020 учебный год]]&lt;br /&gt;
&lt;br /&gt;
[[Машинное_обучение_1/2018_2019 | 2018/2019 учебный год]]&lt;br /&gt;
&lt;br /&gt;
[[Машинное_обучение_1/2017_2018 | 2017/2018 учебный год]]&lt;br /&gt;
&lt;br /&gt;
[[Машинное_обучение_1/2016_2017 | 2016/2017 учебный год]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Esokolov</name></author>
	</entry>
</feed>