<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9D%D0%98%D0%A1_%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B8_%D0%BF%D1%80%D0%B8%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F</id>
	<title>НИС Машинное обучение и приложения - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9D%D0%98%D0%A1_%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B8_%D0%BF%D1%80%D0%B8%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F"/>
	<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%9D%D0%98%D0%A1_%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B8_%D0%BF%D1%80%D0%B8%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F&amp;action=history"/>
	<updated>2026-06-06T13:55:26Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wikicshse.ru/index.php?title=%D0%9D%D0%98%D0%A1_%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B8_%D0%BF%D1%80%D0%B8%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F&amp;diff=1035&amp;oldid=prev</id>
		<title>imported&gt;Tipt0p: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%9D%D0%98%D0%A1_%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B8_%D0%BF%D1%80%D0%B8%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F&amp;diff=1035&amp;oldid=prev"/>
		<updated>2016-06-16T19:26:28Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&amp;#039;&amp;#039;&amp;#039;Таблица с расписание семинаров [https://docs.google.com/spreadsheets/d/1DdPqVTAT5waRSPiRZD0Zp_FEIQpBgw0NarcrspQfZes/edit?usp=sharing здесь]&amp;#039;&amp;#039;&amp;#039; &lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Таблица со списком следующих тем [https://drive.google.com/open?id=1G6_Xte45ct4BPjbgRGUgVgpvzNDcHctFsBqpr46PEQ8 здесь]&amp;#039;&amp;#039;&amp;#039; &lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Таблица с итогами [https://docs.google.com/spreadsheets/d/1qhqqR_p48ayHrr-1vYxFVZzNPdV_dri4Wa-EDaIWf0s/edit?usp=sharing здесь]&amp;#039;&amp;#039;&amp;#039; &lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Контакты: &amp;#039;&amp;#039;&amp;#039; &lt;br /&gt;
* [http://www.hse.ru/staff/dvetrov Ветров Дмитрий Петрович] DVetrov@hse.ru&lt;br /&gt;
* [http://www.hse.ru/org/persons/131072080 Лобачева Екатерина Максимовна] elobacheva@hse.ru&lt;br /&gt;
* [http://www.hse.ru/staff/sergey-bartunov Бартунов Сергей Олегович] sbos.net@gmail.com&lt;br /&gt;
&lt;br /&gt;
Просьба к теме письма добавлять тег &amp;#039;&amp;#039;&amp;#039;[НИС ФКН]&amp;#039;&amp;#039;&amp;#039;.&lt;br /&gt;
&lt;br /&gt;
== Краткое описание ==&lt;br /&gt;
&lt;br /&gt;
В ходе курса студенты изучат теоретические основы машинного обучения и получат практические навыки применения методов поиска скрытых закономерностей в данных. Также студенты получат опыт самостоятельного разбора научной литературы, который пригодится им при написании курсовых, дипломных и научных работ.&lt;br /&gt;
&lt;br /&gt;
== Результаты ==&lt;br /&gt;
&lt;br /&gt;
Напоминаем, что итоговая формула выставления оценки выглядит следующим образом:&lt;br /&gt;
&lt;br /&gt;
О_результ = 0.6 * О_сем + 0.4 * О_доклад + 0.3 * О_итог.контроль&lt;br /&gt;
&lt;br /&gt;
* O_сем складывается на 50% из участия в хакатоне и на 50% из доли посещенных семинаров.&lt;br /&gt;
* О_доклад равняется 10 (успешный доклад), 5 (серьезные замечания к докладчику), 0 (незасчитанный доклад или человек с докладом не выступал)&lt;br /&gt;
* О_итог.контроль определяется результатом собеседования, которое состоится &amp;#039;&amp;#039;&amp;#039;22 июня (среда) в 13:00 в 622 аудитории&amp;#039;&amp;#039;&amp;#039;. На собеседование выносятся все темы, начиная с семинара 4.&lt;br /&gt;
&lt;br /&gt;
Текущее число баллов студентов можно посмотреть в таблице, которая будет выложена [https://docs.google.com/spreadsheets/d/1qhqqR_p48ayHrr-1vYxFVZzNPdV_dri4Wa-EDaIWf0s/edit?usp=sharing здесь]. Студенты, имеющие больше трех баллов, которых устраивает текущая оценка по НИСу, освобождаются от собеседования.&lt;br /&gt;
&lt;br /&gt;
== Темы семинаров ==&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 1. Машинное обучение и история его развития.&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 2. Научный метод.&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Основные моменты:&amp;#039;&amp;#039;&lt;br /&gt;
Что такое научный метод? Его основные особенности. Эмпирическое и теоретический научный метод. Принципы верификации и фальсификации. Бритва Оккама. Научный и ненаучный метод. Псевдонаука.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки:&amp;#039;&amp;#039; [http://elementy.ru/lib/430627 1], [http://megamozg.ru/post/7658/ 2], [http://lebed.com/2014/art6391.htm 3] + глава 22 из Гарри Поттера и методов рацмышления&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 3.1. Как сделать качественную презентацию.&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки:&amp;#039;&amp;#039; [http://habrahabr.ru/company/microsoft/blog/142693/ 1], [http://www4.stat.ncsu.edu/~reich/st810A/oral.pdf 2], [http://www.nextscientist.com/improve-presentation-skills-of-phd-students/ 3], [http://www.skillsyouneed.com/presentation-skills.html 4], [https://www.asp.org/education/EffectivePresentations.pdf 5], [http://www.youtube.com/watch?v=Hp7Id3Yb9XQ 6], [http://psych.colorado.edu/~dbarth/PDFs/5100/Talk%20Tips.pdf 7]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 3.2. Как не нужно работать с данными.&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки:&amp;#039;&amp;#039; [http://habrahabr.ru/post/217545/ 1], [http://www.statease.com/news/news0612.pdf 2], [http://blog.asmartbear.com/data-interpretation-mistakes.html 3], [https://sunlightfoundation.com/blog/2013/02/19/avoiding-data-mistakes/ 4], [http://www.ma.utexas.edu/users/mks/statmistakes/StatisticsMistakes.html 5], [http://sites.stat.psu.edu/~lsimon/stat250/fa99/slides/mistakes/mistakes.PPT 6], [http://gking.harvard.edu/files/mist.pdf 7]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 4. Линейная регрессия.&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;В докладе следует осветить следующие основные моменты:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Общую постановка задачи обучения с учителем, а также регрессии как ее частный случай&lt;br /&gt;
# Привести несколько примеров из жизни, где подобная задача возникает&lt;br /&gt;
# Рассмотреть линейную модель регресии, а также привести пример любой нелинейной модели&lt;br /&gt;
# Записать задачу оптимизации, которая возникает при использовании квадратичной функции потерь.&lt;br /&gt;
# Вывести разложение квадратичной ошибки в виде суммы bias и variance, обсудить значение этого разложения&lt;br /&gt;
# Показать хотя бы два метода для решения данной задачи - метод градиентного спуска и псевдо-решение СЛАУ, обсудить, какие преимущества и недостатки есть у каждого метода.&lt;br /&gt;
# Рассмотреть пример переобучения и использования L2-регуляризации как метода борьбы с ним. Связь L2-регуляризации с нормальным псевдо-решением.&lt;br /&gt;
# Обсудить другие функции потерь, например, L1.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки:&amp;#039;&amp;#039; [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 1], [http://statweb.stanford.edu/~tibs/ElemStatLearn/ 2] (главы 2 и 3), [http://research.microsoft.com/en-us/um/people/cmbishop/PRML/ 3], [https://www.cs.ubc.ca/~murphyk/MLbook/ 4], [http://scott.fortmann-roe.com/docs/BiasVariance.html 5], [http://web.engr.oregonstate.edu/~xfern/classes/cs534/notes/Linear-Regression-3-11.pdf 6], [http://eniac.cs.qc.cuny.edu/andrew/gcml/lecture5.pdf 7], [http://cs229.stanford.edu/notes/cs229-notes1.pdf 8]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 5. Метод опорных векторов. Линейно-разделимый случай&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;План доклада:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Ликбез. Теорема Куна-Такера и как ее использовать для задач оптимизации с ограничениями. &lt;br /&gt;
# Общая постановка задачи обучения с учителем, а также классификации, как ее частный случай.&lt;br /&gt;
# Привести несколько примеров из жизни, где подобная задача возникает&lt;br /&gt;
# Рассмотреть линейный классификатор, как выглядит его решающее правило, его геометрический смысл (разделяющая гиперплоскость).&lt;br /&gt;
# Неоднозначность выбора разделяющей гиперплоскости при использовании бинарной функции потерь.&lt;br /&gt;
# Принцип максимального зазора (или иначе заступа, англ. max margin), как некоторый разумный способ выбора разделяющей гиперплоскости. Показать его устойчивость при добавлении небольшого шума к обучающей выборке.&lt;br /&gt;
# Вывод величины зазора через вектор нормали гиперплоскости&lt;br /&gt;
# Задача оптимизации, возникающая при обучении метода опорных векторов в случае линейно-разделимой выборки.&lt;br /&gt;
# Решение выпуклой задачи условной оптимизации с использованием метода множителей Лагранжа.&lt;br /&gt;
# Двойственная функция, возникающая при обучении SVM.&lt;br /&gt;
# Решение данной задачи оптимизации, его зависимость от опорных векторов. Смысл множителей лагранжа, условий дополняющей нежесткости. &lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки&amp;#039;&amp;#039;: [http://statweb.stanford.edu/~tibs/ElemStatLearn/ 1],&lt;br /&gt;
[http://www.machinelearning.ru/wiki/images/2/25/SMAIS11_SVM.pdf 2],&lt;br /&gt;
[http://www.machinelearning.ru/wiki/images/8/8b/MOTP11_3.pdf 3],&lt;br /&gt;
[http://research.microsoft.com/pubs/67119/svmtutorial.pdf 4],&lt;br /&gt;
[https://www.economics.utoronto.ca/osborne/MathTutorial/KTCF.HTM 5],&lt;br /&gt;
[https://web.stanford.edu/class/ee364a/lectures/duality.pdf 6],&lt;br /&gt;
[https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf 7],&lt;br /&gt;
[http://www.youtube.com/watch?v=FJVmflArCXc 8].&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 6. Метод опорных векторов. Линейно-неразделимый случай, ядровой переход&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;План доклада:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Краткое напоминание основных результатов предыдущего семинара: &lt;br /&gt;
## постановка задачи бинарной классификации&lt;br /&gt;
## вид решающего правила и его геометрический смысл&lt;br /&gt;
##  принцип максимизации зазора&lt;br /&gt;
## прямая и двойственная задачи оптимизации&lt;br /&gt;
# Ослабление предположения о линейной разделимости выборки&lt;br /&gt;
## изменение задачи оптимизаци&lt;br /&gt;
## решение двойственной задачи оптимизации&lt;br /&gt;
## вывод функции потерь SVM (hinge loss)&lt;br /&gt;
# Ядровой переход &lt;br /&gt;
## формальная замена скалярного произведения на функцию ядра&lt;br /&gt;
## свойства скалярного произведения&lt;br /&gt;
## примеры ядер с объяснением их свойств и параметров&lt;br /&gt;
## способы определения новых ядер&lt;br /&gt;
&lt;br /&gt;
См. список материалов к предыдущему семинару.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 7. Деревья решений и ансамбли решающих правил&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;План доклада:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Общие представления о деревьях решений для классификации и регрессии, примеры, геометрия решающего правила.&lt;br /&gt;
# Алгоритм обучения ID3. Проблемы алгоритма ID3: невозможность обработки вещественных признаков, а также пропущенных значений  в данных.&lt;br /&gt;
# Решение этих проблем в алгоритме C4.5, принцип максимизации информационной выгоды (information gain).&lt;br /&gt;
# Проблема переобучения, регуляризация при обучении деревьев решений: ограничение максимальной глубины дерева, обрезание дерева (tree pruning).&lt;br /&gt;
# Ансамбли решающих правил. Примеры, геометрия решающего правила. Общая идея бустинга.&lt;br /&gt;
# Схема алгоритма AdaBoost.&lt;br /&gt;
# Верхняя оценка ошибки на обучающей выборке алгоритма AdaBoost.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки&amp;#039;&amp;#039;: [http://www.jair.org/media/279/live-279-1538-jair.pdf 1],&lt;br /&gt;
[https://basegroup.ru/community/articles/math-c45-part2 2],&lt;br /&gt;
[http://media.nips.cc/Conferences/2007/Tutorials/Slides/schapire-NIPS-07-tutorial.pdf 3],&lt;br /&gt;
[http://cmp.felk.cvut.cz/~sochmj1/adaboost_talk.pdf 4].&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Практическое задание&amp;#039;&amp;#039;&amp;#039;. Классификация изображений. [[НИС Машинное обучение и приложения/Практическое задание|Описание]].&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 9. Конференции и современные результаты в машинном обучении&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 10. Методы кластеризации&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;План доклада:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Задача кластеризации. Отличия от задачи классификации. Неоднозначность/возможность разных постановок задачи.&lt;br /&gt;
# Функция близости/расстояния, ее свойства, подробно рассмотреть неравенство треугольника и проблемы, к которым оно может приводить. В качестве примера можно рассмотреть тройку объектов: человек, лошадь и кентавр. Привести примеры функций близости/расстояния кроме евклидового для различных типов объектов.&lt;br /&gt;
# Иерархические алгоритмы кластеризации. Построение иерархии снизу вверх и сверху вниз, преимущества и недостатки обоих подходов.&lt;br /&gt;
# Алгоритм k-средних. Оптимизируемая функция потерь, алгоритмическая сложность глобальной минимизации данной функции. Алгоритм k-средних как метод локальной покоординатной оптимизации, доказательство сходимости, зависимость от инициализации. Подбор числа кластеров.&lt;br /&gt;
# EM-алгоритм для смеси гауссиан. Многомерное нормальное распределение, его параметры и их смысл. Описания кластера с помощью нормального распределения, связь правдоподобия нормального распределения и евклидового расстояния. Оптимизируемая функция потерь/качества (логарифм неполного правдоподобия или обоснованность модели). Сложность оптимизации подобной функции в явном виде. EM-алгоритм как строгое обобщения алгоритма k-means. &lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки&amp;#039;&amp;#039;: [http://www.machinelearning.ru/wiki/images/3/33/BayesML2010-EM.pdf 1],&lt;br /&gt;
[https://www.cs.duke.edu/courses/fall07/cps271/EM.pdf 2],&lt;br /&gt;
[http://mlg.eng.cam.ac.uk/tutorials/06/cb.pdf 3],&lt;br /&gt;
[http://statweb.stanford.edu/~tibs/stat315a/LECTURES/em.pdf 4].&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 11. Матричные разложения и их приложения в рекомендательных системах и анализе текста&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;План доклада:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Введение. Матрицы как естественное представление данных в рекомендательных системах (оценки пользователей) и анализе текста (количество слов в каждом документе).&lt;br /&gt;
# Предположение о существовании базиса в скрытом пространстве низкой размерности, хорошо описывающем данные в виде общих характеристик/жанров/тематик/etc. Формула для выражения элемента матрицы через скалярное произведение векторов в скрытом пространстве. Аналогичная запись в матричной форме.&lt;br /&gt;
# Функции потерь. Обработка отсутствующих данных.&lt;br /&gt;
# Стохастические алгоритмы оптимизации в задаче матричного разложения.&lt;br /&gt;
# Улучшения предсказаний, вычитание средних значений.&lt;br /&gt;
# Предсказания для новых данных, интерпретация объектов разложения в скрытом пространстве, извлечение признаков.&lt;br /&gt;
# Тензорные разложения (разложение Таккера, СP-разложение)&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки&amp;#039;&amp;#039;: [http://www.columbia.edu/~jwp2128/Teaching/W4721/papers/ieeecomputer.pdf 1],&lt;br /&gt;
[https://github.com/uclmr/acl2015tutorial/blob/master/tutorial.pdf 2],&lt;br /&gt;
[http://www.scholarpedia.org/article/Latent_semantic_analysis 3],&lt;br /&gt;
[http://videolectures.net/slsfs05_hofmann_lsvm/ 4].&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 12. Оптимизация: градиентный спуск и стохастический градиент&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;План доклада:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Задачи машинного обучения и соответствующие им задачи оптимизации: линейная регрессия, логистическая регрессия, двойственная задача в SVM.&lt;br /&gt;
# Понятия функции многих переменных, выпуклости множества и функции, свойства выпуклых функций. Примеры выпуклых и невыпуклых функций.&lt;br /&gt;
# Определение производной (для одномерного случая) и градиента (для функции многих переменных), понятие непрерывной, дифференцируемой и гладкой функции (примеры и антипримеры). &lt;br /&gt;
# Свойства градиента, правила дифференцирования, дифференцирование сложной функции.&lt;br /&gt;
# Алгоритм градиентного спуска (GD)&lt;br /&gt;
#* Общая схема алгоритма&lt;br /&gt;
#* Выбор шага градиента&lt;br /&gt;
#* Условия и скорость сходимости (пояснить смысл данного понятия)&lt;br /&gt;
#* Пример пошаговой оптимизации для двумерной линейной регрессии&lt;br /&gt;
# Стохастическая оценка градиента, сходимость градиентного спуска со стохастической оценкой градиента (теорема Роббинса-Монро).&lt;br /&gt;
# Алгоритм стохастического градиентного спуска (SGD)&lt;br /&gt;
#* Общая схема алгоритма&lt;br /&gt;
#* Выбор шага градиента&lt;br /&gt;
#* Условия и скорость сходимости&lt;br /&gt;
#* Пример пошаговой оптимизации для двумерной линейной регрессии&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Замечание:&amp;#039;&amp;#039; Нужно реализовать GD и SGD и применить их к задаче двумерной линейной регрессии. Следует привести графики зависимости значения минимизируемого функционала от номера итерации, а также показать как меняется положение искомой прямой в пространстве в ходе оптимизации.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки&amp;#039;&amp;#039;: [http://www.machinelearning.ru/wiki/images/7/74/MOMO12_minnd_basic.pdf 1],&lt;br /&gt;
[https://ipvs.informatik.uni-stuttgart.de/mlr/marc/notes/gradientDescent.pdf 2],&lt;br /&gt;
[http://research.microsoft.com/pubs/192769/tricks-2012.pdf 3],&lt;br /&gt;
[http://web.stanford.edu/class/ee364a/lectures/unconstrained.pdf 4],&lt;br /&gt;
[http://web.stanford.edu/class/ee364b/lectures/stoch_subgrad_slides.pdf 5].&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 13. Введение в нейросети&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;План доклада:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Основные тезисы коннекционизма. Сложная модель на основе сети из простых связанных элементов. Биологическая модель нейрона. Модель искусственного нейрона.&lt;br /&gt;
# Функции активации нейронов (сигмоидальная, гиперболический тангенс, кусочно-линейная). Многослойный перцептрон. Выходной слой для различных задач: регрессия над произвольными и неотрицательными числами, классификация.&lt;br /&gt;
# Теорема о многослойном перцептроне как универсальном аппроксиматоре. Примеры.&lt;br /&gt;
# Обзор библиотеки theano или tensorflow (на выбор), основные возможности, типы данных, принципы построения эффективных программ. Типичные проблемы производительности и способы их решения. Методы отладки.&lt;br /&gt;
# &amp;#039;&amp;#039;&amp;#039;Подробный&amp;#039;&amp;#039;&amp;#039; пример &amp;#039;&amp;#039;&amp;#039;собственной&amp;#039;&amp;#039;&amp;#039; реализации двуслойного перцептрона для классификации изображений из коллекции MNIST. &lt;br /&gt;
# Основные управляющие параметры модели: число слоев, размеры слоев, функции активации, регуляризация, инициализация параметров, алгоритм оптимизации и его параметры. Влияние данных параметров на скорость / качество обучения (&amp;#039;&amp;#039;&amp;#039;обязательно&amp;#039;&amp;#039;&amp;#039; с конкретными цифрами / графиками).&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки&amp;#039;&amp;#039;: [http://www.deeplearningbook.org/ 1],&lt;br /&gt;
[http://neuralnetworksanddeeplearning.com/ 2],&lt;br /&gt;
[https://www.tensorflow.org/versions/r0.7/tutorials/mnist/pros/index.html 3],&lt;br /&gt;
[http://deeplearning.net/tutorial/mlp.html 4],&lt;br /&gt;
[https://en.wikipedia.org/wiki/Connectionism 5].&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 14. Сокращение размерности, автокодировщики&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;План доклада:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Важность признакового описания в задачах машинного обучения. Примеры удачных и неудачных признаковых описаний.&lt;br /&gt;
# Недостатки использования “сырого” представления данных (пример: пиксели изображения), избыточность и низкая информативность&lt;br /&gt;
# Задача понижения размерности, связь с извлечением признаков. Метод главных компонент. &lt;br /&gt;
#* Ликбез: ковариационная матрица и ее свойства, SVD-разложение положительно определенной матрицы&lt;br /&gt;
#* Различные постановки задачи и их эквивалентность: поиск ортогонального базиса с наибольшей дисперсией, декорреляция признаков, оптимальное (с точки зрения квадратичной ошибки) линейное уменьшение размерности. &amp;#039;&amp;#039;&amp;#039;Обязательно&amp;#039;&amp;#039;&amp;#039; рассмотреть хотя бы две из формулировок, можно рассмотреть больше.&lt;br /&gt;
#* Итеративный алгоритм поиска главных компонент.&lt;br /&gt;
#* Матрица прямого и обратного преобразования.&lt;br /&gt;
# Пример приложения МГК - система eigenfaces.&lt;br /&gt;
# Автокодировщик как нейросетевая архитектура понижения размерности и извлечения признаков. Нелинейные и иерархические преобразования данных.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки&amp;#039;&amp;#039;: [http://www.face-rec.org/algorithms/PCA/jcn.pdf 1],&lt;br /&gt;
[https://geektimes.ru/post/68870/ 2],&lt;br /&gt;
[http://www.machinelearning.ru/wiki/images/a/a4/MOTP11_5.pdf 3],&lt;br /&gt;
[http://www.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D1%8B%D1%85_%D0%BA%D0%BE%D0%BC%D0%BF%D0%BE%D0%BD%D0%B5%D0%BD%D1%82 4],&lt;br /&gt;
[https://www.cs.princeton.edu/picasso/mats/PCA-Tutorial-Intuition_jp.pdf 5], [http://ufldl.stanford.edu/tutorial/unsupervised/Autoencoders/ 6], [http://cs.stanford.edu/~quocle/tutorial2.pdf 7], [http://www.deeplearningbook.org/contents/autoencoders.html 8].&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 15. Сверточные нейронные сети в компьютерном зрении&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;План доклада:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Полносвязные нейронные сети и их приложения к задачам компьютерного зрения. Преимущества (например, устойчивость к перестановке пикселей) и недостатки (например, большое число настраиваемых параметров).&lt;br /&gt;
# Сверточные сети. Операция свертки с примерами. Мотивация: меньшее число настраиваемых параметров, инвариантнось к небольшим смещениям и поворотам, меньшая зависимость от размера входа.&lt;br /&gt;
# Обзор типичной архитектуры сверточной сети (LeNet) для классификации изображений. Назначение и устройство различных типов слоев (сверточные, пулинг, полносвязные). Обработка RGB-входа.&lt;br /&gt;
# Интерпретация фильтров сверточных слоев. Использование активаций обученных сетей для извлечения признаков и других задач (перенос стиля, моментальное обучение и пр.)&lt;br /&gt;
# Примеры использования сверточных сетей для различных задач. Стоит поискать интересные примеры в интеренете + для многих из них можно скачать готовые модели и позапускать их на семинаре.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки&amp;#039;&amp;#039;: [http://neuralnetworksanddeeplearning.com/chap6.html 1],&lt;br /&gt;
[http://www.deeplearningbook.org/contents/convnets.html 2],&lt;br /&gt;
[http://ufldl.stanford.edu/tutorial/supervised/ConvolutionalNeuralNetwork/ 3],&lt;br /&gt;
[https://events.yandex.ru/lib/talks/2793/ 4],&lt;br /&gt;
[http://yann.lecun.com/exdb/lenet/ 5], [http://image-net.org/tutorials/cvpr2015/ 6], [http://gitxiv.com/posts/jG46ukGod8R7Rdtud/a-neural-algorithm-of-artistic-style 7], [http://googleresearch.blogspot.ru/2015/06/inceptionism-going-deeper-into-neural.html 8], [http://www.matthewzeiler.com/pubs/arxive2013/arxive2013.pdf 9].&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 16. Спектральный анализ графов&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;План доклада:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Ликбез: собственные числа и собственные векторы матрицы.&lt;br /&gt;
# Ненаправленный простой граф. Матрица смежности. Расчет существования путей длины k с помощью матрицы смежности.&lt;br /&gt;
# Случайные блуждания на графе. Вероятность перехода в вершину за k шагов. Стационарное распределение случайного блуждания, достаточные условия его существования, алгоритмы вычисления.&lt;br /&gt;
# Лапласиан графа. Вложения вершин графа с помощью лапласиана, связь с собственными векторами. Приложения: извлечение признаков, спектральная кластеризация.&lt;br /&gt;
# Расчет близостей между вершинами в графе, среднее время пути (average commute time distance) и связанные меры близости/расстояния. Эффективный алгоритм вычисления. Приложения.&lt;br /&gt;
# Бонус: спектральные свойства графов, число компонент связности, диаметр и т.д.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки&amp;#039;&amp;#039;: [https://www.researchgate.net/publication/3297672_Random-Walk_Computation_of_Similarities_between_Nodes_of_a_Graph_with_Application_to_Collaborative_Recommendation 1],&lt;br /&gt;
[https://www.win.tue.nl/~aeb/2WF02/spectra.pdf 2],&lt;br /&gt;
[http://www.cs.cornell.edu/courses/cs685/2007fa/spectral.pdf 3],&lt;br /&gt;
[http://www.cs.yale.edu/homes/spielman/sgta/SpectTut.pdf 4],&lt;br /&gt;
[http://www.math.ucsd.edu/~fan/cbms.pdf 5],&lt;br /&gt;
[https://alexanderdyakonov.files.wordpress.com/2015/03/sgt2015_slides_03.pdf 6],&lt;br /&gt;
[https://csustan.csustan.edu/~tom/Clustering/GraphLaplacian-tutorial.pdf 7],&lt;br /&gt;
[http://ranger.uta.edu/~chqding/Spectral/ 8].&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Семинар 17. Обучение с подкреплением&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;План доклада:&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
# Постановка задачи обучения с подкреплением. Понятия наблюдаемых данных, состояния, действий, награды и стратегии. Марковский процесс приятия решений и его не полностью наблюдаемый аналог. Примеры задач обучения с подкреплением.&lt;br /&gt;
# Понятие ожидаемого дохода (англ. return), средний и дисконтированный доход. Функции ценности состояния (англ. value function) и ценности действия-состояния (англ. action-state function). Уравнение Беллмана. &lt;br /&gt;
# Принцип обучения функции ценности (Q-learning) для марковского процесса принятия решений, аппроксимация функции ценности. &lt;br /&gt;
# Градиентное обучение стратегий, алгоритм REINFORCE.&lt;br /&gt;
# Приложения: алгоритм Deep Q-network для Atari игр.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Полезные ссылки&amp;#039;&amp;#039;: [https://webdocs.cs.ualberta.ca/~sutton/book/the-book.html 1],&lt;br /&gt;
[https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf 2],&lt;br /&gt;
[http://www.iclr.cc/lib/exe/fetch.php?media=iclr2015:silver-iclr2015.pdf 3],&lt;br /&gt;
[http://www.readcube.com/articles/10.1038/nature14236 4],&lt;br /&gt;
[http://hunch.net/~jl/projects/RL/RLTheoryTutorial.pdf 5],&lt;br /&gt;
[http://web.mst.edu/~gosavia/tutorial.pdf 6],&lt;br /&gt;
[http://ml.informatik.uni-freiburg.de/_media/documents/teaching/ws1011/rl/policy_search.pdf 7].&lt;/div&gt;</summary>
		<author><name>imported&gt;Tipt0p</name></author>
	</entry>
</feed>