imported>Simagin.denis: Migrated current public revision from wiki.cs.hse.ru

2018-11-04T16:36:07Z

Migrated current public revision from wiki.cs.hse.ru

Новая страница

{{Карточка_проекта
|name=Darin (deep and reinforced intelligence net)
|mentor=Денис Симагин
|mentor_login={{URLENCODE:Simagin.denis|WIKI}}
|semester=Осень 2018
|course=2-3
|number_of_students= до 10
|categorize=yes
}}

===Что это за проект?===
Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью [http://arxiv.org/pdf/1312.5602v1.pdf Playing atari with deep reinforcement learning]. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом [https://storage.googleapis.com/deepmind-media/alphago/AlphaGoNaturePaper.pdf здесь]. Конечная цель перенести идеи статью [https://deepmind.com/blog/alphago-zero-learning-scratch/ AlphaGo Zero] на игру [https://en.wikipedia.org/wiki/Renju рендзю].

Для участия в проекте нужно пройти собеседование.

===Чему студент научится?===
* Чтение научных статей на английском
* Работе с глубокими нейронными сетями
* Обучение с подкреплением
* Плохие шутки

===Какие начальные требования?===
* Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная)
* Знание Python 3
* Git и работа с командной оболочкой
* Английский

===Какие будут использоваться технологии?===
* Python3
* Scipy stack
* PyTorch (возможно, Tensorflow)
* AWS/GCloud

===Темы вводных занятий?===
* Обучении с учителем
* Линейные модели, градиентный спуск
* Введение в нейронные сети
* Сверточные сети
* Обучение с подкреплением
* Разбор базовых статей

===Направления развития?===
DeepMind и Blizzard сделали [https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/ песочницу] для StarCraft II, поле для исследований просто безгранично.

===Критерии оценки?===
В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки.

Darin (deep and reinforced intelligence net) - История изменений

imported>Simagin.denis: Migrated current public revision from wiki.cs.hse.ru