<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=Darin_%28deep_and_reinforced_intelligence_net%29</id>
	<title>Darin (deep and reinforced intelligence net) - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=Darin_%28deep_and_reinforced_intelligence_net%29"/>
	<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=Darin_(deep_and_reinforced_intelligence_net)&amp;action=history"/>
	<updated>2026-06-06T16:53:37Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wikicshse.ru/index.php?title=Darin_(deep_and_reinforced_intelligence_net)&amp;diff=160&amp;oldid=prev</id>
		<title>imported&gt;Simagin.denis: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=Darin_(deep_and_reinforced_intelligence_net)&amp;diff=160&amp;oldid=prev"/>
		<updated>2018-11-04T16:36:07Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{Карточка_проекта&lt;br /&gt;
|name=Darin (deep and reinforced intelligence net)&lt;br /&gt;
|mentor=Денис Симагин&lt;br /&gt;
|mentor_login={{URLENCODE:Simagin.denis|WIKI}}&lt;br /&gt;
|semester=Осень 2018&lt;br /&gt;
|course=2-3&lt;br /&gt;
|number_of_students= до 10&lt;br /&gt;
|categorize=yes&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
===Что это за проект?===&lt;br /&gt;
Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью [http://arxiv.org/pdf/1312.5602v1.pdf Playing atari with deep reinforcement learning]. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом [https://storage.googleapis.com/deepmind-media/alphago/AlphaGoNaturePaper.pdf здесь]. Конечная цель перенести идеи статью [https://deepmind.com/blog/alphago-zero-learning-scratch/ AlphaGo Zero] на игру [https://en.wikipedia.org/wiki/Renju рендзю].&lt;br /&gt;
&lt;br /&gt;
Для участия в проекте нужно пройти собеседование.&lt;br /&gt;
&lt;br /&gt;
===Чему студент научится?===&lt;br /&gt;
* Чтение научных статей на английском&lt;br /&gt;
* Работе с глубокими нейронными сетями&lt;br /&gt;
* Обучение с подкреплением&lt;br /&gt;
* Плохие шутки&lt;br /&gt;
&lt;br /&gt;
===Какие начальные требования?===&lt;br /&gt;
* Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная)&lt;br /&gt;
* Знание Python 3&lt;br /&gt;
* Git и работа с командной оболочкой&lt;br /&gt;
* Английский&lt;br /&gt;
&lt;br /&gt;
===Какие будут использоваться технологии?===&lt;br /&gt;
* Python3&lt;br /&gt;
* Scipy stack&lt;br /&gt;
* PyTorch (возможно, Tensorflow)&lt;br /&gt;
* AWS/GCloud&lt;br /&gt;
&lt;br /&gt;
===Темы вводных занятий?===&lt;br /&gt;
* Обучении с учителем&lt;br /&gt;
* Линейные модели, градиентный спуск&lt;br /&gt;
* Введение в нейронные сети&lt;br /&gt;
* Сверточные сети&lt;br /&gt;
* Обучение с подкреплением&lt;br /&gt;
* Разбор базовых статей&lt;br /&gt;
&lt;br /&gt;
===Направления развития?===&lt;br /&gt;
DeepMind и Blizzard сделали [https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/ песочницу] для StarCraft II, поле для исследований просто безгранично.&lt;br /&gt;
&lt;br /&gt;
===Критерии оценки?===&lt;br /&gt;
В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки.&lt;/div&gt;</summary>
		<author><name>imported&gt;Simagin.denis</name></author>
	</entry>
</feed>