<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA%3AAkonushin</id>
	<title>Участник:Akonushin - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA%3AAkonushin"/>
	<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Akonushin&amp;action=history"/>
	<updated>2026-06-06T18:15:36Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wikicshse.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Akonushin&amp;diff=2806&amp;oldid=prev</id>
		<title>imported&gt;Akonushin: /* Темы на 2017-2018 учебный год */</title>
		<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Akonushin&amp;diff=2806&amp;oldid=prev"/>
		<updated>2017-10-12T20:02:50Z</updated>

		<summary type="html">&lt;p&gt;&lt;span class=&quot;autocomment&quot;&gt;Темы на 2017-2018 учебный год&lt;/span&gt;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;= Обо мне =&lt;br /&gt;
Меня зовут Конушин Антон. Я доцент департамент больших данных и информационного поиска ФКН НИУ ВШЭ и академический руководитель ОП &amp;quot;Прикладная математика и информатика&amp;quot;. Также я руковожу лабораторией компьютерной графики и мультимедиа ВМК МГУ (http://graphics.cs.msu.ru/ru) и читаю лекции в Школе Анализа Данных Яндекса. Мои основные научные интересы - это компьютерное зрение, машинное обучение и компьютерная графика.&lt;br /&gt;
&lt;br /&gt;
= Научные интересы =&lt;br /&gt;
Основное приложение методов компьютерного зрения, которое мне сейчас интересно, это &amp;quot;разбор видео&amp;quot;, т.е. извлечение всей возможной информации из видеоданных. Главный  рассматриваемый сейчас сценарий - это работа с данными видеонаблюдения. На выходе нужно получить всю возможную информацию - выделение всех людей, отслеживание их движения, определение их характеристик (пол, возраст), идентификация людей по лицу / походке / комплекции / одежде, вплоть до построения трёхмерной модели сцены в динамике. &lt;br /&gt;
&lt;br /&gt;
Главный инструмент компьютерного зрения сейчас - это нейросетевые модели. Нейросети позволяют автоматических вычислять признаки из данных, и их обрабатывать. При этом решение многих задач можно строить в виде одной сложной нейросетевой модели. В этой области идёт бурный прогресс.&lt;br /&gt;
&lt;br /&gt;
= Структура предлагаемых КР и ВКР =&lt;br /&gt;
Все темы КР и ВКР, которые я предлагаю в этом учебном году, связаны с построением, усовершенствованием и применением нейросетевых моделей для задач компьютерного зрения, в первую очередь для анализ видео с людьми. Поэтому общая схема выполнения всех КР и ВКР будет примерно следующая:&lt;br /&gt;
&lt;br /&gt;
1) (Рекомендовано) Знакомство с нейросетями. Для этого нужно выполнить 2-3 небольших практических упражнений по нейросетям, на базе одного из фреймворков (Keras). Это позволит освоить ряд основных принципов работы с нейросетями для изображений (размножение данных, задание правильных функций потерь при обучении, использование предобученных моделей и дообучение и т.д.)&lt;br /&gt;
2)Изучение набора базовых статей по теме (ключевые статьи в целом по нейросетям в зрении, набор конкретных по рассматриваемым моделям)&lt;br /&gt;
3) Выбор конкретной модели и её реализации как базового алгоритма. Для многих задач есть готовые реализации. В этом случае нужно освоить реализацию - т.е. научиться обучать модель на своих данных, измерять качество, анализировать такую работу. В некоторых случаях конкретную модель предлагаю я, в других случаях её нужно будет выбрать самостоятельно по результатам проведённого обзора (п.2). Если модели в открытых источниках нет, тогда нужно будет выполнить самостоятельную реализацию этой модели. В зависимости от выбранной модели может потребоваться дополнительно изучить другой фреймворк нейросетей (Caffe, TensorFlow, Torch). &lt;br /&gt;
4) Собственно исследовательская часть, которая включает в себя проверку некоторой гипотезы о развитии этой модели, доработку модели, сбор данных и т.д.&lt;br /&gt;
5) Текст КР. Если есть интересный, пусть небольшой, научный результат, тогда нужно будет написать по тексту диплома статью и подавать её.&lt;br /&gt;
&lt;br /&gt;
В ходе выполнения курсовой работы на практике можно освоить работу с нейросетевыми моделями, изучать 1-2 фреймворка, научиться применять модели для решения конкретных задач анализа изображений. В зависимости от успехов можно будет успеть провести небольшое законченное исследование. &lt;br /&gt;
&lt;br /&gt;
= Темы на 2017-2018 учебный год =&lt;br /&gt;
&lt;br /&gt;
== Генеративные нейросетевые модели для синтеза обучающих данных (Generative cnn-based models for training data syntethis) ==&lt;br /&gt;
Нейросетевые модели для синтеза и обработки изображений бурно прогрессируют в последние пару лет. Одно из направлений их использования - подготовка обучающих данных для других алгоритмов компьютерного зрения, например обучения и классификации детекторов и распознавателей объектов. Предварительные эксперименты показывают, что качество генерируемых данных достаточно для обучения на уровне обучения по реальным данным. Есть разные направления работы в рамках этой темы - исследование conditional generative models, постобработка синтетических изображений для повышения визуального качества, модели для встраивания данных в изображение, эксперименты с прямым линейным преобразованием в пространстве признаков. Виды объектов - дорожные знаки, автомобили, люди.&lt;br /&gt;
&lt;br /&gt;
== Генеративная нейросетевая модель изображения человека (Generative neural model for images of the person) ==&lt;br /&gt;
&lt;br /&gt;
== Распознавание объектов дорожной сцены для дополненной реальности (Road scene parsing for augmented reality) ==&lt;br /&gt;
&lt;br /&gt;
== Нейросетевые детекторы объектов (CNN-based object detectors) == &lt;br /&gt;
В рамках данной темы возможны различные направления исследований развития детектора объектов:&lt;br /&gt;
&lt;br /&gt;
* поиск редких объектов&lt;br /&gt;
&lt;br /&gt;
* нейросетевой детектор голов и фигур людей для систем видеонаблюдения &lt;br /&gt;
&lt;br /&gt;
* ускорение нейросетевых детекторов &lt;br /&gt;
Нейросетевые детекторы лиц людей на изображении работают сейчас очень хорошо, пусть и не идеально. Основное препятствие на пути использования этих методов в устройствах это их вычислительная сложность. Детектор лица работает порядка 200ms на изображение 1980*1080 на видеокарте Nvidia GTX 1070. Однако был предложен целый ряд методов, которые позволяют увеличить производительность нейросетевой модели. Предлагается исследовать применимость этих методов для ускорения детектора лиц. &lt;br /&gt;
&lt;br /&gt;
== Повторная идентификация и классификация атрибутов человека по изображению фигуры (Person reidentification and classification) ==&lt;br /&gt;
Необходимо реализовать нейросетевую модель отображения изображения фигуры человека в вектор-признак, кодирующий внешность человека. Сравнение изображений людей по таким признакам позволяет определить повторное появление человека в видеопотоке. Также такие атрибуты человека, как пол, возраст, комплекция, можно определить, глядя на фотографию фигуры. Если известна &amp;quot;поза&amp;quot; человека, т.е. положение всех конечностей человека в кадре, то задача решается проще. Предлагается реализовать нейросетевую модель, на вход получающую изображение человека с размеченными частями тела, и определяющую атрибуты человека.&lt;br /&gt;
&lt;br /&gt;
= Материалы =&lt;br /&gt;
&lt;br /&gt;
* [http://caffe.berkeleyvision.org/ Caffe - deep learning framework] - наиболее активно используемая моими студентами библиотека нейросетей&lt;br /&gt;
* [http://u.cs.biu.ac.il/~yogo/nnlp.pdf A Primer on Neural Network Models for Natural Language Processing] хорошее введение в нейросети на примере анализа текстов&lt;br /&gt;
* [http://neuralnetworksanddeeplearning.com/ Neural Networks and Deep Learning] - неплохая небольшая книга по глуибнному обучению, с которой можно начинать изучение.&lt;br /&gt;
* [http://www.iro.umontreal.ca/~bengioy/dlbook/ Deep Learning book] - черновая версия книги Yoshua Bengio, Ian Goodfellow and Aaron Courville про глубинное обучение. Большая и подробная. Можно читать в фоновом режиме, медленно и вдумчиво. &lt;br /&gt;
* [https://github.com/robertsdionne/neural-network-papers robertsdionne/neural-network-papers] - Хорошая коллекция статей про нейросети. Часть мы уже разбирали на семинарах на ВМК, часть будем разбирать, часть посмотрим на семинарах в ВШЭ.&lt;br /&gt;
* [https://colah.github.io/ Colah blog] - блог с хорошим описанием ряда вопросов по нейросетям, например, про backpropagation.&lt;br /&gt;
* [http://nuit-blanche.blogspot.de/ Nuit Blance blog] - блог с описанием разных моментов по машинному обучению. Можно следить.&lt;br /&gt;
* [http://cs231n.github.io/ Курс Стенфорда по нейросетям] - Много интересных материалов по нейросетям&lt;br /&gt;
* [http://ufldl.stanford.edu/wiki/index.php/UFLDL_Tutorial] - Хороший тьюториал Стенфорда&lt;br /&gt;
* [https://www.facebook.com/moscowcv?ref=aymt_homepage_panel Facebook Moscow Computer Vision Group] - страница семинара по компьютерному зрению в ШАД с дайджестами интересных ссылок&lt;/div&gt;</summary>
		<author><name>imported&gt;Akonushin</name></author>
	</entry>
</feed>