<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_1%2F%D0%93%D1%80%D1%83%D0%BF%D0%BF%D0%B0_145_%D0%A0%D0%A1</id>
	<title>Машинное обучение 1/Группа 145 РС - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_1%2F%D0%93%D1%80%D1%83%D0%BF%D0%BF%D0%B0_145_%D0%A0%D0%A1"/>
	<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_1/%D0%93%D1%80%D1%83%D0%BF%D0%BF%D0%B0_145_%D0%A0%D0%A1&amp;action=history"/>
	<updated>2026-06-07T04:05:35Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wikicshse.ru/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_1/%D0%93%D1%80%D1%83%D0%BF%D0%BF%D0%B0_145_%D0%A0%D0%A1&amp;diff=1424&amp;oldid=prev</id>
		<title>imported&gt;Aumnov: /* Общая информация */</title>
		<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_1/%D0%93%D1%80%D1%83%D0%BF%D0%BF%D0%B0_145_%D0%A0%D0%A1&amp;diff=1424&amp;oldid=prev"/>
		<updated>2016-11-01T19:33:49Z</updated>

		<summary type="html">&lt;p&gt;&lt;span class=&quot;autocomment&quot;&gt;Общая информация&lt;/span&gt;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;== Общая информация ==&lt;br /&gt;
&lt;br /&gt;
Время для консультаций (по предварительной договоренности):&lt;br /&gt;
* Среда 11:00 - 12:00, 13:30 - 14:30&lt;br /&gt;
* Пятница 11:00 - 12:00, 13:40 - 15:00&lt;br /&gt;
аудитория 623&lt;br /&gt;
&lt;br /&gt;
Почта: alexeyum@gmail.com&lt;br /&gt;
&lt;br /&gt;
== Семинары ==&lt;br /&gt;
&lt;br /&gt;
Материалы для повторения см. на [http://wiki.cs.hse.ru/Машинное_обучение_1 главной странице курса]&lt;br /&gt;
&lt;br /&gt;
=== Семинар 1 (09.09). Вводные понятия. Инструменты numpy, pandas, matplotlib. ===&lt;br /&gt;
&lt;br /&gt;
Упражнения на дом:&lt;br /&gt;
* Сгенерируйте матрицу 5x5 со случайными числами от 0 до 1. Найдите индексы ячеек со значениями меньше 0.2.&lt;br /&gt;
* Создайте матрицу 5x5 с числами, такими, что в ячейке (i, j) стоит число i+j. В задаче нельзя использовать циклы.&lt;br /&gt;
* Постройте график функции exp(|2*x + 3|).&lt;br /&gt;
* Пусть x, y - два вектора. Найдите проекцию вектора x на вектор y.&lt;br /&gt;
&lt;br /&gt;
=== Семинар 2 (16.09). Векторное дифференцирование. Знакомство с sklearn. ===&lt;br /&gt;
&lt;br /&gt;
Дополнительные упражнения на темы прошлого семинара: [https://www.dropbox.com/s/6t9djpoapkspgkb/%D0%94%D0%BE%D0%BF.%20%D1%83%D0%BF%D1%80%D0%B0%D0%B6%D0%BD%D0%B5%D0%BD%D0%B8%D1%8F%20%D0%B4%D0%BB%D1%8F%20numpy%2C%20matplotlib%2C%20pandas.pdf?dl=0 упражнения], [https://www.dropbox.com/s/2ghqfsnn20fe2uk/titanic.csv?dl=0 titanic.csv]&lt;br /&gt;
&lt;br /&gt;
=== Семинар 3 (23.09). Предобработка: категории, пропуски, нормализация. Минимизация функции потерь. ===&lt;br /&gt;
&lt;br /&gt;
=== Семинары 4 и 5 (07.10 и 08.10). Линейная классификация. Метрики качества, ROC, PR, AUC. Валидация. SVM. ===&lt;br /&gt;
&lt;br /&gt;
Упражнения на дом (в случае затруднений см. тетрадку семинара 4 на главной курса).&lt;br /&gt;
* Скачайте датасет для классификации спама: https://archive.ics.uci.edu/ml/machine-learning-databases/spambase/&lt;br /&gt;
* Разделите выборку на обучение и тест (sklearn.cross_validation.train_test_split)&lt;br /&gt;
* Обучите на нем логистическую регрессию (sklearn.linear_model.LogisticRegression), посчитайте различные метрики для вашего классификатора: правильность, точность, полноту (sklearn.metrics).&lt;br /&gt;
* Постройте ROC-кривую и PR-кривую для этого классификатора, посчитайте для них AUC-значения.&lt;br /&gt;
* Проделайте кросс-валидацию метода (sklearn.cross_validation.KFold)&lt;br /&gt;
&lt;br /&gt;
=== Семинар 6 (14.10). Работа с текстом, TF-IDF, разреженные матрицы. ===&lt;br /&gt;
&lt;br /&gt;
Упражнения на дом (в случае затруднений см. тетрадку семинара 6 на главной курса):&lt;br /&gt;
* Даны разреженные матрицы A и B в одном из трех форматов: COO, CSR, CSC. Какое время потребуется для их перемножения в зависимости от форматов? Какая пара форматов самая оптимальная?&lt;br /&gt;
* Дана разреженная матрица A и вектор z. Покажите, что если A представлена в формате CSR или CSC, то выражение Az можно вычислить эффективно.&lt;br /&gt;
* Загрузите [https://www.dropbox.com/s/18i7lqac9rr4pnx/banki_responses.json.bz2?dl=0 датасет] отзывов о работе банков. Обозначьте отзывы с оценками 4-5 как положительные и 1-3 как отрицательные. Приведите тексты к нижнему регистру, уберите все символы, кроме кириллицы, превратите тексты в признаки с помощью TF-IDF. Обучите линейную регрессию на этих данных.&lt;br /&gt;
* В предыдущем задании изучите, какие слова в наибольшей степени влияют на ответ.&lt;br /&gt;
* * Проведите стемминг текстов с помощью nltk.stem.snowball.RussianStemmer() и еще раз проведите классификацию. Сравните результаты.&lt;br /&gt;
&lt;br /&gt;
=== Семинар 7 (21.10). Решающие деревья. Калибровка вероятности ===&lt;br /&gt;
&lt;br /&gt;
Упражнения на дом (в случае затруднений см. тетрадку семинара 7 на главной курса):&lt;br /&gt;
* Покажите, что оценка качества разбиения с помощью максимального правдоподобия порождает энтропийный критерий для решающих деревьев.&lt;br /&gt;
(Вывод частично был на лекции, нужно провести все преобразования).&lt;br /&gt;
* Сгенерируйте набор точек на плоскости. Создайте из них датасет, где координаты точки являются ее признаками, а&lt;br /&gt;
модуль суммы координат - ответом.&lt;br /&gt;
* Обучите на них решающее дерево и изобразите его значения на точках плоскости.&lt;br /&gt;
* Исследуйте, как меняется дерево в зависимости от глубины.&lt;br /&gt;
* Исследуйте, как меняется дерево при изменении 10% выборки (5%, 1%).&lt;br /&gt;
* Загрузите стандартный датасет с ценами в Бостоне (sklearn.datasets.load_boston).&lt;br /&gt;
* Подберите с помощью кросс-валидации наилучшие параметры решающего дерева для него.&lt;/div&gt;</summary>
		<author><name>imported&gt;Aumnov</name></author>
	</entry>
</feed>