<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%AD%D0%BA%D0%BE%D0%BD%D0%BE%D0%BC%D0%B8%D0%BA%D0%B0_%D0%B2%D0%BF%D0%B5%D1%87%D0%B0%D1%82%D0%BB%D0%B5%D0%BD%D0%B8%D0%B9%3A_%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2_Data_Science</id>
	<title>Экономика впечатлений: Введение в Data Science - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%AD%D0%BA%D0%BE%D0%BD%D0%BE%D0%BC%D0%B8%D0%BA%D0%B0_%D0%B2%D0%BF%D0%B5%D1%87%D0%B0%D1%82%D0%BB%D0%B5%D0%BD%D0%B8%D0%B9%3A_%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2_Data_Science"/>
	<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%AD%D0%BA%D0%BE%D0%BD%D0%BE%D0%BC%D0%B8%D0%BA%D0%B0_%D0%B2%D0%BF%D0%B5%D1%87%D0%B0%D1%82%D0%BB%D0%B5%D0%BD%D0%B8%D0%B9:_%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2_Data_Science&amp;action=history"/>
	<updated>2026-06-07T19:27:28Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wikicshse.ru/index.php?title=%D0%AD%D0%BA%D0%BE%D0%BD%D0%BE%D0%BC%D0%B8%D0%BA%D0%B0_%D0%B2%D0%BF%D0%B5%D1%87%D0%B0%D1%82%D0%BB%D0%B5%D0%BD%D0%B8%D0%B9:_%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2_Data_Science&amp;diff=2568&amp;oldid=prev</id>
		<title>imported&gt;АннаВелликок: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%AD%D0%BA%D0%BE%D0%BD%D0%BE%D0%BC%D0%B8%D0%BA%D0%B0_%D0%B2%D0%BF%D0%B5%D1%87%D0%B0%D1%82%D0%BB%D0%B5%D0%BD%D0%B8%D0%B9:_%D0%92%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2_Data_Science&amp;diff=2568&amp;oldid=prev"/>
		<updated>2020-03-05T15:23:38Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;= О курсе =&lt;br /&gt;
&lt;br /&gt;
Цель учебной дисциплины - познакомить студентов с основными концепциями и методами анализа данных и машинного обучения. &lt;br /&gt;
&lt;br /&gt;
Учимся:&lt;br /&gt;
* работать с питоном&lt;br /&gt;
* понимать основные понятия Data Science&lt;br /&gt;
* знать основные методы AI&lt;br /&gt;
* отличать кластеризацию от регрессии&lt;br /&gt;
* подбирать подходящую визуализацию&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Программа =&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Тема 1. Введение. Что такое Data Science.&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
* Введение в Artificial intelligence, Data Science, Machine Learning, Deep Learning, Big Data. &lt;br /&gt;
* Какие сейчас выполняются задачки в туристическом IT-бизнесе с использованием AI и ML? &lt;br /&gt;
* Какие возможности на рынке труда открывают перед тобой навыки работы с данными. SAAS бизнес.&lt;br /&gt;
* Обзор инструментов и библиотек, которыми будем пользоваться: Python, введение в pandas.&lt;br /&gt;
* Домашка: Посмотреть внимательно несколько ноутбуков в питоне. Введение в pandas, датасет по бронированиям&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Тема 2. Краткий курс нужной математики для Data Science&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
* Теория вероятностей: вероятность, распределение, характеристики распределений. &lt;br /&gt;
* Математическая статистика: выборка, типы выборок. Описательная статистика, меры центральной тенденции. Среднее, мода, медиана, стандартное отклонение, процентили, минимум, максимум. &lt;br /&gt;
* Пакет Pandas&lt;br /&gt;
* Небольшое дз в питоне №1: небольшие задачки на описательную статистику, использование pandas &lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Тема 3. Визуализация данных&amp;#039;&amp;#039;&amp;#039; &lt;br /&gt;
* Основные виды графиков: гистограмма, bar chart, scatterplot. Использование графиков при подготовке данных.&lt;br /&gt;
* Зачем нужна визуализация данных в бизнесе&lt;br /&gt;
* Основные ошибки при визуализации&lt;br /&gt;
* Небольшое дз в питоне №2&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Тема 4. Регрессия&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
* Определение регрессии, нулевая гипотеза, ошибки первого и нулевого рода.&lt;br /&gt;
* Метрики регрессии: MAE, MAPE, MSE, R2&lt;br /&gt;
* Описание и постановка задач для регрессии&lt;br /&gt;
&lt;br /&gt;
Небольшое дз в питоне №3&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Тема 5. Классификация: KNN, Алгоритм решающих деревьев&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
* Определение классификации, метрики: доля правильных ответов (accuracy), точность (precision), полнотa (recall). PR-кривая. ROC-кривая. &lt;br /&gt;
* Обучение с учителем и без учителя. Валидация.&lt;br /&gt;
* Задачи классификации&lt;br /&gt;
* Алгоритмы классификации и их отличия&lt;br /&gt;
* Небольшое дз в питоне №4&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Тема 6. Анализ текстовых данных&amp;#039;&amp;#039;&amp;#039; &lt;br /&gt;
* Подробное изучение бизнес-кейса с тональностью комментариев к отелям с Tripadvisor&lt;br /&gt;
* Распознавание текста комментариев и их тональности. Изучение библиотек работы с текстом. Метод сбора данных из открытых источников. &lt;br /&gt;
* Разметка комментариев по тональности&lt;br /&gt;
* Обучение модельки, которая выявляет тональности у комментариев на размеченной выборке&lt;br /&gt;
* Применение модельки на новых комментариях&lt;br /&gt;
* Оценка результатов&lt;br /&gt;
* Дз в питоне №5: Накидать новые переменные в разобранную на семинаре модель, описать получившийся результат&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Тема 7. Защита проектов с применением машинного обучения&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
* Необходимо разобрать реальный бизнес-кейс, который был решён при помощи машинного обучения и искусственного интеллекта.&lt;br /&gt;
* Описать бизнес-задачу, использованные методы и результаты.&lt;br /&gt;
&lt;br /&gt;
= Презентации =&lt;br /&gt;
&lt;br /&gt;
[https://docs.google.com/presentation/d/17nhXQDFA8b9dwhMfahpeRVVLMMP4DVuaUlrRgNeB-o0/edit?usp=sharing Тема 1. Введение]&lt;br /&gt;
&lt;br /&gt;
[https://docs.google.com/presentation/d/1BPalI7npGd8Xiyk5tGpdyZ5RMX5Yx3RdMz3k2nstKf0/edit?usp=sharing Тема 2. Краткий курс нужной математики и статистики для Data Science]&lt;br /&gt;
&lt;br /&gt;
[https://docs.google.com/presentation/d/1bTNIih-XyyzB_fKXrVXe1poXOsXs8arl2j0yQF4w0ZA/edit?usp=sharing Тема 3. Визуализация данных]&lt;br /&gt;
&lt;br /&gt;
[https://drive.google.com/open?id=1TTGewF1ZaT0sveJab2iE8BWkn3goXEvBF0KLQIxwvsQ Тема 4. Регрессия]&lt;br /&gt;
&lt;br /&gt;
[https://docs.google.com/presentation/d/1SB2b4rrkkolPGChaT5s98PgbPqjjsKoIsdnvw05_yMk/edit?usp=sharing Тема 5. Классификация:метрики]&lt;br /&gt;
&lt;br /&gt;
[https://docs.google.com/presentation/d/1J4VZ7A2wilAO4EReUCgGPFE8YKymOhd5Q0jdcMpXa_w/edit?usp=sharing Тема 5. Классификация:методы]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= Домашка = &lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Тема 1. Введение. Что такое Data Science&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
# [https://postnauka.ru/faq/46974 Big Data]&lt;br /&gt;
# [https://habr.com/ru/post/401857/ Разница между AI, ML, DL]&lt;br /&gt;
# [https://blogs.oracle.com/russia/ai-ml-dl-differ Разница между AI, ML, DL 2] &lt;br /&gt;
# [https://habr.com/ru/post/414165/ Курс о Deep Learning на пальцах]&lt;br /&gt;
Посмотреть три питоновских ноутбука: &lt;br /&gt;
# A quick tour of IPython Notebook&lt;br /&gt;
# PythonTutorial&lt;br /&gt;
# Reading from a csv (это больше для домашки)&lt;/div&gt;</summary>
		<author><name>imported&gt;АннаВелликок</name></author>
	</entry>
</feed>