<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%90%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0_24%2F25_%28%D0%9C%D0%9E%D0%92%D0%A123%29</id>
	<title>Автоматическая обработка текста 24/25 (МОВС23) - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%90%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0_24%2F25_%28%D0%9C%D0%9E%D0%92%D0%A123%29"/>
	<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%90%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0_24/25_(%D0%9C%D0%9E%D0%92%D0%A123)&amp;action=history"/>
	<updated>2026-06-08T23:24:26Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wikicshse.ru/index.php?title=%D0%90%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0_24/25_(%D0%9C%D0%9E%D0%92%D0%A123)&amp;diff=859&amp;oldid=prev</id>
		<title>imported&gt;Saprokhorov 1: small impro</title>
		<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%90%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0_24/25_(%D0%9C%D0%9E%D0%92%D0%A123)&amp;diff=859&amp;oldid=prev"/>
		<updated>2025-06-20T19:28:10Z</updated>

		<summary type="html">&lt;p&gt;small impro&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;==О курсе==&lt;br /&gt;
&lt;br /&gt;
NLP — это область искусственного интеллекта, направленная на решение задач, связанных с обработкой человеческого языка, таких как извлечение информации, машинный перевод, автоматическое суммирование и диалоговые системы. За последние годы мы увидели значительный прогресс благодаря статистическому и глубокому обучению. Демонстрация возможностей современных диалоговых систем по типу ChatGPT от OpenAI позволила нам переосмыслить перспективы NLP в повседневной жизни, что привлекло к области внимание как со стороны исследователей и инженеров, так и институциональных инвесторов, готовых финансировать бурный рост отрасли.&lt;br /&gt;
&lt;br /&gt;
Данный курс ставит перед собой следующие цели:&lt;br /&gt;
* познакомить слушателя с ключевыми направлениями современного развития области, сформировать понимание запросов, с которыми сталкиваются инженеры и исследователи в повседневной работе.&lt;br /&gt;
&lt;br /&gt;
* развить понимание фундаментальных концепций, необходимых для самостоятельного решения задач как прикладного, так и исследовательского характера.&lt;br /&gt;
&lt;br /&gt;
* познакомить слушателя с инструментами, необходимыми для решения прикладных задач.&lt;br /&gt;
&lt;br /&gt;
Курс основан на материалах [https://github.com/yandexdataschool/nlp_course/tree/2023 Школы Анализа Данных Яндекса (ШАД)], [https://web.stanford.edu/class/cs224n/ CS224n by Stanford], а также личном опыте автора. Курс приоритезирует понимание слушателями пространства существующих на сегодня в отрасли задач и умение их решать над полнотой освещения исторически важных, однако на текущий день устаревших концепций&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Занятия проводятся в [https://us06web.zoom.us/j/85123736103?pwd=TbFnaDOVRPyqcVof2vlGbpeub1kDw5.1 Zoom] &amp;#039;&amp;#039;&amp;#039;по четвергам в 19:40&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
==Контакты==&lt;br /&gt;
&lt;br /&gt;
Чат курса в TG: [https://t.me/+7ayE2oKTNPg3M2M6 chat link]&lt;br /&gt;
&lt;br /&gt;
Преподаватель: Хажгериев Мурат Анзорович ([https://t.me/greedisneutral @greedisneutral])&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Ассистент !! Контакты &lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | Соня-Аня Никифорова || [https://t.me/sonya_leaf @sonya_leaf]&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | Стас Ивашков || [https://t.me/ps1va @ps1va]&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | Маша Харченко || [https://t.me/mister_autocrat @mister_autocrat]&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | Савелий Прохоров || [https://t.me/Savely_Prokhorov @Savely_Prokhorov]&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
==Материалы курса==&lt;br /&gt;
Ссылка на плейлист курса на YouTube: [https://www.youtube.com/playlist?list=PLmA-1xX7IuzBARI5ES_l6WOduw0CZs3t4 YouTube-playlist]&lt;br /&gt;
&lt;br /&gt;
Ссылка на плейлист в VK: [https://vk.com/video/playlist/-227011779_15 VK Видео]&lt;br /&gt;
&lt;br /&gt;
Ссылка на GitHub с материалами курса: [https://github.com/greedisneutral/NLP-course GitHub repository]&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
 ! Занятие !! Тема !! Дата !! Материалы для самоподготовки к семинарам !! Дополнительные материалы&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;1&amp;#039;&amp;#039;&amp;#039; [[https://www.youtube.com/watch?v=QSLSIiQ6Mcs&amp;amp;list=PLmA-1xX7IuzBARI5ES_l6WOduw0CZs3t4&amp;amp;index=2&amp;amp;pp=iAQB Запись, YouTube]] || [[https://github.com/greedisneutral/NLP-course/blob/master/1.Embeddings/Word_Embeddings.pdf Слайды], [https://github.com/greedisneutral/NLP-course/blob/master/1.Embeddings/NLP_seminar_week_1.ipynb Тетрадка]] Карта задач и методов NLP, эмбеддинги слов (word embeddings) || 06.11.24 (Ср.) || || &lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;2&amp;#039;&amp;#039;&amp;#039; [[https://www.youtube.com/watch?v=QjmqbOe84vY&amp;amp;list=PLmA-1xX7IuzBARI5ES_l6WOduw0CZs3t4&amp;amp;index=1&amp;amp;pp=iAQB Запись, YouTube]] || [[https://github.com/greedisneutral/NLP-course/blob/master/2.Classification/Classification.pdf Слайды], [https://github.com/greedisneutral/NLP-course/blob/master/2.Classification/NLP_seminar_week_2.ipynb Тетрадка]] Классификация текста || 14.11.24 (Чт.) || || &lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;3&amp;#039;&amp;#039;&amp;#039; [[https://www.youtube.com/watch?v=q9EUpCF97VI&amp;amp;list=PLmA-1xX7IuzBARI5ES_l6WOduw0CZs3t4&amp;amp;index=3&amp;amp;pp=iAQB Запись]] || [[https://github.com/greedisneutral/NLP-course/blob/master/3.Seq2seq/seq2seq_attention.pdf Слайды], [https://github.com/greedisneutral/NLP-course/blob/master/3.Seq2seq/NLP_seminar_week_3.ipynb Тетрадка], [https://github.com/greedisneutral/NLP-course/blob/master/3.Seq2seq/seq2seq_attention_whiteboard.pdf Доска]] Seq2seq, Трансформер и механим внимания || 21.11.24 (Чт.) || || [https://colah.github.io/posts/2015-08-Understanding-LSTMs/ Ссылка] на качественное объяснение того, как работает LSTM (да и RNN вообще)&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;4&amp;#039;&amp;#039;&amp;#039; [[https://www.youtube.com/watch?v=RFdDgHDiKMs&amp;amp;list=PLmA-1xX7IuzBARI5ES_l6WOduw0CZs3t4&amp;amp;index=4&amp;amp;pp=iAQB Запись]] || [[https://github.com/greedisneutral/NLP-course/blob/master/4.Transformers/Transformers.pdf Слайды], [https://github.com/greedisneutral/NLP-course/blob/master/4.Transformers/HSE_NLP_seminar_4.ipynb Ноутбук]] Transfer learning: BERT, ELMO, GPT || 28.11.24 (Чт.) ||&lt;br /&gt;
Замечательный [https://jalammar.github.io/illustrated-transformer/ разбор] архитектуры от Джея Аламмара &lt;br /&gt;
&lt;br /&gt;
Прекрасный [https://lena-voita.github.io/nlp_course/seq2seq_and_attention.html разбор] от Лены Войты в рамках NLP Course | For You&lt;br /&gt;
&lt;br /&gt;
Уже ставшая бородатой [https://arxiv.org/abs/1706.03762 оригинальная статья] Attention is all you need&lt;br /&gt;
|| &lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;5&amp;#039;&amp;#039;&amp;#039; [[https://www.youtube.com/watch?v=Mi21czVUyCo&amp;amp;list=PLmA-1xX7IuzBARI5ES_l6WOduw0CZs3t4&amp;amp;index=5&amp;amp;pp=iAQB Запись]] || [[https://github.com/greedisneutral/NLP-course/blob/master/5.Pretrain_finetune/Pretrain_finetune_slides.pdf Слайды], [https://github.com/greedisneutral/NLP-course/blob/master/5.Pretrain_finetune/Pretrain_finetune_whiteboard.pdf Доска]] Обучение Больших языковых моделей (Large Language Models): Обучение с нуля vs Тонкая настройка (finetuning) || 12.12.24 (Чт.) || || &lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;6&amp;#039;&amp;#039;&amp;#039; [[https://www.youtube.com/watch?v=C5HRjlQLMBM&amp;amp;list=PLmA-1xX7IuzBARI5ES_l6WOduw0CZs3t4&amp;amp;index=6&amp;amp;pp=iAQB Запись]] || [[https://github.com/greedisneutral/NLP-course/blob/master/6.RLHF/RLHF_slides.pdf Слайды], [https://github.com/greedisneutral/NLP-course/blob/master/6.RLHF/RLHF_whiteboard.pdf Доска]] Reinforcement Learning From Human Feedback (RLHF), Direct Preference Optimization (DPO) || 14.12.24 (Сб.) || || &lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;7&amp;#039;&amp;#039;&amp;#039; [[https://www.youtube.com/watch?v=LT_pJ56tVso&amp;amp;list=PLmA-1xX7IuzBARI5ES_l6WOduw0CZs3t4&amp;amp;index=7&amp;amp;pp=iAQB Запись]] || [[https://github.com/greedisneutral/NLP-course/blob/master/7.Efficiency/Efficiency_slides.pdf Слайды]] Практические подходы для эффективного обучения и развертывания LLM || 16.12.24 (Пн.) || [https://github.com/mryab/efficient-dl-systems Хороший курс] по взрослой работе с моделями || &lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;background:#eaecf0;&amp;quot; | &amp;#039;&amp;#039;&amp;#039;8&amp;#039;&amp;#039;&amp;#039; [[https://github.com/greedisneutral/NLP-course/blob/master/8.RAG_Tools/NLP%20system%20showcase_whiteboard.pdf Запись]] || [[https://github.com/greedisneutral/NLP-course/blob/master/8.RAG_Tools/RAG_Tools_slides.pdf Доска], [https://github.com/greedisneutral/NLP-course/blob/master/8.RAG_Tools/NLP%20system%20showcase_whiteboard.pdf Ноутбук]] Retrieval-Augmented Generation (RAG), Tools, LLM-based System Overview || 19.12.24 (Чт.) ||&lt;br /&gt;
RAG and Tooling Frameworks: https://www.llamaindex.ai/framework, https://www.langchain.com/, https://huggingface.co/docs/transformers/en/agents&lt;br /&gt;
&lt;br /&gt;
Graph RAG-specific Repos: https://github.com/HKUDS/LightRAG, https://github.com/microsoft/graphrag&lt;br /&gt;
|| &lt;br /&gt;
Faiss (vectorDB): https://github.com/facebookresearch/faiss, https://github.com/facebookresearch/faiss/wiki/Guidelines-to-choose-an-index&lt;br /&gt;
&lt;br /&gt;
GraphDB (turn-on your VPN): https://neo4j.com/docs/getting-started/graph-database/&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
=== Записи консультаций ===&lt;br /&gt;
&lt;br /&gt;
==Формула оценивания==&lt;br /&gt;
&lt;br /&gt;
=== При участии в устном экзамене ===&lt;br /&gt;
&lt;br /&gt;
Оценка = 0.3*О&amp;lt;sub&amp;gt;Устный экзамен&amp;lt;/sub&amp;gt; + 0.7*О&amp;lt;sub&amp;gt;ДЗ&amp;lt;/sub&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== При отказе от устного экзамене ===&lt;br /&gt;
&lt;br /&gt;
Оценка = 1.0*О&amp;lt;sub&amp;gt;ДЗ&amp;lt;/sub&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Домашние задания ==&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;После выдачи домашнего задания студентам предоставляется 2 (две) недели на выполнение&amp;#039;&amp;#039;&amp;#039;.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Каждый день просрочки штрафуется 1 баллом от максимальной оценки за соответствующее задание.&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
=== Main Track ===&lt;br /&gt;
# Обучение эмбеддингов с помощью библиотеки fasttext, реализация реального движка поиска эмбеддинга-ответа по запросу в векторной БД &amp;lt;br /&amp;gt; - Выдана 21.11.24, &amp;#039;&amp;#039;&amp;#039;Дедлайн - 23:59 (МСК), 01.12.24 (Вс.)&amp;#039;&amp;#039;&amp;#039;, [https://github.com/greedisneutral/NLP-course/blob/master/2.Classification/NLP_hw_week_2.ipynb Ноутбук] &amp;lt;br /&amp;gt; - Весит 30% от итога (если выбираете идти на экзамен) и 40% при перевзвешивании в случае отказа от экзамена&lt;br /&gt;
# Тонкая настройка (fine-tuning) BERT на собственных данных // Имплементация GPT 2 &amp;lt;br /&amp;gt; - Выдана 03.12.24, &amp;#039;&amp;#039;&amp;#039;Дедлайн - 23:59 (МСК), 15.12.24 (Вс.)&amp;#039;&amp;#039;&amp;#039;, [https://github.com/greedisneutral/NLP-course/blob/master/4.Transformers/HSE_NLP_HW_BERT.ipynb Ноутбук (BERT)], [https://github.com/greedisneutral/NLP-course/blob/master/4.Transformers/HSE_NLP_HW_GPT.ipynb Ноутбук (GPT)] &amp;lt;br /&amp;gt; - Весит 20% от итога (если выбираете идти на экзамен) и 30% при перевзвешивании в случае отказа от экзамена&lt;br /&gt;
# Тонкая настройка LLM (LLAMA 3 8b) с помощью PEFT &amp;lt;br /&amp;gt; - Выдана 12.12.24, &amp;#039;&amp;#039;&amp;#039;Дедлайн - 23:59 (МСК), 22.12.2024 (Вс.)&amp;#039;&amp;#039;&amp;#039;, [https://github.com/greedisneutral/NLP-course/blob/master/5.Pretrain_finetune/NLP_seminar_finetuning_raw.ipynb Ноутбук] &amp;lt;br /&amp;gt; - Весит 20% от итога (если выбираете идти на экзамен) и 30% при перевзвешивании в случае отказа от экзамена&lt;br /&gt;
&lt;br /&gt;
=== Optional Track ===&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Мягкий дедлайн - 27.12.24 (Пт.)&amp;#039;&amp;#039;&amp;#039;, &amp;#039;&amp;#039;жёсткий - 30.12.24 (Пн.)&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
* Тонкая настройка собственной модели с использованием библиотеки TRL &amp;lt;br /&amp;gt; - Выдана 14.12.24, [https://github.com/greedisneutral/NLP-course/blob/master/6.RLHF/HSE_NLP_HW_4_optional.ipynb Ноутбук] &amp;lt;br /&amp;gt; - Весит 15% от итога&lt;br /&gt;
* Реализация Round-to-Nearest (RTN), Generalized Post-Training Quantization (GPTQ) &amp;lt;br /&amp;gt; - Выдано 16.12.24, [https://github.com/greedisneutral/NLP-course/blob/master/7.Efficiency/HSE_NLP_HW_5_optional.ipynb.ipynb Ноутбук] &amp;lt;br /&amp;gt; - Весит 15% от итога&lt;br /&gt;
&lt;br /&gt;
== Устный экзамен ==&lt;br /&gt;
&lt;br /&gt;
Программой курса предусмотрен устный экзамен, в рамках которого студентам будет предложено тянуть случайный билет с вопросом по пройденному материалу.&lt;br /&gt;
&lt;br /&gt;
== Автоматы ==&lt;br /&gt;
На курсе предусмотрены автоматы:&lt;br /&gt;
Если оценка студента за блок “домашние задания” ≥ 4 и устраивает студента, ее можно зачесть в виде автомата.&lt;br /&gt;
&lt;br /&gt;
== Литература ==&lt;br /&gt;
Статьи, упомянутые в лекциях&lt;/div&gt;</summary>
		<author><name>imported&gt;Saprokhorov 1</name></author>
	</entry>
</feed>