Современный NLP и большие языковые модели 26
Дополнительные действия
О курсе
Расскажем, как от теории с курса по NLP перейти к практическому применению больших языковых моделей, научимся обсуждать требования к разного уровня решениям и соберём собственный проект по ходу курса.
1. Современные LLM (тюнинг, квантизация)
2. RAG и пререквизиты (методы поиска, выбор энкодеров)
3. Агентные системы (простые и мультиагентные)
4. Инфраструктура вокруг LLM (хостинг LLM, эмбеддингов, observing)
5. Системный дизайн LLM-based продукта
Расписание
Лекция: Понедельник 19:40. Ссылка на занятие.
Семинары: Четверг 18:10. Ссылка на занятие.
Полезные ссылки
- Общий чат курса в telegram: https://t.me/+VLmYI24BJ9hjNTg6
- Github курса: https://github.com/xufana/modern_nlp_llm
- Диск с записями: https://drive.google.com/drive/folders/1sXN69MOfDn40iYmLSkzC06waiSuK64KO?usp=sharing
- Таблица с оценками: TBA
Темы курса
1. Развитие моделей. Записи: лекция, семинар
2. Эмбеддеры и энкодеры. Записи: лекция,семинар
3. RAG. Записи: лекция, семинар
4. Мультимодальные модели и MultimodalRAG: лекция (запись не смогла), семинар
5. Агенты (начало): лекция
Домашние задания
Домашние задания выполняются в командах по 2-4 человека. Записаться как команда можно здесь: https://forms.gle/2HpdGvXWHJdmhLA88
Форма будет закрыта 1 марта и заявки перестанут приниматься.
Общая идея домашних заданий: в рамках четырёх домашних заданий вам предлагается собрать LLM-based проект (будь то RAG, агент, etc) и защитить его в конце курса для получения итоговой оценки.
Задание 1: выбор темы проекта
В рамках первого задания вам предлагается: определиться с темой проекта, заполнить дизайн-документ о проекте и найти данные, необходимые для реализации проекта.
Решение оформите в виде ссылки на PR, содержащий дизайн-док и readme файл с кратким описанием проекта, команды и данных.
Выдано: 18.02.2026
Дедлайн: 02.03.2026
Задание 2: MVP проекта
В рамках второго задания предлагаем воспроизвести кор-функционал проекта (закодить MVP-версию). В качестве артефакта по выполнению ДЗ ожидаем получить:
- Код проекта
- readme.md файл с описанием проекта: пару слов о чем проект, структура проекта, как его запустить, ключевые фичи
- Отчёт по результатам выполнения этапа: почему вами были приняты те или иные решения, чем обусловлен выбор технического стека, с какими сложностями столкнулись, и как решили их (или планируете решить).
Разрешается использовать в работе LLM и кодовые ассистенты, однако мы очень просим: оценить количество времени, затраченное на проект, при использовании генеративных моделей и примерную стоимость данного этапа проекта (подписка / количество токенов / непосредственно деньги / другое), укажите эту информацию в своём отчёте.
Решение оформите в виде ссылки на PR, содержащий код, отчёт и обновлённый readme файл с добавлением новых вводных.
Выдано: 9.03.2026
Дедлайн: 23.03.2026
Задание 3: инфраструктура проекта
В рамках третьего задания предлагаем добавить необходимую для деплоя проекта обвязку + другие сервисы, инфраструктурно необходимые для проекта (мониторинги, хранилища, etc). В качестве артефакта по выполнению ДЗ ожидаем получить:
- Код проекта
- readme.md файл с обновлениями проекта на новой стадии
- Отчёт по результатам выполнения этапа: почему вами были приняты те или иные решения, чем обусловлен выбор технического стека, с какими сложностями столкнулись, и как решили их (или планируете решить).
Разрешается использовать в работе LLM и кодовые ассистенты, однако мы очень просим: оценить количество времени, затраченное на проект, при использовании генеративных моделей и примерную стоимость данного этапа проекта (подписка / количество токенов / непосредственно деньги / другое), укажите эту информацию в своём отчёте.
Решение оформите в виде ссылки на PR, содержащий код, отчёт и обновлённый readme файл с добавлением новых вводных.
Выдано: 9.03.2026
Дедлайн: 23.03.2026
Преподаватели
| Преподаватели |
|---|
| Дарья Андреева |
| Роман Соломатин |
| Александр Потехин |
Формула оценок
Итог = SUM(О_ДЗ_i) *0.125 + О_проект * 0.5
- ДЗ — оценка за домашнее задание
- Проект — оценка за проект
Формат экзамена: защита проекта.