<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%90%D0%B3%D1%80%D0%B5%D0%B3%D0%B0%D1%82%D0%BE%D1%80_%D0%BD%D0%BE%D0%B2%D0%BE%D1%81%D1%82%D0%B5%D0%B9_%D0%BD%D0%B0_%D0%BF%D0%BE%D0%B4%D0%BE%D0%B1%D0%B8%D0%B8_Meduza.io_%28%D0%BA%D0%BE%D0%BC%D0%B0%D0%BD%D0%B4%D0%BD%D1%8B%D0%B9_%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%29</id>
	<title>Агрегатор новостей на подобии Meduza.io (командный проект) - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%90%D0%B3%D1%80%D0%B5%D0%B3%D0%B0%D1%82%D0%BE%D1%80_%D0%BD%D0%BE%D0%B2%D0%BE%D1%81%D1%82%D0%B5%D0%B9_%D0%BD%D0%B0_%D0%BF%D0%BE%D0%B4%D0%BE%D0%B1%D0%B8%D0%B8_Meduza.io_%28%D0%BA%D0%BE%D0%BC%D0%B0%D0%BD%D0%B4%D0%BD%D1%8B%D0%B9_%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%29"/>
	<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%90%D0%B3%D1%80%D0%B5%D0%B3%D0%B0%D1%82%D0%BE%D1%80_%D0%BD%D0%BE%D0%B2%D0%BE%D1%81%D1%82%D0%B5%D0%B9_%D0%BD%D0%B0_%D0%BF%D0%BE%D0%B4%D0%BE%D0%B1%D0%B8%D0%B8_Meduza.io_(%D0%BA%D0%BE%D0%BC%D0%B0%D0%BD%D0%B4%D0%BD%D1%8B%D0%B9_%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82)&amp;action=history"/>
	<updated>2026-06-06T17:14:34Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wikicshse.ru/index.php?title=%D0%90%D0%B3%D1%80%D0%B5%D0%B3%D0%B0%D1%82%D0%BE%D1%80_%D0%BD%D0%BE%D0%B2%D0%BE%D1%81%D1%82%D0%B5%D0%B9_%D0%BD%D0%B0_%D0%BF%D0%BE%D0%B4%D0%BE%D0%B1%D0%B8%D0%B8_Meduza.io_(%D0%BA%D0%BE%D0%BC%D0%B0%D0%BD%D0%B4%D0%BD%D1%8B%D0%B9_%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82)&amp;diff=843&amp;oldid=prev</id>
		<title>imported&gt;GalinaKaleeva: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%90%D0%B3%D1%80%D0%B5%D0%B3%D0%B0%D1%82%D0%BE%D1%80_%D0%BD%D0%BE%D0%B2%D0%BE%D1%81%D1%82%D0%B5%D0%B9_%D0%BD%D0%B0_%D0%BF%D0%BE%D0%B4%D0%BE%D0%B1%D0%B8%D0%B8_Meduza.io_(%D0%BA%D0%BE%D0%BC%D0%B0%D0%BD%D0%B4%D0%BD%D1%8B%D0%B9_%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82)&amp;diff=843&amp;oldid=prev"/>
		<updated>2017-10-08T10:01:05Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{Карточка_командного_проекта&lt;br /&gt;
|name=Агрегатор новостей на подобии Meduza.io&lt;br /&gt;
|company=IPONWEB&lt;br /&gt;
|semester=Осень 2016&lt;br /&gt;
|course=3&lt;br /&gt;
|number_of_students=3-4&lt;br /&gt;
|categorize=yes&lt;br /&gt;
|is_archived=yes&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
=== Что это за проект? ===&lt;br /&gt;
Агрегатор новостных сайтов, также кластеризует новости, находя похожие темы. Также есть админка для коллективной работы над текстами новостей с привязкой к собранным темам.&lt;br /&gt;
&lt;br /&gt;
=== Чему научатся студенты? Что самое интересное в проекте? ===&lt;br /&gt;
* Пример разработки системы агрегации&lt;br /&gt;
* Обработка и анализ текста&lt;br /&gt;
* Разработка системы взаимодействия в реальном времени&lt;br /&gt;
&lt;br /&gt;
=== Организация работы (Как студенты будут работать в команде?) ===&lt;br /&gt;
Основные моменты взаимодействия:&lt;br /&gt;
* Непрерывня интеграция: линтеры кода, прогон тестов, покрытие тестами, сборка пакета и выкладка на прод, работа с конфигурациями. Настройка на примере Jenkins или Phabricator. Работа с конфигурациями через Puppet (или, возможно, Docker или Vagrant)&lt;br /&gt;
* Гибкая методология разработки: бэклог, организация спринтов, оценка сложности задач и сопоставление с фактически потраченным, демо. Технически на примере Trello, RedMine или Phabricator&lt;br /&gt;
* В группе каждые 2 недели (спринт) переходит роль менеджера проекта, чтобы каждый мог попробовать роль пару раз и на планирование не забивали.&lt;br /&gt;
* Взаимные код-ревью: все ревьюят всех.&lt;br /&gt;
* Удаленная работа, встречаться нечасто (например, в конце каждого спринта), но раз в 2-3 дня обязательно синхронизовать результаты и планы в слаке/телеграмме или по почте.&lt;br /&gt;
&lt;br /&gt;
=== Компоненты (Из каких частей состоит проект?) ===&lt;br /&gt;
* Агрегация и работа с разными источниками.&lt;br /&gt;
* Кластеризация новостей, склеивание по общим темам, возможно склеивание в истории с развитием.&lt;br /&gt;
* Параллельная работа в админке (см. Описание Медузы)&lt;br /&gt;
* Редактор новости: проверка правописания, выявление именованных сущностей и рекомендации справки о них, поиск новостей по этой же теме по мере написания материала.&lt;br /&gt;
* Составление рекомендаций связанного контента: по тексту и корректировка по поведению пользователей&lt;br /&gt;
&lt;br /&gt;
Техническое описание устройства Медузы:&lt;br /&gt;
* https://medium.com/meduza-dev/-9dbf37861e11#.tcci76sag&lt;br /&gt;
* https://medium.com/meduza-dev/-f86a924c09a2#.uqcmksrtt&lt;br /&gt;
* https://medium.com/meduza-how-it-works/-1a99202d27a3#.uocxelhaj&lt;br /&gt;
&lt;br /&gt;
Сделать агрегацию нескольких источников, нормализацию текста (и перевод в bag-of-words), затем кластеризацию новостей за последнее время для поиска схожих тем и их развитий.&lt;br /&gt;
&lt;br /&gt;
Админка должна отображать текущие агрегированные темы, тему, на которую составляется новость. Также через веб-сокеты должна быть реализована совместная работа над текстом. Также печатаемый текст проверяется на поиск именованых сущностей для привязки справки по ним.&lt;br /&gt;
&lt;br /&gt;
=== Какие будут использоваться технологии? ===&lt;br /&gt;
Язык разработки непринципиален, подойдет любой, в котором удобно работать с HTTP-запросами, взаимодействовать с СУБД и разрабатывать веб-сервер (например, Python, Ruby, JavaScript)&lt;br /&gt;
&lt;br /&gt;
В качестве платформы подойдут AWS или Google Cloud&lt;br /&gt;
&lt;br /&gt;
=== Какие начальные требования? ===&lt;br /&gt;
* Базовое понимание HTTP, опыт работы с API.&lt;br /&gt;
* Опыт веб-разработки&lt;br /&gt;
&lt;br /&gt;
=== Темы вводных занятий ===&lt;br /&gt;
* Взаимодействие в команде, методология Agile&lt;br /&gt;
* Архитектура разрабатываемого проекта&lt;br /&gt;
* Составление бэклога и планирование спринтов&lt;br /&gt;
&lt;br /&gt;
=== Критерии оценки ===&lt;br /&gt;
Минимальные требования (на 4-5):&lt;br /&gt;
*Агрегация по крайне мере 10 источников новостей на русском языке&lt;br /&gt;
*Нормализация (составление bag of words, векторной модели новостей)&lt;br /&gt;
*Кластеризация новостей по схожести, определение дубликатов&lt;br /&gt;
*Веб-сайт с лентой новостей с кешированием.&lt;br /&gt;
&lt;br /&gt;
Требования (на 6-7):&lt;br /&gt;
*Выделение именованных сущностей в тексте и связка с другими новостями по ним или страницами википедии.&lt;br /&gt;
*Агрегация добавляемых аккаунтов социальных медиа: фейсбук, жж. + Несложный классификатор, похож ли пост на информационный повод (например, по длине поста, наличию именованных сущностей, слов из заданного списка, ссылок)&lt;br /&gt;
*Админка для работы с новостями на веб-сокетах для совместных правок и работы выпускающего редактора: редактирование текста, блокировка полей для других при редактировании, сохранение истории изменений и чат/комментарии.&lt;br /&gt;
&lt;br /&gt;
Требования (на 8-10):&lt;br /&gt;
*Интеграция с Яндекс.Метрикой через API - подгрузка и кеширование данных о просмотревших новость (демография, интересы, регион и тд)&lt;br /&gt;
*Система персональной рекомендации контента на основе фич новости и данных из Метрики.&lt;br /&gt;
*Конструктор верстки текста новости. + AMP версия.&lt;br /&gt;
*Работа с твиттером: мониторинг трендов, отслеживание добавляемых аккаунтов, экспорт и визуализация твиттов и диалогов в новости.&lt;br /&gt;
*Пуш-уведомления о новостях.&lt;br /&gt;
&lt;br /&gt;
Требования (на вероятность создать в итоге успешный сервис для СМИ):&lt;br /&gt;
* Код соответствует современным стандартам кодирования&lt;br /&gt;
* Актуальная документация по работе процессов сервиса&lt;br /&gt;
* Покрытие тестами, юнит-тесты, функциональные и интеграционные тесты&lt;br /&gt;
* Проведен UX-анализ основных интерфейсов и сценариев пользователей&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Точные требования на 6-10 будут сформулированы на первых занятиях исходя из составленного бэклога и уровня подготовки участников проекта.&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
=== Похожие проекты ===&lt;br /&gt;
* Яндекс.Новости, Google News - агрегация&lt;br /&gt;
* Meduza.io - редактирование новостей&lt;br /&gt;
&lt;br /&gt;
=== Контактная информация ===&lt;br /&gt;
* Почта: acccko@gmail.com&lt;br /&gt;
* Телеграмм: @acccko&lt;/div&gt;</summary>
		<author><name>imported&gt;GalinaKaleeva</name></author>
	</entry>
</feed>