<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9F%D1%80%D0%BE%D0%B3%D0%BD%D0%BE%D0%B7_%D0%BA%D0%B0%D1%80%D0%BC%D1%8B_%D0%BF%D0%BE%D1%81%D1%82%D0%B0_%D0%BD%D0%B0_reddit_%28%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%29</id>
	<title>Прогноз кармы поста на reddit (проект) - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9F%D1%80%D0%BE%D0%B3%D0%BD%D0%BE%D0%B7_%D0%BA%D0%B0%D1%80%D0%BC%D1%8B_%D0%BF%D0%BE%D1%81%D1%82%D0%B0_%D0%BD%D0%B0_reddit_%28%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%29"/>
	<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%9F%D1%80%D0%BE%D0%B3%D0%BD%D0%BE%D0%B7_%D0%BA%D0%B0%D1%80%D0%BC%D1%8B_%D0%BF%D0%BE%D1%81%D1%82%D0%B0_%D0%BD%D0%B0_reddit_(%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82)&amp;action=history"/>
	<updated>2026-06-06T18:16:32Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wikicshse.ru/index.php?title=%D0%9F%D1%80%D0%BE%D0%B3%D0%BD%D0%BE%D0%B7_%D0%BA%D0%B0%D1%80%D0%BC%D1%8B_%D0%BF%D0%BE%D1%81%D1%82%D0%B0_%D0%BD%D0%B0_reddit_(%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82)&amp;diff=1900&amp;oldid=prev</id>
		<title>imported&gt;Ira dolgaleva: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%9F%D1%80%D0%BE%D0%B3%D0%BD%D0%BE%D0%B7_%D0%BA%D0%B0%D1%80%D0%BC%D1%8B_%D0%BF%D0%BE%D1%81%D1%82%D0%B0_%D0%BD%D0%B0_reddit_(%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82)&amp;diff=1900&amp;oldid=prev"/>
		<updated>2015-10-20T07:47:43Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{Карточка_проекта&lt;br /&gt;
|name=Прогноз кармы поста на reddit (проект)&lt;br /&gt;
|mentor=Иван Савин&lt;br /&gt;
|mentor_login={{URLENCODE:Ivsavin|WIKI}}&lt;br /&gt;
|semester=Весна 2015&lt;br /&gt;
|course=1&lt;br /&gt;
|summer=on&lt;br /&gt;
|categorize=yes&lt;br /&gt;
|is_archived=yes&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
=== Что это за проект? ===&lt;br /&gt;
Reddit.com - социальный новостной сайт похожий по принципам работы на habrahabr/dirty/leprasorium и тд. Инструмент для прогноза рейтинга поста позволит анализировать интерес аудитории и реакцию на разные особенности подачи материала: время суток, пунктуация, длина заголовка и прочее.&lt;br /&gt;
&lt;br /&gt;
=== Чему вы научитесь? ===&lt;br /&gt;
* Работа с API веб-сервисов: авторизация, составление запросов, разбор результатов&lt;br /&gt;
* Анализ данных: классификация, логическая регрессия. Использование готовых инструментов аналитики&lt;br /&gt;
&lt;br /&gt;
=== Какие начальные требования? ===&lt;br /&gt;
* Бызовые понятия веб-технологий: HTTP, OAuth, API, HTML&lt;br /&gt;
* Владение любым из популярных языков программирования: Python, Java, Perl&lt;br /&gt;
* Работа с базой (предпочтительнее MongoDB, SQLite)&lt;br /&gt;
&lt;br /&gt;
=== Какие будут использоваться технологии? ===&lt;br /&gt;
Зависит от выбранного языка программирования. Нужно убедиться, что для него уже есть готовые модули для следующих операций:&lt;br /&gt;
* Отправка запросов POST/GET по HTTP&lt;br /&gt;
* Разбор JSON&lt;br /&gt;
* Реализация логической регрессии&lt;br /&gt;
* Могут потребоваться инструменты для работы обработки текстов на естественных языках (NLP)&lt;br /&gt;
&lt;br /&gt;
Рекомендуется начать поиски модулей тут:&lt;br /&gt;
* https://github.com/bayandin/awesome-awesomeness&lt;br /&gt;
* https://github.com/josephmisiti/awesome-machine-learning&lt;br /&gt;
&lt;br /&gt;
=== Темы вводных занятий ===&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
=== Направления развития ===&lt;br /&gt;
* Инструмент для анализа социальных новостых сайтов, ассистент, подсказывающий, как и когда делать популярные посты.&lt;br /&gt;
* Инструмент для определения накрутки рейтинга, выявление аномалий.&lt;br /&gt;
&lt;br /&gt;
=== Критерии оценки ===&lt;br /&gt;
4-5: Написан скрипт для скачивания постов, которых сохраняет извлеченную информацию в БД. Написан скрипт для бинарного определения рейтинга поста (например, наберет 50 очков или нет) по алгоритму OneR.&lt;br /&gt;
&lt;br /&gt;
6-7: Написан скрипт для скачивания постов и информации об авторах (link karma, comment karma, дата регистрации) и информацию о сабредите. Написан скрипт для регрессионного анализа постов по извлеченным параметрам, который выдает предполагаемый рейтинг в виде числа.&lt;br /&gt;
&lt;br /&gt;
8-10: + первый скрипт извлекает информацию о комментариях к посту: глубина дискуссий, количество и длина ответов. В анализаторе используются особенности поста: длина заголовка, длина поста в символах, абзацах, среднее количество слов в абзаце, использование знаков препинания &amp;quot;!&amp;quot; и &amp;quot;?&amp;quot; и любых других особенностей, объяснимо влияющих на рейтинг.&lt;/div&gt;</summary>
		<author><name>imported&gt;Ira dolgaleva</name></author>
	</entry>
</feed>