<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0_%28%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%29</id>
	<title>Поисковая система (проект) - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0_%28%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%29"/>
	<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0_(%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82)&amp;action=history"/>
	<updated>2026-06-06T16:00:24Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wikicshse.ru/index.php?title=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0_(%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82)&amp;diff=1836&amp;oldid=prev</id>
		<title>imported&gt;Ira dolgaleva: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0_(%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82)&amp;diff=1836&amp;oldid=prev"/>
		<updated>2015-10-20T07:46:48Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{Карточка_проекта&lt;br /&gt;
|name=Поисковая система&lt;br /&gt;
|mentor=Фролов Дмитрий&lt;br /&gt;
|mentor_login={{URLENCODE:Dmitry|WIKI}}&lt;br /&gt;
|semester=Весна 2015&lt;br /&gt;
|course=1&lt;br /&gt;
|summer=on&lt;br /&gt;
|categorize=yes&lt;br /&gt;
|is_archived=yes&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
=== Что это за проект? ===&lt;br /&gt;
Одной из важнейших задач, возникающих при обработке естественного языка, является работа с большими множествами (коллекциями) текстовых документов, в частности, проблема поиска документов по запросу.&lt;br /&gt;
Программы и программные комплексы, позволяющие решать эту задачу, называются поисковыми системами. Главными характеристиками качества поисковой системы является соответствие извлеченных документов исходному запросу и время выполнения запроса. Итогом работы над проектом должна быть программа, производящая извлечение релевантных запросу документов из коллекции.&lt;br /&gt;
&lt;br /&gt;
=== Чему вы научитесь? ===&lt;br /&gt;
# Основные понятия из теории поисковых систем, основные алгоритмы поиска, методы обработки документов&lt;br /&gt;
# Базовые знания Unix Shell&lt;br /&gt;
# Работа с нереляционными базами данных&lt;br /&gt;
# Работа с системой управления версиями git&lt;br /&gt;
&lt;br /&gt;
=== Какие начальные требования? ===&lt;br /&gt;
# Основы языка программирования Python&lt;br /&gt;
&amp;lt;!-- # Представления о системах управления версиями --&amp;gt;&lt;br /&gt;
&amp;lt;!--# Базовые представления о базах данных--&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Какие будут использоваться технологии? ===&lt;br /&gt;
# Python 2.7&lt;br /&gt;
# MyStem, PyMorphy, NLTK&lt;br /&gt;
# Ubuntu Linux/OpenSUSE/FreeBSD, GNU Emacs или Vim - на выбор&lt;br /&gt;
# git, github/bitbucket&lt;br /&gt;
# MongoDB&lt;br /&gt;
&lt;br /&gt;
=== Темы вводных занятий ===&lt;br /&gt;
# Общие понятия теории поисковых систем. Поисковые движки. Коллекции документов. Меры близости. Качество поиска.&lt;br /&gt;
# Общие методы разработки с использованием систем управления версиями.&lt;br /&gt;
# Нереляционные базы данных, преимущества, недостатки, особенности использования&lt;br /&gt;
&lt;br /&gt;
=== Направления развития ===&lt;br /&gt;
# Реализация системы в виде: база данных + сервер + веб-интерфейс&lt;br /&gt;
# Модификация индекса в целью снижения временной сложности поиска&lt;br /&gt;
# Предобработка коллекции документов и поисковых запросов для возможности выполнения нечеткого поиска&lt;br /&gt;
&lt;br /&gt;
=== Критерии оценки ===&lt;br /&gt;
# 4-5  - Система, выполняющая предобработку коллекции, строящая поисковый индекс, позволяющая производить поиск с простейшим синтаксисом запросов: слова, словосочетания, одновременная встреча слов из запроса в документе, хотя бы одно из слов, указанных в запросе. Найденные документы должны выдаваться системой в порядке убывания релевантности. Система должна быть оформлена в виде консольного приложения.&lt;br /&gt;
# 6-7  - Система, реализующая функции, перечисленные в Пункте (1), и, кроме того, позволяющая производить поиск вне зависимости от словоформ в запросе и в документах. &lt;br /&gt;
# 8-10 - Система, реализующая функции, перечисленные в Пункте (2), и, кроме того, позволяющая выполнять нечеткий поиск (например, для запросов с ошибками).  Для поисковой системы необходимо произвести ее анализ на фиксированной коллекции, рассчитать метрики эффективности качества поиска.&lt;/div&gt;</summary>
		<author><name>imported&gt;Ira dolgaleva</name></author>
	</entry>
</feed>