Анализатор спама
Вернуться к списку проектовНа главную страницу курсаЗаказчик
ООО Плейрикс: Гавриков Иван, ivan.gavrikov@playrix.com.Инструктор
Димитров Вячеслав Михайлович, преподаватель кафедры Информатики и математического обеспечения. Эл.почта: dimitrov@cs.karelia.ru. Раб.тел.: 711015. Офис: 215 каб.Аннотация проекта
Разработать систему анализа сообщений приложения на предмет наличия там спама, т.е. наличия регулярно повторяющихся одинаковых или почти одинаковых сообщений или последовательностей сообщений.
Исходные данные:
- Файлы с данными формате txt, которые содержат набор строк с отметками времени и телом сообщения. Входной файл может быть большой длины.
- В общем случае отметки времени в каждой строчке разные, но не обязательно.
- Сообщения могут полностью или частично повторяться
- Последовательность из нескольких сообщений может полностью или частично повторяться. Между такими повторяющимися последовательностями могут находиться другие сообщения, которые в свою очередь тоже могут образовывать последовательность.
Обязательный функционал:
- Анализ данных, опираясь на все его содержимое.
- Анализ файла при последовательном получении каждой новой строки
- Сам по себе факт повторяющихся сообщений на длительном промежутке времени не является спамом. Необходимо предусмотреть регулировку или набор регулировок чувствительности.
Дополнительный функционал:
- Сообщения в последовательности могут повторяться не в том же порядке при повторении.
- Предоставить отчет анализа, в котором “подозрительным сообщениям” будет указана вероятность того, что это спам.
Ссылки
Разработчики
- Хромина Анна Александровна, 22305
- Морозова Екатерина Сергеевна, 22305
- Су Сонг, 22305
- Головко Дмитрий Олегович, 22306
- Сысоев Сергей Васильевич, 22306