Анализ текстовых Интернет-источников
Вернуться к списку проектовНа главную страницу курсаЗаказчик(и)
Ивашнев Кирилл Русланович, аспирант кафедры прикладной математики и кибернетики Эл.почта: ivashnev-kirill@mail.ruАннотация проекта
Реализовать систему сбора и представления данных о заданной территории (примеры - г.Петрозаводск, микрорайон Кукковка, т.д..). Источники данных о регионе могут включать в себя интернет-данные новостных ресурсов, социальных сетей, статистических отчетов, отзывов об организациях. Система должна накапливать релевантную информацию о заданной области.
Необходимо обеспечить сбор, структурирование и анализ текстовой информации для создания виртуального представления территории. Предварительная обработка текстов включает в себя выгрузку текстов с веб-страниц, фильтрацию (определение принадлежности к тематике заданной местности) и классификацию (разбиение на подтемы). Для длинных текстов необходимо формировать краткую сводку (суммаризация текста). Необходимо накапливать информацию в соответствующем хранилище (например,MongoDB ,Elasticsearch ,Hadoop)
Веб-система должна содержать:
- подразделы для навигации по виду ресурсов (новости, соцсети, отзывы),
- возможность полнотекстового поиска,
- фильтрации по категориям и местоположению.
- функционал просмотра сводки дня (дайджеста, с новостями, отзывами)
- интерактивную карту с текстовыми аннотациями, визуализацией событий и данных.
Разработчики
- Калинина Мария Сергеевна 22303
- Пискунова Юлия Евгеньевна 22303
- Дехтярева Алина Владимировна 22303
- Артамонов Алексей Романович 22304
- Кротова Ирина Дмитриевна 22304