Январь, 31

Числитель

(c) Larry Ewing, Simon Budig, Garrett LeSage
с 1994 г.

Кафедра Информатики и Математического Обеспечения

ПетрГУ | ИМиИТ | О кафедре | Проекты | Лаборатория ИТС | Семинары НФИ/AMICT
Сотрудники | Учебный процесс | Табель-календарь | Курсовые и выпускные работы
Вычислительные ресурсы | Публикации | Архив новостей | Контактная информация (English)

Анализ текстовых Интернет-источников

Вернуться к списку проектовНа главную страницу курса

Заказчик(и)

Ивашнев Кирилл Русланович, аспирант кафедры прикладной математики и кибернетики Эл.почта: ivashnev-kirill@mail.ru

Аннотация проекта

Реализовать систему сбора и представления данных о заданной территории (примеры - г.Петрозаводск, микрорайон Кукковка, т.д..). Источники данных о регионе могут включать в себя интернет-данные новостных ресурсов, социальных сетей, статистических отчетов, отзывов об организациях. Система должна накапливать релевантную информацию о заданной области.

Необходимо обеспечить сбор, структурирование и анализ текстовой информации для создания виртуального представления территории. Предварительная обработка текстов включает в себя выгрузку текстов с веб-страниц, фильтрацию (определение принадлежности к тематике заданной местности) и классификацию (разбиение на подтемы). Для длинных текстов необходимо формировать краткую сводку (суммаризация текста). Необходимо накапливать информацию в соответствующем хранилище (например,MongoDB ,Elasticsearch ,Hadoop)

Веб-система должна содержать:

Разработчики

  1. Калинина Мария Сергеевна 22303
  2. Пискунова Юлия Евгеньевна 22303
  3. Дехтярева Алина Владимировна 22303
  4. Артамонов Алексей Романович 22304
  5. Кротова Ирина Дмитриевна 22304