Декабрь, 6

Числитель

(c) Larry Ewing, Simon Budig, Garrett LeSage
с 1994 г.

Кафедра Информатики и Математического Обеспечения

ПетрГУ | ИМиИТ | О кафедре | Проекты | Лаборатория ИТС | Семинары НФИ/AMICT
Сотрудники | Учебный процесс | Табель-календарь | Курсовые и выпускные работы
Вычислительные ресурсы | Публикации | Архив новостей | Контактная информация (English)

Анализ текстовых Интернет-источников

Вернуться к списку проектовНа главную страницу курса

Заказчик(и)

Ивашнев Кирилл Русланович, аспирант кафедры прикладной математики и кибернетики Эл.почта: ivashnev-kirill@mail.ru

Аннотация проекта

Реализовать систему сбора и представления данных о заданной территории (примеры - г.Петрозаводск, микрорайон Кукковка, т.д..). Источники данных о регионе могут включать в себя интернет-данные новостных ресурсов, социальных сетей, статистических отчетов, отзывов об организациях. Система должна накапливать релевантную информацию о заданной области.

Необходимо обеспечить сбор, структурирование и анализ текстовой информации для создания виртуального представления территории. Предварительная обработка текстов включает в себя выгрузку текстов с веб-страниц, фильтрацию (определение принадлежности к тематике заданной местности) и классификацию (разбиение на подтемы). Для длинных текстов необходимо формировать краткую сводку (суммаризация текста). Необходимо накапливать информацию в соответствующем хранилище (например,MongoDB ,Elasticsearch ,Hadoop)

Веб-система должна содержать:

Разработчики

  1. Калинина Мария Сергеевна 22303
  2. Пискунова Юлия Евгеньевна 22303
  3. Дехтярева Алина Владимировна 22303
  4. Артамонов Алексей Романович 22304
  5. Кротова Ирина Дмитриевна 22304
  6. Золотарев Максим Алексеевич 22304