Разработка и сравнение моделей глубокого обучения для автоматической сегментации древостоя по аэрофотоснимкам с БПЛА

Вернуться к списку проектов На главную страницу курса

Заказчик(и)

Кабонен Алексей Валерьевич, к.с.-x.н., директор центра цифрового мониторинга северных и арктических экосистем, alexkabonen@mail.ru.

Аннотация проекта

Провести сравнительное исследование современных архитектур нейронных сетей для семантической сегментации с целью автоматического выделения контуров отдельных деревьев и крон на фотографиях, полученных с беспилотных летательных аппаратов (БПЛА).

В качестве базовых для исследования предлагается выбрать и реализовать такие архитектуры, как U-Net, DeepLabv3+, FPN (Feature Pyramid Network) и современные трансформеры для сегментации (например, Segmenter или SegFormer). Этапы работ: подготовка данных, реализация и обучение моделей, их количественная оценка по метрикам (IoU, Dice Score, точность), качественный анализ ошибок и создание интерактивного демо-интерфейса.

Первичные требования

1. Сбор и подготовка датасета:

Предобработка изображений: нормализация, приведение к единому размеру.
Аугментация данных (повороты, отражения, изменения яркости/контраста) для увеличения разнообразия обучающей выборки и улучшения обобщающей способности моделей.

2. Реализация и обучение моделей:

Кодирование (на Python с использованием PyTorch/TensorFlow) 3-4 выбранных архитектур нейронных сетей для сегментации.
Настройка процесса обучения: определение функции потерь (Dice Loss, Cross-Entropy), выбор оптимизатора.
Проведение экспериментов по обучению моделей, сохранение весов и журналов обучения.

3. Сравнительный анализ и оценка:

Разработка скриптов для расчета стандартных метрик качества сегментации (IoU, Dice, Precision, Recall, F1-Score).
Качественная визуализация результатов: наложение масок предсказания на исходные изображения для выявления типичных ошибок моделей.
Сравнение моделей по точности и скорости.

4. Оптимизация и инференс:

Эксперименты с дообучением предварительно подготовленных моделей (transfer learning).
Попытка оптимизации лучшей модели (например, прунинг, квантизация) для ускорения работы.
Написание скрипта для пакетной обработки новых фотографий с помощью обученной модели.

5. Разработка демонстрационного интерфейса:

Создание простого веб- или десктоп-приложения.
Функционал для загрузки пользовательского изображения, запуска сегментации и отображения результата с наложенной маской.
Визуализация сравнения результатов разных моделей в интерфейсе.

Апрель, 29

Знаменатель

Кафедра Информатики и Математического Обеспечения