Разработка и сравнение моделей глубокого обучения для автоматической сегментации древостоя по аэрофотоснимкам с БПЛА
Вернуться к списку проектовНа главную страницу курсаЗаказчик(и)
Кабонен Алексей Валерьевич, к.с.-x.н., директор центра цифрового мониторинга северных и арктических экосистем, alexkabonen@mail.ru.Аннотация проекта
Провести сравнительное исследование современных архитектур нейронных сетей для семантической сегментации с целью автоматического выделения контуров отдельных деревьев и крон на фотографиях, полученных с беспилотных летательных аппаратов (БПЛА).
В качестве базовых для исследования предлагается выбрать и реализовать такие архитектуры, как U-Net, DeepLabv3+, FPN (Feature Pyramid Network) и современные трансформеры для сегментации (например, Segmenter или SegFormer). Этапы работ: подготовка данных, реализация и обучение моделей, их количественная оценка по метрикам (IoU, Dice Score, точность), качественный анализ ошибок и создание интерактивного демо-интерфейса.
Первичные требования
1. Сбор и подготовка датасета:
- Предобработка изображений: нормализация, приведение к единому размеру.
- Аугментация данных (повороты, отражения, изменения яркости/контраста) для увеличения разнообразия обучающей выборки и улучшения обобщающей способности моделей.
2. Реализация и обучение моделей:
- Кодирование (на Python с использованием PyTorch/TensorFlow) 3-4 выбранных архитектур нейронных сетей для сегментации.
- Настройка процесса обучения: определение функции потерь (Dice Loss, Cross-Entropy), выбор оптимизатора.
- Проведение экспериментов по обучению моделей, сохранение весов и журналов обучения.
3. Сравнительный анализ и оценка:
- Разработка скриптов для расчета стандартных метрик качества сегментации (IoU, Dice, Precision, Recall, F1-Score).
- Качественная визуализация результатов: наложение масок предсказания на исходные изображения для выявления типичных ошибок моделей.
- Сравнение моделей по точности и скорости.
4. Оптимизация и инференс:
- Эксперименты с дообучением предварительно подготовленных моделей (transfer learning).
- Попытка оптимизации лучшей модели (например, прунинг, квантизация) для ускорения работы.
- Написание скрипта для пакетной обработки новых фотографий с помощью обученной модели.
5. Разработка демонстрационного интерфейса:
- Создание простого веб- или десктоп-приложения.
- Функционал для загрузки пользовательского изображения, запуска сегментации и отображения результата с наложенной маской.
- Визуализация сравнения результатов разных моделей в интерфейсе.