Автоматична семантична сегментація зображень Sentinel-2: інтеграція методів кластеризації та великих мовних моделей для інтерпретації кластерів

dc.contributor.authorГончаров, Олександр Геннадійовичuk_UA
dc.contributor.authorГнатушенко, Вікторія Володимирівнаuk_UA
dc.date.accessioned2025-05-25T18:53:01Z
dc.date.available2025-05-25T18:53:01Z
dc.date.issued2025
dc.descriptionВік. Гнатушенко: ORCID 0000-0001-5304-4144uk_UA
dc.description.abstractUKR: Семантична сегментація супутникових зображень, зокрема даних Sentinel-2, є важливим інструментом екологічного моніторингу та управління земними ресурсами. У роботі запропоновано метод автоматичної класифікації земного покриву без використання маркованих даних. Підхід ґрунтується на поєднанні кластеризації (K-Means, DBSCAN, автоенкодери) та мультимодального маркування за допомогою великих мовно-візуальних моделей (GPT-4, Claude, Gemini 2.0 тощо). Інтерпретація кластерів здійснюється на основі візуалізацій, що автоматично аналізуються моделями. Методологія дозволяє досягти точності сегментації на рівні 85–90%, порівнянної з супервізованими підходами, та забезпечує інтерпретованість і масштабованість. Система також підтримує нормалізацію термінів і голосування кількох моделей для підвищення надійності. Результати валідуються з використанням карт ESA WorldCover. Підхід є перспективним для швидкого картографування в умовах обмежених ресурсів.uk_UA
dc.description.abstractENG: Semantic segmentation of satellite imagery, particularly Sentinel-2 data, is crucial for environmental monitoring and land cover mapping. This paper presents an unsupervised method for land cover classification that eliminates the need for pixel-level annotations. The approach combines clustering techniques (K-Means, DBSCAN, autoencoders) with automated cluster labeling using large vision-language models (e.g., GPT-4, Claude, Gemini 2.0). Clusters are visualized and interpreted by these models based on spatial context and color. The methodology achieves segmentation accuracy of 85–90%, comparable to supervised methods, while ensuring interpretability and scalability. A majority voting mechanism and terminology normalization improve consistency across model outputs. Validation is performed using ESA WorldCover maps. The proposed approach is promising for rapid land cover mapping in resource-constrained or emergency situations.en
dc.identifier.citationГончаров О. Г., Гнатушенко Вік. В. Автоматична семантична сегментація зображень Sentinel-2: інтеграція методів кластеризації та великих мовних моделей для інтерпретації кластерів. Інформаційні технології в металургії та машинобудуванні – ІТММ’2025 : тези доп. Міжнародної наук.-техн. конф. (м. Дніпро, 23-24 березня 2025 р.). Дніпро, 2025. C. 538–541. DOI: 10.34185/1991-7848.itmm.2025.01.095.uk_UA
dc.identifier.doi10.34185/1991-7848.itmm.2025.01.095
dc.identifier.issn2708-0102 (Online)
dc.identifier.urihttps://journals.nmetau.edu.ua/index.php/itmm/article/view/2164en
dc.identifier.urihttps://crust.ust.edu.ua/handle/123456789/20350en
dc.language.isouk
dc.publisherУкраїнський державний університет науки і технологій, ІВК «Системні технології», Дніпроuk_UA
dc.subjectсемантична сегментаціяuk_UA
dc.subjectкластеризаціяuk_UA
dc.subjectземний покривuk_UA
dc.subjectмультимодальні моделіuk_UA
dc.subjectsemantic segmentationen
dc.subjectclusteringen
dc.subjectSentinel-2en
dc.subjectland coveren
dc.subjectmultimodal modelsen
dc.subjectКІТСuk_UA
dc.subject.classificationTECHNOLOGY::Information technology::Image analysisen
dc.titleАвтоматична семантична сегментація зображень Sentinel-2: інтеграція методів кластеризації та великих мовних моделей для інтерпретації кластерівuk_UA
dc.title.alternativeAutomatic Semantic Segmentation of Sentinel-2 Images: Integration of Clustering and Large Multimodal Models for Cluster Interpretationen
dc.typeThesisen

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Honcharov.pdf
Size:
197.93 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
159 B
Format:
Item-specific license agreed upon to submission
Description: