Автоматична семантична сегментація зображень Sentinel-2: інтеграція методів кластеризації та великих мовних моделей для інтерпретації кластерів
| dc.contributor.author | Гончаров, Олександр Геннадійович | uk_UA |
| dc.contributor.author | Гнатушенко, Вікторія Володимирівна | uk_UA |
| dc.date.accessioned | 2025-05-25T18:53:01Z | |
| dc.date.available | 2025-05-25T18:53:01Z | |
| dc.date.issued | 2025 | |
| dc.description | Вік. Гнатушенко: ORCID 0000-0001-5304-4144 | uk_UA |
| dc.description.abstract | UKR: Семантична сегментація супутникових зображень, зокрема даних Sentinel-2, є важливим інструментом екологічного моніторингу та управління земними ресурсами. У роботі запропоновано метод автоматичної класифікації земного покриву без використання маркованих даних. Підхід ґрунтується на поєднанні кластеризації (K-Means, DBSCAN, автоенкодери) та мультимодального маркування за допомогою великих мовно-візуальних моделей (GPT-4, Claude, Gemini 2.0 тощо). Інтерпретація кластерів здійснюється на основі візуалізацій, що автоматично аналізуються моделями. Методологія дозволяє досягти точності сегментації на рівні 85–90%, порівнянної з супервізованими підходами, та забезпечує інтерпретованість і масштабованість. Система також підтримує нормалізацію термінів і голосування кількох моделей для підвищення надійності. Результати валідуються з використанням карт ESA WorldCover. Підхід є перспективним для швидкого картографування в умовах обмежених ресурсів. | uk_UA |
| dc.description.abstract | ENG: Semantic segmentation of satellite imagery, particularly Sentinel-2 data, is crucial for environmental monitoring and land cover mapping. This paper presents an unsupervised method for land cover classification that eliminates the need for pixel-level annotations. The approach combines clustering techniques (K-Means, DBSCAN, autoencoders) with automated cluster labeling using large vision-language models (e.g., GPT-4, Claude, Gemini 2.0). Clusters are visualized and interpreted by these models based on spatial context and color. The methodology achieves segmentation accuracy of 85–90%, comparable to supervised methods, while ensuring interpretability and scalability. A majority voting mechanism and terminology normalization improve consistency across model outputs. Validation is performed using ESA WorldCover maps. The proposed approach is promising for rapid land cover mapping in resource-constrained or emergency situations. | en |
| dc.identifier.citation | Гончаров О. Г., Гнатушенко Вік. В. Автоматична семантична сегментація зображень Sentinel-2: інтеграція методів кластеризації та великих мовних моделей для інтерпретації кластерів. Інформаційні технології в металургії та машинобудуванні – ІТММ’2025 : тези доп. Міжнародної наук.-техн. конф. (м. Дніпро, 23-24 березня 2025 р.). Дніпро, 2025. C. 538–541. DOI: 10.34185/1991-7848.itmm.2025.01.095. | uk_UA |
| dc.identifier.doi | 10.34185/1991-7848.itmm.2025.01.095 | |
| dc.identifier.issn | 2708-0102 (Online) | |
| dc.identifier.uri | https://journals.nmetau.edu.ua/index.php/itmm/article/view/2164 | en |
| dc.identifier.uri | https://crust.ust.edu.ua/handle/123456789/20350 | en |
| dc.language.iso | uk | |
| dc.publisher | Український державний університет науки і технологій, ІВК «Системні технології», Дніпро | uk_UA |
| dc.subject | семантична сегментація | uk_UA |
| dc.subject | кластеризація | uk_UA |
| dc.subject | земний покрив | uk_UA |
| dc.subject | мультимодальні моделі | uk_UA |
| dc.subject | semantic segmentation | en |
| dc.subject | clustering | en |
| dc.subject | Sentinel-2 | en |
| dc.subject | land cover | en |
| dc.subject | multimodal models | en |
| dc.subject | КІТС | uk_UA |
| dc.subject.classification | TECHNOLOGY::Information technology::Image analysis | en |
| dc.title | Автоматична семантична сегментація зображень Sentinel-2: інтеграція методів кластеризації та великих мовних моделей для інтерпретації кластерів | uk_UA |
| dc.title.alternative | Automatic Semantic Segmentation of Sentinel-2 Images: Integration of Clustering and Large Multimodal Models for Cluster Interpretation | en |
| dc.type | Thesis | en |