A Neural Network Approach to Semantic Segmentation of Vehicles in Very High Resolution Images

dc.contributor.authorKashtan, Vita Yu.en
dc.contributor.authorHnatushenko, Volodymyr V.en
dc.contributor.authorUdovyk, Iryna M.en
dc.contributor.authorKazymyrenko, O. V.en
dc.contributor.authorRadionov, Y. D.en
dc.date.accessioned2025-09-26T11:51:40Z
dc.date.issued2025
dc.descriptionVol. Hnatushenko: ORCID 0000-0003-3140-3788en
dc.description.abstractENG: Context. The semantic segmentation of vehicles in very high resolution aerial images is essential in developing intelligent transportation systems. It allows for the automation of real-time traffic management and the detection of congestion and emergencies. Objective. This work aims to develop and evaluate the effectiveness of a neural network approach to semantic segmentation in very high resolution aerial images, which provides high detail and correct reproduction of object boundaries. Method. The DeepLab architecture with ResNet-101 as a backbone is used for gradient preservation and multiscale feature analysis. We trained on DOTA data and retrained on specialized sets with classes: vehicles, green areas, buildings, and roads. A loss function based on the Dice coefficient was applied to reduce the imbalance of classes. It effectively solves the class imbalance problem and improves the accuracy of segmenting objects of different sizes. Using ResNet-101 instead of Xception in the backbone network allows us to maintain the gradient as the network depth increases. Results. Experimental studies have confirmed the effectiveness of the proposed approach, which achieves a segmentation accuracy of more than 90%, outperforming existing analogs. The use of multiscale feature analysis allows for preserving the texture features of objects, reducing false classifications. A comparative study with U-Net, SegNet, FCN8s, and other methods confirms the higher performance of the proposed approach in terms of mIoU (82.3%) and Pixel Accuracy (95.1%). Conclusions. The experiments confirm the effectiveness of the proposed method of semantic segmentation of vehicles in ultrahigh spatial resolution images. Using DeepLab v3+ResNet-101 significantly improves the quality of vehicle segmentation in an urbanized environment. Excellent metric performance makes it promising for infrastructure monitoring and traffic planning tasks. Further research will focus on adapting the model to new datasets.en
dc.description.abstractUKR: Актуальність. Семантична сегментація транспортних засобів на аерокосмічних зображеннях надвисокого просторового розрізнення є важливим завданням для розвитку інтелектуальних транспортних систем, дозволяє автоматизувати управління дорожнім рухом у реальному часі, виявляти затори та аварійні ситуації. Мета роботи – розробка та оцінка ефективності нейромережевого підходу для сегментації транспортних засобів на аерокосмічних зображеннях надвисокого розрізнення, що забезпечує високу деталізацію та коректне відтворення границь об’єктів. Метод. Використано архітектуру DeepLab із ResNet-101 як Backbone для збереження градієнтів і багатомасштабного аналізу ознак. Проведено навчання на даних DOTA та донавчання на спеціалізованих наборах із класами: транспортні засоби, зелені зони, будівлі, дороги. Для зменшення дисбалансу класів застосовано функцію втрат на основі коефіцієнта Dice. Це дозволяє ефективно вирішити проблему дисбалансу класів та покращити точність сегментації об’єктів різних розмірів. Використання ResNet-101 замість Xception у магістральній мережі дозволяє зберегти градієнт при збільшенні глибини мережі. Результати. Експериментальні дослідження підтвердили ефективність запропонованого підходу, що досягає точності сегментації понад 90%, перевершуючи існуючі аналоги. Використання багатомасштабного аналізу ознак дозволяє зберігати текстурні особливості об’єктів, зменшуючи хибні класифікації. Порівняльний аналіз із методами U-Net, SegNet, FCN8s та іншими підтверджує вищу продуктивність запропонованого підходу за метриками mIoU (82.3%) та Pixel Accuracy (95.1%). Висновки. Експерименти підтверджують ефективність запропонованого методу семантичної сегментації транспортних засобів на зображеннях надвисокого просторового розрізнення. Використання DeepLab v3+ ResNet-101 значно покращує якість сегментації транспортних засобів в урбанізованому середовищі. Високі метричні показники роблять його перспективним для застосування у задачах інфраструктурного моніторингу та планування дорожнього руху. Подальші дослідження будуть зосереджені на адаптації моделі до нових наборів даних.uk_UA
dc.description.sponsorshipDnipro University of Technology, Dniproen
dc.identifier.citationKashtan V. Yu., Hnatushenko Vol. V., Udovyk I. M., Kazymyrenko O. V., Radionov Y. D. A Neural Network Approach to Semantic Segmentation of Vehicles in Very High Resolution Images. Radio Electronics, Computer Science, Control. 2025. No. 3. P. 77–85. DOI: https://doi.org/10.15588/1607-3274-2025-3-8.en
dc.identifier.doihttps://doi.org/10.15588/1607-3274-2025-3-8en
dc.identifier.issn1607-3274 (Print)
dc.identifier.issn2313-688X (Online)
dc.identifier.urihttps://ric.zp.edu.ua/article/view/339302en
dc.identifier.urihttps://crust.ust.edu.ua/handle/123456789/20993en
dc.language.isoen
dc.publisherNational University "Zaporizhzhia Polytechnic", Zaporizhzhiaen
dc.rightsCreative Commons Attribution-ShareAlike 4.0 International Licenseen
dc.rights.urihttps://creativecommons.org/licenses/by-sa/4.0/en
dc.subjectsemantic segmentationen
dc.subjectvehiclesen
dc.subjectdeep neural networksen
dc.subjectResNet-101en
dc.subjectDeepLaben
dc.subjectmulti-scale analysisen
dc.subjectvery high resolution imagesen
dc.subjectсемантична сегментаціяuk_UA
dc.subjectтранспортні засобиuk_UA
dc.subjectглибокі нейронні мережіuk_UA
dc.subjectбагатомасштабний аналізuk_UA
dc.subjectзображення надвисокого розрізненняuk_UA
dc.subjectКІТСuk_UA
dc.subject.classificationTECHNOLOGYen
dc.subject.classificationTECHNOLOGY::Information technologyen
dc.subject.classificationTECHNOLOGY::Information technology::Image analysisen
dc.titleA Neural Network Approach to Semantic Segmentation of Vehicles in Very High Resolution Imagesen
dc.title.alternativeНейромережевий підхід до семантичної сегментації транспортних засобів на зображеннях надвисокого просторового розрізненняuk_UA
dc.typeArticleen

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Kashtan_Hnatushenko.pdf
Size:
1.22 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: