Нейромережеве розпізнавання об’єктів забудови на аерофотознімках

Loading...
Thumbnail Image
Date
2023
Journal Title
Journal ISSN
Volume Title
Publisher
Видавничий дім «Гельветика»
Abstract
UKR: Автоматизоване розпізнавання об’єктів забудови на аерофотознімках є однією з найбільш складних проблем у комп'ютерному зорі. Це пов'язано як з варіаціями зовнішнього вигляду будівель, так і з їх семантичною характеристикою в міських районах. У даній роботі запропоновано метод автоматизованого розпізнавання об’єктів забудови на цифрових аерофотознімках на основі 2D-CNN. Спочатку завантажуються та обробляються знімки високого просторового розрізнення, отримані з безпілотних літальних апаратів. Потім проводиться класифікація та сегментація зображення на основі архітектури нейронної мережі 2D-CNN з функцією softmax для вихідного шару та використовується випрямлений лінійний блок (ReLu) для решти шарів. Згорткові шари застосовують фільтри до всіх пікселів вхідного зображення, щоб отримати набір абстрактних особливостей високого рівня. Далі, для класифікації кожного пікселя зображення з БПЛА, була проведена сегментація даних, де поле сприйняття (fov) для кожного зображення вважається ковзним вікном розміру 3×3 вхідних даних. Це дозволяє визначати приналежність об’єкту до певного класу. Завершальним етапом є створення бінарної маски розпізнавання об’єктів забудови на основі функції втрат перехресної ентропії. Тренування мережі проводилося на рівні пікселів, що дозволило підвищити точність ідентифікації об'єктів забудови та зменшити кількість неправильно класифікованих зон. Експериментальні результати показали значне покращення точності розпізнавання будівель у загальнодоступному наборі даних. Зокрема, метрики OA, AA та K покращилися на 2,6%, 5,6% та 3,2% відповідно для навчального набору даних і на 1,2%, 1,8% та 1,5% для тестового набору даних.
ENG: Automated recognition of building objects based on aerial image data is a complex problem in computer vision. It is related to variations in the appearance of buildings and the semantic characteristics of scenes in urban areas. This paper proposes a method of automated recognition of building objects on digital aerial photographs based on 2D-CNN. The first step is to download and process high spatial resolution images from unmanned aerial vehicles. Then classification and segmentation of the image are performed based on 2D-CNN neural network architecture with softmax function for the output layer and rectified linear block (ReLu) for the remaining layers. Convolutional layers apply filters to all pixels of the input image to obtain a set of high-level abstract features. Data segmentation was performed to classify each pixel from the UAV images, where the field of view (fov) for each image is considered a sliding window of size 3×3 of the input data. It made it possible to determine whether the object of the researched scene belongs to a certain class. The last step is the binary mask creation of the building object recognition based on the cross-entropy loss function. The neural network was trained at the pixel level, which allowed to increase the accuracy of identification of building objects and reduce the number of misclassified zones. Experimental results showed a significant improvement in the accuracy of building recognition in a publicly available dataset. Specifically, the OA, AA, and K metrics improved by 2.6%, 5.6%, and 3.2%, respectively, for the training dataset and by 1.2%, 1.8%, and 1.5% for the test dataset.
Description
Вол. Гнатушенко: ORCID 0000-0003-3140-3788
Keywords
згорткові нейронні мережі, сегментація зображень, розпізнавання, аерофотознімок, комп’ютерний зір, convolutional neural networks, image segmentation, recognition, aerial image, computer vision, КІТС
Citation
Каштан В., Гнатушенко В., Удовик І., Шевцова О. Нейромережеве розпізнавання об’єктів забудови на аерофотознімках. Information Technology: Computer Science, Software Engineering and Cyber Security. 2023. № 1. C. 30–39. DOI: https://doi.org/10.32782/IT/2023-1-5.