Нейромережеве розпізнавання об’єктів забудови на аерофотознімках

dc.contributor.authorКаштан, Вітаuk_UA
dc.contributor.authorГнатушенко, Володимир Володимировичuk_UA
dc.contributor.authorУдовик, Іринаuk_UA
dc.contributor.authorШевцова, Ольгаuk_UA
dc.date.accessioned2023-09-14T08:17:14Z
dc.date.available2023-09-14T08:17:14Z
dc.date.issued2023
dc.descriptionВол. Гнатушенко: ORCID 0000-0003-3140-3788uk_UA
dc.description.abstractUKR: Автоматизоване розпізнавання об’єктів забудови на аерофотознімках є однією з найбільш складних проблем у комп'ютерному зорі. Це пов'язано як з варіаціями зовнішнього вигляду будівель, так і з їх семантичною характеристикою в міських районах. У даній роботі запропоновано метод автоматизованого розпізнавання об’єктів забудови на цифрових аерофотознімках на основі 2D-CNN. Спочатку завантажуються та обробляються знімки високого просторового розрізнення, отримані з безпілотних літальних апаратів. Потім проводиться класифікація та сегментація зображення на основі архітектури нейронної мережі 2D-CNN з функцією softmax для вихідного шару та використовується випрямлений лінійний блок (ReLu) для решти шарів. Згорткові шари застосовують фільтри до всіх пікселів вхідного зображення, щоб отримати набір абстрактних особливостей високого рівня. Далі, для класифікації кожного пікселя зображення з БПЛА, була проведена сегментація даних, де поле сприйняття (fov) для кожного зображення вважається ковзним вікном розміру 3×3 вхідних даних. Це дозволяє визначати приналежність об’єкту до певного класу. Завершальним етапом є створення бінарної маски розпізнавання об’єктів забудови на основі функції втрат перехресної ентропії. Тренування мережі проводилося на рівні пікселів, що дозволило підвищити точність ідентифікації об'єктів забудови та зменшити кількість неправильно класифікованих зон. Експериментальні результати показали значне покращення точності розпізнавання будівель у загальнодоступному наборі даних. Зокрема, метрики OA, AA та K покращилися на 2,6%, 5,6% та 3,2% відповідно для навчального набору даних і на 1,2%, 1,8% та 1,5% для тестового набору даних.uk_UA
dc.description.abstractENG: Automated recognition of building objects based on aerial image data is a complex problem in computer vision. It is related to variations in the appearance of buildings and the semantic characteristics of scenes in urban areas. This paper proposes a method of automated recognition of building objects on digital aerial photographs based on 2D-CNN. The first step is to download and process high spatial resolution images from unmanned aerial vehicles. Then classification and segmentation of the image are performed based on 2D-CNN neural network architecture with softmax function for the output layer and rectified linear block (ReLu) for the remaining layers. Convolutional layers apply filters to all pixels of the input image to obtain a set of high-level abstract features. Data segmentation was performed to classify each pixel from the UAV images, where the field of view (fov) for each image is considered a sliding window of size 3×3 of the input data. It made it possible to determine whether the object of the researched scene belongs to a certain class. The last step is the binary mask creation of the building object recognition based on the cross-entropy loss function. The neural network was trained at the pixel level, which allowed to increase the accuracy of identification of building objects and reduce the number of misclassified zones. Experimental results showed a significant improvement in the accuracy of building recognition in a publicly available dataset. Specifically, the OA, AA, and K metrics improved by 2.6%, 5.6%, and 3.2%, respectively, for the training dataset and by 1.2%, 1.8%, and 1.5% for the test dataset.en
dc.description.sponsorshipНаціональний технічний університет «Дніпровська політехніка», Дніпроuk_UA
dc.identifier.citationКаштан В., Гнатушенко В., Удовик І., Шевцова О. Нейромережеве розпізнавання об’єктів забудови на аерофотознімках. Information Technology: Computer Science, Software Engineering and Cyber Security. 2023. № 1. C. 30–39. DOI: https://doi.org/10.32782/IT/2023-1-5.uk_UA
dc.identifier.doihttps://doi.org/10.32782/IT/2023-1-5en
dc.identifier.issn2786-507X (Print)
dc.identifier.issn2786-5088 (Online)
dc.identifier.urihttps://journals.politehnica.dp.ua/index.php/it/article/view/256en
dc.identifier.urihttps://crust.ust.edu.ua/handle/123456789/17447en
dc.language.isouk
dc.publisherВидавничий дім «Гельветика»uk_UA
dc.subjectзгорткові нейронні мережіuk_UA
dc.subjectсегментація зображеньuk_UA
dc.subjectрозпізнаванняuk_UA
dc.subjectаерофотознімокuk_UA
dc.subjectкомп’ютерний зірuk_UA
dc.subjectconvolutional neural networksen
dc.subjectimage segmentationen
dc.subjectrecognitionen
dc.subjectaerial imageen
dc.subjectcomputer visionen
dc.subjectКІТСuk_UA
dc.subject.classificationTECHNOLOGY::Information technology::Image analysisen
dc.titleНейромережеве розпізнавання об’єктів забудови на аерофотознімкахuk_UA
dc.title.alternativeNeural Network Recognition of Building Objects in Aerial Imagesen
dc.typeArticleen
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Kashtan.pdf
Size:
979.63 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: