Розпізнавання зображень набору Fashion MNIST методами глибокого навчання

dc.contributor.authorГнатушенко, Вікторія Володимирівнаuk_UA
dc.contributor.authorДорош, Наталія Леонідівнаuk_UA
dc.contributor.authorФененко, Тетяна Михайлівнаuk_UA
dc.date.accessioned2022-06-10T09:03:12Z
dc.date.available2022-06-10T09:03:12Z
dc.date.issued2021
dc.descriptionВік. Гнатушенко: ORCID: 0000-0001-5304-4144; Н. Дорош: ORCID 0000-0003-4184-3648; Т. Фененко: ORCID: 0000-0002-7631-3148uk_UA
dc.description.abstractUKR: Огляд сучасних методів розпізнавання об’єктів-зображень показав, що алгоритми глибокого навчання успішно використовуються і дозволяють отримати високу якість. Прикладом можливо привести якість розпізнавання символів набору MNIST, яка наблизилась до 100%. Для другого набору даних, який теж популярний при тестуванні алгоритмів глибокого навчання, а саме, набору елементів одягу та аксесуарів Fashion MNIST, така висока якість розпізнавання ще не отримана. У роботі представлені результати розпізнавання даних Fashion MNISТ. Розглянуті моделі нейронної мережі прямого поширення і згорткової мережі. Виконано програмну реалізацію алгоритмів глибокого навчання, а саме, розглянуто багатошарову мережу прямого поширення (FNN) та згорткову нейронну мережу (CNN). Використано мову Python, бібліотеки TensorFlow та Keras Бібліотека Keras дозволяє спрощувати виклики функцій з TensorFlow. Типовий процес роботи в Python Keras полягає в наступному: завантаження необхідних модулів, завантаження даних, попередня обробка, розбивка їх на навчальну, тестову і валідаційну частини; створення моделі із зазначенням архітектури, та інше. Розроблено модуль для перегляду зображень набору даних, параметрів мережі та інформації з якості розпізнавання. Виконано чисельний експеримент розпізнавання елементів одягу засобами FNN. Проведено автоматичне налаштування гіперпараметрів мережі. Якість розпізнавання на тестових даних дорівнює 0,89. Налаштування гіперпараметрів покращило якість несуттєво. Невисока якість розпізнавання пояснюється також використанням дуже простої моделі нейронної мережі. Поліпшення результатів було досягнуто з використанням згорткової нейронної мережі. Кращій результат розпізнавання, який отримано у роботі, дорівнює 91.26%, але відомий найкращий результат якості розпізнавання дорівнює 94%. Роботу з вдосконалення результатів розпізнавання зображень даних Fashion MNIST доцільно продовжити, а програмний засіб, який розроблено, можливо використовувати щодо розпізнавання інших даних. При творчому підході розпізнавання об'єктів зображень на Python з застосуванням бібліотек Keras Tensorflow і інших є дуже перспективним напрямком для практичного застосування.uk_UA
dc.description.abstractRUS: Обзор современных методов распознавания объектов изображений показал, что алгоритмы глубокого обучения успешно используются и позволяют получить высокое качество. Примером можно привести качество распознавания символов набора MNIST, которое приблизилось к 100%. Для другого набора данных, который тоже популярен в реализации алгоритмов глубокого обучения, а именно, набора элементов одежды и аксессуаров Fashion MNIST, такое высокое качество распознавания еще не достигнуто. В работе представлены результаты распознавания данных Fashion MNISТ. Рассмотрены модели нейронной сети прямого распространения и сверточной сети. Проведена программная реализация алгоритмов глубокого обучения, а именно, рассмотрены многослойная сеть прямого распространения (FNN) и сверточная нейронная сеть (CNN). Использованы язык Python, библиотеки TensorFlow и Keras. Библиотека Keras позволяет упрощать вызовы функций по TensorFlow. Типичный процесс работы в Python Keras заключается в следующем: загрузка необходимых модулей, загрузка данных, предварительная обработка, разбивка их на учебную, тестовую и валидационную части; создание модели с указанием архитектуры, и другое. Разработан модуль для просмотра изображений набора данных, параметров сети и информации по качеству распознавания. Проведен численный эксперимент распознавания элементов одежды средствами FNN. Выполнена автоматическая настройка гиперпараметров сети. Качество распознавания на тестовых данных равно 0,89. Настройка гиперпараметров улучшила качество несущественно. Невысокое качество распознавания объясняется также использованием очень простой модели нейронной сети. Улучшение результатов было достигнуто с использованием сверточной нейронной сети. Лучший результат распознавания, полученный в работе, равен 91.26%, но известный лучший результат качества распознавания равен 94%. Работу по совершенствованию результатов распознавания изображений данных Fashion MNIST целесообразно продолжить, а программное средство, которое разработано, возможно использовать по распознаванию других данных.ru_RU
dc.description.abstractENG: A review of modern methods for recognizing image objects has shown that deep learning algorithms are successfully used and provide high quality. An example is the quality of character recognition of the MNIST set, which is close to 100%. For another dataset, which is also popular in the implementation of deep learning algorithms, namely, the Fashion MNIST set of clothing items and accessories, such a high recognition quality has not yet been achieved. The paper presents the results of data recognition Fashion MNISТ. Models of a feedforward neural network and convolutional network are considered. The software implementation of deep learning algorithms is carried out, namely, a multilayer feedforward network (FNN) and a convolutional neural network (CNN) are considered. The Python language, the TensorFlow and Keras libraries are used. The Keras library allows you to simplify TensorFlow function calls. A typical workflow in Python Keras is as follows: loading the necessary modules, loading data, preprocessing, breaking them into training, test and validation parts; creating a model with an indication of the architecture, and more. A numerical experiment was carried out to recognize clothing items by means of FNN. Automatic tuning of network hyperparameters has been performed. The recognition quality on test data is 0.89. The hyperparameter tuning did not significantly improve the quality. The low quality of recognition is also explained by the use of a very simple neural network model. Improved results have been achieved using convolutional neural networks. The best recognition results obtained in the work is 91.26%, but the known best recognition quality result is 94%. It is advisable to continue the work on improving the results of recognition of images of Fashion MNIST data, and the software that has been developed can be used to recognize other data. With a creative approach to image object recognition in Python using the Keras Tensorflow libraries and others, it is a very promising direction for practical application.en
dc.identifierDOI: 10.32782/KNTU2618-0340/2021.4.1.8en
dc.identifier.citationГнатушенко В. В., Дорош Н. Л., Фененко Т. М. Розпізнавання зображень набору Fashion MNIST методами глибокого навчання. Прикладні питання математичного моделювання. 2021. Т. 4. № 1. С. 78–85. DOI: 10.32782/KNTU2618-0340/2021.4.1.8.uk_UA
dc.identifier.issn2618-0332
dc.identifier.issn2618-0340
dc.identifier.urihttps://ojs.kntu.net.ua/index.php/aqmm/article/view/104en
dc.identifier.urihttp://eadnurt.diit.edu.ua/jspui/handle/123456789/15318en
dc.language.isouk_UAuk_UA
dc.publisherХерсонський національний технічний університетuk_UA
dc.subjectрозпізнавання зображеньuk_UA
dc.subjectFashion MNISTen
dc.subjectнейронна мережаuk_UA
dc.subjectFNNen
dc.subjectCNNen
dc.subjectPYTHONen
dc.subjectKERASen
dc.subjectTENSORFLOWen
dc.subjectякість розпізнаванняuk_UA
dc.subjectгіперпараметриuk_UA
dc.subjectраспознавание изображенийru_Ru
dc.subjectнейронная сетьru_Ru
dc.subjectкачество распознаванияru_RU
dc.subjectгиперпараметрыru_RU
dc.subjectimage recognitionen
dc.subjectneural networken
dc.subjectrecognition qualityen
dc.subjecthyperparametersen
dc.subjectКІТСuk_UA
dc.titleРозпізнавання зображень набору Fashion MNIST методами глибокого навчанняuk_UA
dc.title.alternativeРаспознавание изображений набора Fashion MNIST методами глубокого обученияru_RU
dc.title.alternativeFashion MNIST Image Recognition by Deep Learning Methodsen
dc.typeArticleen
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Gnatushenkо.pdf
Size:
649.86 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: