Розпізнавання зображень набору Fashion MNIST методами глибокого навчання

Loading...
Thumbnail Image
Date
2021
Journal Title
Journal ISSN
Volume Title
Publisher
Херсонський національний технічний університет
Abstract
UKR: Огляд сучасних методів розпізнавання об’єктів-зображень показав, що алгоритми глибокого навчання успішно використовуються і дозволяють отримати високу якість. Прикладом можливо привести якість розпізнавання символів набору MNIST, яка наблизилась до 100%. Для другого набору даних, який теж популярний при тестуванні алгоритмів глибокого навчання, а саме, набору елементів одягу та аксесуарів Fashion MNIST, така висока якість розпізнавання ще не отримана. У роботі представлені результати розпізнавання даних Fashion MNISТ. Розглянуті моделі нейронної мережі прямого поширення і згорткової мережі. Виконано програмну реалізацію алгоритмів глибокого навчання, а саме, розглянуто багатошарову мережу прямого поширення (FNN) та згорткову нейронну мережу (CNN). Використано мову Python, бібліотеки TensorFlow та Keras Бібліотека Keras дозволяє спрощувати виклики функцій з TensorFlow. Типовий процес роботи в Python Keras полягає в наступному: завантаження необхідних модулів, завантаження даних, попередня обробка, розбивка їх на навчальну, тестову і валідаційну частини; створення моделі із зазначенням архітектури, та інше. Розроблено модуль для перегляду зображень набору даних, параметрів мережі та інформації з якості розпізнавання. Виконано чисельний експеримент розпізнавання елементів одягу засобами FNN. Проведено автоматичне налаштування гіперпараметрів мережі. Якість розпізнавання на тестових даних дорівнює 0,89. Налаштування гіперпараметрів покращило якість несуттєво. Невисока якість розпізнавання пояснюється також використанням дуже простої моделі нейронної мережі. Поліпшення результатів було досягнуто з використанням згорткової нейронної мережі. Кращій результат розпізнавання, який отримано у роботі, дорівнює 91.26%, але відомий найкращий результат якості розпізнавання дорівнює 94%. Роботу з вдосконалення результатів розпізнавання зображень даних Fashion MNIST доцільно продовжити, а програмний засіб, який розроблено, можливо використовувати щодо розпізнавання інших даних. При творчому підході розпізнавання об'єктів зображень на Python з застосуванням бібліотек Keras Tensorflow і інших є дуже перспективним напрямком для практичного застосування.
RUS: Обзор современных методов распознавания объектов изображений показал, что алгоритмы глубокого обучения успешно используются и позволяют получить высокое качество. Примером можно привести качество распознавания символов набора MNIST, которое приблизилось к 100%. Для другого набора данных, который тоже популярен в реализации алгоритмов глубокого обучения, а именно, набора элементов одежды и аксессуаров Fashion MNIST, такое высокое качество распознавания еще не достигнуто. В работе представлены результаты распознавания данных Fashion MNISТ. Рассмотрены модели нейронной сети прямого распространения и сверточной сети. Проведена программная реализация алгоритмов глубокого обучения, а именно, рассмотрены многослойная сеть прямого распространения (FNN) и сверточная нейронная сеть (CNN). Использованы язык Python, библиотеки TensorFlow и Keras. Библиотека Keras позволяет упрощать вызовы функций по TensorFlow. Типичный процесс работы в Python Keras заключается в следующем: загрузка необходимых модулей, загрузка данных, предварительная обработка, разбивка их на учебную, тестовую и валидационную части; создание модели с указанием архитектуры, и другое. Разработан модуль для просмотра изображений набора данных, параметров сети и информации по качеству распознавания. Проведен численный эксперимент распознавания элементов одежды средствами FNN. Выполнена автоматическая настройка гиперпараметров сети. Качество распознавания на тестовых данных равно 0,89. Настройка гиперпараметров улучшила качество несущественно. Невысокое качество распознавания объясняется также использованием очень простой модели нейронной сети. Улучшение результатов было достигнуто с использованием сверточной нейронной сети. Лучший результат распознавания, полученный в работе, равен 91.26%, но известный лучший результат качества распознавания равен 94%. Работу по совершенствованию результатов распознавания изображений данных Fashion MNIST целесообразно продолжить, а программное средство, которое разработано, возможно использовать по распознаванию других данных.
ENG: A review of modern methods for recognizing image objects has shown that deep learning algorithms are successfully used and provide high quality. An example is the quality of character recognition of the MNIST set, which is close to 100%. For another dataset, which is also popular in the implementation of deep learning algorithms, namely, the Fashion MNIST set of clothing items and accessories, such a high recognition quality has not yet been achieved. The paper presents the results of data recognition Fashion MNISТ. Models of a feedforward neural network and convolutional network are considered. The software implementation of deep learning algorithms is carried out, namely, a multilayer feedforward network (FNN) and a convolutional neural network (CNN) are considered. The Python language, the TensorFlow and Keras libraries are used. The Keras library allows you to simplify TensorFlow function calls. A typical workflow in Python Keras is as follows: loading the necessary modules, loading data, preprocessing, breaking them into training, test and validation parts; creating a model with an indication of the architecture, and more. A numerical experiment was carried out to recognize clothing items by means of FNN. Automatic tuning of network hyperparameters has been performed. The recognition quality on test data is 0.89. The hyperparameter tuning did not significantly improve the quality. The low quality of recognition is also explained by the use of a very simple neural network model. Improved results have been achieved using convolutional neural networks. The best recognition results obtained in the work is 91.26%, but the known best recognition quality result is 94%. It is advisable to continue the work on improving the results of recognition of images of Fashion MNIST data, and the software that has been developed can be used to recognize other data. With a creative approach to image object recognition in Python using the Keras Tensorflow libraries and others, it is a very promising direction for practical application.
Description
Вік. Гнатушенко: ORCID: 0000-0001-5304-4144; Н. Дорош: ORCID 0000-0003-4184-3648; Т. Фененко: ORCID: 0000-0002-7631-3148
Keywords
розпізнавання зображень, Fashion MNIST, нейронна мережа, FNN, CNN, PYTHON, KERAS, TENSORFLOW, якість розпізнавання, гіперпараметри, распознавание изображений, нейронная сеть, качество распознавания, гиперпараметры, image recognition, neural network, recognition quality, hyperparameters, КІТС
Citation
Гнатушенко В. В., Дорош Н. Л., Фененко Т. М. Розпізнавання зображень набору Fashion MNIST методами глибокого навчання. Прикладні питання математичного моделювання. 2021. Т. 4. № 1. С. 78–85. DOI: 10.32782/KNTU2618-0340/2021.4.1.8.