Дослідження засобів штучного інтелекту для розпізнавання усного мовлення
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
UKR: Пояснювальна записка до кваліфікаційної роботи магістра виконана на 92 сторінках, містить 18 рисунків, 7 таблиць, 4 додатки, 19 джерел. Проведено дослідження засобів штучного інтелекту для розпізнавання усного мовлення. Виконано аналіз сучасних архітектур нейронних мереж, здатних працювати в умовах обмежених обчислювальних ресурсів та обрано дві архітектури для дослідження: CRNN та MobileNetV2. Досліджено вплив наборів даних на якість розпізнавання та узагальнювальну здатність моделей з використанням датасетів Google Speech Commands v0.01 та v0.02, що міслять аудіозаписи коротких мовних команд. розроблено програмний засіб що забезпечує обробку та аугментацію аудіоданих, реалізує механізм навчання та тестування моделей. У ході дослідження проводилось пряме тестування, при якому моделі тестувались на тому ж датасеті, на якому навчались та перехресне, при якому модель навчалась на одній версії датасету, а тестувалась на іншій. Результати тестування виводились у вигляді класифікаційного звіту, який включає в себе показники точності, повноти та F1-міри для кожної команди класу, а також список перших 10 правильних і неправильних розпізнавань. Програма написана мовою Python із використанням бібліотек PyTorch, Librosa, Scikit-learn, Tkinter. Мета роботи полягає у дослідженні сучасних засобів штучного інтелекту для розпізнавання мовлення та порівнянні отриманих результатів за показниками точності та узагальнювальної здатності.