Дослідження методів на основі нейронних мереж для аналізу тональності корпусу текстів

Островська, Катерина Юріївна; Стовпченко, Іван Володимирович; Печений, Денис Сергійович

doi:10.34185/1562-9945-4-147-2023-14

Дослідження методів на основі нейронних мереж для аналізу тональності корпусу текстів

Files

Ostrovska.pdf (687.89 KB)

Date

2023

Authors

Островська, Катерина Юріївна

Стовпченко, Іван Володимирович

Печений, Денис Сергійович

Publisher

Український державний університет науки і технологій, ННІ ≪Інститут промислових та бізнес технологій≫, ІВК ≪Системні технології≫, Дніпро

Abstract

UKR: Об'єктом дослідження є методи з урахуванням нейронних мереж для аналізу тональності корпусу текстів. Для досягнення поставленої в роботі мети необхідно вирішити такі завдання: вивчити теоретичний матеріал для навчання глибинних нейронних мереж та їх особливості стосовно обробки природної мови; вивчити документацію бібліотеки Tensorflow; розробити моделі згорткової та рекурентної нейронних мереж; розробити реалізацію лінійних та нелінійних методів класифікації на моделях мішка слів та Word2Vec; порівняти точність та інші показники якості реалізованих нейромережевих моделей із класичними методами. Для візуалізації навчання використовується Tensorboard. У роботі показано перевагу класифікаторів на основі глибоких нейронних мереж над класичними методами класифікації, навіть якщо для векторних уявлень слів використовується модель Word2Vec. Найвищу точність для даного корпусу текстів має модель рекурентної нейронної мережі з LSTM-блоками.

ENG: The object of the study is methods based on neural networks for analyzing the tonality of a corpus of texts. To achieve the goal set in the work, it is necessary to solve the following tasks: study the theoretical material for learning deep neural networks and their features in relation to natural language processing; study the documentation of the Tensorflow library; develop models of convolutional and recurrent neural networks; to develop the implementation of linear and non-linear classification methods on bag of words and Word2Vec models; to compare the accuracy and other quality indicators of implemented neural network models with classical methods. Tensorboard is used for learning visualization. The work shows the superiority of classifiers based on deep neural networks over classical classification methods, even if the Word2Vec model is used for vector representations of words. The model of recurrent neural network with LSTM blocks has the highest accuracy for this corpus of texts.

Description

К. Островська: ORCID 0000-0002-9375-4121

Keywords

штучні нейронні мережі, глибокі нейронні мережі, навчання з учителем, глибоке навчання, рекурентна нейронна мережа, LSTM, згорткова нейронна мережа, аналіз тональності тексту, мішок слів, Word2vec, artificial neural networks, deep neural networks, tutored learning, deep learning, recurrent neural network, convolutional neural network, text tonality analysis, bag of words, КІТС

Citation

Островська К. Ю., Стовпченко І. В., Печений Д. С. Дослідження методів на основі нейронних мереж для аналізу тональності корпусу текстів. Системні технології. Дніпро, 2023. Т. 4, № 147. С. 155–167. DOI: 10.34185/1562-9945-4-147-2023-14.

URI

https://journals.nmetau.edu.ua/index.php/st/article/view/1310
https://crust.ust.edu.ua/handle/123456789/17833

Collections

Том 4 № 147 (СТ ІПБТ)
Статті КІТС (ДМетІ)

Creative Commons license

Except where otherwised noted, this item's license is described as Creative Commons Attribution 4.0 International License

Full item page

Дослідження методів на основі нейронних мереж для аналізу тональності корпусу текстів

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By

Creative Commons license