Формування моделей класифікації невизначених даних процедурами редукції і каппа статистики

Loading...
Thumbnail Image
Date
2023
Journal Title
Journal ISSN
Volume Title
Publisher
Український державний університет науки і технологій, ННІ ≪Інститут промислових та бізнес технологій≫, ІВК ≪Системні технології≫, Дніпро
Abstract
UKR: Стаття присвячена розвитку математичних моделей класифікації невизначених даних, представлених нечіткими величинами та коефіцієнтами упевненості CF(A). Процедури формування шаблонів діагностування використовують модифіковані мережі Хеммінга (МХН), а також методи редукції та статистики каппа Коена. При цьому визначаються граничні розмірності та склад параметрів моделі класифікації, які забезпечують встановлені ймовірнісні вимоги достовірності результатів розрахунків. Представлена процедура редукції простору моделі діагностування невизначених даних. У статті наведено постановки, математичні моделі та реалізації завдань класифікації за недетермінованими даними. Прикладом моделі класифікації за нечіткими даними являється завдання із встановлення авторів україномовних текстів. Завдання класифікації при даних у форматі CF(A) відповідає відбору кандидата. Результати числового моделювання дозволили встановити результативність, достовірність та ефективність запропонованих процедур формування достовірних моделей класифікації при невизначених даних.
ENG: The article is devoted to the development of mathematical models for the classification of uncertain data represented by fuzzy values and certainty factors CF(A). Diagnostic pattern formation procedures use modified Hamming networks (MHN), as well as reduction methods and Cohen's kappa statistics. At the same time, the limiting dimensions and composition of the parameters of the classification model are determined, which ensure the established probabilistic requirements for the reliability of the calculation results. The model space reduction procedure and the structure of the software complex for diagnosing uncertain data are presented. An example of a classification model based on fuzzy data is the task of identifying the authors of Ukrainian-language texts. The classification task for data in CF(A) format corresponds to candidate selection. The results of the numerical modeling made it possible to establish the effectiveness, reliability and efficiency of the proposed procedures for the formation of reliable classification models with uncertain data.
Description
В. Скалозуб: ORCID 0000-0002-1941-4751; В. Горячкін: ORCID 0000-0002-8952-952X
Keywords
класифікація, достовірні моделі, розмірність простору, нечіткі величини, коефіцієнти CF(A), модифікована мережа Хеммінга, процедура редукції, статистика каппа Коена, classification, reliable models, dimensionality of space, fuzzy values, CF(A) certainty factors, modified Hamming network, reduction procedure, Cohen's kappa statistic, Ukrainian-language texts, author's definition, computer simulation, україномовні тексти, визначення автора, комп’ютерне моделювання, КІТ
Citation
Скалозуб В. В., Горячкін В. М., Терлецький І. А., Дудник І. П. Формування моделей класифікації невизначених даних процедурами редукції і каппа статистики. Системні технології. Дніпро, 2023. Т. 5, № 148. С. 141–155. DOI: 10.34185/1562-9945-5-148-2023-13.