Скалозуб, Владислав ВасильовичГорячкін, Вадим МиколайовичТерлецький, Ігор АндрійовичДудник, Ілля Петрович2023-12-242023-12-242023Скалозуб В. В., Горячкін В. М., Терлецький І. А., Дудник І. П. Формування моделей класифікації невизначених даних процедурами редукції і каппа статистики. Системні технології. Дніпро, 2023. Т. 5, № 148. С. 141–155. DOI: 10.34185/1562-9945-5-148-2023-13.1562-9945 (Print)2707-7977 (Online)https://journals.nmetau.edu.ua/index.php/st/article/view/1401https://crust.ust.edu.ua/handle/123456789/17922В. Скалозуб: ORCID 0000-0002-1941-4751; В. Горячкін: ORCID 0000-0002-8952-952XUKR: Стаття присвячена розвитку математичних моделей класифікації невизначених даних, представлених нечіткими величинами та коефіцієнтами упевненості CF(A). Процедури формування шаблонів діагностування використовують модифіковані мережі Хеммінга (МХН), а також методи редукції та статистики каппа Коена. При цьому визначаються граничні розмірності та склад параметрів моделі класифікації, які забезпечують встановлені ймовірнісні вимоги достовірності результатів розрахунків. Представлена процедура редукції простору моделі діагностування невизначених даних. У статті наведено постановки, математичні моделі та реалізації завдань класифікації за недетермінованими даними. Прикладом моделі класифікації за нечіткими даними являється завдання із встановлення авторів україномовних текстів. Завдання класифікації при даних у форматі CF(A) відповідає відбору кандидата. Результати числового моделювання дозволили встановити результативність, достовірність та ефективність запропонованих процедур формування достовірних моделей класифікації при невизначених даних.ENG: The article is devoted to the development of mathematical models for the classification of uncertain data represented by fuzzy values and certainty factors CF(A). Diagnostic pattern formation procedures use modified Hamming networks (MHN), as well as reduction methods and Cohen's kappa statistics. At the same time, the limiting dimensions and composition of the parameters of the classification model are determined, which ensure the established probabilistic requirements for the reliability of the calculation results. The model space reduction procedure and the structure of the software complex for diagnosing uncertain data are presented. An example of a classification model based on fuzzy data is the task of identifying the authors of Ukrainian-language texts. The classification task for data in CF(A) format corresponds to candidate selection. The results of the numerical modeling made it possible to establish the effectiveness, reliability and efficiency of the proposed procedures for the formation of reliable classification models with uncertain data.ukкласифікаціядостовірні моделірозмірність просторунечіткі величиникоефіцієнти CF(A)модифікована мережа Хеммінгапроцедура редукціїстатистика каппа Коенаclassificationreliable modelsdimensionality of spacefuzzy valuesCF(A) certainty factorsmodified Hamming networkreduction procedureCohen's kappa statisticUkrainian-language textsauthor's definitioncomputer simulationукраїномовні текстивизначення авторакомп’ютерне моделюванняКІТSOCIAL SCIENCES::Statistics, computer and systems science::Informatics, computer and systems science::Data processingTECHNOLOGY::Information technologyФормування моделей класифікації невизначених даних процедурами редукції і каппа статистикиFormation Classification Models of Undetermined Data by Means of Procedures Reduction and Kappa StatisticArticle10.34185/1562-9945-5-148-2023-13