Шинкаренко, Віктор ІвановичДемидович, Інна Миколаївна2019-07-242019-07-242018Шинкаренко, В. І. Визначення ознак авторства природньомовних текстів: [препринт] / В. І. Шинкаренко, І. М. Демидович // Штучний інтелект. – 2018. – № 3 (81). – С. 27–35.1561-5359http://eadnurt.diit.edu.ua/jspui/handle/123456789/11443http://jai.in.ua/index.php/%D0%B0%D1%80%D1%85%D1%96%D0%B2?paper_num=1303В. Шинкаренко: ORCID 0000-0001-8738-7225UKR: Досліджені можливості встановлення авторства природньомовних текстів та їх фрагментів методом класифікації за найменшою відстанню у просторі образів. Образи у n-мірному Евклідовому просторі формуються за ознаками вимірювань методами статистичного та рекурентного аналізу, показниками складності тексту. Метод рекурентного аналізу часових рядів адаптовано до аналізу природньомовних текстів. Встановлено, що визначені ознаки мають недостатньо високу ефективність при визначенні авторства; у 85% випадків хоча б один з методів дозволяє встановити авторство; модифікований метод рекурентного аналізу має той же рівень ефективності, як статистичний та аналіз складності тексту.RUS: Исследованы возможности установления авторства естественноязыковых текстов и их фрагментов методом классификации по наименьшим расстоянием в пространстве образов. Образы в n-мерном Эвклидовом пространстве формируются по признакам измерений методами статистического и рекуррентного анализа, показателями сложности текста. Метод рекуррентного анализа временных рядов адаптировано к анализу естественноязыковых текстов. Установлено, что определенные признаки имеют недостаточно высокую эффективность при определении авторства; в 85% случаев хотя бы один из методов позволяет установить авторство; модифицированный метод рекуррентного анализа имеет тот же уровень эффективности, как статистический и анализ сложности текстаENG: The possibility of defining the authorship of natural language texts and its fragments was explored by minimum distance classification in space images. In n-dimensional Euclidean space the image forms by measurement signs of statistic and recurrent analysis, complexity indicators. The method of recurrent analysis of time series was adapted to the analysis of natural language texts. Certain signs weren’t efficient enough in authorship determination; in 85% of cases at least one of the methods allows to establish authorship; the modified method of recurrent analysis has the same level of efficiency as statistical and complexity analysis.uk-UAприродньомовні текстирекурентний аналізстатистичний аналізскладність текстівавторство текстукласифікаціяестественноязыковые текстырекуррентный анализстатистический анализсложность текстовавторство текстаклассификацияnatural language textsrecurrence analysisstatistic analysistext complexitytext authorshipclassificationКІТВизначення ознак авторства природньомовних текстівОпределение признаков авторства естественноязыковых текстовDetermination of the Attributes of Authorship of Natural TextsArticle