Authorship Determination of Natural Language Texts by Several Classes of Indicators with Customizable Weights

dc.contributor.authorShynkarenko, Viktor I.en
dc.contributor.authorDemidovich, Innaen
dc.date.accessioned2021-07-02T11:54:25Z
dc.date.available2021-07-02T11:54:25Z
dc.date.issued2021
dc.descriptionV. Shynkarenko: ORCID 0000-0001-8738-7225; I. Demidovich: ORCID 0000-0002-3644-184Xen
dc.description.abstractENG: In this work we try to improve the results of texts and their fragments attribution using the classification method of the least distance in Euclidean space of images, by selecting weights for each of the image measures. For weights determination the genetic algorithm was used. Images are formed using statistical and modified recurrent analysis and the text complexity indicators. We will try to identify the effectiveness for each of them. It was found that this method usage improves the efficiency of the text attribution and the reliability of authorship determination of the texts from the control sample reaches 80-91%.en
dc.description.abstractUKR: У даній роботі ми намагаємося поліпшити результати атрибуції текстів і їх фрагментів, використовуючи метод класифікації найменшої відстані в евклідовому просторі зображень, вибираючи ваги для кожної із мір зображення. Для визначення ваги використовувався генетичний алгоритм. Зображення формуються з використанням статистичного та модифікованого рекуррентного аналізу і показників складності тексту. Ми постараємося визначити ефективність кожного з них. Встановлено, що використання цього методу підвищує ефективність атрибуції тексту, а надійність визначення авторства текстів з контрольної вибірки досягає 80-91%.uk_UA
dc.description.abstractRUS: В данной работе мы пытаемся улучшить результаты атрибуции текстов и их фрагментов, используя метод классификации наименьшего расстояния в евклидовом пространстве изображений, выбирая веса для каждой из мер изображения. Для определения веса использовался генетический алгоритм. Изображения формируются с использованием статистического и модифицированного рекуррентного анализа и показателей сложности текста. Мы постараемся определить эффективность каждого из них. Установлено, что использование этого метода повышает эффективность атрибуции текста, а надежность определения авторства текстов из контрольной выборки достигает 80-91%.ru_RU
dc.identifier.citationShynkarenko V., Demidovich I. Authorship determination of natural language texts by several classes of indicators with customizable weights. CEUR Workshop Proceedings. Vol. 2870 : 5th International Conference on Computational Linguistics and Intelligent Systems. Vol. I: Main Conference, (COLINS 2021), Lviv, Ukraine, 22–23 April 2021. Lviv, 2021. P. 832–844.en
dc.identifier.issn1613-0073
dc.identifier.urihttp://eadnurt.diit.edu.ua/jspui/handle/123456789/13843en
dc.identifier.urihttp://ceur-ws.org/Vol-2870/paper62.pdfen
dc.identifier.urihttp://ceur-ws.org/Vol-2870/en
dc.language.isoen
dc.publisherCEUR-WS Team, Aachen, Germanyen
dc.subjectnatural language textsen
dc.subjectrecurrence analysisen
dc.subjectfrequency analysisen
dc.subjecttext complexityen
dc.subjecttext authorshipen
dc.subjectclassificationen
dc.subjectgenetic algorithmen
dc.subjectтексти на природній мовіuk_UA
dc.subjectаналіз повторюваностіuk_UA
dc.subjectчастотний аналізuk_UA
dc.subjectскладність текстуuk_UA
dc.subjectавторство текстуuk_UA
dc.subjectкласифікаціяuk_UA
dc.subjectгенетичний алгоритмuk_UA
dc.subjectтексты на естественном языкеru_RU
dc.subjectанализ повторяемостиru_RU
dc.subjectчастотный анализru_RU
dc.subjectсложность текстаru_RU
dc.subjectавторство текстаru_RU
dc.subjectклассификацияru_RU
dc.subjectгенетический алгоритмru_RU
dc.subjectКІТuk_UA
dc.titleAuthorship Determination of Natural Language Texts by Several Classes of Indicators with Customizable Weightsen
dc.title.alternativeАвторське визначення текстів природної мови по декількох класах індикаторів з настроюванням вагиuk_UA
dc.title.alternativeАвторское определение текстов естественного языка по нескольким классам индикаторов с настройкой весаru_RU
dc.typeArticleen
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Shynkarenko62.pdf
Size:
1.44 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: