Інші праці КІТ

Permanent URI for this collectionhttp://crust.ust.edu.ua/handle/123456789/8990

ENG: Other Works

Browse

Now showing 1 - 2 of 2

Застосування конструктивного моделювання при визначенні авторства текстів
(Український державний університет науки і технологій, ІВК «Системні технології», Дніпро, 2023) Демидович, Інна Миколаївна; Шинкаренко, Віктор Іванович
UKR: Представлено розробку конструктора, що дозволяє відобразити особливості побудови речень у різних авторів. Такий підхід враховує структуру речень, характерну для окремого автора, і може бути використаний для виявлення плагіату та встановлення авторства текстів у різних жанрах і стилях. Завдяки чому звичайне перефразування твору чи зміна порядку розділів, речень чи слів не стане перешкодою для визначення авторства. Запропонований підхід є перспективним і малозатратним за розрахунковою потужністю на відміну від існуючих. Такий спосіб представлення побудови речень представлено вперше.
Розвиток методів та засобів для визначення авторства україномовних текстів на основі конструктивно-продукційного моделювання
(Український державний університет науки і технологій, Дніпро, Україна, 2023) Демидович, Інна Миколаївна
UKR: Дисертація присвячена дослідженню та розробці різних методів й засобів встановлення авторства природньомовних текстів на основі різних показників, що відображають особливості авторського стилю мовлення. У дисертаційній роботі отримані нові науково обґрунтовані теоретичні та експериментальні результати, що у сукупності дозволять застосовувати досліджені методи самостійно або у комплексі з іншими для встановлення авторства текстів та пошуку запозичень. У першому розділі виконано огляд та аналіз існуючих наразі методів та підходів, що допомагають вловити авторський стиль для різних мов світу. Показано, що різні підходи зумовлені складністю задачі та особливостями різних мов. Встановлено, що досконалого 100% результату у питанні встановлення авторства текстів досі не набуто, незважаючи на широкий перелік використаних інструментів та підходів. Виявлено, що дослідження підходів для роботи саме з україномовними текстам мають невеликий відсоток на відміну від робіт присвячених іншим мовам, що зумовлено складністю нормалізування та вільністю побудови речень. З’ясовано, що через особливості побудови речень українською мовою, широкі можливості автора щодо надання тексту певної стилістики на вимогу ідеї твору чи призначенні роботи, поширені методи та підходи роботи з іншими мовами не зможуть в достатній мірі відобразити авторський стиль. У другому розділі представлені досліджені методи та розроблені моделі статистичного аналізу, аналізу складності текстів, рекурентного аналізу конструктивно-продукційного моделювання. Виконано адаптацію методів для роботи з природньомовними текстами українською мови. Запропоновано метод створення профілю автора та метод роботи з багатьма показниками для найкращого врахування особливостей авторського стилю. Розроблена модель природньомовного тексту у вигляді множини правил стохастичних граматик та розроблені метод порівняння текстів на основі порівняння цих правил, що дозволяє враховувати синтаксичні та стилістичні особливості тексту автора. Розроблені конструктори для перетворення природньомовного тексту на множину стохастичних правил та подальше порівняння таких множин для встановлення ступеня їх співпадіння. У третьому розділі приведені результати експериментальних досліджень. Перевірена та підтверджена ефективність кожного з методів та розроблених моделей. Виконано експерименти за допомогою репрезентативних вибірків як художніх творів різних авторів, так технічних текстів різного розміру та складу. Встановлено ступінь ефективності кожного з досліджених методів окремо. В подальшому методи було об’єднано для отримання кращого результату та врахування різних особливостей авторського стилю. Було розвинуто та експериментально доведено ефективність методів роботи з великою кількістю різних показників для отримання кращого результату. У четвертому розділі розроблено інструменти для автоматичного аналізу тексту, підрахунку відповідних показників та подальшого порівняння робіт за ними. Та інструменти що на основі розроблених конструкторів автоматично будують множини правил для різних текстів та порівнюють обрані на ступінь схожості. Ключові слова: багатокритеріальна оптимізація, генетичний алгоритм, рекурентний аналіз, розпізнавання образів, конструктивне моделювання, авторство текстів, стохастичні граматики, формальні мови, природньомовні тексти, атрибуція текстів, українська мова, авторська атрибуція, критерій Стьюдента.