Automation of Template Formation to Identify the Structure of Natural Language Documents

dc.contributor.authorKuropiatnyk, Olena S.en
dc.contributor.authorShynkarenko, Viktor I.en
dc.date.accessioned2021-07-05T09:47:22Z
dc.date.available2021-07-05T09:47:22Z
dc.date.issued2021
dc.descriptionO. Kuropiatnyk: ORCID 0000-0003-2286-884x; V. Shynkarenko: 0000-0001-8738-7225en
dc.description.abstractENG: In the task of text borrowings and plagiarism detection, it is important to take into account the structure of the document. This allows getting a more accurate assessment of the text and reducing the volume of material for comparison. Using a template allows identifying the structure of the document. The paper presents a constructive synthesizing model for automating the construction of a structural template of a document. Possible implementations of some algorithms by means of programming in C# are considered. Their comparative assessment is performed. Possible modification of the template is presented to increase the importance of keywords and simplify the xml-tree, which is a template.en
dc.description.abstractUKR: У задачі із запозичення тексту і виявлення плагіату важливо враховувати структуру документа. Це дозволяє отримати більш точну оцінку тексту і зменшити обсяг матеріалу для порівняння. Використання шаблону дозволяє визначити структуру документа. У статті представлена конструктивна синтезуюча модель для автоматизації побудови структурного шаблону документа. Розглянуто можливі реалізації деяких алгоритмів засобами програмування на C #. Проведена їх порівняльна оцінка. Можлива модифікація шаблону представлена для збільшення важливості ключових слів і спрощення xml-дерева, яке є шаблоном.uk_UA
dc.description.abstractRUS: В задаче по заимствованию текста и обнаружению плагиата важно учитывать структуру документа. Это позволяет получить более точную оценку текста и уменьшить объем материала для сравнения. Использование шаблона позволяет определить структуру документа. В статье представлена конструктивная синтезирующая модель для автоматизации построения структурного шаблона документа. Рассмотрены возможные реализации некоторых алгоритмов средствами программирования на C #. Проведена их сравнительная оценка. Возможная модификация шаблона представлена для увеличения важности ключевых слов и упрощения xml-дерева, которое является шаблоном.ru_RU
dc.identifier.citationKuropiatnyk, O., Shynkarenko V. Automation of template formation to identify the structure of natural language documents. CEUR Workshop Proceedings. Vol. 2870 : 5th International Conference on Computational Linguistics and Intelligent Systems. Vol. I: Main Conference (COLINS 2021), Lviv, Ukraine, 22–23 April 2021. Lviv, 2021. P. 179–190.en
dc.identifier.issn1613-0073
dc.identifier.urihttp://eadnurt.diit.edu.ua/jspui/handle/123456789/13850en
dc.identifier.urihttp://ceur-ws.org/Vol-2870/en
dc.identifier.urihttp://ceur-ws.org/Vol-2870/paper17.pdfen
dc.language.isoen
dc.publisherCEUR-WS Team, Aachen, Germanyen
dc.subjectnatural languageen
dc.subjectdocument comparisonen
dc.subjectplagiarism detectionen
dc.subjectdocument structureen
dc.subjectdocument templateen
dc.subjectconstructive-synthesizing modelingen
dc.subjectconstructoren
dc.subjectструктура документуuk_UA
dc.subjectшаблон документуuk_UA
dc.subjectконструктивно-синтезуюче моделюванняuk_UA
dc.subjectконструкторuk_UA
dc.subjectестественный языкru_RU
dc.subjectсравнение документовru_RU
dc.subjectобнаружение плагиатаru_RU
dc.subjectконструктивно-синтезирующее моделированиеru_RU
dc.subjectКІТuk_UA
dc.titleAutomation of Template Formation to Identify the Structure of Natural Language Documentsen
dc.title.alternativeАвтоматизація формування шаблону для визначення структури документів на натуральній мовіuk_UA
dc.title.alternativeАвтоматизация формирования шаблона для определения структуры документов на натуральном языкеru_RU
dc.typeArticleen
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Kuropiatnyk 17.pdf
Size:
1.3 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: