Automation of Template Formation to Identify the Structure of Natural Language Documents
dc.contributor.author | Kuropiatnyk, Olena S. | en |
dc.contributor.author | Shynkarenko, Viktor I. | en |
dc.date.accessioned | 2021-07-05T09:47:22Z | |
dc.date.available | 2021-07-05T09:47:22Z | |
dc.date.issued | 2021 | |
dc.description | O. Kuropiatnyk: ORCID 0000-0003-2286-884x; V. Shynkarenko: 0000-0001-8738-7225 | en |
dc.description.abstract | ENG: In the task of text borrowings and plagiarism detection, it is important to take into account the structure of the document. This allows getting a more accurate assessment of the text and reducing the volume of material for comparison. Using a template allows identifying the structure of the document. The paper presents a constructive synthesizing model for automating the construction of a structural template of a document. Possible implementations of some algorithms by means of programming in C# are considered. Their comparative assessment is performed. Possible modification of the template is presented to increase the importance of keywords and simplify the xml-tree, which is a template. | en |
dc.description.abstract | UKR: У задачі із запозичення тексту і виявлення плагіату важливо враховувати структуру документа. Це дозволяє отримати більш точну оцінку тексту і зменшити обсяг матеріалу для порівняння. Використання шаблону дозволяє визначити структуру документа. У статті представлена конструктивна синтезуюча модель для автоматизації побудови структурного шаблону документа. Розглянуто можливі реалізації деяких алгоритмів засобами програмування на C #. Проведена їх порівняльна оцінка. Можлива модифікація шаблону представлена для збільшення важливості ключових слів і спрощення xml-дерева, яке є шаблоном. | uk_UA |
dc.description.abstract | RUS: В задаче по заимствованию текста и обнаружению плагиата важно учитывать структуру документа. Это позволяет получить более точную оценку текста и уменьшить объем материала для сравнения. Использование шаблона позволяет определить структуру документа. В статье представлена конструктивная синтезирующая модель для автоматизации построения структурного шаблона документа. Рассмотрены возможные реализации некоторых алгоритмов средствами программирования на C #. Проведена их сравнительная оценка. Возможная модификация шаблона представлена для увеличения важности ключевых слов и упрощения xml-дерева, которое является шаблоном. | ru_RU |
dc.identifier.citation | Kuropiatnyk, O., Shynkarenko V. Automation of template formation to identify the structure of natural language documents. CEUR Workshop Proceedings. Vol. 2870 : 5th International Conference on Computational Linguistics and Intelligent Systems. Vol. I: Main Conference (COLINS 2021), Lviv, Ukraine, 22–23 April 2021. Lviv, 2021. P. 179–190. | en |
dc.identifier.issn | 1613-0073 | |
dc.identifier.uri | http://eadnurt.diit.edu.ua/jspui/handle/123456789/13850 | en |
dc.identifier.uri | http://ceur-ws.org/Vol-2870/ | en |
dc.identifier.uri | http://ceur-ws.org/Vol-2870/paper17.pdf | en |
dc.language.iso | en | |
dc.publisher | CEUR-WS Team, Aachen, Germany | en |
dc.subject | natural language | en |
dc.subject | document comparison | en |
dc.subject | plagiarism detection | en |
dc.subject | document structure | en |
dc.subject | document template | en |
dc.subject | constructive-synthesizing modeling | en |
dc.subject | constructor | en |
dc.subject | структура документу | uk_UA |
dc.subject | шаблон документу | uk_UA |
dc.subject | конструктивно-синтезуюче моделювання | uk_UA |
dc.subject | конструктор | uk_UA |
dc.subject | естественный язык | ru_RU |
dc.subject | сравнение документов | ru_RU |
dc.subject | обнаружение плагиата | ru_RU |
dc.subject | конструктивно-синтезирующее моделирование | ru_RU |
dc.subject | КІТ | uk_UA |
dc.title | Automation of Template Formation to Identify the Structure of Natural Language Documents | en |
dc.title.alternative | Автоматизація формування шаблону для визначення структури документів на натуральній мові | uk_UA |
dc.title.alternative | Автоматизация формирования шаблона для определения структуры документов на натуральном языке | ru_RU |
dc.type | Article | en |