Оцінка впливу попередньої фільтрації на якість вибірки в RAG-системах з векторним пошуком

dc.contributor.authorКлименко, Іван Вікторовичuk_UA
dc.contributor.authorЛебідь, Євген Андрійовичuk_UA
dc.date.accessioned2026-06-18T11:37:33Z
dc.date.issued2026
dc.descriptionІ. Клименко: ORCID 0000-0001-5149-3974; Є Лебідь: ORCID 0009-0007-4277-2083uk_UA
dc.description.abstractUKR: В роботі проаналізовано сучасні підходи до оцінювання RAG‑систем, що поєднують векторний пошук і генерацію відповідей великими мовними моделями (LLM). Розглянуто класичні метрики якості вибірки та LLM‑орієнтовані метрики якості генерації, у тому числі в контексті фреймворків RAGAS, ARES, VERA та MIRAGE. Проведено машинний експеримент на базі Google Cloud Platform (GCP) Firestore колекції з векторним пошуком по датасету резюме ІТ‑фахівців, де порівнюються стандартний векторний пошук і пошук з попередньою фільтрацією за метаданими. Встановлено, що попередня фільтрація підвищує частку релевантних документів у контексті, зменшує затримку вибірки та дозволяє збільшувати розмір контексту без пропорційного погіршення якості генерації. Результати експерименту підтверджують залежність якості відповідей RAG‑систем від чистоти й релевантності контексту.uk_UA
dc.description.abstractENG: The paper analyzes modern approaches to evaluating Retrieval-Augmented Generation (RAG) systems that integrate vector search with answer generation by large language models (LLMs). It examines classical retrieval quality metrics alongside LLM-oriented generation quality metrics, including their application within frameworks such as RAGAS, ARES, VERA, and MIRAGE. A computational experiment was conducted using a Google Cloud Platform (GCP) Firestore collection with vector search over a dataset of IT professionals' CVs, comparing standard vector search against search enhanced by pre-filtering on metadata. The results demonstrate that pre-filtering increases the proportion of relevant documents in the context, reduces retrieval latency, and enables larger context sizes without proportional degradation in generation quality. The experimental findings confirm the dependence of RAG system answer quality on the purity and relevance of the retrieved context.en
dc.identifier.citationКлименко І. В., Лебідь Є. А. Оцінка впливу попередньої фільтрації на якість вибірки в RAG-системах з векторним пошуком. Інформаційні технології в металургії та машинобудуванні – ІТММ’2026 : тези доп. Міжнародної наук.-техн. конф. (м. Дніпро, 21-23 березня 2026 р.). Дніпро, 2026. C. 194–200. DOI: https://doi.org/10.34185/1991-7848.itmm.2026.01.035.uk_UA
dc.identifier.doihttps://doi.org/10.34185/1991-7848.itmm.2026.01.035en
dc.identifier.issn2708-0102 (Online)
dc.identifier.urihttps://journals.nmetau.edu.ua/index.php/itmm/uk/article/view/2419en
dc.identifier.urihttps://crust.ust.edu.ua/handle/123456789/22440en
dc.language.isouk
dc.publisherУкраїнський державний університет науки і технологій, ІВК «Системні технології», Дніпроuk_UA
dc.rightsCreative Commons Attribution 4.0 International Licenseen
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/en
dc.subjectкомп’ютерні системиuk_UA
dc.subjectінформаційні технологіїuk_UA
dc.subjectінтелектуальний аналіз данихuk_UA
dc.subjectштучний інтелектuk_UA
dc.subjectмашинний експериментuk_UA
dc.subjectгенеративні мовні моделіuk_UA
dc.subjectcomputer systemsen
dc.subjectinformation technologiesen
dc.subjectdata miningen
dc.subjectartificial intelligenceen
dc.subjectRAGen
dc.subjectmachine-based benchmarkingen
dc.subjectgenerative language modelsen
dc.subjectКІТuk_UA
dc.subject.classificationTECHNOLOGYen
dc.subject.classificationTECHNOLOGY::Information technologyen
dc.titleОцінка впливу попередньої фільтрації на якість вибірки в RAG-системах з векторним пошукомuk_UA
dc.title.alternativeThe Assessment of Impact of Pre-Filtering on Retrieval Quality in RAG Systems with Vector Searchen
dc.typeThesisen

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Klymenko.pdf
Size:
373.74 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
159 B
Format:
Item-specific license agreed upon to submission
Description: