Створення кризово-залежного датасету для Adaptive IRM
| dc.contributor.author | Березюк, Микита Олександрович | uk_UA |
| dc.contributor.author | Гуда, Антон Ігорович | uk_UA |
| dc.date.accessioned | 2026-06-17T07:18:03Z | |
| dc.date.issued | 2026 | |
| dc.description | М. Березюк: ORCID 0009-0000-2205-3611; А. Гуда: ORCID 0000-0003-1139-1580 | uk_UA |
| dc.description.abstract | UKR: У кризових ситуаціях великі мовні моделі (LLM) мають потенціал допомагати у формуванні порад та рекомендацій, однак їх стандартна поведінка часто ігнорує специфіку події. Це знижує релевантність і може становити ризик у критичних ситуаціях. У роботі представлено підхід до створення спеціалізованого датасету для навчання та оцінки Adaptive IRM – модуля, який інжектує прихований кризовий контекст у LLM. За основу взято корпус HumAID із твітами про стихійні лиха, для яких згенеровано абстрактні запитання без прямої згадки події. Сформований набір (~41 тис. прикладів) дозволяє перевіряти, чи здатні моделі з Adaptive IRM давати відповіді, що відрізняються залежно від типу кризи, підвищуючи їх релевантність і безпечність. | uk_UA |
| dc.description.abstract | ENG: In crisis communications, Large Language Models (LLMs) have the potential to assist in generating guidance and recommendations; however, their default behavior often ignores the specific nature of the event. This reduces relevance and may pose risks in critical situations. This paper presents an approach to constructing a specialized dataset for training and evaluating Adaptive IRM - a module that injects latent crisis context into the forward pass of an LLM. The HumAID corpus of disaster-related tweets was used as a foundation, with abstract questions generated without explicit mentions of the crisis type. The resulting dataset (~41K examples) enables the assessment of whether models equipped with Adaptive IRM can produce responses that vary according to the crisis type, thereby improving both relevance and safety. | en |
| dc.identifier.citation | Березюк М. О., Гуда А. І. Створення кризово-залежного датасету для Adaptive IRM. Інформаційні технології в металургії та машинобудуванні – ІТММ’2026 : тези доп. Міжнародної наук.-техн. конф. (м. Дніпро, 21-23 березня 2026 р.). Дніпро, 2026. C. 410–414. DOI: https://doi.org/10.34185/1991-7848.itmm.2026.01.073. | uk_UA |
| dc.identifier.doi | https://doi.org/10.34185/1991-7848.itmm.2026.01.073 | en |
| dc.identifier.issn | 2708-0102 (Online) | |
| dc.identifier.uri | https://journals.nmetau.edu.ua/index.php/itmm/uk/article/view/2457 | en |
| dc.identifier.uri | https://crust.ust.edu.ua/handle/123456789/22412 | en |
| dc.language.iso | uk | |
| dc.publisher | Український державний університет науки і технологій, ІВК «Системні технології», Дніпро | uk_UA |
| dc.rights | Creative Commons Attribution 4.0 International License | en |
| dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | en |
| dc.subject | контекстно залежна генерація | uk_UA |
| dc.subject | великі мовні моделі | uk_UA |
| dc.subject | мультимодальний датасет | uk_UA |
| dc.subject | анотація кризових даних | uk_UA |
| dc.subject | кризова інформатика | uk_UA |
| dc.subject | датасет HumAID | uk_UA |
| dc.subject | ін’єкція контексту | uk_UA |
| dc.subject | адаптація поведінки моделі | uk_UA |
| dc.subject | context-aware generation | en |
| dc.subject | large language models | en |
| dc.subject | multimodal dataset | en |
| dc.subject | crisis data annotation | en |
| dc.subject | crisis informatics | en |
| dc.subject | HumAID dataset | en |
| dc.subject | context injection | en |
| dc.subject | model behavior adaptation | en |
| dc.subject | КІТС | uk_UA |
| dc.subject.classification | TECHNOLOGY | en |
| dc.subject.classification | TECHNOLOGY::Information technology | en |
| dc.title | Створення кризово-залежного датасету для Adaptive IRM | uk_UA |
| dc.title.alternative | Creating a Crisis-Dependent Dataset for Adaptive IRM | en |
| dc.type | Thesis | en |