Створення кризово-залежного датасету для Adaptive IRM

Березюк, Микита Олександрович; Гуда, Антон Ігорович

doi:https://doi.org/10.34185/1991-7848.itmm.2026.01.073

Створення кризово-залежного датасету для Adaptive IRM

Files

Berezuk.pdf (435.22 KB)

Date

2026

Authors

Березюк, Микита Олександрович

Гуда, Антон Ігорович

Publisher

Український державний університет науки і технологій, ІВК «Системні технології», Дніпро

Abstract

UKR: У кризових ситуаціях великі мовні моделі (LLM) мають потенціал допомагати у формуванні порад та рекомендацій, однак їх стандартна поведінка часто ігнорує специфіку події. Це знижує релевантність і може становити ризик у критичних ситуаціях. У роботі представлено підхід до створення спеціалізованого датасету для навчання та оцінки Adaptive IRM – модуля, який інжектує прихований кризовий контекст у LLM. За основу взято корпус HumAID із твітами про стихійні лиха, для яких згенеровано абстрактні запитання без прямої згадки події. Сформований набір (~41 тис. прикладів) дозволяє перевіряти, чи здатні моделі з Adaptive IRM давати відповіді, що відрізняються залежно від типу кризи, підвищуючи їх релевантність і безпечність.

ENG: In crisis communications, Large Language Models (LLMs) have the potential to assist in generating guidance and recommendations; however, their default behavior often ignores the specific nature of the event. This reduces relevance and may pose risks in critical situations. This paper presents an approach to constructing a specialized dataset for training and evaluating Adaptive IRM - a module that injects latent crisis context into the forward pass of an LLM. The HumAID corpus of disaster-related tweets was used as a foundation, with abstract questions generated without explicit mentions of the crisis type. The resulting dataset (~41K examples) enables the assessment of whether models equipped with Adaptive IRM can produce responses that vary according to the crisis type, thereby improving both relevance and safety.

Description

М. Березюк: ORCID 0009-0000-2205-3611; А. Гуда: ORCID 0000-0003-1139-1580

Keywords

контекстно залежна генерація, великі мовні моделі, мультимодальний датасет, анотація кризових даних, кризова інформатика, датасет HumAID, ін’єкція контексту, адаптація поведінки моделі, context-aware generation, large language models, multimodal dataset, crisis data annotation, crisis informatics, HumAID dataset, context injection, model behavior adaptation, КІТС

Citation

Березюк М. О., Гуда А. І. Створення кризово-залежного датасету для Adaptive IRM. Інформаційні технології в металургії та машинобудуванні – ІТММ’2026 : тези доп. Міжнародної наук.-техн. конф. (м. Дніпро, 21-23 березня 2026 р.). Дніпро, 2026. C. 410–414. DOI: https://doi.org/10.34185/1991-7848.itmm.2026.01.073.

URI

https://journals.nmetau.edu.ua/index.php/itmm/uk/article/view/2457
https://crust.ust.edu.ua/handle/123456789/22412

Collections

Міжнародна науково-технічна конференція «Інформаційні технології в металургії та машинобудуванні. ІТММ'26»
Інші праці КІТС (ДМетІ)

Creative Commons license

Except where otherwised noted, this item's license is described as Creative Commons Attribution 4.0 International License

Full item page

Створення кризово-залежного датасету для Adaptive IRM

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By

Creative Commons license