Створення кризово-залежного датасету для Adaptive IRM
Files
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
UKR: У кризових ситуаціях великі мовні моделі (LLM) мають потенціал допомагати у формуванні порад та рекомендацій, однак їх стандартна поведінка часто ігнорує специфіку події. Це знижує релевантність і може становити ризик у критичних ситуаціях. У роботі представлено підхід до створення спеціалізованого датасету для навчання та оцінки Adaptive IRM – модуля, який інжектує прихований кризовий контекст у LLM. За основу взято корпус HumAID із твітами про стихійні лиха, для яких згенеровано абстрактні запитання без прямої згадки події. Сформований набір (~41 тис. прикладів) дозволяє перевіряти, чи здатні моделі з Adaptive IRM давати відповіді, що відрізняються залежно від типу кризи, підвищуючи їх релевантність і безпечність.
ENG: In crisis communications, Large Language Models (LLMs) have the potential to assist in generating guidance and recommendations; however, their default behavior often ignores the specific nature of the event. This reduces relevance and may pose risks in critical situations. This paper presents an approach to constructing a specialized dataset for training and evaluating Adaptive IRM - a module that injects latent crisis context into the forward pass of an LLM. The HumAID corpus of disaster-related tweets was used as a foundation, with abstract questions generated without explicit mentions of the crisis type. The resulting dataset (~41K examples) enables the assessment of whether models equipped with Adaptive IRM can produce responses that vary according to the crisis type, thereby improving both relevance and safety.
