Випускні роботи студентів КІТ ДІІТ
Permanent URI for this communityhttps://crust.ust.edu.ua/handle/123456789/21755
ENG: Students' final projects
Browse
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Item type:Item, Дослідження оптимізації пам’яті в роботі з великими наборами даних засобами Python(Український державний університет науки і технологій, Дніпро, 2026) Ковальчук, Руслан РуслановичUKR: Кваліфікаційна робота: 136 с., 16 рис., 62 джерела. Об’єкт дослідження: процес обробки великих наборів даних засобами мови програмування Python за умов обмеженого обсягу оперативної пам’яті. Предмет дослідження: методи та інструменти оптимізації споживання оперативної пам’яті при роботі з великими наборами даних у Python (обсягом від кількох гігабайт до терабайт), включаючи бібліотеки Pandas, Dask, Vaex, Polars та техніки chunking, downcasting, стиснення і паралельну обробку. Мета дослідження: розробити та експериментально обґрунтувати комплекс рекомендацій щодо ефективної обробки великих наборів даних у Python з мінімальним використанням оперативної пам’яті без виникнення помилок типу MemoryError. Методи дослідження: теоретичні – огляд і порівняльний аналіз науково-технічної літератури, систематизація сучасних підходів; практичні – експериментальне тестування на реальних (наприклад, NYC Taxi) та синтетичних датасетах, використання бібліотек Pandas, Dask, Vaex, Polars, NumPy; моніторинг споживання пам’яті (psutil), вимірювання часу виконання (timeit), візуалізація результатів (Matplotlib, Seaborn). Теоретичне значення роботи полягає у систематизації та порівняльній характеристиці сучасних бібліотек і технік оптимізації пам’яті в Python, що розширює уявлення про можливості out-of-core обчислень та паралельної обробки даних у data science. Практичне значення роботи полягає у розробці чітких, готових до впровадження рекомендацій і прикладів коду, які дозволяють зменшити споживання RAM на 30–90 % та прискорити обробку в 2–10 разів залежно від типу даних і обраного інструменту. Галузь використання: data science, бізнес-аналітика, машинне навчання, обробка логів, фінансові системи, IoT-аналітика, наукові обчислення – будь-які проєкти, де обсяг даних перевищує доступну оперативну пам’ять.