Дослідження оптимізації пам’яті в роботі з великими наборами даних засобами Python

dc.contributor.authorКовальчук, Руслан Руслановичuk_UA
dc.date.accessioned2026-03-24T12:17:20Z
dc.date.issued2026
dc.descriptionНАУКОВИЙ КЕРІВНИК: Клименко Іван Вікторовичuk_UA
dc.description.abstractUKR: Кваліфікаційна робота: 136 с., 16 рис., 62 джерела. Об’єкт дослідження: процес обробки великих наборів даних засобами мови програмування Python за умов обмеженого обсягу оперативної пам’яті. Предмет дослідження: методи та інструменти оптимізації споживання оперативної пам’яті при роботі з великими наборами даних у Python (обсягом від кількох гігабайт до терабайт), включаючи бібліотеки Pandas, Dask, Vaex, Polars та техніки chunking, downcasting, стиснення і паралельну обробку. Мета дослідження: розробити та експериментально обґрунтувати комплекс рекомендацій щодо ефективної обробки великих наборів даних у Python з мінімальним використанням оперативної пам’яті без виникнення помилок типу MemoryError. Методи дослідження: теоретичні – огляд і порівняльний аналіз науково-технічної літератури, систематизація сучасних підходів; практичні – експериментальне тестування на реальних (наприклад, NYC Taxi) та синтетичних датасетах, використання бібліотек Pandas, Dask, Vaex, Polars, NumPy; моніторинг споживання пам’яті (psutil), вимірювання часу виконання (timeit), візуалізація результатів (Matplotlib, Seaborn). Теоретичне значення роботи полягає у систематизації та порівняльній характеристиці сучасних бібліотек і технік оптимізації пам’яті в Python, що розширює уявлення про можливості out-of-core обчислень та паралельної обробки даних у data science. Практичне значення роботи полягає у розробці чітких, готових до впровадження рекомендацій і прикладів коду, які дозволяють зменшити споживання RAM на 30–90 % та прискорити обробку в 2–10 разів залежно від типу даних і обраного інструменту. Галузь використання: data science, бізнес-аналітика, машинне навчання, обробка логів, фінансові системи, IoT-аналітика, наукові обчислення – будь-які проєкти, де обсяг даних перевищує доступну оперативну пам’ять.uk_UA
dc.description.abstractENG: The qualification work consists of an introduction, 4 sections, findings, a list of references The qualification work volume is 136 pages long. There are 16 illustrations. Object of research: the process of handling large-scale datasets using Python under limited RAM conditions. Subject of research: methods and tools for optimizing memory consumption when processing large datasets in Python (ranging from several gigabytes to terabytes), including libraries Pandas, Dask, Vaex, Polars, and techniques such as chunking, downcasting, compression, and parallel processing. Purpose of research: to develop and experimentally validate a comprehensive set of recommendations for efficient processing of large datasets in Python with minimal RAM usage while avoiding MemoryError exceptions. Research methods: literature review, comparative analysis, systematization of modern approaches, experimental testing on real-world (e.g., NYC Taxi) and synthetic datasets, implementation using Pandas, Dask, Vaex, Polars, NumPy; memory monitoring (psutil), execution time measurement (timeit), result visualization (Matplotlib, Seaborn). The theoretical significance of the work lies in systematization and comparative evaluation of modern Python libraries and memory optimization techniques, expanding understanding of out-of-core computing and parallel data processing in data science. The practical significance of the work lies in the development of ready-to-use recommendations and code examples that reduce RAM usage by 30–90 % and accelerate processing 2–10 times depending on data type and selected tool. Field of application: data science, business intelligence, machine learning, log processing, financial systems, IoT analytics, scientific computing — any project where data volume exceeds available RAM.en
dc.identifier.citationКовальчук, Р. Р. Дослідження оптимізації пам’яті в роботі з великими наборами даних засобами Python : дипломна робота на здобуття кваліфікаційного ступеня магістра: спец. 121 – Інженерія програмного забезпечення / наук. керівник І. В. Клименко ; Укр. держ. ун-т науки і технологій. Дніпро, 2026. 136 с.uk_UA
dc.identifier.urihttps://crust.ust.edu.ua/handle/123456789/21915
dc.language.isouk
dc.publisherУкраїнський державний університет науки і технологій, Дніпроuk_UA
dc.subjectмагістерська роботаuk_UA
dc.subjectоптимізація пам’ятіuk_UA
dc.subjectвеликі набори данихuk_UA
dc.subjectout-of-core обчисленняen
dc.subjectdasken
dc.subjectvaexen
dc.subjectpolarsen
dc.subjectparqueten
dc.subjectchunkingen
dc.subjectdowncastingen
dc.subjectpythonen
dc.subjectmaster’s thesisen
dc.subjectmemory optimizationen
dc.subjectbig dataen
dc.subjectout-of-core computingen
dc.subjectВКРuk_UA
dc.subjectКІТuk_UA
dc.subject.classificationTECHNOLOGYen
dc.subject.classificationTECHNOLOGY::Information technologyen
dc.titleДослідження оптимізації пам’яті в роботі з великими наборами даних засобами Pythonuk_UA
dc.title.alternativeMemory Optimization Techniques for Processing Large-Scale Datasets in Pythonen
dc.type Master’s Thesisen

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Kovalchuk_Ruslan_2026.pdf
Size:
1.49 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: