Навчальний стенд із демонстрацією використання Apache Spark у вирішенні Big Data задач

Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Український державний університет науки і технологій, Дніпро
UKR: Бакалаврська робота виконана на 61 сторінці, містить 12 рисунків, 2 таблиці та 8 використаних джерел. В бакалаврській роботі створено навчальний стенд із демонстрацією використання Apache Spark у вирішенні Big Data задач. У ході написання навчального стенду були отримані навички роботи з фреймворком великих даних Apache Spark. Була створена система, завдяки якій є можливість навчатись даній технології студентам, які хотіли б спробувати себе у якості Big Data розробника. Стенд організовано у вигляді вирішення трьох задач за допомогою різних модулей фреймворку Spark Core, SQL та Spark MLlib. Акцент в інфраструктурі проекту був зроблений на доступність цього стенду на різних системах, а саме Windows 10+ та дистрибутивах Linux (Ubuntu та Debian). Для опису функціональних вимог та архітектури проекту були створені діаграми прецедентів, класів та артефактів до кожної з задач стенду.
ENG: The bachelor's thesis is completed on 61 pages, contains 12 figures, 2 tables and 8 sources used. In the bachelor's thesis, a training stand was created to demonstrate the use of Apache Spark in solving Big Data problems. During the writing of the training stand, the skills of working with the Apache Spark big data framework were acquired. A system that has been created allows students who want to try themselves as a Big Data developer to learn this technology. The stand is organized in the form of solving three tasks using different modules of the Spark Core, SQL and Spark MLlib framework. The emphasis in the project infrastructure was on the availability of this stand on various systems, namely Windows 10+ and Linux distributions (Ubuntu and Debian). To describe the functional requirements and architecture of the project, were created diagrams of precedents, classes and artifacts for each of the tasks of the stand.
дипломна робота, кластеризація, алгоритм K-середніх, Big Data, Apache Spark (Core, SQL, MLlib), Map Reduce, Spark Configuration, Spark Context, Spark In Memory Processing, SparkSession, Dataframe and Dataset, RDD, Java 11, Tuple, Maven, Spring Boot, MongoDB-Spark-Connector, MongoDB, URI, Bson, Docker Compose, Docker, КІТ
Котенко Р. О. Навчальний стенд із демонстрацією використання Apache Spark у вирішенні Big Data задач : дипломна робота на здобуття кваліфікаційного ступеня бакалавра : спец. 121 – Інженерія програмного забезпечення / наук. керівник О. П. Іванов ; Укр. держ. ун-т науки і технологій. Дніпро, 2022. 61 с.