Розроблення та впровадження розподіленої обчислювальної системи для високопродуктивних обчислень

Міканов, Артем Віталійович; Mikanov, Artem Vitaliiovych

Розроблення та впровадження розподіленої обчислювальної системи для високопродуктивних обчислень

Files

Primary 2024_61220000_Mikanov_Artem_Vitaliiovych_272137.pdf (6.12 MB)

Date

2024

Authors

Міканов, Артем Віталійович

Mikanov, Artem Vitaliiovych

Publisher

Національний університет "Львівська політехніка"

Abstract

Сучасні обчислювальні системи для високопродуктивних обчислень можна побудувати з недорогих споживчих компонентів, що надає широкі можливості для проведення досліджень, симуляцій та навчальних експериментів у звичайних академічних установах, без потреби у мільйонних інвестиціях. Побудова таких систем — актуальна задача як з практичної, так і з дослідницької точки зору, що дає змогу одночасно вивчити принципи паралельних обчислень, оптимізації архітектур, мережевої взаємодії та програмного забезпечення. Об’єктом дослідження у бакалаврській роботі є процеси організації розподілених обчислень у системах високопродуктивного класу (HPC). Предметом дослідження виступають інструменти та методи побудови кластерних систем, налаштування інфраструктури для запуску паралельних задач і оцінювання ефективності їх виконання. У роботі створено кластерну обчислювальну систему на основі бюджетного апаратного забезпечення. Проведено налаштування мережевої взаємодії, файлової системи, аутентифікації, планувальника задач (Slurm), бібліотек для паралельних обчислень (MPI, PETSc, FenicsX), а також інструментів моніторингу та профілювання (Prometheus, Grafana, perf). Реалізовано та протестовано низку задач: синтетичні тести продуктивності, чисельні алгоритми та приклади криптографічної обробки даних. Проведено аналіз масштабованості, впливу розподілу навантаження між вузлами, продуктивності пам’яті та мережі, надано рекомендації щодо використання такої системи в наукових або освітніх цілях. Загальний обсяг роботи: 89 сторінок, 23 рисунки, 28 посилань.
Modern computing systems for high-performance computing (HPC) can be built using affordable consumer-grade components, enabling a wide range of research, simulation, and educational experiments within academic institutions—without the need for multi-million-dollar investments. The design and implementation of such systems is a highly relevant task from both practical and scientific perspectives, offering an opportunity to explore parallel computing principles, architecture optimization, network communication, and software deployment. The object of research in this bachelor’s thesis is the organization of distributed computing processes in high-performance computing systems. The subject of research includes the tools and methods for building cluster systems, configuring infrastructure for launching parallel applications, and evaluating execution efficiency. This work presents the creation of a cluster computing system based on budget hardware. It covers the configuration of network communication, a shared file system, authentication mechanisms, job scheduling (Slurm), parallel computing libraries (MPI, PETSc, FenicsX), and monitoring and profiling tools (Prometheus, Grafana, perf). A number of computational tasks have been implemented and tested, including synthetic benchmarks, numerical algorithms, and cryptographic data processing examples. Scalability, workload distribution, memory and network performance have been analyzed, and recommendations are provided for using such a system in research or educational settings. Total volume of the work: 89 pages, 23 figures, 28 references.

Keywords

6.122.00.00, високопродуктивні обчислення, кластер, паралельне програмування, MPI, SLURM, PETSc, FenicsX, Prometheus, Grafana, моніторинг, розподілені обчислення, профілювання, STREAM, OSU benchmarks, логування, хешування, шифрування. Перелік використаних джерел: ? ? ? ? Denning, P. J., & Lewis, T. G. (2017, January 1). Exponential laws of computing growth. Communications of the ACM, 60(1), 54–65. https://cacm.acm.org/research/exponential-laws-of-computing-growth/ Radulovic, M. (2019). Memory bandwidth and latency in HPC: System requirements and performance impact (Doctoral thesis). Universitat Politecnica de https://upcommons.upc.edu/handle/2117/134613 Gropp, W. (n.d.). PETSc https://theartofhpc.com/pcse/petsc-solver.html Catalunya. solver. The Art of HPC. Slurm Workload Manager. (2025). Slurm documentation. Retrieved June 5, 2025, from https://slurm.schedmd.com/documentation.html ? Prometheus Authors. (2025). Prometheus: Monitoring system & time series database. Retrieved June https://prometheus.io/docs/introduction/overview/ 5, 2025, from, high-performance computing, cluster, parallel programming, MPI, SLURM, PETSc, FenicsX, Prometheus, Grafana, monitoring, distributed computing, profiling, STREAM, OSU benchmarks, logging, hashing, encryption

Citation

Міканов А. В. Розроблення та впровадження розподіленої обчислювальної системи для високопродуктивних обчислень : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „6.122.00.00 — Комп'ютерні науки“ / Артем Віталійович Міканов. — Львів, 2024. — 92 с.

URI

https://ena.lpnu.ua/handle/ntb/100719

Collections

Бакалаврські роботи

Full item page

Розроблення та впровадження розподіленої обчислювальної системи для високопродуктивних обчислень

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By