Розроблення та впровадження розподіленої обчислювальної системи для високопродуктивних обчислень
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Львівська політехніка"
Abstract
Сучасні обчислювальні системи для високопродуктивних обчислень
можна побудувати з недорогих споживчих компонентів, що надає широкі
можливості для проведення досліджень, симуляцій та навчальних експериментів
у звичайних академічних установах, без потреби у мільйонних інвестиціях.
Побудова таких систем — актуальна задача як з практичної, так і з дослідницької
точки зору, що дає змогу одночасно вивчити принципи паралельних обчислень,
оптимізації архітектур, мережевої взаємодії та програмного забезпечення.
Об’єктом дослідження у бакалаврській роботі є процеси організації
розподілених обчислень у системах високопродуктивного класу (HPC).
Предметом дослідження виступають інструменти та методи побудови
кластерних систем, налаштування інфраструктури для запуску паралельних
задач і оцінювання ефективності їх виконання.
У роботі створено кластерну обчислювальну систему на основі
бюджетного апаратного забезпечення. Проведено налаштування мережевої
взаємодії, файлової системи, аутентифікації, планувальника задач (Slurm),
бібліотек для паралельних обчислень (MPI, PETSc, FenicsX), а також
інструментів моніторингу та профілювання (Prometheus, Grafana, perf).
Реалізовано та протестовано низку задач: синтетичні тести продуктивності,
чисельні алгоритми та приклади криптографічної обробки даних.
Проведено аналіз масштабованості, впливу розподілу навантаження між
вузлами, продуктивності пам’яті та мережі, надано рекомендації щодо
використання такої системи в наукових або освітніх цілях.
Загальний обсяг роботи: 89 сторінок, 23 рисунки, 28 посилань.
Modern computing systems for high-performance computing (HPC) can be built using affordable consumer-grade components, enabling a wide range of research, simulation, and educational experiments within academic institutions—without the need for multi-million-dollar investments. The design and implementation of such systems is a highly relevant task from both practical and scientific perspectives, offering an opportunity to explore parallel computing principles, architecture optimization, network communication, and software deployment. The object of research in this bachelor’s thesis is the organization of distributed computing processes in high-performance computing systems. The subject of research includes the tools and methods for building cluster systems, configuring infrastructure for launching parallel applications, and evaluating execution efficiency. This work presents the creation of a cluster computing system based on budget hardware. It covers the configuration of network communication, a shared file system, authentication mechanisms, job scheduling (Slurm), parallel computing libraries (MPI, PETSc, FenicsX), and monitoring and profiling tools (Prometheus, Grafana, perf). A number of computational tasks have been implemented and tested, including synthetic benchmarks, numerical algorithms, and cryptographic data processing examples. Scalability, workload distribution, memory and network performance have been analyzed, and recommendations are provided for using such a system in research or educational settings. Total volume of the work: 89 pages, 23 figures, 28 references.
Modern computing systems for high-performance computing (HPC) can be built using affordable consumer-grade components, enabling a wide range of research, simulation, and educational experiments within academic institutions—without the need for multi-million-dollar investments. The design and implementation of such systems is a highly relevant task from both practical and scientific perspectives, offering an opportunity to explore parallel computing principles, architecture optimization, network communication, and software deployment. The object of research in this bachelor’s thesis is the organization of distributed computing processes in high-performance computing systems. The subject of research includes the tools and methods for building cluster systems, configuring infrastructure for launching parallel applications, and evaluating execution efficiency. This work presents the creation of a cluster computing system based on budget hardware. It covers the configuration of network communication, a shared file system, authentication mechanisms, job scheduling (Slurm), parallel computing libraries (MPI, PETSc, FenicsX), and monitoring and profiling tools (Prometheus, Grafana, perf). A number of computational tasks have been implemented and tested, including synthetic benchmarks, numerical algorithms, and cryptographic data processing examples. Scalability, workload distribution, memory and network performance have been analyzed, and recommendations are provided for using such a system in research or educational settings. Total volume of the work: 89 pages, 23 figures, 28 references.
Description
Keywords
6.122.00.00, високопродуктивні обчислення, кластер, паралельне
програмування, MPI, SLURM, PETSc, FenicsX, Prometheus, Grafana, моніторинг, розподілені обчислення, профілювання, STREAM, OSU benchmarks, логування, хешування, шифрування.
Перелік використаних джерел:
?
?
?
?
Denning, P. J., & Lewis, T. G. (2017, January 1). Exponential laws of
computing growth. Communications of the ACM, 60(1), 54–65.
https://cacm.acm.org/research/exponential-laws-of-computing-growth/
Radulovic, M. (2019). Memory bandwidth and latency in HPC: System
requirements and performance impact (Doctoral thesis). Universitat
Politecnica
de
https://upcommons.upc.edu/handle/2117/134613
Gropp, W.
(n.d.).
PETSc
https://theartofhpc.com/pcse/petsc-solver.html
Catalunya.
solver.
The
Art
of
HPC.
Slurm Workload Manager. (2025). Slurm documentation. Retrieved June
5, 2025, from https://slurm.schedmd.com/documentation.html
?
Prometheus Authors. (2025). Prometheus: Monitoring system & time
series
database.
Retrieved
June
https://prometheus.io/docs/introduction/overview/
5, 2025, from, high-performance computing, cluster, parallel programming, MPI, SLURM, PETSc, FenicsX, Prometheus, Grafana, monitoring, distributed computing, profiling, STREAM, OSU benchmarks, logging, hashing, encryption
Citation
Міканов А. В. Розроблення та впровадження розподіленої обчислювальної системи для високопродуктивних обчислень : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „6.122.00.00 — Комп'ютерні науки“ / Артем Віталійович Міканов. — Львів, 2024. — 92 с.