Порівняльний аналіз програмно-апаратного забезпечення алгоритмів глибокого навчання
Journal Title
Journal ISSN
Volume Title
Видавництво Львівської політехніки
Lviv Politechnic Publishing House
Lviv Politechnic Publishing House
Автоматичний переклад, розпізнавання мови та її синтез, розпізнавання об’єктів та навіть
людських емоцій – надзвичайно складні завдання, із якими легко справляються сучасні
смартфони. Їх ефективна реалізація стала можливою завдяки широкому застосуванню
алгоритмів штучного інтелекту та машинного навчання, серед яких надзвичайно популярними є
штучні нейронні мережі та алгоритми глибокого навчання. Ці алгоритми проникли в усі галузі
індустрії, а їх стрімкий розвиток неможливий без застосування апаратної акселерації та чіткої
взаємодії між апаратними складовими та програмним забезпеченням. Особливо актуальним це
завдання стає, коли програмне забезпечення, призначене для застосування в хмарах, адаптується
для невеликих за розміром та обчислювальними потужностями вбудованих систем. Статтю
присвячено трьом пунктам, що, відповідно, пов’язані з програмним забезпеченням глибокого
навчання, спеціалізованою апаратурою на основі GPU та перспективами побудови акселераторів
для алгоритмів глибокого навчання на основі програмованих логічних матриць. У роботі
проведено порівняльний аналіз найпопулярніших програмних фреймворків, таких як Caffe,
Theano, Torch, MXNet, Tensorflow, Neon, CNTK. Описано переваги GPU-рішень на основі CUDA і
cuDNN. Розглянуто перспективи FPGA як високошвидкісних та енергоефективних рішень для
розроблення алгоритмів глибокого навчання, особливо у поєднанні з мовою OpenCL.
The automated translation, speech recognition and synthesis, object detection as well as emotion recognition are well known complex tasks that modern smartphone can solve. It became possible with intensive usage of algorithms of Artificial Intelligence and Machine Learning. Most popular now are implementations of deep neural networks and deep learning algorithms. Such algorithms are widely used in all verticals and need hardware accelerators as well as deep cooperation between both software and hardware parts. The mentioned task became very actual during embedding of cloud-based algorithms into systems with limited computing capabilities, small physical size, and extremely low power consumption. The aim of this paper is to compare existing software and hardware solutions dedicated to the development of artificial neural networks and deep learning applications. The paper is focused on three topics related to deep learning software frameworks, specialized GPU-based hardware, and prospects of deep learning acceleration using FPGA. The most popular software frameworks, such as Caffe, Theano, Torch, MXNet, Tensorflow, Neon, CNTK have been compared and analyzed in the paper. Advantages of GPU solutions based on CUDA and cuDNN frameworks have been described. Prospects of FPGA as high-speed and power-efficient solutions for deep learning algorithm design, especially in terms of combination with OpenCL language have been discussed in the paper.
The automated translation, speech recognition and synthesis, object detection as well as emotion recognition are well known complex tasks that modern smartphone can solve. It became possible with intensive usage of algorithms of Artificial Intelligence and Machine Learning. Most popular now are implementations of deep neural networks and deep learning algorithms. Such algorithms are widely used in all verticals and need hardware accelerators as well as deep cooperation between both software and hardware parts. The mentioned task became very actual during embedding of cloud-based algorithms into systems with limited computing capabilities, small physical size, and extremely low power consumption. The aim of this paper is to compare existing software and hardware solutions dedicated to the development of artificial neural networks and deep learning applications. The paper is focused on three topics related to deep learning software frameworks, specialized GPU-based hardware, and prospects of deep learning acceleration using FPGA. The most popular software frameworks, such as Caffe, Theano, Torch, MXNet, Tensorflow, Neon, CNTK have been compared and analyzed in the paper. Advantages of GPU solutions based on CUDA and cuDNN frameworks have been described. Prospects of FPGA as high-speed and power-efficient solutions for deep learning algorithm design, especially in terms of combination with OpenCL language have been discussed in the paper.
штучний інтелект, алгоритми глибокого навчання, штучні нейронні мережі, програмні рішення, artificial intelligence, deep learning algorithms, artificial neural networks, software solutions
Хома Ю. В. Порівняльний аналіз програмно-апаратного забезпечення алгоритмів глибокого навчання / Ю. В. Хома, А. Я. Бенч // Комп’ютерні системи та мережі. — Львів : Видавництво Львівської політехніки, 2019. — Том 1. — № 1. — С. 97–102.