Синтез біомедичних зображень на підставі генеративно-змагальних мереж

Abstract

Досліджено сучасні бази даних біомедичних зображень. Показано, що отримання біомедичних зображень є дорогим і тривалим. Розроблено базу даних зображень передракових і ракових станів молочної залози "BPCI2100". База даних складається із 2100 файлів зображень та MySQL бази даних інформації медичних досліджень (інформація про пацієнта та ознаки зображення). З'ясовано, що ефективним засобом генерування зображень є генеративно-змагальні мережі. Розроблено архітектуру генеративно-змагальної мережі, яка складається із генератора та дискримінатора. Дискримінатором є глибока згорткова нейромережа, на вхід якої надходять кольорові зображення розміром 128×128 пікселів. Ця мережа складається з шести згорткових шарів із розміром вікна 5×5 пікселів. Використано функцію активації типу Leaky ReLU для згорткових шарів. Для останнього шару використано сигмоїдну функцію активації. Генератором є нейромережа, яка складається з повнозв'язного шару та семи деконволюційних шарів з розміром вікна 5×5 пікселів. Для всіх шарів використано функцію активації Leaky ReLU. Останній шар використовує функцію активації гіперболічний тангенс. Для навчання генеративно-змагальної мережі використано засоби Google Cloud Compute Instance. Проведено генерування гістологічних і цитологічних зображень на підставі генеративно-змагальної мережі. Внаслідок значно збільшено навчальну вибірку для класифікаторів. Оригінальні гістологічні зображення поділені на 5 класів, цитологічні зображення – на 4 класи. Розмір оригінальної вибірки для гістологічних зображень становить 91 зображення, для цитологічних - 78 зображень. Навчальні вибірки було розширено до 1000 зображень шляхом афінних перетворень (зсув, масштабування, поворот, відображення). Навчання класифікатора на оригінальній вибірці дало точність ≈84 % для гістологічних та ≈75 % для цитологічних зображень. На вибірці зі згенерованих зображень вихідна точність класифікації становить ≈96,5 % для гістологічних та ≈95,5 для цитологічних зображень. Приріст точності становить ≈12 % для гістологічних та ≈20,5 % для цитологічних зображень. Проведена класифікація гістологічних і цитологічних зображень показала, що приріст точності класифікації становить ≈12 % для гістологічних та ≈20,5 % для цитологічних зображень. Комп'ютерні експерименти показали, що тривалість навчання генеративно-змагальної мережі для гістологічних зображень становить ≈9 год, для цитологічних- ≈8,5 год. Перспективами подальших досліджень є розпаралелення алгоритмів навчання генеративно-змагальних мереж.
Modern databases of biomedical images have been investigated. Biomedical imaging has been shown to be expensive and time consuming. A database of images of precancerous and cancerous breasts "BPCI2100" was developed. The database consists of 2,100 image files and a MySQL database of medical research information (patient information and image features). Generative adversarial networks (GAN) have been found to be an effective means of image generation. The architecture of the generative adversarial network consisting of a generator and a discriminator has been developed.The discriminator is a deep convolutional neural network with color images of 128×128 pixels. This network consists of six convolutional layers with a window size of 5×5 pixels. Leaky ReLU type activation function for convolutional layers is used. The last layer used a sigmoid activation function. The generator is a neural network consisting of a fully connected layer and seven deconvolution layers with a 5×5 pixel window size. Leaky ReLU activation function is used for all layers. The last layer uses the hyperbolic tangent activation function. Google Cloud Compute Instance tools have been used to train the the generative adversarial network. Generation of histological and cytological images on the basis of the generative adversarial network is conducted. As a result, the training sample for classifiers has been significantly increased. Original histological images are divided into 5 classes, cytological images into 4 classes. The original sample size for histological images is 91 images, for cytological images – 78 images. Training samples have been expanded to 1000 images by affine transformations (shift, zoom, rotate, reflection). Studying the classifier on the original sample yielded an accuracy of ≈84 % for histological images and ≈75 % for cytological images, respectively. On the sample of the generated images, the initial classification accuracy was ≈96.5 % for histological images and ≈95.5 for cytological images. The accuracy gain is ≈12 % for histological images and ≈20.5 % for cytological images. The performed classification of histological and cytological images showed that the increase in classification accuracy was ≈12 % for histological images and ≈20.5 % for cytological images. Computer experiments have shown that the time of study of the generative adversarial network for histological images was ≈9 hours, for cytology – ≈ 8.5 hours. Prospects for further research are the parallelization of algorithms for training generative-competitive networks.

Description

Keywords

біомедичні зображення, генеративно-змагальна мережа, згорткова нейронна мережа, архітектура нейронної мережі, генерування зображень, biomedical images, generative adversarial network, convolutional neural network, neural network architecture, image generation

Citation

Синтез біомедичних зображень на підставі генеративно-змагальних мереж / О. М. Березький, П. М. Лящинський, П. М. Лящинський, А. Р. Сухович, Т. М. Долинюк // Український журнал інформаційних технологій. — Львів : Видавництво Львівської політехніки, 2019. — Том 1. — № 1. — С. 35–40.