A statistical approach to coronavirus classification based on nucleotide distributions

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Видавництво Львівської політехніки
Lviv Politechnic Publishing House

Abstract

Метою цього дослідження є аналіз конкретних геномів, а саме РНК коронавірусів, на основі параметрів, отриманих із розподілу нуклеотидних послідовностей у їхніх РНК. Вірусна РНК була розділена на нуклеотидні послідовності, отримані шляхом зміни однієї нуклеотидної основи (аденін) на пробіл, причому порожні послідовності позначено як x. Для послідовностей побудовано статистичні спектри. Вони показали три чіткі піки, які були послідовними для досліджуваних видів. Розраховано параметри на основі ранґово-частотного розподілу отриманих нуклеотидних послідовностей, довжини послідовностей та деякі інші статистичні параметри. На підставі цих параметрів було визначено головні компоненти, які лягли в основу групування досліджуваних вірусів. Найбільш релевантні параметри сформували модель наївного класифікатора Баєса, що аналізує ймовірність належності вірусу до певної групи вірусів у моделі.
The objective of this study is to analyze specific genomes, namely the RNA of coronaviruses, based on the parameters obtained from the distributions of nucleotide sequences in their RNA. The viral RNA was subjected to distribution based on nucleotide sequences obtained by changing one nucleotide base (adenine) into a “whitespace”, with empty sequences denoted as “x”. Statistical spectra were constructed in such cases. They exhibited three distinct peaks that were consistent across the studied species. Parameters based on the rank–frequency distributions of the obtained nucleotide sequences, sequence lengths, and some other statistical parameters were calculated. Based on these parameters, the principal components were built, which were the basis for the grouping of the studied viruses. The most relevant parameters formed the model of a na¨ıve Bayes classifier, which analyzes the probability of the virus belonging to a certain group of viruses in the model.

Description

Citation

Husiev M. A statistical approach to coronavirus classification based on nucleotide distributions / M. Husiev, A. Rovenchak // Mathematical Modeling and Computing. — Lviv : Lviv Politechnic Publishing House, 2024. — Vol 11. — No 4. — P. 987–994.

Endorsement

Review

Supplemented By

Referenced By