Please use this identifier to cite or link to this item:
https://elib.bsu.by/handle/123456789/222090
Title: | Отбор информативных признаков экзонов генов человека |
Other Titles: | Selecting informative features of human gene exons / A. U. Volkau, M. M. Yatskou, V. V. Grinev |
Authors: | Волков, А. В. Яцков, Н. Н. Гринев, В. В. |
Keywords: | ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Биология |
Issue Date: | 2019 |
Publisher: | Минск : БГУ |
Citation: | Журнал Белорусского государственного университета. Математика. Информатика = Journal of the Belarusian State University. Mathematics and Informatics . - 2019. - № 1. - С. 77-89 |
Abstract: | Рассмотрена задача сокращения размерности пространства признаков экзонов человека с целью определить их генную принадлежность. Для оценки эффективности алгоритмов отбора признаков проведены вычислительные эксперименты на примерах экзонов 14 известных генов человека. Установлено, что экзоны четко разделимы относительно генной принадлежности. Алгоритмы автоматического отбора чувствительны к шумовым признакам и позволяют оценить количество таких признаков. Сокращение числа последних улучшает производительность вычислений и потребление памяти, а также позволяет получать значительно более простые прогностические модели и повышает их интерпретируемость. Показано, что тренировка алгоритмов индуктивного обучения на признаках фланкирующих интронов обеспечивает более высокую предсказательную способность в сравнении с обучением алгоритмов на признаках экзонов. Результаты представленной работы открывают новые возможности для изучения организации генов человека с помощью алгоритмов машинного обучения. |
Abstract (in another language): | Dimensionality reduction of the human gene exon feature space is considered with the aim of gene identification. To evaluate the performance of various feature selection algorithms, computational experiments were carried out using the examples of exons of 14 known human genes. It is proven that exons are clearly separable regarding gene affiliation. Feature selection algorithms are sensitive to noise features and allow to estimate their number. Reducing the number of features improves CPU-time, memory usage as well as reduces the complexity of a model and makes it easier to interpret. Our findings indicate that utilizing of features of flanking intronic sequences leads to better prediction models in comparison with utilizing of exon features. The results of the research provide new opportunities for study of human gene data using machine learning algorithms. |
URI: | http://elib.bsu.by/handle/123456789/222090 |
ISSN: | 1561-834X |
DOI: | https://doi.org/10.33581/2520-6508-2019-1-77-89 |
Licence: | info:eu-repo/semantics/openAccess |
Appears in Collections: | 2019, №1 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.