Logo BSU

Please use this identifier to cite or link to this item: https://elib.bsu.by/handle/123456789/318078
Full metadata record
DC FieldValueLanguage
dc.contributor.authorYatskou, M. M.-
dc.contributor.authorApanasovich, V. V.-
dc.contributor.authorGrinev, V. V.-
dc.date.accessioned2024-09-04T08:08:33Z-
dc.date.available2024-09-04T08:08:33Z-
dc.date.issued2024-
dc.identifier.citationЖурнал Белорусского государственного университета. Математика. Информатика = Journal of the Belarusian State University. Mathematics and Informatics. – 2024. – № 2. – С. 104-112ru
dc.identifier.issn2520-6508-
dc.identifier.urihttps://elib.bsu.by/handle/123456789/318078-
dc.descriptionThis work was carried out in the framework of the state programme of scientific research «Convergence-2025» (grant No. 3.04.3.1, state registration No. 20211918). = Работа выполнена в рамках государственной программы научных исследований «Конвергенция-2025» (грант № 3.04.3.1, № гос. регистрации 20211918).ru
dc.description.abstractWe propose an approach for the identification of single nucleotide polymorphisms (SNPs) in DNA sequences, based on the simulation modelling of sites of single nucleotides using the generation of random events according to the beta or normal distributions, the parameters of which are estimated from the available experimental data. The developed approach improves the accuracy of determining SNPs in DNA molecules and permits to investigate the reliability of specific experiments as well as to estimate the errors of determination of the parameters obtained in real experimental conditions. The verification of the simulation model and analysis methods is carried out on a set of reference human genomic DNA sequencing data provided by the Genome in a Bottle Consortium. The comparative analysis of the existing statistical SNP identification algorithms and machine learning methods, trained on the simulated data from the genomic sequencing of human DNA molecules, is carried out. The best results are obtained for machine learning models, in which the accuracy of SNP identification is 2–5 % higher than for classical statistical methods.ru
dc.language.isoenru
dc.publisherМинск : БГУru
dc.rightsinfo:eu-repo/semantics/openAccessru
dc.subjectЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатикаru
dc.subjectЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Биологияru
dc.subjectЭБ БГУ::МЕЖОТРАСЛЕВЫЕ ПРОБЛЕМЫ::Статистикаru
dc.titleSimulation modelling of single nucleotide genetic polymorphismsru
dc.title.alternativeИмитационное моделирование однонуклеотидных генетических полиморфизмов / Н. Н. Яцков, В. В. Апанасович, В. В. Гриневru
dc.typearticleru
dc.rights.licenseCC BY 4.0ru
dc.description.alternativeДля идентификации однонуклеотидных полиморфизмов в последовательностях молекул ДНК предложен подход, основанный на имитационном моделировании сайтов отдельных нуклеотидов с использованием генерации случайных событий по бета-распределению или нормальному распределению, параметры которых оцениваются на базе имеющихся экспериментальных данных. Разработанный подход повышает точность определения однонуклеотидных полиморфизмов в молекулах ДНК и позволяет исследовать достоверность результатов отдельных экспериментов и оценить точность параметров, полученных в реальных условиях проведения эксперимента. Имитационная модель и методы анализа верифицированы на наборе данных геномного секвенирования молекул ДНК человека, предоставленных консорциумом GIAB (Genome in a Bottle Consortium). Выполнен сравнительный анализ известных статистических алгоритмов идентификации однонуклеотидных полиморфизмов и методов машинного обучения, параметры которых настраиваются по смоделированным данным геномного секвенирования молекул ДНК человека. Лучшие результаты получены для моделей машинного обучения, у которых точность идентификации сайтов однонуклеотидных поли морфизмов на 2–5 % выше, чем у классических статистических методов.ru
Appears in Collections:2024, №2

Files in This Item:
File Description SizeFormat 
104-112.pdf802,96 kBAdobe PDFView/Open
Show simple item record Google Scholar



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.