Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/318078
Заглавие документа: | Simulation modelling of single nucleotide genetic polymorphisms |
Другое заглавие: | Имитационное моделирование однонуклеотидных генетических полиморфизмов / Н. Н. Яцков, В. В. Апанасович, В. В. Гринев |
Авторы: | Yatskou, M. M. Apanasovich, V. V. Grinev, V. V. |
Тема: | ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Биология ЭБ БГУ::МЕЖОТРАСЛЕВЫЕ ПРОБЛЕМЫ::Статистика |
Дата публикации: | 2024 |
Издатель: | Минск : БГУ |
Библиографическое описание источника: | Журнал Белорусского государственного университета. Математика. Информатика = Journal of the Belarusian State University. Mathematics and Informatics. – 2024. – № 2. – С. 104-112 |
Аннотация: | We propose an approach for the identification of single nucleotide polymorphisms (SNPs) in DNA sequences, based on the simulation modelling of sites of single nucleotides using the generation of random events according to the beta or normal distributions, the parameters of which are estimated from the available experimental data. The developed approach improves the accuracy of determining SNPs in DNA molecules and permits to investigate the reliability of specific experiments as well as to estimate the errors of determination of the parameters obtained in real experimental conditions. The verification of the simulation model and analysis methods is carried out on a set of reference human genomic DNA sequencing data provided by the Genome in a Bottle Consortium. The comparative analysis of the existing statistical SNP identification algorithms and machine learning methods, trained on the simulated data from the genomic sequencing of human DNA molecules, is carried out. The best results are obtained for machine learning models, in which the accuracy of SNP identification is 2–5 % higher than for classical statistical methods. |
Аннотация (на другом языке): | Для идентификации однонуклеотидных полиморфизмов в последовательностях молекул ДНК предложен подход, основанный на имитационном моделировании сайтов отдельных нуклеотидов с использованием генерации случайных событий по бета-распределению или нормальному распределению, параметры которых оцениваются на базе имеющихся экспериментальных данных. Разработанный подход повышает точность определения однонуклеотидных полиморфизмов в молекулах ДНК и позволяет исследовать достоверность результатов отдельных экспериментов и оценить точность параметров, полученных в реальных условиях проведения эксперимента. Имитационная модель и методы анализа верифицированы на наборе данных геномного секвенирования молекул ДНК человека, предоставленных консорциумом GIAB (Genome in a Bottle Consortium). Выполнен сравнительный анализ известных статистических алгоритмов идентификации однонуклеотидных полиморфизмов и методов машинного обучения, параметры которых настраиваются по смоделированным данным геномного секвенирования молекул ДНК человека. Лучшие результаты получены для моделей машинного обучения, у которых точность идентификации сайтов однонуклеотидных поли морфизмов на 2–5 % выше, чем у классических статистических методов. |
Доп. сведения: | This work was carried out in the framework of the state programme of scientific research «Convergence-2025» (grant No. 3.04.3.1, state registration No. 20211918). = Работа выполнена в рамках государственной программы научных исследований «Конвергенция-2025» (грант № 3.04.3.1, № гос. регистрации 20211918). |
URI документа: | https://elib.bsu.by/handle/123456789/318078 |
ISSN: | 2520-6508 |
Лицензия: | info:eu-repo/semantics/openAccess |
Располагается в коллекциях: | 2024, №2 |
Полный текст документа:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
104-112.pdf | 802,96 kB | Adobe PDF | Открыть |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.