Logo BSU

Please use this identifier to cite or link to this item: https://elib.bsu.by/handle/123456789/279848
Title: Автоматическое преобразование белорусской речи в текст методами глубокого обучения: магистерская диссертация / Александр Сергеевич Трофимов; БГУ, Факультет прикладной математики и информатики, Кафедра дискретной математики и алгоритмики; науч. рук. Гецевич Ю. С.
Authors: Трофимов, Александр Сергеевич
Keywords: ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика
ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика
Issue Date: 2022
Publisher: БГУ, ФПМИ, Кафедра дискретной математики и алгоритмики
Abstract: Цель работы – построение качественной модели распознавания общей белорусской речи, а также сбор необходимых для этого данных. Объект исследования – является автоматическое распознавание речи. Предмет исследования – автоматическое распознавание общей белорусской речи методами глубокого обучения. В магистерской работе были проанализированы основные подходы к распознаванию речи а также предыдущие эксперименты по построению систем распознавания белорусской речи. Был собран большой корпус начитанных белорусских текстов при участии большого числа дикторов. Была успешно обучена система распознавания речи на основе архитектуры Wav2Vec2 з использованием n-грамной лингвистической модели. Полученная система опубликована на платформе Hugging Face. Также создан и опубликован на платформе Hugging Face демонстрационный веб-интерфейс, который позволяет распознавать белорусскую речь прямо через браузер. Полученную модель можно использовать для создания системы голосового ввода текста, построения голосовых помощников, создания систем автоматизированного обучения белорусскому языку.
URI: https://elib.bsu.by/handle/123456789/279848
Licence: info:eu-repo/semantics/openAccess
Appears in Collections:1-31 81 09 - "Алгоритмы и системы обработки больших объемов информации"

Files in This Item:
File Description SizeFormat 
МД(АСОБД)_Трофимов_2022.pdf1,44 MBAdobe PDFView/Open
Show full item record Google Scholar



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.