Logo BSU

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ: https://elib.bsu.by/handle/123456789/259143
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.authorПеченев, Николай Леонидович-
dc.date.accessioned2021-04-28T09:06:32Z-
dc.date.available2021-04-28T09:06:32Z-
dc.date.issued2021-
dc.identifier.urihttps://elib.bsu.by/handle/123456789/259143-
dc.description.abstractОбъект исследования: алгоритмы обучения с подкреплением, нейросетевые модели. Цель работы: изучить методы обучения с подкреплением, разработать и реализовать алгоритмы обучения нейросетевых моделей, провести сравнительный анализ полученных результатов, определить возможные направления работы для улучшения качества работы алгоритмов. Методы исследования: анализ, эксперимент, тестирование, сравнение. В ходе работы были выявлены особенности среды, которые не позволяли обучать агента, а именно: проблемы эксплоринга и разреженной функции награды. Для каждой задачи были разработаны методы их решения. Далее был проведен обзор наиболее распространенных нейросетевых методов обучения, после чего они были применены для обучения агента. Был проведен сравнительный анализ результатов, по итогом которого были предложены возможные направления дальнейших исследований. Результат работы: исследовано состояние проблематики задачи, изучена литература по методам обучения с подкреплением, решены проблемы исследования среды, смоделирована функция награды, построен, обучен и протестирован нейросетевой агент. Область применения – разработка искусственного интеллекта, робототехника, обработка естественного языка.ru
dc.language.isoruru
dc.publisherБГУ, ФПМИ, Кафедра дискретной математики и алгоритмикиru
dc.subjectЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатикаru
dc.subjectЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математикаru
dc.titleИсследование методов обучения с подкреплением на примере компьютерных игр: магистерская диссертация / Николай Леонидович Печенев; БГУ, Факультет прикладной математики и информатики, Кафедра дискретной математики и алгоритмики; науч. рук. Марков С. В.ru
dc.typemaster thesisru
dc.rights.licenseCC BY 4.0ru
Располагается в коллекциях:1-31 81 09 - "Алгоритмы и системы обработки больших объемов информации"

Полный текст документа:
Файл Описание РазмерФормат 
МД(АСОБД)_Печенев_2021.pdf2,2 MBAdobe PDFОткрыть
Показать базовое описание документа Статистика Google Scholar



Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.