Logo BSU

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ: https://elib.bsu.by/handle/123456789/216672
Заглавие документа: Как считать Q-функцию
Авторы: Качков, Д. И.
Тема: ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика
Дата публикации: 2018
Издатель: Минск : БГУ
Библиографическое описание источника: 75-я научная конференция студентов и аспирантов Белорусского государственного университета [Электронный ресурс] : материалы конф. В 3 ч. Ч. 2, Минск, 14–23 мая 2018 г. / Белорус. гос. ун-т, Гл. упр. науки ; редкол.: В. Г. Сафонов (пред.) [и др.]. – Минск : БГУ, 2018. – С. 227-230.
Аннотация: В работе рассматривается Q-learning – один из алгоритмов обучения с подкреплением. Ключевым в алгоритме Q-learning является итеративное построение Q-функции, ставящей в соответствие каждой паре (состояние среды, действие) действительное число – долгосрочный выигрыш, который может быть получен агентом после совершения данного действия в данном состоянии. В статье предложен ряд механизмов, идей и подходов, позволяющий ускорить процесс построения Q-функции.
Доп. сведения: Факультет прикладной математики и информатики
URI документа: http://elib.bsu.by/handle/123456789/216672
ISBN: 978-985-566-658-6; 978-985-566-684-5 (ч. 2)
Располагается в коллекциях:2018. Научная конференция студентов и аспирантов БГУ. В трех частях

Полный текст документа:
Файл Описание РазмерФормат 
227-230.pdf446,66 kBAdobe PDFОткрыть
Показать полное описание документа Статистика Google Scholar



Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.