Logo BSU

Please use this identifier to cite or link to this item: https://elib.bsu.by/handle/123456789/216672
Title: Как считать Q-функцию
Authors: Качков, Д. И.
Keywords: ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика
Issue Date: 2018
Publisher: Минск : БГУ
Citation: 75-я научная конференция студентов и аспирантов Белорусского государственного университета [Электронный ресурс] : материалы конф. В 3 ч. Ч. 2, Минск, 14–23 мая 2018 г. / Белорус. гос. ун-т, Гл. упр. науки ; редкол.: В. Г. Сафонов (пред.) [и др.]. – Минск : БГУ, 2018. – С. 227-230.
Abstract: В работе рассматривается Q-learning – один из алгоритмов обучения с подкреплением. Ключевым в алгоритме Q-learning является итеративное построение Q-функции, ставящей в соответствие каждой паре (состояние среды, действие) действительное число – долгосрочный выигрыш, который может быть получен агентом после совершения данного действия в данном состоянии. В статье предложен ряд механизмов, идей и подходов, позволяющий ускорить процесс построения Q-функции.
Description: Факультет прикладной математики и информатики
URI: http://elib.bsu.by/handle/123456789/216672
ISBN: 978-985-566-658-6; 978-985-566-684-5 (ч. 2)
Appears in Collections:2018. Научная конференция студентов и аспирантов БГУ. В трех частях

Files in This Item:
File Description SizeFormat 
227-230.pdf446,66 kBAdobe PDFView/Open
Show full item record Google Scholar



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.