Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/216672
Заглавие документа: | Как считать Q-функцию |
Авторы: | Качков, Д. И. |
Тема: | ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика |
Дата публикации: | 2018 |
Издатель: | Минск : БГУ |
Библиографическое описание источника: | 75-я научная конференция студентов и аспирантов Белорусского государственного университета [Электронный ресурс] : материалы конф. В 3 ч. Ч. 2, Минск, 14–23 мая 2018 г. / Белорус. гос. ун-т, Гл. упр. науки ; редкол.: В. Г. Сафонов (пред.) [и др.]. – Минск : БГУ, 2018. – С. 227-230. |
Аннотация: | В работе рассматривается Q-learning – один из алгоритмов обучения с подкреплением. Ключевым в алгоритме Q-learning является итеративное построение Q-функции, ставящей в соответствие каждой паре (состояние среды, действие) действительное число – долгосрочный выигрыш, который может быть получен агентом после совершения данного действия в данном состоянии. В статье предложен ряд механизмов, идей и подходов, позволяющий ускорить процесс построения Q-функции. |
Доп. сведения: | Факультет прикладной математики и информатики |
URI документа: | http://elib.bsu.by/handle/123456789/216672 |
ISBN: | 978-985-566-658-6; 978-985-566-684-5 (ч. 2) |
Располагается в коллекциях: | 2018. Научная конференция студентов и аспирантов БГУ. В трех частях |
Полный текст документа:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
227-230.pdf | 446,66 kB | Adobe PDF | Открыть |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.