Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/216672| Заглавие документа: | Как считать Q-функцию |
| Авторы: | Качков, Д. И. |
| Тема: | ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика |
| Дата публикации: | 2018 |
| Издатель: | Минск : БГУ |
| Библиографическое описание источника: | 75-я научная конференция студентов и аспирантов Белорусского государственного университета [Электронный ресурс] : материалы конф. В 3 ч. Ч. 2, Минск, 14–23 мая 2018 г. / Белорус. гос. ун-т, Гл. упр. науки ; редкол.: В. Г. Сафонов (пред.) [и др.]. – Минск : БГУ, 2018. – С. 227-230. |
| Аннотация: | В работе рассматривается Q-learning – один из алгоритмов обучения с подкреплением. Ключевым в алгоритме Q-learning является итеративное построение Q-функции, ставящей в соответствие каждой паре (состояние среды, действие) действительное число – долгосрочный выигрыш, который может быть получен агентом после совершения данного действия в данном состоянии. В статье предложен ряд механизмов, идей и подходов, позволяющий ускорить процесс построения Q-функции. |
| Доп. сведения: | Факультет прикладной математики и информатики |
| URI документа: | http://elib.bsu.by/handle/123456789/216672 |
| ISBN: | 978-985-566-658-6; 978-985-566-684-5 (ч. 2) |
| Располагается в коллекциях: | 2018. Научная конференция студентов и аспирантов БГУ. В трех частях |
Полный текст документа:
| Файл | Описание | Размер | Формат | |
|---|---|---|---|---|
| 227-230.pdf | 446,66 kB | Adobe PDF | Открыть |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.

