Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/216672
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Качков, Д. И. | |
dc.date.accessioned | 2019-03-12T13:40:18Z | - |
dc.date.available | 2019-03-12T13:40:18Z | - |
dc.date.issued | 2018 | |
dc.identifier.citation | 75-я научная конференция студентов и аспирантов Белорусского государственного университета [Электронный ресурс] : материалы конф. В 3 ч. Ч. 2, Минск, 14–23 мая 2018 г. / Белорус. гос. ун-т, Гл. упр. науки ; редкол.: В. Г. Сафонов (пред.) [и др.]. – Минск : БГУ, 2018. – С. 227-230. | |
dc.identifier.isbn | 978-985-566-658-6; 978-985-566-684-5 (ч. 2) | |
dc.identifier.uri | http://elib.bsu.by/handle/123456789/216672 | - |
dc.description | Факультет прикладной математики и информатики | |
dc.description.abstract | В работе рассматривается Q-learning – один из алгоритмов обучения с подкреплением. Ключевым в алгоритме Q-learning является итеративное построение Q-функции, ставящей в соответствие каждой паре (состояние среды, действие) действительное число – долгосрочный выигрыш, который может быть получен агентом после совершения данного действия в данном состоянии. В статье предложен ряд механизмов, идей и подходов, позволяющий ускорить процесс построения Q-функции. | |
dc.language.iso | ru | |
dc.publisher | Минск : БГУ | |
dc.subject | ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика | |
dc.title | Как считать Q-функцию | |
dc.type | conference paper | |
Располагается в коллекциях: | 2018. Научная конференция студентов и аспирантов БГУ. В трех частях |
Полный текст документа:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
227-230.pdf | 446,66 kB | Adobe PDF | Открыть |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.