Please use this identifier to cite or link to this item:
https://elib.bsu.by/handle/123456789/259883| Title: | Обучение с подкреплением мультиагентных систем |
| Authors: | Акула, К. А. |
| Keywords: | ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Кибернетика |
| Issue Date: | 2020 |
| Publisher: | Минск : БГУ |
| Citation: | 77-я научная конференция студентов и аспирантов Белорусского государственного университета [Электронный ресурс] : материалы конф. В 3 ч. Ч. 1, Минск, 11–22 мая 2020 г. / Белорус. гос. ун-т ; редкол.: В. Г. Сафонов (гл. ред.) [и др.]. – Минск : БГУ, 2020. – С. 140-143. |
| Abstract: | Исследуются способы машинного обучения с подкреплением. Охарактеризованы алгоритмы на основе метода временных различий для обучения мультиагентных систем. Для проведения вычислительного эксперимента для трех алгоритмов – SARSA, Q-learning и Deep-Q-learning – разработаны компьютерные программы. Проведен сравнительный анализ применения указанных алгоритмов по критерию значения вознаграждения в зависимости от числа итераций, что позволяет определить оптимальный алгоритм для обучения с подкреплением мультиагентных систем |
| Description: | Факультет радиофизики и компьютерных технологий |
| URI: | https://elib.bsu.by/handle/123456789/259883 |
| ISBN: | 978-985-881-077-1; 978-985-881-080-1 (ч. 1) |
| Appears in Collections: | 2020. Научная конференция студентов и аспирантов БГУ. В трех частях |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| 140-143.pdf | 558,65 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

