Обучение с подкреплением мультиагентных систем

Акула, К. А.

Даты публикации Авторы Заглавия Темы

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ: https://elib.bsu.by/handle/123456789/259883

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.author	Акула, К. А.
dc.date.accessioned	2021-05-25T13:18:37Z	-
dc.date.available	2021-05-25T13:18:37Z	-
dc.date.issued	2020
dc.identifier.citation	77-я научная конференция студентов и аспирантов Белорусского государственного университета [Электронный ресурс] : материалы конф. В 3 ч. Ч. 1, Минск, 11–22 мая 2020 г. / Белорус. гос. ун-т ; редкол.: В. Г. Сафонов (гл. ред.) [и др.]. – Минск : БГУ, 2020. – С. 140-143.
dc.identifier.isbn	978-985-881-077-1; 978-985-881-080-1 (ч. 1)
dc.identifier.uri	https://elib.bsu.by/handle/123456789/259883	-
dc.description	Факультет радиофизики и компьютерных технологий
dc.description.abstract	Исследуются способы машинного обучения с подкреплением. Охарактеризованы алгоритмы на основе метода временных различий для обучения мультиагентных систем. Для проведения вычислительного эксперимента для трех алгоритмов – SARSA, Q-learning и Deep-Q-learning – разработаны компьютерные программы. Проведен сравнительный анализ применения указанных алгоритмов по критерию значения вознаграждения в зависимости от числа итераций, что позволяет определить оптимальный алгоритм для обучения с подкреплением мультиагентных систем
dc.language.iso	ru
dc.publisher	Минск : БГУ
dc.subject	ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Кибернетика
dc.title	Обучение с подкреплением мультиагентных систем
dc.type	conference paper
Располагается в коллекциях:	2020. Научная конференция студентов и аспирантов БГУ. В трех частях

Полный текст документа:

Файл	Описание	Размер	Формат
140-143.pdf		558,65 kB	Adobe PDF	Открыть

Показать базовое описание документа Статистика Google Scholar

Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.