Logo BSU

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ: https://elib.bsu.by/handle/123456789/333846
Заглавие документа: Алгоритмы обучения с подкреплением в онлайн-аукционах: аннотация к дипломной работе / Плескач Тимофей Юрьевич; БГУ, механико-математический факультет, кафедра теории функций; науч. рук.: С.А. Бондарев
Авторы: Плескач, Тимофей Юрьевич
Тема: ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика
Дата публикации: 2024
Издатель: Минск, БГУ
Аннотация: В дипломной работе изучается применение алгоритмов обучения с под- креплением в онлайн-аукционах. Особое внимание уделяется моделям мно- горукого бандита и стратегиям выбора ставок. Доказаны неравенства, огра- ничивающие псевдопотери. Представлены результаты экспериментов, демон- стрирующие эффективность адаптивных алгоритмов в динамической среде аукционов. Как результат, было реализована стратегия оптимальных ставок на языке программирования Python
Аннотация (на другом языке): The thesis study studies applications of reinforcement learning algorithms in online-auctions. Special attention is paid to multi-armed bandit models and bid selection policies. Inequalities bounding pseudo-regret are proven. Experiment results demonstrating e ectiveness of adaptive algorithms in a dynamic auctions environment are presented. As a result, an optimal bidding strategy was implemented in Python programming language.
URI документа: https://elib.bsu.by/handle/123456789/333846
Лицензия: info:eu-repo/semantics/openAccess
Располагается в коллекциях:Математика (по направлениям). 2024

Полный текст документа:
Файл Описание РазмерФормат 
Плескач_resume.pdf148,9 kBAdobe PDFОткрыть
Показать полное описание документа Статистика Google Scholar



Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.