Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/333846
Заглавие документа: | Алгоритмы обучения с подкреплением в онлайн-аукционах: аннотация к дипломной работе / Плескач Тимофей Юрьевич; БГУ, механико-математический факультет, кафедра теории функций; науч. рук.: С.А. Бондарев |
Авторы: | Плескач, Тимофей Юрьевич |
Тема: | ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика |
Дата публикации: | 2024 |
Издатель: | Минск, БГУ |
Аннотация: | В дипломной работе изучается применение алгоритмов обучения с под- креплением в онлайн-аукционах. Особое внимание уделяется моделям мно- горукого бандита и стратегиям выбора ставок. Доказаны неравенства, огра- ничивающие псевдопотери. Представлены результаты экспериментов, демон- стрирующие эффективность адаптивных алгоритмов в динамической среде аукционов. Как результат, было реализована стратегия оптимальных ставок на языке программирования Python |
Аннотация (на другом языке): | The thesis study studies applications of reinforcement learning algorithms in online-auctions. Special attention is paid to multi-armed bandit models and bid selection policies. Inequalities bounding pseudo-regret are proven. Experiment results demonstrating e ectiveness of adaptive algorithms in a dynamic auctions environment are presented. As a result, an optimal bidding strategy was implemented in Python programming language. |
URI документа: | https://elib.bsu.by/handle/123456789/333846 |
Лицензия: | info:eu-repo/semantics/openAccess |
Располагается в коллекциях: | Математика (по направлениям). 2024 |
Полный текст документа:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
Плескач_resume.pdf | 148,9 kB | Adobe PDF | Открыть |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.