Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/333846| Title: | Алгоритмы обучения с подкреплением в онлайн-аукционах: аннотация к дипломной работе / Плескач Тимофей Юрьевич; БГУ, механико-математический факультет, кафедра теории функций; науч. рук.: С.А. Бондарев |
| Authors: | Плескач, Тимофей Юрьевич |
| Keywords: | ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика |
| Issue Date: | 2025 |
| Publisher: | Минск, БГУ |
| Abstract: | В дипломной работе изучается применение алгоритмов обучения с под- креплением в онлайн-аукционах. Особое внимание уделяется моделям мно- горукого бандита и стратегиям выбора ставок. Доказаны неравенства, огра- ничивающие псевдопотери. Представлены результаты экспериментов, демон- стрирующие эффективность адаптивных алгоритмов в динамической среде аукционов. Как результат, было реализована стратегия оптимальных ставок на языке программирования Python |
| Abstract (in another language): | The thesis study studies applications of reinforcement learning algorithms in online-auctions. Special attention is paid to multi-armed bandit models and bid selection policies. Inequalities bounding pseudo-regret are proven. Experiment results demonstrating e ectiveness of adaptive algorithms in a dynamic auctions environment are presented. As a result, an optimal bidding strategy was implemented in Python programming language. |
| URI: | https://elib.bsu.by/handle/123456789/333846 |
| Licence: | info:eu-repo/semantics/openAccess |
| Appears in Collections: | Математика (по направлениям). 2025 |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Плескач_resume.pdf | 148,9 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

