Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/333846| Заглавие документа: | Алгоритмы обучения с подкреплением в онлайн-аукционах: аннотация к дипломной работе / Плескач Тимофей Юрьевич; БГУ, механико-математический факультет, кафедра теории функций; науч. рук.: С.А. Бондарев |
| Авторы: | Плескач, Тимофей Юрьевич |
| Тема: | ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика |
| Дата публикации: | 2025 |
| Издатель: | Минск, БГУ |
| Аннотация: | В дипломной работе изучается применение алгоритмов обучения с под- креплением в онлайн-аукционах. Особое внимание уделяется моделям мно- горукого бандита и стратегиям выбора ставок. Доказаны неравенства, огра- ничивающие псевдопотери. Представлены результаты экспериментов, демон- стрирующие эффективность адаптивных алгоритмов в динамической среде аукционов. Как результат, было реализована стратегия оптимальных ставок на языке программирования Python |
| Аннотация (на другом языке): | The thesis study studies applications of reinforcement learning algorithms in online-auctions. Special attention is paid to multi-armed bandit models and bid selection policies. Inequalities bounding pseudo-regret are proven. Experiment results demonstrating e ectiveness of adaptive algorithms in a dynamic auctions environment are presented. As a result, an optimal bidding strategy was implemented in Python programming language. |
| URI документа: | https://elib.bsu.by/handle/123456789/333846 |
| Лицензия: | info:eu-repo/semantics/openAccess |
| Располагается в коллекциях: | Математика (по направлениям). 2025 |
Полный текст документа:
| Файл | Описание | Размер | Формат | |
|---|---|---|---|---|
| Плескач_resume.pdf | 148,9 kB | Adobe PDF | Открыть |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.

