Please use this identifier to cite or link to this item:
https://elib.bsu.by/handle/123456789/333552
Title: | Алгоритмы обработки несбалансированных данных: дипломная работа / Екатерина Клицунова; БГУ, Факультет прикладной математики и информатики, Кафедра информационных систем управления; науч. рук. Лукашевич М. М. |
Authors: | Клицунова, Екатерина |
Keywords: | ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Информатика |
Issue Date: | 2025 |
Publisher: | БГУ, ФПМИ, Кафедра информационных систем управления |
Abstract: | РЕФЕРАТ Структура и объём дипломной работы 49 страниц, 16 рисунков, 8 таблиц, 5 приложений, 26 источников Ключевые слова: НЕСБАЛАНСИРОВАННЫЕ ДАННЫЕ, МЕТОДЫ БАЛАНСИРОВКИ ДАННЫХ, МАШИННОЕ ОБУЧЕНИЕ, КЛАССИФИКАЦИЯ, ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ, РЕКОМЕНДАТЕЛЬНАЯ СИСТЕМА, ВЕБ-ПРИЛОЖЕНИЕ Объект исследования – алгоритмы и методы машинного обучения, предназначенные для работы с несбалансированными наборами данных. Предмет исследования – влияние методов балансировки данных на качество моделей классификации при несбалансированности данных. Цель исследования – провести экспериментальное исследование влияния методов балансировки данных на эффективность классических моделей классификации. Разработать приложение, рекомендующее алгоритмы балансировки в зависимости от размера набора данных и величины дисбаланса, и дающее возможность провести балансировку данных. Методы исследования: сравнительный анализ алгоритмов для работы с несбалансированными данными, постановка и реализация эксперимента, проектирование модели ранжирования для рекомендации алгоритмов балансировки данных, проектирование и разработка приложения. Полученные результаты и их новизна: оценено влияние методов балансировки данных и подбора гиперпараметров на качество модели в задачах классификации. Разработано веб-приложение с моделью рекомендаций методов балансировки. Новизна работы заключается в интеграции алгоритма подбора методов балансировки с практической реализацией программного инструмента, позволяющего применять стандартные методы балансировки данных. Достоверность материалов и результатов дипломной работы. Автор работы подтверждает, что приведенный в ней расчетно-аналитический материал правильно и объективно отражает состояние объекта исследования. Все заимствованные из источников теоретические, методологические и методические положения и концепции сопровождаются ссылками на их авторов. Область практического применения: оптимизация выбора подходящих методов работы с несбалансированными данными для конкретных практических задач в сферах, где данная проблема является критической: медицине, биоинформатике, инженерии, безопасности, бизнесе и других. |
URI: | https://elib.bsu.by/handle/123456789/333552 |
Licence: | info:eu-repo/semantics/openAccess |
Appears in Collections: | Лучшие дипломные проекты, защищенные студентами факультета прикладной математики и информатики. 2025 |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ДР_ИНФ_КлицуноваЕ_2025.pdf | 2,22 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.