Logo BSU

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ: https://elib.bsu.by/handle/123456789/334796
Заглавие документа: Алгоритмы обработки несбалансированных данных: дипломная работа / Екатерина Клицунова; БГУ, Факультет прикладной математики и информатики, Кафедра информационных систем управления; науч. рук. Лукашевич М. М.
Авторы: Клицунова, Екатерина
Тема: ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика
ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Информатика
Дата публикации: 2025
Издатель: БГУ, ФПМИ, Кафедра информационных систем управления
Аннотация: РЕФЕРАТ Структура и объём дипломной работы 49 страниц, 16 рисунков, 8 таблиц, 5 приложений, 26 источников Ключевые слова: НЕСБАЛАНСИРОВАННЫЕ ДАННЫЕ, МЕТОДЫ БАЛАН- СИРОВКИ ДАННЫХ, МАШИННОЕ ОБУЧЕНИЕ, КЛАССИФИКАЦИЯ, ЭКС- ПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ, РЕКОМЕНДАТЕЛЬНАЯ СИСТЕМА, ВЕБ-ПРИЛОЖЕНИЕ Объект исследования – алгоритмы и методы машинного обучения, пред- назначенные для работы с несбалансированными наборами данных. Предмет исследования – влияние методов балансировки данных на каче- ство моделей классификации при несбалансированности данных. Цель исследования – провести экспериментальное исследование влияния методов балансировки данных на эффективность классических моделей класси- фикации. Разработать приложение, рекомендующее алгоритмы балансировки в зависимости от размера набора данных и величины дисбаланса, и дающее воз- можность провести балансировку данных. Методы исследования: сравнительный анализ алгоритмов для работы с несбалансированными данными, постановка и реализация эксперимента, проек- тирование модели ранжирования для рекомендации алгоритмов балансировки данных, проектирование и разработка приложения. Полученные результаты и их новизна: оценено влияние методов балан- сировки данных и подбора гиперпараметров на качество модели в задачах клас- сификации. Разработано веб-приложение с моделью рекомендаций методов ба- лансировки. Новизна работы заключается в интеграции алгоритма подбора ме- тодов балансировки с практической реализацией программного инструмента, позволяющего применять стандартные методы балансировки данных. Достоверность материалов и результатов дипломной работы. Автор работы подтверждает, что приведенный в ней расчетно-аналитический материал правильно и объективно отражает состояние объекта исследования. Все заим- ствованные из источников теоретические, методологические и методические по- ложения и концепции сопровождаются ссылками на их авторов. Область практического применения: оптимизация выбора подходящих методов работы с несбалансированными данными для конкретных практических задач в сферах, где данная проблема является критической: медицине, биоинформатике, инженерии, безопасности, бизнесе и других.
URI документа: https://elib.bsu.by/handle/123456789/334796
Лицензия: info:eu-repo/semantics/openAccess
Располагается в коллекциях:Лучшие дипломные проекты, защищенные студентами факультета прикладной математики и информатики. 2025

Полный текст документа:
Файл Описание РазмерФормат 
ДР_ИНФ_КлицуноваЕ_2025.pdf2,22 MBAdobe PDFОткрыть
Показать полное описание документа Статистика Google Scholar



Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.