Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/318073
Заглавие документа: | Использование сверточных вейвлет-блоков в задаче классификации изображений |
Другое заглавие: | Convolutional wavelet blocks in image classification / U. A. Varabei, A. E. Malevich |
Авторы: | Воробей, В. А. Малевич, А. Э. |
Тема: | ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика |
Дата публикации: | 2024 |
Издатель: | Минск : БГУ |
Библиографическое описание источника: | Журнал Белорусского государственного университета. Математика. Информатика = Journal of the Belarusian State University. Mathematics and Informatics. – 2024. – № 2. – С. 93-103 |
Аннотация: | На примере задачи классификации изображений и вейвлет-семейства CDF-9/7 показано, как можно внедрить дискретное вейвлет-преобразование в модель компьютерного зрения, сохранив возможность ее обучения методом обратного распространения ошибки. Предложен и успешно встроен в ряд моделей нейронных сетей сверточный вейвлет-блок, который сочетает в себе обработку признаков входного сигнала на нескольких уровнях вейвлет-разложения и позволяет уменьшить исходный размер модели на 30 – 40 %, обеспечивая при этом сопоставимое качество. Продемонстрирована возможность эффективно выполнять дискретное вейвлет-преобразование на графическом процессоре при использовании лифтинг-схемы. Реализация вейвлет-преобразования построена на поэлементных операциях сложения и умножения, что позволяет при необходимости экспортировать обученную модель в требуемый формат для запуска на новых данных без дополнительных сложностей. В качестве базовых моделей использованы архитектуры ResNetV2-50, MobileNetV2 и EfficientNetV2-B0. Для проведения экспериментов подготовлен набор данных на основе подвыборки категорий датасета LSUN. |
Аннотация (на другом языке): | In this paper, based on an image classification problem and wavelet family CDF-9/7, it is shown how to incorporate discrete wavelet transform into a computer vision model, while maintaining the ability of its training with the backpropagation method. A convolutional wavelet block, that extracts features at different levels of decomposition of the incoming signal, is proposed and successfully integrated into a set of neural network models. The blocks implemented allow to reduce the original model size by 30 – 40 %, while maintaining comparable quality in terms of metric. An effective method for evaluation of discrete wavelet transform on graphics processing unit with lifting scheme is presented. The implementation of wavelet blocks uses element-wise operations of additions and multiplications, thus allowing a simple export of a trained model into one of desired formats for running on new data. ResNetV2-50, MobileNetV2 and EfficientNetV2-B0 architectures are used as the basis models. A new dataset, which is based on a set of categories of LSUN dataset, is constructed for conducting experiments. |
URI документа: | https://elib.bsu.by/handle/123456789/318073 |
ISSN: | 2520-6508 |
Лицензия: | info:eu-repo/semantics/openAccess |
Располагается в коллекциях: | 2024, №2 |
Полный текст документа:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
93-103.pdf | 2,86 MB | Adobe PDF | Открыть |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.