Logo BSU

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ: https://elib.bsu.by/handle/123456789/341145
Заглавие документа: Цвето-ориентированная ResNet с механизмом внимания для задач поиска изображений одежды
Другое заглавие: Color-oriented ResNet with attention mechanism for clothing image search / A. A. Ablameyko, V. V. Sorokina
Авторы: Абламейко, А. А.
Сорокина, В. В.
Тема: ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Кибернетика
Дата публикации: 2025
Издатель: Минск : БГУ
Библиографическое описание источника: Информационные системы и технологии = Information Systems and Technologies : материалы XI Междунар. науч. конгр. по информатике (CSIST-2025), Респ. Беларусь, Минск, 29–31 окт. 2025 г. В 2 ч. Ч. 2 / Белорус. гос. ун-т ; редкол.: С. В. Абламейко (гл. ред.) [и др]. – Минск : БГУ, 2025. – С. 8-13.
Аннотация: В данной работе рассматривается задача поиска схожих изображений товаров (одежды) электронной коммерции. Несмотря на высокую эффективность современных архитектур сверточных нейронных сетей, таких как ResNet-101, они часто недостаточно учитывают цветовые характеристики изображения, фокусируясь в первую очередь на текстуре и форме объектов, что является недостаточным в сфере электронной коммерции, где цвет играет ключевую роль. Для решения этой проблемы в данной работе предлагается новая гибридная архитектура, объединяющая ResNet-101, генеративный модуль усиления цвета и механизм пространственно-канального внимания. Цветовая подсистема усиливает хроматические признаки и интегрирует их с семантическими признаками, извлекаемыми ResNet-101, тогда как модуль внимания избирательно акцентирует релевантные характеристики одежды. Такая комбинация позволяет формировать представления, одновременно учитывающие структуру, текстуру и цвет. Ключевым нововведением является специализированный модуль для извлечения и анализа цветовых характеристик, который обеспечивает явное кодирование цветовой информации в итоговый дескриптор изображения. Предложенная архитектура превосходит базовые ResNet и модели с одним лишь механизмом вниманием по точности поиска в среднем на 7% mAP и 6% Top-10 Accuracy
Аннотация (на другом языке): In this paper, we consider the task of searching for similar images of e-commerce products (clothing). Despite the high efficiency of modern deep architectures such as ResNet-101, they often do not take into account the color characteristics of the image sufficiently, focusing primarily on the texture and shape of objects that is insufficient for the e-commerce sphere where color plays a pivotal role. To solve this problem, a new hybrid architecture combining ResNet-101, a generative color enhancement module, and a spatial-channel attention mechanism is proposed. The color subsystem enhances chromatic features and integrates them with semantic features extracted by ResNet-101, while the attention module selectively emphasizes the relevant characteristics of clothing. This combination allows the user to create representations that simultaneously take into account structure, texture, and color. The key innovation is a specialized module for extracting and analyzing color characteristics, which provides explicit encoding of color information into the final image descriptor. The proposed architecture outperforms baseline ResNet and attention-only models in search accuracy by an average of 5% mAP and 4% Top-10 Accuracy
Доп. сведения: Раздел I. Компьютерное зрение и графика
URI документа: https://elib.bsu.by/handle/123456789/341145
ISBN: 978-985-881-851-7
978-985-881-853-1 (ч. 2)
Лицензия: info:eu-repo/semantics/openAccess
Располагается в коллекциях:2025. Информационные системы и технологии

Полный текст документа:
Файл Описание РазмерФормат 
8-13.pdf416,3 kBAdobe PDFОткрыть
Показать полное описание документа Статистика Google Scholar



Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.