Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/341145| Заглавие документа: | Цвето-ориентированная ResNet с механизмом внимания для задач поиска изображений одежды |
| Другое заглавие: | Color-oriented ResNet with attention mechanism for clothing image search / A. A. Ablameyko, V. V. Sorokina |
| Авторы: | Абламейко, А. А. Сорокина, В. В. |
| Тема: | ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Кибернетика |
| Дата публикации: | 2025 |
| Издатель: | Минск : БГУ |
| Библиографическое описание источника: | Информационные системы и технологии = Information Systems and Technologies : материалы XI Междунар. науч. конгр. по информатике (CSIST-2025), Респ. Беларусь, Минск, 29–31 окт. 2025 г. В 2 ч. Ч. 2 / Белорус. гос. ун-т ; редкол.: С. В. Абламейко (гл. ред.) [и др]. – Минск : БГУ, 2025. – С. 8-13. |
| Аннотация: | В данной работе рассматривается задача поиска схожих изображений товаров (одежды) электронной коммерции. Несмотря на высокую эффективность современных архитектур сверточных нейронных сетей, таких как ResNet-101, они часто недостаточно учитывают цветовые характеристики изображения, фокусируясь в первую очередь на текстуре и форме объектов, что является недостаточным в сфере электронной коммерции, где цвет играет ключевую роль. Для решения этой проблемы в данной работе предлагается новая гибридная архитектура, объединяющая ResNet-101, генеративный модуль усиления цвета и механизм пространственно-канального внимания. Цветовая подсистема усиливает хроматические признаки и интегрирует их с семантическими признаками, извлекаемыми ResNet-101, тогда как модуль внимания избирательно акцентирует релевантные характеристики одежды. Такая комбинация позволяет формировать представления, одновременно учитывающие структуру, текстуру и цвет. Ключевым нововведением является специализированный модуль для извлечения и анализа цветовых характеристик, который обеспечивает явное кодирование цветовой информации в итоговый дескриптор изображения. Предложенная архитектура превосходит базовые ResNet и модели с одним лишь механизмом вниманием по точности поиска в среднем на 7% mAP и 6% Top-10 Accuracy |
| Аннотация (на другом языке): | In this paper, we consider the task of searching for similar images of e-commerce products (clothing). Despite the high efficiency of modern deep architectures such as ResNet-101, they often do not take into account the color characteristics of the image sufficiently, focusing primarily on the texture and shape of objects that is insufficient for the e-commerce sphere where color plays a pivotal role. To solve this problem, a new hybrid architecture combining ResNet-101, a generative color enhancement module, and a spatial-channel attention mechanism is proposed. The color subsystem enhances chromatic features and integrates them with semantic features extracted by ResNet-101, while the attention module selectively emphasizes the relevant characteristics of clothing. This combination allows the user to create representations that simultaneously take into account structure, texture, and color. The key innovation is a specialized module for extracting and analyzing color characteristics, which provides explicit encoding of color information into the final image descriptor. The proposed architecture outperforms baseline ResNet and attention-only models in search accuracy by an average of 5% mAP and 4% Top-10 Accuracy |
| Доп. сведения: | Раздел I. Компьютерное зрение и графика |
| URI документа: | https://elib.bsu.by/handle/123456789/341145 |
| ISBN: | 978-985-881-851-7 978-985-881-853-1 (ч. 2) |
| Лицензия: | info:eu-repo/semantics/openAccess |
| Располагается в коллекциях: | 2025. Информационные системы и технологии |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.

