Logo BSU

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ: https://elib.bsu.by/handle/123456789/279008
Заглавие документа: Space semantic aware loss function for embedding creation in case of transaction data
Другое заглавие: Функция потерь, учитывающая семантику пространства, для синтеза эмбеддингов на транзакционных данных / М. Е. Ваткин, Д. А. Воробей, М. В. Яковлев, М. Г. Кривова
Авторы: Vatkin, M. E.
Vorobey, D. A.
Yakovlev, M. V.
Krivova, M. G.
Тема: ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика
Дата публикации: 2022
Издатель: Минск : БГУ
Библиографическое описание источника: Журнал Белорусского государственного университета. Математика. Информатика = Journal of the Belarusian State University. Mathematics and Informatics. – 2022. – № 1. – С. 97-102
Аннотация: Transaction data are the most popular data type of bank domain, they are often represented as sparse vectors with a large number of features. Using sparse vectors in deep learning tasks is computationally inefficient and may lead to overfitting. Аutoencoders are widely applied to extract new useful features in a lower dimensional space. In this paper we propose to use a novel loss function based on the metric that estimates the quality of mapping the semantic structure of the original tabular data to the embedded space. The proposed loss function allows preserving the item relation structure of the original space during the dimension reduction transformation. The obtained results show the improvement of the resulting embedding properties while using the combination of the new loss function and the traditional mean squared error one.
Аннотация (на другом языке): Популярные в банковской сфере транзакционные данные часто представляются в виде разреженных (с большим количеством признаков) векторов. Использование разреженных векторов в задачах глубинного обучения является неэффективным и может вести к переобучению. Для извлечения полезных признаков в пространстве меньшей размерности широко применяют автокодировщики. В настоящей работе предлагается новая функция потерь, которая основана на метрике, оценивающей качество отображения исходных табличных данных в пространство эмбеддингов. Эта функция служит для преобразования снижения размерности и позволяет сохранить структуру отношений объектов исходного пространства. Полученные результаты показывают улучшение качества получаемых эмбеддингов посредством использования новой функции потерь в комбинации с традиционной средней квадратической ошибкой функции.
URI документа: https://elib.bsu.by/handle/123456789/279008
ISSN: 2520-6508
DOI документа: 10.33581/2520-6508-2022-1-97-102
Лицензия: info:eu-repo/semantics/openAccess
Располагается в коллекциях:2022, №1

Полный текст документа:
Файл Описание РазмерФормат 
97-102.pdf793,51 kBAdobe PDFОткрыть
Показать полное описание документа Статистика Google Scholar



Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.