Logo BSU

Please use this identifier to cite or link to this item: https://elib.bsu.by/handle/123456789/279008
Title: Space semantic aware loss function for embedding creation in case of transaction data
Other Titles: Функция потерь, учитывающая семантику пространства, для синтеза эмбеддингов на транзакционных данных / М. Е. Ваткин, Д. А. Воробей, М. В. Яковлев, М. Г. Кривова
Authors: Vatkin, M. E.
Vorobey, D. A.
Yakovlev, M. V.
Krivova, M. G.
Keywords: ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика
Issue Date: 2022
Publisher: Минск : БГУ
Citation: Журнал Белорусского государственного университета. Математика. Информатика = Journal of the Belarusian State University. Mathematics and Informatics. – 2022. – № 1. – С. 97-102
Abstract: Transaction data are the most popular data type of bank domain, they are often represented as sparse vectors with a large number of features. Using sparse vectors in deep learning tasks is computationally inefficient and may lead to overfitting. Аutoencoders are widely applied to extract new useful features in a lower dimensional space. In this paper we propose to use a novel loss function based on the metric that estimates the quality of mapping the semantic structure of the original tabular data to the embedded space. The proposed loss function allows preserving the item relation structure of the original space during the dimension reduction transformation. The obtained results show the improvement of the resulting embedding properties while using the combination of the new loss function and the traditional mean squared error one.
Abstract (in another language): Популярные в банковской сфере транзакционные данные часто представляются в виде разреженных (с большим количеством признаков) векторов. Использование разреженных векторов в задачах глубинного обучения является неэффективным и может вести к переобучению. Для извлечения полезных признаков в пространстве меньшей размерности широко применяют автокодировщики. В настоящей работе предлагается новая функция потерь, которая основана на метрике, оценивающей качество отображения исходных табличных данных в пространство эмбеддингов. Эта функция служит для преобразования снижения размерности и позволяет сохранить структуру отношений объектов исходного пространства. Полученные результаты показывают улучшение качества получаемых эмбеддингов посредством использования новой функции потерь в комбинации с традиционной средней квадратической ошибкой функции.
URI: https://elib.bsu.by/handle/123456789/279008
ISSN: 2520-6508
DOI: 10.33581/2520-6508-2022-1-97-102
Licence: info:eu-repo/semantics/openAccess
Appears in Collections:2022, №1

Files in This Item:
File Description SizeFormat 
97-102.pdf793,51 kBAdobe PDFView/Open
Show full item record Google Scholar



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.