Logo BSU

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ: https://elib.bsu.by/handle/123456789/215999
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.authorЛиходед, Н. А.-
dc.contributor.authorПолещук, М. А.-
dc.date.accessioned2019-03-04T11:52:18Z-
dc.date.available2019-03-04T11:52:18Z-
dc.date.issued2018-
dc.identifier.citationЖурнал Белорусского государственного университета. Математика. Информатика = Journal of the Belarusian State University. Mathematics and Informatics . - 2018. - № 3. - С. 59-67ru
dc.identifier.issn1561-834X-
dc.identifier.urihttp://elib.bsu.by/handle/123456789/215999-
dc.description.abstractМножество операций параллельного алгоритма для реализации на графическом процессоре должно быть разбито на потоки (нити) вычислений. Потоки следует сгруппировать в блоки вычислений, выполняющиеся атомарно на потоковых процессорах, называемых также мультипроцессорами. Для хорошей производительности графического процессора важно, чтобы как можно больше данных умещались в быстрых регистровой и разделяемой памяти, иначе используются медленные глобальная и локальная память. Степень использования памяти с быстрым доступом отражает вычислительное свойство алгоритма, называемое локальностью. При реализации алгоритмов на многопроцессорных вычислительных устройствах применение локальности играет важнейшую роль для достижения высокой производительности. В данной работе сформулированы и доказаны необходимые условия и достаточные условия, использование которых позволяет получать потоки с приватизированными данными, т. е. такие потоки вычислений, что элемент массива используется только одним потоком, и поэтому его целесообразно разместить в регистре.ru
dc.language.isoruru
dc.publisherМинск : БГУru
dc.rightsinfo:eu-repo/semantics/openAccessen
dc.subjectЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математикаru
dc.titleУсловия приватизации элементов массива потоками вычисленийru
dc.title.alternativeConditions for privatizing the elements of arrays by computing threads / N. A. Likhoded, M. A. Paliashchukru
dc.typearticleen
dc.description.alternativeThe set of operations of the parallel algorithm for implementation on the GPU must be split into computation threads. The threads must be grouped into computation units that run atomically on stream processors, also called multiprocessors. For good GPU performance, it is important that as much data as possible can fit into fast register and shared memory, otherwise slow global and local memory are used. The degree of memory usage with fast access reflects the computational property of the algorithm, called locality. When implementing algorithms on multiprocessor computing devices, the use of locality plays a crucial role in achieving high performance. In this paper, necessary conditions and sufficient conditions have been formulated and proved, the use of which allows receiving threads with privatized data, i. e. it allows to receive such computation threads that the array element is used only by one thread and therefore it is advisable to place it in the register.ru
Располагается в коллекциях:2018, №3

Полный текст документа:
Файл Описание РазмерФормат 
59-67.pdf508,41 kBAdobe PDFОткрыть
Показать базовое описание документа Статистика Google Scholar



Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.