Обобщенный блочный алгоритм Флойда – Уоршелла

Лиходед, Н. А.; Сипейко, Д. С.

doi:10.33581/2520-6508-2019-3-84-92

Issue Date Author Title Subject

Please use this identifier to cite or link to this item: https://elib.bsu.by/handle/123456789/241096

Title:	Обобщенный блочный алгоритм Флойда – Уоршелла
Other Titles:	Generalized blocked Floyd – Warshall algorithm / N. A. Likhoded, D. S. Sipeyko
Authors:	Лиходед, Н. А. Сипейко, Д. С.
Keywords:	ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Кибернетика
Issue Date:	2019
Publisher:	Минск : БГУ
Citation:	Журнал Белорусского государственного университета. Математика. Информатика = Journal of the Belarusian State University. Mathematics and Informatics . - 2019. - № 3. - С. 84-92
Abstract:	Одним из наиболее используемых на практике алгоритмов для поиска кратчайших путей между всеми парами вершин во взвешенных графах является алгоритм Флойда – Уоршелла. Блочная версия алгоритма служит основой для получения эффективных параллельных алгоритмов при реализации на многоядерных центральных процессорах, компьютерах с распределенной памятью, графических процессорах. Увеличение зернистости вычислений в блочных версиях алгоритмов приводит к более эффективному использованию кешей и более эффективной организации параллельных вычислений. В этой работе предложено обобщение блочного алгоритма Флойда – Уоршелла. Порядок выполнения блоков вычислений реорганизован таким образом, чтобы элементы массива, участвующие в коммуникационных операциях как чтения, так и записи, реже вытеснялись из памяти с быстрым доступом. Тогда при реализации алгоритма на графическом процессоре реже, по сравнению с исходным блочным алгоритмом, используется медленная глобальная память.
Abstract (in another language):	One of the most commonly used on practice all-pairs shortest paths algorithms on weighted graphs is Floyd – Warshall algorithm. Blocked version serves as a basis for obtaining effective parallel algorithms to be implemented on multicore central processing units, on computers with distributed memory, on graphics processing units (GPU). Increasing computation granularity in blocked versions of algorithm leads to a more efficient usage of caches and more efficient organization of parallel computations. In this paper we introduce generalization of blocked Floyd – Warshall algorithm. Computing blocks execution order was reorganized in such a way that array elements which participate in communication operations, both reading and writing, are pushed out of fast-access memory less often. This means that in GPU implementation slow global memory is used less often, compared with the original blocked algorithm.
URI:	http://elib.bsu.by/handle/123456789/241096
ISSN:	1561-834X
DOI:	10.33581/2520-6508-2019-3-84-92
Licence:	info:eu-repo/semantics/openAccess
Appears in Collections:	2019, №3

Files in This Item:

File	Description	Size	Format
84-92.pdf		547,57 kB	Adobe PDF	View/Open

Show full item record Google Scholar