Please use this identifier to cite or link to this item:
https://elib.bsu.by/handle/123456789/241096| Title: | Обобщенный блочный алгоритм Флойда – Уоршелла |
| Other Titles: | Generalized blocked Floyd – Warshall algorithm / N. A. Likhoded, D. S. Sipeyko |
| Authors: | Лиходед, Н. А. Сипейко, Д. С. |
| Keywords: | ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Кибернетика |
| Issue Date: | 2019 |
| Publisher: | Минск : БГУ |
| Citation: | Журнал Белорусского государственного университета. Математика. Информатика = Journal of the Belarusian State University. Mathematics and Informatics . - 2019. - № 3. - С. 84-92 |
| Abstract: | Одним из наиболее используемых на практике алгоритмов для поиска кратчайших путей между всеми парами вершин во взвешенных графах является алгоритм Флойда – Уоршелла. Блочная версия алгоритма служит основой для получения эффективных параллельных алгоритмов при реализации на многоядерных центральных процессорах, компьютерах с распределенной памятью, графических процессорах. Увеличение зернистости вычислений в блочных версиях алгоритмов приводит к более эффективному использованию кешей и более эффективной организации параллельных вычислений. В этой работе предложено обобщение блочного алгоритма Флойда – Уоршелла. Порядок выполнения блоков вычислений реорганизован таким образом, чтобы элементы массива, участвующие в коммуникационных операциях как чтения, так и записи, реже вытеснялись из памяти с быстрым доступом. Тогда при реализации алгоритма на графическом процессоре реже, по сравнению с исходным блочным алгоритмом, используется медленная глобальная память. |
| Abstract (in another language): | One of the most commonly used on practice all-pairs shortest paths algorithms on weighted graphs is Floyd – Warshall algorithm. Blocked version serves as a basis for obtaining effective parallel algorithms to be implemented on multicore central processing units, on computers with distributed memory, on graphics processing units (GPU). Increasing computation granularity in blocked versions of algorithm leads to a more efficient usage of caches and more efficient organization of parallel computations. In this paper we introduce generalization of blocked Floyd – Warshall algorithm. Computing blocks execution order was reorganized in such a way that array elements which participate in communication operations, both reading and writing, are pushed out of fast-access memory less often. This means that in GPU implementation slow global memory is used less often, compared with the original blocked algorithm. |
| URI: | http://elib.bsu.by/handle/123456789/241096 |
| ISSN: | 1561-834X |
| DOI: | 10.33581/2520-6508-2019-3-84-92 |
| Licence: | info:eu-repo/semantics/openAccess |
| Appears in Collections: | 2019, №3 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

