Научная статья на тему 'ПРЕОБРАЗОВАНИЕ ПОСЛЕДОВАТЕЛЬНОГО ИНФОРМАЦИОННОГО ГРАФА МЕТОДА ПРОГОНКИ В ПАРАЛЛЕЛЬНУЮ ФОРМУ'

ПРЕОБРАЗОВАНИЕ ПОСЛЕДОВАТЕЛЬНОГО ИНФОРМАЦИОННОГО ГРАФА МЕТОДА ПРОГОНКИ В ПАРАЛЛЕЛЬНУЮ ФОРМУ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
49
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОД ПРОГОНКИ / СЛАУ / ПОСЛЕДОВАТЕЛЬНЫЙ ИНФОРМАЦИОННЫЙ ГРАФ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Михайлов Денис Васильевич

Множество вычислительных задач может быть представлено в виде последовательного информационного графа. В общем случае такой информационный граф не может быть приведён к параллельному виду с целью ускорения выполнения его операций. Но в случае если вершины этого графа обладают свойствами ассоциативности, дистрибутивности и т.д., такой граф можно преобразовать в параллельно-конвейерную форму. Эти преобразования могут быть произведены не только над графами, содержащими элементарные операции - сложение, умножение, логическое И и т.д. - но и над графами, содержащими макрооперации. Одним из примеров таких графов является информационный граф решения СЛАУ методом прогонки (методом Томаса). В статье рассмотрено решение для трёхдиагональных СЛАУ. Информационный граф метода прогонки состоит из двух частей: прямого хода, в котором выполняется переход от трёхдиагональной формы к двухдиагональной, и обратного хода, в котором непосредственно вычисляются значения неизвестных. Несмотря на то, что операции, составляющие базовую макрооперацию метода прогонки, обладают свойством ассоциативности, простое преобразование графа к пирамидальному виду не даст необходимого результата. Необходимо преобразовать базовые макрооперации особым образом и изменить то, какие данные на них поступают. После этого возможно будет привести граф к пирамидальному виду. Для обратного хода применяется аналогичное преобразование графа и составляющих его базовых подграфов. Поскольку для того, чтобы начать вычисления в обратном ходе, нам необходимо полное завершение вычислений прямого хода, следует перейти от двух специализированных типов вычислительных блоков к одному универсальному, и построить на его основе универсальную вычислительную структуру.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Михайлов Денис Васильевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CONVERSION OF THE SEQUENTIAL INFORMATION GRAPH OF THE THOMAS ALGORITHM INTO A PARALLEL FORM

Many computational tasks can be represented in the form of a sequential information graph. In the general case, such an information graph cannot be reduced to a parallel form in order to speed up the execution of its operations. But if the vertices of this graph have the properties of associativity, distributivity, etc., such a graph can be transformed into a parallel-pipeline form. These transformations can be performed not only on graphs containing elementary operations - addition, multiplication, logical AND, etc. - but also over graphs containing macro operations. One example of such graphs is the information graph for solving SLAEs by the sweep method (Thomas's method). The article considers a solution for tridiagonal linear systems. The information graph of the sweep method consists of two parts: the forward move, in which the transition from the three-diagonal form to the two-diagonal form is performed, and the reverse move, in which the values of the variables are directly calculated. Despite the fact that the operations that make up the basic macro-operation of the sweep method have the property of associativity, a simple transformation of the graph to a pyramidal form will not give the desired result. It is necessary to transform the basic macro operations in a special way and change what data is received on them. After that, it will be possible to bring the graph to a pyramidal form. For the reverse move, a similar transformation of the graph and its constituent base subgraphs is applied. Since in order to start computations in the reverse run, we need to complete the computations of the forward run, we should switch from two specialized types of computational blocks to one universal one, and build a universal computational structure on its basis.

Текст научной работы на тему «ПРЕОБРАЗОВАНИЕ ПОСЛЕДОВАТЕЛЬНОГО ИНФОРМАЦИОННОГО ГРАФА МЕТОДА ПРОГОНКИ В ПАРАЛЛЕЛЬНУЮ ФОРМУ»

19. Kryzhanovsky A.V, Gushanskiy SM. Issledovanie kvantovykh algoiitmov obnaruzheniya i raspoznavaniya lits s pomoshch'yu kvantovoy neyroseti [Investigation of quantum algorithms for face detection and recognition using a quantum neural network], Fundamental'nye iprikladnye aspekty komp'yuternykh tekhnologiy i informatsionnoy bezopasnosti: Mater. VII Vserossiyskoy nauchno-tekhnicheskoy konferentsii [Fundamental and applied aspects of computer technology and information security: Materials of the VII All-Russian Scientific and Technical Conference]. Taganrog: Izd-vo YuFU, 2021, pp. 346-349.

20. Dunjko V. and Briegel H.J. Machine learning & artificial intelligence in the quantum domain: A review of recent progress, Rep. Prog. Phys., June 2018, Vol. 81, pp. 074001.

Статью рекомендовал к опубликованию д.ф.-м.н. Г.В. Куповых.

Гушанский Сергей Михайлович - Южный федеральный университет; e-mail: smgushanskiy@sfedu.ru; г. Таганрог, Россия; кафедра вычислительной техники; к.т.н.; доцент.

Буглов Владислав Евгеньевич - e-mail: buglov@sfedu.ru; тел.: +79508674921; кафедра вычислительной техники; аспирант.

Gushanskiy Sergey Mikhaylovich - Southern Federal University; e-mail: smgushanskiy@sfedu.ru; Taganrog, Russia; the department of computer engineering; cand. of eng. sc.; associate professor.

Buglov Vladislav Evgen'evich - e-mail: buglov@sfedu.ru; phone: +79508674921; the department of computer engineering; graduate student.

УДК 519.178 Б01 10.18522/2311-3103-2021-7-177-188

Д.В. Михайлов

ПРЕОБРАЗОВАНИЕ ПОСЛЕДОВАТЕЛЬНОГО ИНФОРМАЦИОННОГО ГРАФА МЕТОДА ПРОГОНКИ В ПАРАЛЛЕЛЬНУЮ ФОРМУ

Множество вычислительных задач может быть представлено в виде последовательного информационного графа. В общем случае такой информационный граф не может быть приведён к параллельному виду с целью ускорения выполнения его операций. Но в случае если вершины этого графа обладают свойствами ассоциативности, дистрибутивности и т.д., такой граф можно преобразовать в параллельно-конвейерную форму. Эти преобразования могут быть произведены не только над графами, содержащими элементарные операции - сложение, умножение, логическое И и т.д. - но и над графами, содержащими макрооперации. Одним из примеров таких графов является информационный граф решения СЛАУ методом прогонки (методом Томаса). В статье рассмотрено решение для трёхдиагональных СЛАУ. Информационный граф метода прогонки состоит из двух частей: прямого хода, в котором выполняется переход от трёхдиагональной формы к двух-диагональной, и обратного хода, в котором непосредственно вычисляются значения неизвестных. Несмотря на то, что операции, составляющие базовую макрооперацию метода прогонки, обладают свойством ассоциативности, простое преобразование графа к пирамидальному виду не даст необходимого результата. Необходимо преобразовать базовые макрооперации особым образом и изменить то, какие данные на них поступают. После этого возможно будет привести граф к пирамидальному виду. Для обратного хода применяется аналогичное преобразование графа и составляющих его базовых подграфов. Поскольку для того, чтобы начать вычисления в обратном ходе, нам необходимо полное завершение вычислений прямого хода, следует перейти от двух специализированных типов вычислительных блоков к одному универсальному, и построить на его основе универсальную вычислительную структуру.

Метод прогонки; СЛАУ; последовательный информационный граф.

D.V. Mikhailov

CONVERSION OF THE SEQUENTIAL INFORMATION GRAPH OF THE THOMAS ALGORITHM INTO A PARALLEL FORM

Many computational tasks can be represented in the form of a sequential information graph. In the general case, such an information graph cannot be reduced to a parallel form in order to speed up the execution of its operations. But if the vertices of this graph have the properties of associativity, distributivity, etc., such a graph can be transformed into a parallel-pipeline form. These transformations can be performed not only on graphs containing elementary operations -addition, multiplication, logical AND, etc. - but also over graphs containing macro operations. One example of such graphs is the information graph for solving SLAEs by the sweep method (Thomas's method). The article considers a solution for tridiagonal linear systems. The information graph of the sweep method consists of two parts: the forward move, in which the transition from the three-diagonal form to the two-diagonal form is performed, and the reverse move, in which the values of the variables are directly calculated. Despite the fact that the operations that make up the basic macro-operation of the sweep method have the property of associativity, a simple transformation of the graph to a pyramidal form will not give the desired result. It is necessary to transform the basic macro operations in a special way and change what data is received on them. After that, it will be possible to bring the graph to a pyramidal form. For the reverse move, a similar transformation of the graph and its constituent base subgraphs is applied. Since in order to start computations in the reverse run, we need to complete the computations of the forward run, we should switch from two specialized types of computational blocks to one universal one, and build a universal computational structure on its basis.

Tridiagonal matrix algorithm; system of linear equations; sequential information graph.

Введение. В современном мире сложность задач, решаемых на вычислительной технике, постоянно растёт. Компьютерное моделирование природных и антропогенных процессов, необходимое для прогнозирования, задачи криптографии, задачи радиолокации, связанные с управлением в различных системах, поиск по базам данных и т.д. - всё это требует громадных вычислительных затрат, которые возрастают вместе с ростом требований к скорости получения результатов и их качеству. Многие описанные задачи могут быть описаны с помощью последовательного информационного графа.

В определённых условиях абсолютно последовательные информационные графы могут быть приведены к параллельной форме, что позволяет значительно сократить общее время выполнения операций в вычислительных системах, соответствующих этим графам. Подобные преобразования могут быть применены также и для случаев, когда операции в вершинах информационного графа представляют собой сложную комбинацию элементарных операций. Это может быть показано на примере информационного графа решения СЛАУ методом прогонки (алгоритмом Томаса).

Постановка задачи. Метод прогонки применяется для решения систем линейных уравнений вида Ax = F, равносильных соотношению:

A iXi _ x + BiXi + CiXi+! = Ft.

Вычисления производятся в два этапа: на первом этапе, называемом прямым ходом, осуществляется переход от трёхдиагональной матрицы, соответствующей СЛАУ, к двухдиагональной.

Коэффициенты B'i и вектор F' задаются формулами

Ai

В 1 - Blt В'¿ - Bt - —--Ci_lt

о i-1

F 1 = F1,F _

На втором этапе (обратный ход) вычисляются корни уравнений системы

р'

_ 1 п _

^П ' 1

а „

^ I ' XI

1+г

В\

Информационный граф прямого хода представлен на рис. 1.

<А2, В2, С2> <А3, В3, С3>

<А^Ъ BN-1, С[М-1> <AN, BN, CN>

<А1, В1, С1>

l<A'N, B'N, C'N>

а

-Ап В'„-1

■§- <Ап, Вп, Сп>

<A'n-1, B'n-1, С'п-1-

* п В n, с п>

б

Рис. 1. Информационный граф (а) и подграф (б) прямого хода

Время выполнения всех операций графа составит

Т ={N-1 а-т,1 а=Ь5+Ьм+ Ъв, где N - количество строк в СЛАУ, LS - латентность сумматора, LM - латентность умножителя, LD - латентность делителя.

Предлагаемое решение. Для повышения быстродействия вычислительной системы необходимо сократить это значение. Согласно теореме Иванова [1] в случае, если нам не хватает вычислительного ресурса для реализации всей схемы, максимальная эффективность будет достигаться при реализации единственного подграфа а (рис. 2), причём глубина обратной связи, охватывающей а будет ограничивать возможность добиться плотного потока данных. Операция сложения строк, представляющая собой сложение с весовыми коэффициентами, обладает свойством ассоциативности, и очевидным кажется применение преобразований, аналогичных преобразованиям графа из ассоциативных операций, чтобы перейти от последовательной формы к пирамидальной. Но здесь мы сталкиваемся с проблемой: вычисления B' и F' строго последовательны, для вычисления B'i необходимо предварительно вычислить B'i-1 и т.д. В случае произвольного порядка выполнения операций над строками мы не получим сокращения количества коэффициентов, которое является необходимым элементом решения. Следовательно, этот способ неприменим. Необходима процедура, позволяющая выполнять операции над строками трёхдиагональной матрицы в произвольном порядке.

<А1, В1, С1; А2, В2/ С2; - 0<|>

<А'1/ В'1/ С'1; А'2/ В2/ С2; - C'N>

Рис. 2. Вычислительная структура с обратной связью

Как это уже было показано выше в разделе, посвящённом смешанным информационным графам, с помощью метода автоподстановки возможно добиться плотного потока в структурах с обратной связью, при условии, что имеющегося оборудования хватит для одновременной обработки нужного количества данных. На рисунке 3 показано преобразование графа а2, соответствующего формуле

! А■ А■ в 1 = ' С1 - 1 = --А~,--с1- 1 = , (!)

В 1-2

_ д _ ' ^1-1 — д _ ' ^ '~2 _

' ^¿-1 ' В'1-2 ~ ^¿-1 • ' £¿-1 ■ В'1-2 - А1_г ■ С;_2

В'1-2

_ ■ (^¿-1 ■ В' 1_2 - А1-1 ■ С;_2) - АЬ ■ С1_1 ■ В'1-2 В[-1 ■ В' 1—2 — ■ 2

т.е. содержащего два подграфа а. На рис. 3 штриховой линией показан критический путь графа, определяющий временные затраты на выполнение всех операций графа.

Рис. 3. Преобразование подграфа, содержащего два подграфа а

Ниже показаны попарное объединение подграфов а (рис. 4,а), сводящееся к соединению подграфов а2, и структура подграфа а2 (рис. 4,б).

<А2, В2, С2> <Аз, Вз, Сз> <Ад, В4, С4> <Аб, В5, Сб>

1.............................1 !............................I

<AN-1, BN-1, CN-1> <AN, BN, CN>

I..........................!

<А1, В1, С1> 4

а

а

В'п-1 -Ап+1 В'п

<Ап+1, Вп+1, Сп+

<А'п-1» В'п-1, С'п-1

<А'п+1, В'п+1, С'п+1>

б

Рис. 4. Информационный граф с объединением подграфов (а) и подграф а2 (б)

С помощью автоподстановки возможно сократить критический путь графа, содержащего любое количество подграфов а до одной вершины, выполняющей функцию умножения, одной - сложения и ещё одной - деления. Однако затраты оборудования при этом значительно возрастают. Также следует отметить, что для вычисления каждого B'i необходимо будет организовывать отдельную вычислительную структуру (поскольку на выходе структуры, содержащей п подграфов а мы получим только Б'п, но не Б'п-1, Б'„-2 и т.д.), что увеличит затраты оборудования ещё сильнее.

Таким образом, метод объединения подграфов а и автоподстановки принципиально не решает проблему сокращения времени вычислений.

Эту проблему удаётся решить в случае, если операции проводятся сразу над тремя строками, что позволяет исключить коэффициенты с нечётными номерами и нечётные строки матрицы.

а

а

Подграф а2 может быть преобразован в подграф а*, представляющий макрооперацию, которая может выполняться в произвольном порядке. Однако если ограничиться преобразованием подграфа а2 в подграф а* не меняя входных информационных вершин, мы не получим ускорения и время выполнения всех операций графа составит:

Т=^-1 )-1 а т,Ь а, =Ь5 + Ьм+ Ьв.

Причиной этого является сохраняющаяся зависимость вычисления очередного коэффициента от вычисления предыдущего (рис. 6).

^2, B2, C2> <Аз, В3, Cз> <A4, В., C4> <A5, B5, C5> <AN-l, BN-l, CN-l> <AN, BN, CN>

,1..............................................................................Т.. ,Т...............................

<АЬ В1, С1>в • • ■ в<А^, B'N, C'N>

а* а* а* а*

Рис. 6. Граф, состоящий из подграфов а *

Для ускорения вычислений нам необходимо заменить ещё и входные информационные вершины подграфа, добившись информационной независимости каждого подграфа а* от любого предыдущего подграфа. В результате мы получим граф, представленный на рис. 7.

<А1, В1, С1> <А2, В2, С2> <Аз, Вз, Сз> <А. В. С4> <Аз, В5, Сз> <А6, В6, С6> <А„ В„ С7> <А„_1, В„.1, С„_1> <А„, В„, С„> <0, 0, 0>

<0, а2,2, а2,4> <а4,2, 04,4, а4,б> <ам, 05,5, as,s> <aN,N_2, aN,N, 0>

Рис. 7. Первая ступень преобразованного графа

Таким образом формируются коэффициенты новой матрицы, которая в два раза меньше исходной. Далее мы производим аналогичные преобразования уже над коэффициентами из этой матрицы и т.д. Все вычисления могут быть произведены независимо от предыдущих вычислений на этом же ярусе, следовательно, можно перейти к пирамидальной структуре. Итоговый граф представлен на рис. 8.

Рис. 8. Граф после преобразования

В итоге мы получим граф прямого хода решения СЛАУ, имеющий пирамидальную структуру. Граф, состоящий из подграфов а*, имеющий пирамидальную структуру и представленный на рис. 9, с точностью до входных вершин соответст-

вует графу циклической редукции. Метод циклической редукции заключается в исключении из уравнений неизвестных, как и в методе прогонки, однако в ней исключение ведут одновременно по всей СЛАУ [2].

Рис. 9. Пример структуры графа, состоящего из подграфов а*

Время выполнения всех операций в таком графе будет равно тпт = [1 о g 2 ■ Iа„ ■ т.

Таким образом, в случае, если нам хватает оборудования для реализации всех операционных вершин прямого хода решения СЛАУ методом циклической редук-

N

ции, мы получим ускорение решения примерно в -—— раз.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В случае же, если имеющегося оборудования недостаточно для реализации всего графа, нам придётся преобразовать граф для конвейерных вычислений. Для этого мы должны будем выделить одинаковые пирамидальные подграфы, содержащие Я подграфов а*, где Я - доступный нам вычислительный ресурс. Эти пирамидальные подграфы должны охватывать весь массив входных информационных вершин, что приведёт к частичному перекрытию подграфов.

Затем мы переходим от информационного графа к вычислительной структуре. Пирамидальному подграфу, выделенному выше, соответствует пирамидальная структура из блоков, соответствующих подграфу а*, а после этой структуры размещается вычислительный блок, соответствующий подграфу ак, охваченный обратной связью. Для достижения плотного потока необходимо, чтобы к (степень автоподстановки подграфа ак) равнялось латентности блока, соответствующего подграфу а2. В результате на выходе пирамидального вычислительного блока мы получаем последовательность наборов коэффициентов <0, акк, ак2к>, <а2кк, а2к2к, а2к,зк>, ..., <аы-ь,ы-2ь, аы.кы-ь аы.кы>, <ат-ь ат, 0>, над которыми затем выполняется макрооперация а (прогонка). к = 2Р, где р = [1 оg2 И]. В результате мы получим массив коэффициентов В 'п*к, где п целое.

Особенностью как метода прогонки, так и метода циклической редукции является то, что невозможно перейти к вычислениям обратного хода не вычислив все коэффициенты В' и ¥' во время прямого хода. В случае, если нам хватает ресурса для реализации всей вычислительной структуры, это не создаёт неудобств. Однако в обратном случае эта особенность приводит к тому, что в вычислениях возникает разрыв - часть вычислительной структуры, отвечающая за обратный ход будет простаивать, ожидая, пока закончатся все вычисления прямого хода. Результат этих вычислений сохраняется в блок ОЗУ, откуда затем будут поданы на обратный ход.

Время выполнения всех операций прямого хода в этом случае составит

Тпт = ( Г оё2 Я ] + а, + Ьа- ( Г1с^2 Щ-т) )-т,

й+1

г - количество одновременно подаваемых строк, г = —

Я > 1 (2к)-т,т е М,т = \1ощ2(г - 1)] ,

т - количество слоёв, которые возможно реализовать на имеющемся оборудовании одновременно.

Вычисление свободного члена ¥' осуществляется на этой же вычислительной схеме, поэтому не требует дополнительных временных затрат, но требует дополнительных затрат оборудования. На рис. 10 представлен подграф а* с указанием входных информационных вершин, включающий в себя вычисления свободного члена Е'.

Рис. 10. Подграф а *

Теперь рассмотрим обратный ход. Пример информационного графа обратного хода циклической редукции показан на рис. 11,а.

б

а

-Ап

Рис. 11. Пример графа обратного хода (а) и подграфы в (б) и в* (в)

Результаты вычислений прямого хода, которые мы сохранили в ОЗУ, теперь подаются на вход структуры обратного хода, где они сначала обрабатываются в блоке в, охваченном обратной связью, а затем подаются на пирамидальную структуру, включающую в себя блоки в и в* (рис. 12). В результате на выходе мы получаем результаты <х1, х2, ... хг>, <хг+1, хг+2, ... х2г> и т.д. вплоть до <хы_г+1, хм.г+2, ... хы>.

Время выполнения Т0бр = ( [1 о g2 (г0 + 1 ) ] + — ■ Ьр*) ■ т

3 в*

5 в*

в в

Рис. 12. Пример графа, включающего прямой и обратный ход

В'

F

х

в

в

в

в

в

в

в

в

в*

в*

в*

в

Поскольку для того, чтобы начать вычисления в обратном ходе, нам необходимо полное завершение вычислений прямого хода, следует перейти от двух специализированных типов вычислительных блоков (а и в) к одному универсальному а/в, и построить на его основе универсальную вычислительную структуру, которая будет последовательно осуществлять вычисления сначала прямого хода, а затем обратного хода. Сигналы на входы универсальных блоков будут подаваться через мультиплексоры, управляемые в зависимости от того, прямой или обратный ход вычисляется в данный момент. Вид универсального вычислительного блока а/в приведён на рис. 13,а. Пример вычислительной структуры на основе универсальных блоков приведён на рис. 13,б.

Bn-1 F'n Cn 1 An B'n Bntl 1

<A.n Bn.1, Cn.1,

Xn+k • ß

б

Рис. 13. Универсальный вычислительный блок а/в (а) и пример вычислительной

структуры на его основе (б)

Время выполнения всех операций в такой структуре составит

2 N

Т = ( (|log2 R] + 2 + flog2(Ä - 2)1) ■ Laß + 2

г + 1

Заключение. Применение описанных методов позволяет добиться значительного ускорения решения СЛАУ методом прогонки. Для произвольно выбранного случая ускорение составит около пяти тысяч раз. Использование универсальной вычислительной структуры приводит к повышению удельной производительности вычислительной системы.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Иванов А.И., Коновальчик П.М. Методы организации параллельно-конвейерных вычислений для решения расчетоемких задач // Информационные технологии. - 2004. - № 12. - С. 38-43.

2. Ильин В.П., Кузнецов Ю.И. Трехдиагональные матрицы и их приложения. - М.: Наука. Главная редакция физико-математической литературы, 1985. - 208 с.

3. Ортега Джеймс. Введение в параллельные и векторные методы решения линейных систем. - М.: Изд-во Мир, 1991. - 367 с.

4. Касаркин А.В., Левин И.И. Структурная реализация задачи нахождения всех максимальных клик графа на реконфигурируемых вычислительных системах // Вестник компьютерных и информационных технологий - 2018. - № 10 (172). - С. 3-10.

5. Левин И.И., Пелипец А.В. Методология распараллеливания по итерациям при решении задач линейной алгебры на реконфигурируемых вычислительных системах // Вестник компьютерных и информационных технологий. - 2016. - № 7 (145). - С. 34-40.

а

6. Левин И.И., Пелипец А.В., Сорокин Д.А. Решение задачи LU-декомпозиции на реконфигурируемых вычислительных системах: оценка и перспективы // Известия ЮФУ. Технические науки. - 2015. - № 7 (168). - С. 62-70.

7. Гуленок А.А. Оптимизация блоков перекоммутации в вычислительных структурах параллельных программ для реконфигурируемых вычислительных систем // Десятая Всероссийская Мультиконференция по проблемам управления (МКПУ-2017): Матер. 10-й Всероссийской мультиконференции: в 3 т. - Ростов-на-Дону: Изд-во: ЮФУ, 2017. - C. 130-131.

8. Каляев И.А., Левин И.И. Реконфигурируемые мультиконвейерные вычислительные системы для решения потоковых задач // Информационные технологии и вычислительные системы. - 2011. - № 2. - С. 12-22.

9. Левин И.И. Структурно-процедурная организация параллельных вычислений // Матер. Четвертой Международной научной молодежной школы "Высокопроизводительные вычислительные системы". - Таганрог: Изд-во ТТИ ЮФУ, 2007. - С. 49-68.

10. Михайлов Д.В. Преобразование некоторых видов последовательных информационных графов в параллельно-конвейерную форму // Известия ЮФУ. Технические науки.

- 2020. - № 7 (217). - С. 78-93.

11. Задача суммирования элементов массива // Лаборатории Параллельных информационных технологий НИВЦ МГУ. - URL: https://parallel.ru/fpga/Summ2 (дата обращения: 25.10.2021).

12. Ефимов С.С. Обзор методов распараллеливания алгоритмов решения некоторых задач вычислительной дискретной математики // Математические структуры и моделирование. - 2007. - Вып. 17. - С. 72-93.

13. Дасгупта С., ПападимитриуХ., Вазирани У. Алгоритмы: пер. с англ. / под ред. А. Шеня.

- М.: МЦНМО, 2014. -320 с.

14. Харари Ф. Теория графов. - М.: Мир, 1973. - 300 с.

15. Кормен Т.М. и др. Часть VI. Алгоритмы для работы с графами // Алгоритмы: построение и анализ = Introduction to Algorithms. - 2-е изд. - М.: Вильямс, 2006. - С. 1296.

16. Edward A. Bender. Lists, Decisions and Graphs. With an Introduction to Probability. S. Gill Williamson. - 2010. - 251 p.

17. Trudeau, Richard J. Introduction to graph theory. - Dover Publications, Inc. New York, 1993.

- 224 p.

18. Старченко А.В., Берцун В.Н. Методы параллельных вычислений. - Томск: Изд-во Том. ун-та, 2013. - 223 с.

19. Фрич Р., Перегуд Е.Е., Мациевский С.В. Избранные главы теории графов: учеб. пособие: пер. с нем. Е.Е. Перегуда / под ред. С.В. Мациевского. - Калининград: Изд-во РГУ им. И. Канта, 2008. - 204 с.

20. Татт У. Теория графов: пер. с англ. Г.П. Гаврилова. - М.: Мир, 1988. - 424 с.

REFERENCES

1. Ivanov A.I., Konoval'chik P.M. Metody organizatsii parallel'no-konveyernykh vychisleniy dlya resheniya raschetoemkikh zadach [Methods of organization of parallel-pipeline computations for solving computationally intensive tasks], Informatsionnye tekhnologii [Information Technologies], 2004, No. 12, pp. 38-43.

2. Il'in V.P., Kuznetsov Yu.I. Trekhdiagonal'nye matritsy i ikh prilozheniya [Tridiagonal matrices and their applications]. Moscow: Nauka. Glavnaya redaktsiya fiziko-matematicheskoy literatury, 1985, 208 p.

3. Ortega Dzheyms. Vvedenie v parallel'nye i vektornye metody resheniya lineynykh system [Introduction to parallel and vector methods for solving linear systems]. Moscow: Izd-vo Mir, 1991, 367 p.

4. Kasarkin A.V., Levin I.I. Strukturnaya realizatsiya zadachi nakhozhdeniya vsekh maksimal'nykh klik grafa na rekonfiguriruemykh vychislitel'nykh sistemakh [Structural realization of the problem of finding all maximal cliques of a graph on reconfigurable computing systems], Vestnik komp'yuternykh i informatsionnykh tekhnologiy [Bulletin of Computer and Information Technologies], 2018, No. 10 (172), pp. 3-10.

5. Levin I.I., Pelipets A.V. Metodologiya rasparallelivaniya po iteratsiyam pri reshenii zadach lineynoy algebry na rekonfiguriruemykh vychislitel'nykh sistemakh [Methodology of parallel-ization by iterations in solving linear algebra problems on reconfigurable computing systems], Vestnik komp'yuternykh i informatsionnykh tekhnologiy [Bulletin of Computer and Information Technologies], 2016, No. 7 (145), pp. 34-40.

6. Levin I.I., Pelipets A. V., Sorokin D.A. Reshenie zadachi LU-dekompozitsii na rekonfiguriruemykh vychislitel'nykh sistemakh: otsenka i perspektivy [Solving the LU-decomposition problem on reconfigurable computing systems: assessment and prospects], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2015, No. 7 (168), pp. 62-70.

7. Gulenok A.A. Optimizatsiya blokov perekommutatsii v vychislitel'nykh strukturakh parallel'nykh programm dlya rekonfiguriruemykh vychislitel'nykh sistem [Optimization of recommutation blocks in computing structures of parallel programs for reconfigurable computing systems], Desyataya Vserossiyskaya Mul'tikonferentsiya po problemam upravleniya (MKPU-2017): Mater. 10-y Vserossiyskoy mul'tikonferentsii [The tenth all-Russian multimedia conference on management (mcpu-2017): proceedings of the 10th all-Russian conference]: in 3 vol. Rostov-on-Don: Izd-vo: YuFU, 2017, pp. 130-131.

8. Kalyaev I.A., Levin I.I. Rekonfiguriruemye mul'tikonveyernye vychislitel'nye sistemy dlya resheniya potokovykh zadach [Reconfigurable multiconveyor computing systems for solving streaming tasks], Informatsionnye tekhnologii i vychislitel'nye sistemy [Information technologies and computing systems], 2011, No. 2, pp. 12-22.

9. Levin I.I. Strukturno-protsedurnaya organizatsiya parallel'nykh vychisleniy [Structural and procedural organization of parallel computing], Mater. Chetvertoy Mezhdunarodnoy nauchnoy molodezhnoy shkoly "Vysokoproizvoditel'nye vychislitel'nye sistemy" [Materials of the Fourth International Scientific Youth School "High-performance computing systems"]. Taganrog: Izd-vo TTI YuFU, 2007, pp. 49-68.

10. Mikhaylov D.V. Preobrazovanie nekotorykh vidov posledovatel'nykh informatsionnykh grafov v parallel'no-konveyernuyu formu [Transformation of some types of sequential information graphs into a parallel-conveyor form], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2020, No. 7 (217), pp. 78-93.

11. Zadacha summirovaniya elementov massiva [The task of summing array elements], Laboratorii Parallel'nykh informatsionnykh tekhnologiy NIVTS MGU [Laboratories of Parallel information technologies of the NIVC MSU]. Available at: https://parallel.ru/fpga/Summ2 (accessed 25 October 2021).

12. Efimov S.S. Obzor metodov rasparallelivaniya algoritmov resheniya nekotorykh zadach vychislitel'noy diskretnoy matematiki [Review of methods for parallelizing algorithms for solving some problems of computational discrete mathematics], Matematicheskie struktury i modelirovanie [Mathematical structures and modeling], 2007, Issue 17, pp. 72-93.

13. Dasgupta S., Papadimitriu Kh., Vazirani U. Algoritmy [Algorithms]: transl. from engl., ed. by A. Shenya. Moscow: MTSNMO, 2014, 320 p.

14. KharariF. Teoriya grafov [Graph theory]. Moscow: Mir, 1973, 300 p.

15. Kormen T.M. i dr. Chast' VI. Algoritmy dlya raboty s grafami [Part VI. Algorithms for working with graphs], Algoritmy: postroenie i analiz = Introduction to Algorithms [Algorithms: construction and analysis = Introduction to Algorithms]. 2nd ed. Moscow: Vil'yams, 2006, pp. 1296.

16. Edward A. Bender. Lists, Decisions and Graphs. With an Introduction to Probability. S. Gill Williamson, 2010, 251 p.

17. Trudeau, Richard J. Introduction to graph theory. Dover Publications, Inc. New York, 1993, 224 p.

18. Starchenko A.V., Bertsun V.N. Metody parallel'nykh vychisleniy [Methods of parallel computing]. Tomsk: Izd-vo Tom. un-ta, 2013, 223 p.

19. Frich R., Peregud E.E., Matsievskiy S.V. Izbrannye glavy teorii grafov: ucheb. posobie [Selected chapters of graph theory: studies. manua]: transl. from german by. E.E. Pereguda, ed. by S.V. Matsievskogo. Kaliningrad: Izd-vo RGU im. I. Kanta, 2008, 204 p.

20. Tatt U. Teoriya grafov [Graph theory]: transl. from the engl. G.P. Gavrilova. Moscow: Mir, 1988, 424 p.

Статью рекомендовала к опубликованию д.т.н. А.В. Никитина.

Михайлов Денис Васильевич - ООО «НИЦ СЭ и НК»; e-mail: mixailow.den@gmail.com;

г. Таганрог, Россия; тел.: 89287502869.

Mikhailov Denis Vasilevich - «SRC SC & NC» Co Ltd; e-mail: mixailow.den@gmail.com;

Taganrog, Russia; phone: +79287502869.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.