Научная статья на тему 'Методы обеспечения бесперебойной работы сетецентрических информационно-вычислительных систем с кластеризацией'

Методы обеспечения бесперебойной работы сетецентрических информационно-вычислительных систем с кластеризацией Текст научной статьи по специальности «Математика»

CC BY
380
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕТЕЦЕНТРИЧЕСКОЕ УПРАВЛЕНИЕ / СЕТЕЦЕНТРИЧЕСКИЙ ПОДХОД / ИНФОРМАЦИОННО-УПРАВЛЯЮЩАЯ СИСТЕМА / ОТКАЗОУСТОЙЧИВОСТЬ / НАДЕЖНОСТЬ / ДЕЦЕНТРАЛИЗОВАННОЕ ДИСПЕТЧИРОВАНИЕ / NETWORK-CENTRIC CONTROL / NETWORK-CENTRIC APPROACH / INFORMATION-CONTROL SYSTEM / FAULT-TOLERANCE / RELIABILITY / DECENTRALIZED DISPATCHING

Аннотация научной статьи по математике, автор научной работы — Мельник Эдуард Всеволодович, Клименко Анна Борисовна, Иванов Донат Яковлевич, Гандурин Виктор Александрович

Статья посвящена вопросам обеспечения бесперебойной работысетецентрических информационно-управляющих систем (СИУС) с распределенным диспетчированием и кластеризацией, применение которых целесообразно для управления мультиробототехническими комплексами, производствами, энергетическими, транспортными и ресурсодобывающими системами и другими сложными мехатронными комплексами. Являясь средством достижения бесперебойности функционирования, для многих типов СИУС отказоустойчивость реализована путем возможности реконфигурирования, что, в свою очередь, ставит вопросы о разработке новых и адаптации известных методов и алгоритмов процедуры реконфигурации. В настоящее время наиболее перспективными считаются активные реконфигурируемые системы, подразумевающие изменение управления в зависимости от возникшей внештатной ситуации, поскольку позволяют парировать широкий круг отказов. Помимо этого, отказ от структурной избыточности в пользу смешанного резерва, включающего структурное резервирование, принципы скользящего резерва и резерв производительности позволяет существенно улучшить стоимостные, массогабаритные и надежностные характеристики СИУС. В рамках данной статьи внимание акцентируется на одной из наиболее важных задач обеспечения отказоустойчивости посредством реконфигурации задаче формирования конфигураций системы, ее формальной постановке, методам решения и исследованию влияния критерия выравнивания нагрузки в составе целевой функции на качество получаемых конфигураций с точки зрения загруженности процессорных устройств. Формирование конфигураций СИУС с распределенным диспетчированием и кластеризацией многокритериальная задача с многими ограничениями, относящаяся к классу NP-сложных. В общем случае задача формирования конфигурации СИУС сводится к распределению задач управления по процессорным устройствам, с учетом ограничений на время выполнения комплекса задач и на их следование, если исходное множество частично упорядочено. В силу сложности пространства поиска, его предварительное исследование по трудоемкости сопоставимо со сложностью получения решений, а применение каких-либо априорных знаний о строении поискового пространства малоэффективно. По этой причине эффективными являются методы, в основе которых лежит случайный поиск, либо различного рода эволюционные стратегии. Для решения сформулированной задачи формирования конфигураций СИУС был выбран метод имитации отжига как метод, позволяющий в относительно короткие сроки получить по крайней мере одно приближенное решение из множества существующих. В качестве эксперимента на произвольно сформированных частично упорядоченных множествах задач управления производилось моделирование их распределения по процессорным устройствам. Эффективность получаемых решений оценивалась по нескольким критериям, включая и критерий выравнивания загруженности устройств. Результаты моделирования показали присутствие эффекта сглаживания пиков нагрузки, что, в свою очередь, позволяет повысить вероятность безотказной работы СИУС.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Мельник Эдуард Всеволодович, Клименко Анна Борисовна, Иванов Донат Яковлевич, Гандурин Виктор Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS FOR PROVIDING THE UNINTERRUPTED OPERATION OF NETWORK-CENTRIC DATA-COMPUTING SYSTEMS WITH CLUSTERIZATION

The paper is devoted to the synthesis of dependable network-centric information and control systems (ICSs) with decentralized dispatching and clustering. The usage of such systems is reasonable for the mechatronic objects, plants, energy plants, etc. Fault-tolerance is the mean to reach the dependability, so the question of the new reconfiguring methods and algorithms synthesis is a kind of cornerstone. The ICSs with active reconfiguring procedure are considered to be prospective because of their possibility to handle failures of multiple nature. The sliding reserve using combined with the performance redundancy improves system cost, weight and reliability. In the context of this article the configuration forming problem is under concern. The problem formalizing is given, some problem solving methods are represented and discussed, and the load-balancing criteria impact on the solutions is explored. Configuration forming problem is multicriteria and multiconstraint, so it is np-hard. In general, the configuration forming problem is considered as resource allocation problem with constraints and optimization criteria taken according to the contemporary ICSs issues. The search space is complicated, so the preliminary research of the search space is inexpedient. Also the a-priory knowledge about the search space is useless too. This is the main reason to use stochastic or evolutionary search strategies. For the configuration forming problem solving the simulated annealing search method was chosen. Simulated annealing with quenching temperature scheme allows getting adequate solutions fast enough. The simulation includes some problem solving sequences. The quality of solutions was evaluated with chosen criteria, enriched with the load-balancing option. Simulation results show the load pikes smoothing effect, which impacts onto the system reliability function.

Текст научной работы на тему «Методы обеспечения бесперебойной работы сетецентрических информационно-вычислительных систем с кластеризацией»

УДК 004.75+004.052.3 Б01 10.18522/2311-3103-2016-12-7184

Э.В. Мельник, А.Б. Клименко, Д.Я. Иванов, В.А. Гандурин

МЕТОДЫ ОБЕСПЕЧЕНИЯ БЕСПЕРЕБОЙНОЙ РАБОТЫ СЕТЕЦЕНТРИЧЕСКИХ ИНФОРМАЦИОННО-ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ С КЛАСТЕРИЗАЦИЕЙ*

Статья посвящена вопросам обеспечения бесперебойной работысетецентрических информационно-управляющих систем (СИУС) с распределенным диспетчированием и кластеризацией, применение которых целесообразно для управления мультиробототехниче-скими комплексами, производствами, энергетическими, транспортными и ресурсодобывающими системами и другими сложными мехатронными комплексами. Являясь средством достижения бесперебойности функционирования, для многих типов СИУС отказоустойчивость реализована путем возможности реконфигурирования, что, в свою очередь, ставит вопросы о разработке новых и адаптации известных методов и алгоритмов процедуры реконфигурации. В настоящее время наиболее перспективными считаются активные реконфигурируемые системы, подразумевающие изменение управления в зависимости от возникшей внештатной ситуации, поскольку позволяют парировать широкий круг отказов. Помимо этого, отказ от структурной избыточности в пользу смешанного резерва, включающего структурное резервирование, принципы скользящего резерва и резерв производительности позволяет существенно улучшить стоимостные, массогабаритные и надежностные характеристики СИУС. В рамках данной статьи внимание акцентируется на одной из наиболее важных задач обеспечения отказоустойчивости посредством реконфигурации - задаче формирования конфигураций системы, ее формальной постановке, методам решения и исследованию влияния критерия выравнивания нагрузки в составе целевой функции на качество получаемых конфигураций с точки зрения загруженности процессорных устройств. Формирование конфигураций СИУС с распределенным диспетчированием и кластеризацией - многокритериальная задача с многими ограничениями, относящаяся к классу N.Р-сложных. В общем случае задача формирования конфигурации СИУС сводится к распределению задач управления по процессорным устройствам, с учетом ограничений на время выполнения комплекса задач и на их следование, если исходное множество частично упорядочено. В силу сложности пространства поиска, его предварительное исследование по трудоемкости сопоставимо со сложностью получения решений, а применение каких-либо априорных знаний о строении поискового пространства малоэффективно. По этой причине эффективными являются методы, в основе которых лежит случайный поиск, либо различного рода эволюционные стратегии. Для решения сформулированной задачи формирования конфигураций СИУС был выбран метод имитации отжига - как метод, позволяющий в относительно короткие сроки получить по крайней мере одно приближенное решение из множества существующих. В качестве эксперимента на произвольно сформированных частично упорядоченных множествах задач управления производилось моделирование их распределения по процессорным устройствам. Эффективность получаемых решений оценивалась по нескольким критериям, включая и критерий выравнивания загруженности устройств. Результаты моделирования показали присутствие эффекта сглаживания пиков нагрузки, что, в свою очередь, позволяет повысить вероятность безотказной работы СИУС.

Сетецентрическое управление; сетецентрический подход; информационно-управляющая система; отказоустойчивость; надежность; децентрализованное диспет-чирование.

* Работа выполнена в рамках проектов ЮНЦ РАН № 0256-2015-0079 и № 0256-2015-0008 (в рамках задания 007-01114-16 РЯ).

E.V. Melnik, A.B. Klimenko, D.Ya. Ivanov, V.A. Gandurin

METHODS FOR PROVIDING THE UNINTERRUPTED OPERATION OF NETWORK-CENTRIC DATA-COMPUTING SYSTEMS WITH CLUSTERIZATION

The paper is devoted to the synthesis of dependable network-centric information and control systems (ICSs) with decentralized dispatching and clustering. The usage of such systems is reasonable for the mechatronic objects, plants, energy plants, etc. Fault-tolerance is the mean to reach the dependability, so the question of the new reconfiguring methods and algorithms synthesis is a kind of cornerstone. The ICSs with active reconfiguring procedure are considered to be prospective because of their possibility to handle failures of multiple nature. The sliding reserve using combined with the performance redundancy improves system cost, weight and reliability. In the context of this article the configuration forming problem is under concern. The problem formalizing is given, some problem solving methods are represented and discussed, and the load-balancing criteria impact on the solutions is explored. Configuration forming problem is multicriteria and multiconstraint, so it is np-hard. In general, the configuration forming problem is considered as resource allocation problem with constraints and optimization criteria taken according to the contemporary ICSs issues. The search space is complicated, so the preliminary research of the search space is inexpedient. Also the a-priory knowledge about the search space is useless too. This is the main reason to use stochastic or evolutionary search strategies. For the configuration forming problem solving the simulated annealing search method was chosen. Simulated annealing with quenching temperature scheme allows getting adequate solutions fast enough. The simulation includes some problem solving sequences. The quality of solutions was evaluated with chosen criteria, enriched with the load-balancing option. Simulation results show the load pikes smoothing effect, which impacts onto the system reliability function.

Network-centric control; network-centric approach; information-control system; fault-tolerance; reliability; decentralized dispatching.

Введение. Сетецентрический подход [1-4] к построению информационно-управляющих систем в последние годы находит применениев различных сферах, таких как робототехника[5], распределенные лаборатории [6], транспортные [7-9], телекоммуникационные [10] и ресурсодобывающиесистемы [11, 12], IoT [13, 14]. Применение сетецентрического подхода при построении ИУС применяется в том числе и для обеспечения требуемых высоких показателей надежности.

В работе [15] предложена концепция построения сетецентрических информационно-управляющих систем (СИУС) с распределенным диспетчированием и кластеризацией (см. рис. 1).

Рис. 1. Концепция построения СИУС

Методы организации работы таких систем описаны в работе [16] и ориентированы, в первую очередь, на повышение надежности. Работоспособность таких СИУС сохраняется как при изменении аппаратной структуры системы, так и при изменении решаемой задачи управления. Предложенные методы организации рассматриваемых СИУС позволяют удовлетворить предъявляемые к ним высокие требования по надежности за счет обеспечения выравнивания нагрузки и отказа от центрального диспетчирующего устройства, вместо которого применяется распределенное диспетчирование с помощью множества программных локальных диспетчеров (ЛД), каждый из которых запущен на отдельном процессорном узле (ПУ) СИУС. При этом диспетчирование СИУС осуществляется коллективом ЛД с использованием мультиагентного подхода.

Применение СИУС с кластеризацией целесообразно при объединении гетерогенных и ранее разнородных ИУС меньшего масштаба, что часто и происходит.

Методы обеспечения бесперебойной работы СИУС с кластеризацией. Бесперебойная работа СИУС во время отказов отдельных ПУ обеспечивается посредством перераспределения подзадач, выполнявшихся на этих ПУ, между имеющимися резервами: выделенными резервными ПУ или резервом производительности, имеющемся на используемых ПУ резервами производительности [15-16].В случае возникновения отказов некоторых узлов СИУС, функции, выполнявшиеся этими узлами, должны быть перераспределены между теми узлами СИУС, которые сохранили работоспособность.

Учитывая размеры СИУС и большое число входящих в ее состав узлов, определение подходящего способа перераспределения между всеми узлами СИУС является сложной задачей, требующей значительных вычислительных ресурсов и временных затрат. С целью снижения времени и вычислительной сложности решения задачи перераспределения функций, предлагается осуществлять реконфигурацию решаемых подзадач лишь в некоторой части СИУС, например - внутри одного кластера. В связи с тем, что имеющихся в кластере резервов производительности может не хватить для перераспределения подзадач, предлагается осуществлять реконфигурацию в некоторой локальной подгруппе ПУ.

Формирование локальных подгрупп осуществляется на основе принципа локального взаимодействия, являющегося одной из основ роевого интеллекта [17], широко применяемого в задачах оптимизации [18] и в групповой робототехнике [19-22]. В локальную подгруппу кластера входят все ПУ этого кластера, а также те ПУ соседних кластеров, с которыми есть прямые каналы связи. Такой подход позволяет снизить вычислительную и коммуникационную нагрузку, связанную с мониторингом работоспособности отдельных узлов СИУС.

В том случае, если ЛД одного из ПУ обнаруживает отказ некоторого узла СИУС (ПУ, кластера, канала связи), он должен передать информацию об изменении структуры СИУС всем остальным ЛД. Для этого предлагается применять модификацию эпидемического алгоритма [23, 24].

Предлагается использовать три эшелона обеспечения бесперебойной работы СИУС в случае выхода из строя отдельного ПУ (рис. 2):

1. Решаемые на вышедшем из строя ПУ подзадачи перераспределяются между ПУ того же кластера.

2. В случае, если имеющихся в кластере резервов производительности не хватает для перераспределения подзадач, осуществляется перераспределение внутри локальной подгруппы.

3. В случае, если имеющихся в локальной подгруппе резервов производительности не хватает для перераспределения подзадач, осуществляется перераспределение внутри группы, содержащей все инцидентные кластера, имеющие прямые каналы связи с кластером, в котором возник отказ.

_Kjiia:i_q] 5_ J I JCjacrep 6_ J

а

, Кластер 5 I ( Кластер 6 J б

l _Кластср ) l _Кластср6_ J

в

Рис. 2. Три эшелона обеспечения бесперебойной работы СИУС в случае выхода

из строя отдельного ПУ

Задача переразмещения подзадач по ПУ в общем случае представляет собой №-полную задачу со многими ограничениями и, кроме того, многокритериальную. При реконфигурации на основе предложенного подхода учитываются не все узлы ИУС и не все подзадачи задачи управления, а только некоторая их часть, что позволяет снизить вычислительную и коммуникационную нагрузки при реконфигурации системы.

Последовательность действий ЛД при отказе одного из ПУ может быть следующей:

1. Осуществить рассылку сообщения о произошедшем изменении аппаратной структуры СИУС всем ЛД системы.

2. Определение списка подзадач, которые выполнялись на выбывших ПУ.

3. Определение доступных резервных узлов, а также доступные резервы производительности задействованных ПУ.

4. Принять участие в процедуре перераспределения (размещения) операционных вершин графа между работоспособными ПУ.

5. Передача промежуточных результатов вычислений этих подзадач из источника резервирования информации.

6. Осуществить рассылку сообщения о произошедших изменениях в распределении решаемых подзадач между ПУ СИУС.

7. По завершении процедуры перераспределения (размещения) перейти в штатный режим решения задачи управления.

Наибольшую сложность в данном алгоритме представляет пункт 4, требующий для своей реализации быстродействующего приближенного алгоритма решения задачи распределения подзадач между ресурсами в сетецентрической ИУС. Сформулируем обобщенную модель задачи формирования конфигурации с учетом описанных выше особенностей СИУС с кластеризацией.

Задача формирования конфигурации СИУС. Задача формирования конфигурации СИУС формулируется следующим образом: необходимо осуществить-распределение частично упорядоченного множества подзадач задачи управления-поимеющимся в наличии ПУ таким образом, чтобы задача управления была решена в установленные сроки. На протяжении истории развития вычислительной тех-

ники и технологий параллельной обработки информации аналогичная задача ставилась и решалась многократно, как, например, в [25-27]. Некоторые постановки задачи предназначены для распределения неупорядоченного множества задач, и потому сводятся либо к задаче упаковки в контейнеры [28], либо к задаче разбиения множества на k подмножеств [29]. При формализации задачи формировании конфигурации СИУС необходимо акцентировать внимание на особенностях современных реконфигурируемых СИУС, по причине наличия которых попытки адаптации задачи формирования конфигурации к ранее рассмотренным задачам становится нецелесообразной. Так, например, ограничения, накладываемые в СИУС на физические линии связи, а также на время реконфигурации, ведут к требованию о необходимости закрепления активных задач за функционирующими ПУ и введении полного или частичного запрета на их перемещение. Подобные особенности организации современных СИУС приводят к необходимости синтеза новой модели задачи размещения ЗУ по ПУ - задаче формирования конфигурации.

Как правило, задача формирования конфигурации СИУС жесткого реального времени решается на этапе проектирования отказоустойчивой СИУС. Для систем, где требования к времени восстановления менее жесткие, возможны варианты реализации алгоритмов поиска решений «на лету» [30-32].

Сформулируем обобщенную постановку задачи формирования конфигурации и проведем исследование влияния наличия критерия выравнивания нагрузки на результат.

Пусть задано множество частично упорядоченных ЗУ в виде ориентированного ациклического графаО,

О = {X, L},

где Х={х}, i=1,..,N - множество, элементы которого описываютх,- - трудоемкости подзадач ЗУ;

Ь={<НХм>>}, к^е[1М], - множество ребер графа G, определяющие ограничения на следование задачи взвешенные значениями wкk- объемами передаваемых между подзадачами данных.

Необходимо отметить, что в рамках данной модели мы будем считать, что ^я задачаполучает данные от к-й задачи, и потому момент начала ее выполнения не должен состояться раньше, чем наступит момент готовности получаемых данных.

N - число ЗУ, которые требуется распределить по ПУ.

Пусть GJ - подграф, описывающий подзадачи, ранее исполняемые на ПУ, где моделируется отказ. Тогда X^ с X , Xр с X , где Xр - подзадачи, исполняемые функционирующимПУ, Xр X^ = 0 , Xp ^ X^ = X .

Следующие равенства справедливы для множества ребер графа L:

Ь с ь; ьр с ь; Ьр ^ ь/ = ь.

При этом I е Ь^ , если хотя бы одна из вершин, соединяемых этим ребром, принадлежит X^ .

Предположим, что ^ан - период времени, планируемый для выполнения графа задач Озаданным множеством ПУ; М - общее число ПУ с идентичной производительностью р. Также будем считать, что каждая ЗУ будет назначаться на ПУ в момент /„.Представим распределение подзадач по ПУ в состоянии системы до отказа в виде матрицы Я:

R

11

N1

12

'1M

rNM

(1)

где r„ = f

x

V ujp

(

f

\

V ujP У

——, если x¡ выполняется на ВУ j,

ujP

0, в противном случае, иу - доля вычислительного ресурса, выделяемого ]-м ПУ для решения 1-й подзадачи, ] = 1, ..., М.

Пусть произошел отказ на ПУ с номером ^ Столбец d матрицы Я вычеркивается, и таким образом остается (М - 1)-столбцов (в случае, когда происходит более одного отказа, то остается (М- _0)-столбцов соответственно, где D - число одновременных отказов). Задачи Х/более нигде не выполняются, поэтому все элементы матрицы Я, соответствующие подзадаче обнуляются. Отметим, что при получении новой конфигурации дораспределять следует только подзадачи с нефункциони-рующих узлов, поскольку перераспределение задач связано с переносом операционных данных. Учитывая вероятность отсутствия такого решения, предположим, что возможен перезапуск работающей задачи с перенесением по сети сопутствующих данных, поэтому следует свести подобные действия к минимуму.

Перенумеруем элементы матрицы таким образом, чтобы верхние индексы отражали положение элемента в матрице (до отказа):

R

f

rij rij rM r11 r12 r1(M-1)

,Nj

N1

rNM r( M-1)

(2)

где R/ - матрица состояния системы в момент отказа.

После проведения реконфигурации, ЗУ из множества О/должны быть добавлены в матрицу с числом столбцов М - 1. При этом получим матрицу

R r

11

rNj N1

Jj riM

'12 r1(M-1)

r

NM

(N)(M-1)

(3)

Построим матрицу, значения элементов которой позволяют определить, была ли перемещена подзадача с одного ПУ на другой во время реконфигурации:

V =|Иа,b,c) ... N,M,M-1)|, (4)

где a- номер подзадачи, не принадлежащей множеству X/, b - номерПУ, на котором выполнялась данная подзадача до отказа; c - номерПУ, на которой подзадаче выделяется ресурс после реконфигурации,

x

y/(a, b, c) =

0, b = c

1, b * c.

Матрица V в качестве элементов будет иметь 0, если соответствующей задаче из ранее функционирующих не выделены ресурсы на другом ВУ, и 1, если в силу невозможности получения иных решений выполнение задачи перенесено на другой ПУ.

Опишем далее критерии, по которым целесообразно проводить оптимизацию распределения подзадач.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Во-первых, важным критерием оценивания качества распределения является количество переносимых на другое ПУ подзадач, которые выполнялись на функционирующих ПУ. Как было сказано раньше, это связано с необходимостью переноса контекстных данных подзадач и, как следствие, излишней и не всегда предсказуемой нагрузки на коммуникационную среду.

Во-вторых, еще одним аспектом процесса размещения подзадач является минимизация передачи информации задачами в коммуникационную среду: в связи с этим задачи, обменивающиеся данными, предпочтительно размещать в пределах одного ПУ.

И, наконец, еще одним критерием оптимизации распределения подзадач является минимизация разброса значений загруженности ПУ [33].

Таким образом, в качестве первой целевой функции (ЦФ) примем минимизацию переноса выполняемых ЗУ:

А

F = min

k, j )

(5)

''V >J

В качестве второй ЦФ примем минимизацию передаваемых по сети данных:

í N ,N Л

(6)

F2 = min

R„ ,tj

V x>z J

fü, ЗУ x, z расположены на одном ПУ

гДе %(wxz) = 1

[ wxz, в противном случае

Третья ЦФ, соответственно, будет иметь вид:

f N N Л

F3 = min I max ^ uik uil I, V i, k, l, (7)

V i=i i=i J

где l - номер ПУ; uik, uil - доля вычислительного ресурса, выделяемого к-м и l-м

ПУ для решения; i-й задачи.

Далее сформулируем основные ограничения данной задачи. Необходимо учесть, что множество подзадач является частично упорядоченным и, следовательно, подзадача v не может начать выполнение до того, как будут выполнены предшествующие ей задачи в соответствии с множеством ребер L. То есть:

к

t.

Tj , v>k, (8)

г=1

где ^ - момент времени, соответствующий началу выполнения подзадачи V.

Таким образом формулируются ограничения для всех подзадач, вершины которых связаны ребрами: время начала решения задачи v не должно быть меньше, чем сумма времен решения задач-предшественников.

к

Vtv, V > к, tv >I т. . (9)

i=1

Также ограничениями задачи формирования конфигурации являются:

т. < ТЛлан, V i, j, i e[1,..., N],j e[1,..., M -1]; (10)

I Tj < Тплан, Vj С M - 1. (11) i

В качестве граничных условий задачи примем:

xi > 0; 0 < uij < 1. (12)

В общем виде модель задачи формирования конфигурации СИУС с кластеризацией будет иметь следующий вид:

F1 = min (^У^ к, j) J;

(N,N Л

F = mm ^ Хъ) )

f N N \

F = min I max I ukk -I un I, V i, к, l;

\ i=1 i=1 ' (13)

к

Vt , v > k, t >I r..;

v 5 5 V ^^ j '

i=1

Tj < V i, j, i e [1,..., N ], j e [1,..., M -1];

I rtj < Гплан, Vj с M -1;

i

x > 0; 0 < u < 1.

i ij

Результаты моделирования. В качестве исходных данных для проведения моделирования были взяты следующие наборы данных: в первом случае ПУ количеством 5, множество частично упорядоченных ЗУ произвольной трудоемкости (количество ЗУ - 30); во втором - количество ПУ=10, количество ЗУ=40. Для получения результатов в обоих случаях использовалась имитация отжига (с температурной схемой «тушения»). Первая серия экспериментов проводилась без выравнивания нагрузки, вторая, соответственно, с добавлением оптимизации по критерию выравнивания нагрузки. Полученные результаты отражают максимальное значение загруженности ПУ СИУС для различных вариантов отказов (до 2 одновременно).

На графиках рис. 2 и 3 видно, что при добавлении критерия балансировки нагрузки ПУ происходит сглаживание пиковой нагрузки системы. Также видно, что подобный эффект прослеживается не для всех конфигураций. Причиной этому может быть следующее: не найдено (или не существует) решения, которое бы при прочих оптимизируемых параметрах и налагаемых ограничениях позволяло бы уменьшить загруженность ПУ.При необходимости уменьшения пиковых значений

нагрузки ПУ можно рекомендовать либо послабление ограничений задачи (если это возможно), либо проведение серии процедур поиска решений, поскольку имитация отжига позволяет получить одно решение из множества существующих на фронте Парето. При этом, при сглаживании пиковых значений нагрузки, увеличивается значение вероятности безотказной работы для ПУ[34] (до 15 %).

-1 >

л»

И !<:-■.. &

О I ...

1 1 3 4 5 6 7 а 9 10 11 1? 13 14 15

Варианты отказов

Рис. 3. Результаты моделирования вариантов отказов ПУ при исходном количестве ПУ=5, максимальном числе одновременных отказов равным 2, количестве решаемых подзадач равным 30

^ I ■.

50

О I 1.1 II. I I........................I II. ..........

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55

Варианты отказов

Рис. 4. Результаты моделирования вариантов отказов ПУ при исходном количестве ПУ=10, максимальном числе одновременных отказов равным 2, количестве решаемых подзадач равным 40

Заключение. В статье рассмотрен один из аспектов обеспечения бесперебойного функционирования СИУС с децентрализованным диспетчированием и кластеризацией, а именно -обеспечение возможности проведения реконфигурации. В рамках проводимого исследования была предложена стратегия проведения реконфигурации такой системы, сформулирована модель задачи формирования конфигурации с учетом особенностей современных СИУС. Путем моделирования вариантов отказов получена серия решений по распределению ЗУ по ПУ с учетом ограничений на следование ЗУ. Оптимизация проводилась по критериям перемещения функционирующих задач, объемов передаваемых в коммуникационную среду данных и балансировки нагрузки. Результаты моделирования позволяют зафиксировать наличие эффекта от введения критерия балансировки нагрузки: загруженность ПУ уменьшается до 18 %, что, в свою очередь, повышает вероятность безотказной работы СИУС (в среднем до 15 %).

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Фархадов М.П., Душкин Д.Н. Сетецентрические технологии: эволюция, текущее ноло-жение и области дальнейших исследований // Автоматизация и современные технологии. - 2012. - № 1. - C. 21-29.

2. Рахманов A.A. Принципы и подходы к концептуальному проектированию сетецентриче-ских систем // Известия ЮФУ. Технические науки. - 2010. - № 12 (113). - C. 125-134.

3. Ефремов А.Ю., Максимов Д.Ю. Сетецентрическая система управления - что вкладывается в это понятие // 3-я Российская конференция с международным участием «Технические и программные средства систем управления, контроля и измерения» (УКИ-12).

- 2012. - C. 158-161.

4. Маслобоев A.B., Путилов В.А., Сютин A.B. Координация в многоуровневых сетецентри-ческих системах управления региональной безопасностью: подход и формальная модель // Научно-технический вестник информационных технологий, механики и оптики.

- 2015. - Вып. 15, № 1. - C. 1-12.

5. Заборовский B.C. и др. Сетецентрический подход к созданию системы удаленного управления робототехническими объектами с борта орбитальной станции // Научно-технические ведомости СПбГПУ. Информатика. Телекоммуникации. Управление.

- 2013. - Вып. 186, № 6. - С. 17-26.

6. Dado E., Koenders E.A.B., Carvalho D.B.F. Netcentric Virtual Laboratories for Composite Materials II Compos. Their Prop. I ed. Hu N. InTech, 2012. - P. 227-244.

7. Шабунин A£. и др. Сетецентричский подход к созданию распределенных систем управления ресурсами ОАО "РЖД" на основе мультиагентных технологий // Труды XIV Международной конференции «Проблемы управления и моделирования в сложных системах» ПУМСС'2012. - Самара: СНЦ РАН, 2012. - С. 724-734.

8. Шабунин A.Б. и др. Сетецентрический подход к созданию мультиагентной системы для управления производственными процессами ОАО «РЖД» // Материалы Международной научно-практической мультиконференции «Управление большими системами-2011». 14-16 ноября. Т. 3. - М., 2011. - С. 222-225.

9. Павлов B.B., Bолков A.E., Bолошенюк ДЛ. Инвариантная сетецентрическая система управления конфликтными ситуациями воздушных кораблей на этапе захода на посадку // Кибернетика и вычислительная техника. - 2015. - № 180. - С. 45-65.

10. Шнепс М.A. О сетях телекоммуникаций для Системы 112, МЧС и МО // Int. J. OpenInf. Technol. - 2014. - Vol. 2, No. 3. - P. 1-10.

11. Коробкин B.B., Серогодский A.И. Безопасность функционирования программного обеспечения в управляющих системах на высокорисковых промышленных объектах // Шестая Всероссийская мультиконференция но проблемам управления (30 сентября - 5 октября 2013 г.): Материалы мультиконференции в 4 т. - Ростов-на-Дону: Изд-во ЮФУ, 2013. - С. 228-232.

12. Коровин Я.С., Ткаченко М.Г., Кононов C.B. Оперативная диагностика состояния нефтепромыслового оборудования на основе технологий интеллектуальной обработки данных // Нефтяное хозяйство. - 2012. - № 9. - С. 116-118.

13. Ashton K. That "Internet of Things" ThingThing, in the real world things matter more than ideas // RFiD J. -2009.

14. Gubbi J. et al. Internet of Things (IoT): A vision, architectural elements, and future directions // Futur. Gener. Comput. Syst. - 2013. - Vol. 29. - P. 1645-1660.

15. Иванов Д.Я., Мельник Э.В. Принципы организации децентрализованных сетецентриче-ских информационно-управляющих систем // Вестник компьютерных и информационных технологий. - 2013. - № 4. - С. 25-30.

16. Мельник Э.В. и др. Методы организации высоконадежныхсетецентрических ИУС с распределенным диспетчированием и кластеризацией // Известия ЮФУ. Технические науки. - 2015. - № 10 (171). - С. 129-143.

17. DorigoM., BirattariM. Swarm intelligence // Scholarpedia. - 2007. - Vol. 2, No. 9. - P. 1462.

18. Bonabeau E., Dorigo M., Theraulaz G. Swarm intelligence: from natural to artificial systems.

- Oxford university press, 1999. - No. 1.

19. Beni G. From Swarm Intelligence to Swarm Robotics // Swarm Robot. Work. state-of-the-artSurv. - 2005. - P. 1-9.

20. Dorigo M. et al. Swarmanoid: A novel concept for the study of heterogeneous robotic swarms // IEEE Robot. Autom. Mag. - 2013. - Vol. 20. - P. 60-71.

21. Sahin E. Swarm Robotics : From Sources of Inspiration // Swarm Robot. Work. state-of-the-artSurv. - 2005. - P. 10-20.

22. Kaliaev I., Kapustjan S., Ivanov D. Decentralized control strategy within a large group of objects based on swarm intelligence // 2011 IEEE 5th Int. Conf. Robot. Autom. Mechatronics.

- 2011. - P. 299-303.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

23. Kostadinova R., Adam C. Performance Analysis of the Epidemic Algorithms // Intell. Control Autom. - 2008. - No. 6. - P. 6675-6679.

24. Hollerung T.D., Bleckmann P. Epidemic Algorithms. - URL: http://my.fit.edu/~gfrederi/ ComplexNetworks/09-Epidemic-Algorithms.pdf (accessed: 15.05.2015).

25. Барский А.Б. Параллельные информационные технологии. - М.: ИНТУИ, 2007. - 503 с.

26. Костенко В.А., Смелянский Р.Л., Трекин А.Г. Синтез структур вычислительных систем реального времени с использованием генетических алгоритмов // Программирование.

- 2000. - № 5. - С. 63-72.

27. Костенко В.А. Задача построения расписания при совместном проектировании аппаратных и программных средств // Программирование. - 2002. - № 3. - С. 64-80.

28. Korf R.E. A new algorithm for optimal bin packing // AAAI/IAAI. - 2002. - P. 731-736.

29. Mertens S. The easiest hard problem: Number partitioning // Comput. Complex. Stat. Phys. Oxford University Press New York, NY, USA, 2006. - Vol. 125, No. 2. - P. 125-139.

30. Korobkin V., Melnik E., Klimenko A. Fault-tolerant architecture for the hazardous object information control systems // Appl. Inf. Commun. Technol. (AICT), 2015 9th Int. Conf. - Rostov-on-Don: SFedU, 2015. - P. 274-276.

31. KlimenkoA.B., Klimenko V. V, MelnikE.V. The parallel simulated annealing-based reconfiguration speedup algorithm for the real time distributed control system fault-tolerance providing // Appl. Inf. Commun. Technol. (AICT), 2015 9th Int. Conf. - Rostov-on-Don: SFedU, 2015.

- P. 277-280.

32. Melnik E.V. et al. A Novel Approach to Fault Tolerant Information and Control System Design // 5-th Int. Conf. Informatics, Electron. Vis. Dhaka, Bangladesh: University of Dhaka, 2016.

33. Melnik E.V., Klimenko A.B. Informational and Control System Configuration Generation Problem with Load-Balancing Optimization // Proc. 10th Int. Conf. Appl. Inf. Commun. Technol.

- 2016. - P. 492-496.

34. Горелова Г.В., Мельник Э.В. Эффект выравнивания вычислительной нагрузки процессорных устройств в высоконадежных распределенных информационно-управляющих системах // Мехатроника, автоматизация, управление. - 2012. - С. 29-35.

REFERENCES

1. Farkhadov M.P., Dushkin D.N. Setetsentricheskie tekhnologii: evolyutsiya, tekushchee polozhenie i oblasti dal'neyshikh issledovaniy [Network-centric technology: evolution, current situation and areas for future research], Avtomatizatsiya i sovremennye tekhnologii [Automation and modern technology], 2012, No. 1, pp. 21-29.

2. Rakhmanov A.A. Printsipy i podkhody k kontseptual'nomu proektirovaniyu setetsentricheskikh sistem [Principles and methods of approach to conceptual designing of network-centric systems], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2010, No. 12 (113). pp. 125-134.

3. EfremovA.Yu., Maksimov D.Yu. Setetsentricheskaya sistema upravleniya - chto vkladyvaetsya v eto ponyatie [Network-centric control system - what is embedded in this concept], 3-ya Rossiyskaya konferentsiya s mezhdunarodnym uchastiem «Tekhnicheskie i programmnye sredstva sistem upravleniya, kontrolya i izmereniya» (UKI-12) [3rd all-Russian conference with international participation "Technical and software control systems, control and measurement" (IES-12)], 2012, pp. 158-161.

4. Masloboev A.V., Putilov V.A., Syutin A.V. Koordinatsiya v mnogourovnevykh setetsentricheskikh sistemakh upravleniya regional'noy bezopasnost'yu: podkhod i formal'naya model' [Coordination in the multilevel network-centric control systems of regional security: approach and formal model] Nauchno-tekhnicheskiy vestnik informatsionnykh tekhnologiy, mekhaniki i optiki [Scientific and technical journal of information technologies, mechanics and optics], 2015, Issue 15, No. 1, pp. 1-12.

5. Zaborovskiy V.S. i dr. Setetsentricheskiy podkhod k sozdaniyu sistemy udalennogo upravleniya robototekhnicheskimi ob"ektami s borta orbital'noy stantsii [Network-centric approach to creation of system of remote control of robotic objects aboard the space station], Nauchno-tekhnicheskie vedomosti SPbGPU. Informatika. Telekommunikatsii. Upravlenie [Nauchno-tekhnicheskie Vedomosti SPbGPU. Informatics. Telecommunications. Management], 2013, Issue 186, No. 6, pp. 17-26.

6. Dado E., Koenders E.A.B., Carvalho D.B.F. Netcentric Virtual Laboratories for Composite Materials, Compos. Their Prop. ed. Hu N. InTech, 2012, pp. 227-244.

7. Shabunin A.B. i dr. Setetsentrichskiy podkhod k sozdaniyu raspredelennykh sistem upravleniya resursami OAO "RZhD" na osnove mul'tiagentnykh tekhnologiy [Settecentesco approach to creating distributed systems of resource management of JSC "Russian Railways" on the basis of multiagent technologies], Trudy XIVMezhdunarodnoy konferentsii «Problemy upravleniya i modelirovaniya v slozhnykh siste-makh» PUMSS'2012 [Proceedings of XIV International conference "problems of control and modeling in complex systems", P0MS'2012]. Samara: SNTs RAN, 2012, pp. 724-734.

8. Shabunin A.B. i dr. Setetsentricheskiy podkhod k sozdaniyu mul'tiagentnoy sistemy dlya upravleniya proizvodstvennymi protsessami OAO «RZhD» [Network-centric approach to the creation of multi-agent systems for control of production processes of JSC "RZD"], Materialy Mezhdunarodnoy nauchno-prakticheskoy mul'tikonferentsii «Upravlenie bol'shimi sistemami-2011». 14-16 noyabrya [Materials of International scientific-practical conference "Management of large systems-2011". 14-16 November]. Vol. 3. Moscow, 2011, pp. 222-225.

9. Pavlov V.B., Volkov A.E., Voloshenyuk D.A. Invariantnaya setetsentricheskaya sistema upravleniya konfliktnymi situatsiyami vozdushnykh korabley na etape zakhoda na posadku [Invariant network-centric system of management of the conflict situations of aircraft on the stage of the landing], Kibernetika i vychislitel'naya tekhnika [Cybernetics and computing technique], 2015, No. 180, pp. 45-65.

10. Shneps M.A. O setyakh telekommunikatsiy dlya Sistemy 112, MChS i MO [About telecommunication networks to the System 112, MES and MO], Int. J. OpenInf. Technol., 2014, Vol. 2, No. 3, pp. 1-10.

11. Korobkin V.V., Serogodskiy A.I. Bezopasnost' funktsionirovaniya programmnogo obes-pecheniya v upravlyayushchikh sistemakh na vysokoriskovykh promyshlennykh ob"ektakh [Security software in control systems on high-risk industrial objects], Shestaya Vserossiyskaya mul'tikonferentsiya po problemam upravleniya (30 sentyabrya - 5 oktyabrya 2013 g.): Materialy mul'tikonferentsii v 4 t. [The Sixth all-Russian multimedia conference on governance (30 September - 5 October 2013): Materials of conference in 4 vol.]. Rostov-on-Don: Izd-vo YuFU, 2013, pp. 228-232.

12. Korovin Ya.S., Tkachenko M.G., Kononov S.V.Operativnaya diagnostika sostoyaniya neftepromyslovogo oborudovaniya na osnove tekhnologiy intellektual'noy obrabotki dannykh [Operational diagnostics of oil field equipment based on the technology of intelligent data processing], Neftyanoe khozyaystvo [Oil industry], 2012, No. 9, pp. 116-118.

13. Ashton K. That "Internet of Things" ThingThing, in the real world things matter more than ideas, RFiD J., 2009.

14. Gubbi J. et al. Internet of Things (IoT): A vision, architectural elements, and future directions, Futur. Gener. Comput. Syst., 2013, Vol. 29, pp. 1645-1660.

15. Ivanov D.Ya., Mel'nik E.V. Printsipy organizatsii detsentralizovannykh setetsentricheskikh informatsionno-upravlyayushchikh sistem [The principles of organization of decentralized network-centric information management systems/ Vestnik komp'yuternykh i informatsionnykh tekhnologiy [Herald of Computer and Information Technologies], 2013, No. 4, pp. 25-30.

16. Mel'nik E.V. i dr. Metody organizatsii vysokonadezhnykhsetetsentricheskikh IUS s raspredelennym dispetchirovaniem i klasterizatsiey [Methods of highly reliable net-centric information-control systems with the distribution distribution dispatching and clustering], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2015, No. 10 (171), pp. 129-143.

17. DorigoM., BirattariM. Swarm intelligence, Scholarpedia, 2007, Vol. 2, No. 9, pp. 1462.

18. Bonabeau E., Dorigo M., Theraulaz G. Swarm intelligence: from natural to artificial systems. Oxford university press, 1999, No. 1.

19. Beni G. From Swarm Intelligence to Swarm Robotics, Swarm Robot. Work. state-of-the-artSurv., 2005, pp. 1-9.

20. Dorigo M. et al. Swarmanoid: A novel concept for the study of heterogeneous robotic swarms, IEEERobot. Autom. Mag, 2013, Vol. 20, pp. 60-71.

21. Sahin E. Swarm Robotics: From Sources of Inspiration, Swarm Robot. Work. state-of-the-artSurv, 2005, pp. 10-20.

22. Kaliaev I., Kapustjan S., Ivanov D. Decentralized control strategy within a large group of objects based on swarm intelligence, 2011 IEEE 5th Int. Conf. Robot. Autom. Mechatronics, 2011, pp. 299-303.

23. Kostadinova R., Adam C. Performance Analysis of the Epidemic Algorithms, Intell. Control Autom, 2008, No. 6, pp. 6675-6679.

24. Hollerung T.D., Bleckmann P. Epidemic Algorithms. Available at: http://my.fit.edu/~gfrederi/ComplexNetworks/09-Epidemic-Algorithms.pdf (accessed 15 May 2015).

25. Barskiy A.B. Parallel'nye informatsionnye tekhnologii [Parallel information technology]. Moscow: INTUI, 2007, 503 p.

26. Kostenko V.A., Smelyanskiy R.L., Trekin A.G. Sintez struktur vychislitel'nykh sistem real'nogo vremeni s ispol'zovaniem geneticheskikh algoritmov [Synthesis of computational structures for real-time systems using genetic algorithms], Programmirovanie [Programming], 2000, No. 5, pp. 63-72.

27. Kostenko V.A. Zadacha postroeniya raspisaniya pri sovmestnom proektirovanii apparatnykh i programmnykh sredstv [The task of building the schedule in a joint design of hardware and software], Programmirovanie [Programming], 2002, No. 3, pp. 64-80.

28. Korf R.E. A new algorithm for optimal bin packing, AAAI/IAAI, 2002, pp. 731-736.

29. Mertens S. The easiest hard problem: Number partitioning, Comput. Complex. Stat. Phys. Oxford University Press New York, NY, USA, 2006, Vol. 125, No. 2, pp. 125-139.

30. Korobkin V., Melnik E., Klimenko A. Fault-tolerant architecture for the hazardous object information control systems, Appl. Inf. Commun. Technol. (AICT), 2015 9th Int. Conf. Rostov-on-Don: SFedU, 2015, pp. 274-276.

31. Klimenko A.B., Klimenko V. V, Melnik E.V. The parallel simulated annealing-based reconfiguration speedup algorithm for the real time distributed control system fault-tolerance providing, Appl. Inf. Commun. Technol. (AICT), 2015 9th Int. Conf. Rostov-on-Don: SFedU, 2015, pp. 277-280.

32. Melnik E.V. et al. A Novel Approach to Fault Tolerant Information and Control System Design, 5-th Int. Conf. Informatics, Electron. Vis. Dhaka, Bangladesh: University of Dhaka, 2016.

33. Melnik E.V., Klimenko A.B. Informational and Control System Configuration Generation Problem with Load-Balancing Optimization, Proc. 10th Int. Conf. Appl. Inf. Commun. Technol., 2016, pp. 492-496.

34. Gorelova G.V., Mel'nik E.V. Effekt vyravnivaniya vychislitel'noy nagruzki protsessornykh ustroystv v vysokonadezhnykh raspredelennykh informatsionno-upravlyayushchikh sistemakh [The alignment effect of the processing load of the processor devices into highly distributed information-control systems], Mekhatronika, avtomatizatsiya, upravlenie [Mechatronics, Automation, Control], 2012, pp. 29-35.

Статью рекомендовал к опубликованию д.т.н., профессор С.Г. Капустян.

Мельник Эдуард Всеволодович - Южный научный центр Российской академии наук; e-mail: [email protected]; г. Ростов-на-Дону, просп. Чехова, 41; зав. отделом; д.т.н.

Иванов Донат Яковлевич - e-mail: [email protected]; м.н.с..

Клименко Анна Борисовна - Научно-исследовательский институт многопроцессорных вычислительных систем им. А.В. Каляева ЮФУ; e-mail: [email protected]; г. Таганрог г., ул. Чехова, 2; научный сотрудник; к.т.н.

Гандурин Виктор Александрович - АО «Заслон»; e-mail: [email protected]; 196084, Санкт-Петербург, ул. Коли Томчака, 9; тел.: +78123279099 (доб. 4012); руководитель отделения - заместитель генерального конструктора; д.т.н.

Melnik Eduard Vsevolodovich - Southern Scientific Centre of the Russian Academy of Sciences; e-mail: [email protected]; 41, Chekhov avenue, Rostov-on-Don, Russia; head of department; dr. of eng. sc.

Ivanov Donat Yakovlevich - e-mail: [email protected]; jr. research assistant.

Klimenko Anna Borisovna - SFedU Acad. Kalyaev Scientific Research Institute of Multiprocessor Computer Systems; e-mail: [email protected]; 2, Chekhov street, taganrog, Russia; cand. of eng. sc.; research assistant.

Gandurin Victor Alexandrovich - JSC «ZASLON»; e-mail: [email protected]; 9, Koli Tomchaka street, Saint-Petersburg, 196084, Russia; phone: +78123279099 (ex. 4012); dr. of eng. sc.; head of department - branch chief designer.

УДК 004.272:[519.87:519.248] Б01 10.18522/2311-3103-2016-12-8491

К.В. Павский, В.А. Павский

РАСЧЕТ ФУНКЦИИ ОСУЩЕСТВИМОСТИ РЕШЕНИЯ ЗАДАЧ НА РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ ПРИ ОТКАЗАХ И ВОССТАНОВЛЕНИЯХ*

Качество функционирования вычислительных систем (ВС) оценивается набором показателей производительности, надежности, живучести, осуществимости решения задачи и технико-экономической эффективности. Для оценки потенциальных возможностей ВС по достижению цели их функционирования (решения поступающих задач) используют показатели осуществимости решений задач. Данные показатели характеризуют процесс решения задач на неабсолютно надёжных ВС. Функция осуществимости - это условная вероятность того, что сложная задача, представленная параллельной программой, будет решена на ВС за данное время, при условии что параллельная программа на начало решения задачи использовала все работоспособные ЭМ. Предлагается стохастическая модель функционирования вычислительных систем при решении сложных задач. Предложено выражение для расчета функции осуществимости решения трудоемких задач на распределенных вычислительных системах. Считаем, что известно ускорение решения задачи на рассматриваемом числе машин вычислительной системы в определенный момент времени.

* Работа выполнена при поддержке РФФИ (грант № 16-07-00712). 84

i Надоели баннеры? Вы всегда можете отключить рекламу.