Научная статья на тему 'БИОИНСПИРИРОВАННЫЙ МЕТОД КЛАССИФИКАЦИИ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ РЕСУРСОВ ДЛЯ ДИСПЕТЧИРОВАНИЯ В ГРИД-СИСТЕМАХ'

БИОИНСПИРИРОВАННЫЙ МЕТОД КЛАССИФИКАЦИИ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ РЕСУРСОВ ДЛЯ ДИСПЕТЧИРОВАНИЯ В ГРИД-СИСТЕМАХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
45
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИСПЕТЧИРОВАНИЕ / ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯ / GRID-СИСТЕМЫ / РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛИТЕЛЬНЫЕ РЕСУРСЫ / БИОИНСПИРИРОВАННЫЙ ПОИСК / ПОПУЛЯЦИОННЫЕ МЕТОДЫ / ДЕЦЕНТРАЛИЗОВАННЫЙ ПОИСК

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кравченко Даниил Юрьевич, Кравченко Юрий Алексеевич, Марков Владимир Васильевич, Саак Андрей Эрнестович

Статья посвящена решению задачи диспетчирования распределенных вычислительных ресурсов на основе их классификации методом биоинспирированного поиска для повышения эффективности функционирования грид-систем. Актуальность задачи обоснована значительным ростом востребованности парадигмы распределенных вычислений в условиях информационного переполнения и неопределенности. В статье рассмотрены проблемы диспетчирования гетерогенных вычислительных ресурсов при решении сложных профессиональных и научных задач, поступающих в различные моменты времени, на основе классификации по значимым признакам соответствия и готовности ресурса. Проведен сравнительный обзор существующих аналогов. Сформулирована постановка решаемой задачи в контексте выбранной тематики исследования. Обоснована стратегия выбора биоинспирированного моделирования для решения поставленной задачи. Проанализированы аспекты эффективности применения различных децентрализованных биоинспирированных методов. Предложено решать задачу диспетчирования вычислительных ресурсов на основе определения соответствия ресурса необходимому классу. Классификация проводиться на основе применения биоинспирированного метода оптимизации, построенного на основе алгоритма поиска косяком рыб. Использование популяционного биоинспирированного метода позволяет обеспечить беспрецедентный параллелизм получения альтернативных решений и оптимизировать распределение имеющихся вычислительных ресурсов в зависимости от наборов значимых признаков. Объектом исследования являются процессы классификации данных, включающие в себя упорядоченные последовательности действий, направленных на распределение вычислительных ресурсов по классам решаемых задач. Предметом исследования являются биоинспирированные методы решения задачи классификации данных в грид-системах. Для оценки эффективности предложенного метода разработано программное приложение и проведен вычислительный эксперимент с разным количеством сформированных классов вычислительных ресурсов. Каждый вычислительный ресурс имеет определенный набор атрибутов, являющийся вектором его признаков. Косинусная мера сходства вектора признаков ресурса и вектора признаков определенного класса является критерием классификации. Для повышения качества процесса диспетчирования задача классификации вычислительных ресурсов решена для множества вариантов организации потоков сложных решаемых задач в грид-системах. Полученные количественные оценки демонстрируют экономию времени при решении задач диспетчирования распределенных вычислительных ресурсов на основе их классификации методом биоинспирированного поиска не менее 7 %. Временная сложность в рассмотренных примерах составила O n 2 . Описанные исследования имеют высокий уровень теоретической и практической значимости и напрямую связаны с решением классических задач искусственного интеллекта.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кравченко Даниил Юрьевич, Кравченко Юрий Алексеевич, Марков Владимир Васильевич, Саак Андрей Эрнестович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

BIOINSPIRED METHOD FOR CLASSIFICATION OF DISTRIBUTED RESOURCES FOR DISPATCHING IN GRID-COMPUTING

The article is devoted to solving the problem of scheduling distributed computing resources based on their classification by the bioinspired search method to improve the efficiency of grid-computing functioning. The relevance of the problem is justified by a significant increase in the demand for the paradigm of distributed computing in conditions of information overflow and uncertainty. The article deals with the problems of scheduling heterogeneous computing resources when solving complex professional and scientific problems arriving at different points in time, based on the classification according to significant signs of resource compliance and readiness. A comparative review of existing analogues is carried out. The formulation of the problem to be solved in the context of the selected research topic is formulated. The strategy of choosing bioinspired modeling for solving the problem has been substantiated. The aspects of various decentralized bioinspired methods effectiveness of the use are analyzed. It is proposed to solve the problem of scheduling computational resources based on determining the correspondence of the resource to the required class. The classification is carried out on the basis of the bioinspired optimization method application, built on the basis of the Fish School Search algorithm. The use of the population bioinspired method allows us to provide unprecedented parallelism in obtaining alternative solutions and to optimize the distribution of available computing resources depending on the sets of significant features. The object of the research is the processes of data classification, which include ordered sequences of actions aimed at the distribution of computing resources by classes of problems to be solved. The subject of the research is bioinspired methods for solving the problem of data classification in grid-computing. To evaluate the effectiveness of the proposed method, a software application was developed and a computational experiment was carried out with a different number of computing resources generated classes. Each computing resource has a certain set of attributes, which is a vector of its features. The cosine measure of the similarity between a resource attributes vector and a certain class attributes vector is a classification criterion. To improve the quality of the dispatching process, the task of classifying computing resources is solved for a variety of options for organizing the flows of complex tasks to be solved in grid-computing. The obtained quantitative estimates demonstrate the time savings in solving the problems of scheduling distributed computing resources based on their classification by the bioinspired search method at least 7%. The time complexity in the considered examples was O n 2 . The described studies have a high level of theoretical and practical significance and are directly related to the solution of artificial intelligence classical problems.

Текст научной работы на тему «БИОИНСПИРИРОВАННЫЙ МЕТОД КЛАССИФИКАЦИИ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ РЕСУРСОВ ДЛЯ ДИСПЕТЧИРОВАНИЯ В ГРИД-СИСТЕМАХ»

22. Raspopov S.V., Vasilenko R.I. Podkhod k upravleniyu resursami raspredelennoy vychislitel'noy sistemy [An approach to resource management of a distributed computing system], Informatsionnye sistemy i tekhnologii: fundamental'nye i prikladnye issledovaniya: Sb. statey I Vserossiyskoy nauchno-prakticheskoy konferentsii molodykh uchenykh, aspirantov, magistrantov i studentov [Information systems and technologies: fundamental and applied research: Collection of articles of the I All-Russian Scientific and Practical Conference of Young Scientists, Postgraduates, Undergraduates and Students], 2016, pp. 26-29.

23. Konoplev S.G., Levchegov O.N. Ispol'zovanie raspredelennykh vychisleniy dlya modelirovaniya protsessov regional'nogo razvitiya v dinamicheski-izmenyaemoy srede [The use of distributed computing for modeling regional development processes in a dynamically changing environment], Ustoychivoe i innovatsionnoe razvitie regionov Rossii v usloviyakh global'nykh transformatsiy: Materialy mezhdunarodnoy nauchno-prakticheskoy konferentsii. Lipetskiy filial Finansovogo universiteta pri Pravitel'stve RF [Sustainable and innovative development of Russian regions in the context of global transformations: Materials of the international scientific and practical conference. Lipetsk branch of the Financial University under the Government of the Russian Federation], 2015, pp. 170-175.

Статью рекомендовал к опубликованию д.т.н., профессор Ю.О. Чернышев.

Литвиненко Василий Афанасьевич - Южный федеральный университет; e-mail: litv_va@mail.ru; г. Таганрог, Россия; тел.: 88634371651; кафедра систем автоматизированного проектирования; доцент.

Ховансков Сергей Андреевич - e-mail: sah59@mail.ru; тел.: 88634676616; кафедра информационной безопасности телекоммуникационных систем; доцент.

Хованскова Вера Сергеевна - e-mail: bepok2010@gmail.com; тел.: 88634676616; кафедра информационной безопасности телекоммуникационных систем; аспирантка.

Litvinenko Vasily Avanasjevich - Southern Federal University;; e-mail: litv_va@mail.ru; Taganrog, Russia; phone: +78634371651; the department of computer aided design; associate professor.

Khovanskov Sergey Andreevich -e-mail: sah59@mail.ru; phone: +78634676616; the department of information security of telecommunication systems, associate professor.

Khovanskovа Vera Sergeevna - e-mail: bepok2010@gmail.com; phone: +78634676616; the department of information security of telecommunication systems; postgraduate student.

УДК 004.272 DOI 10.18522/2311-3103-2021-4-31-41

Д.Ю. Кравченко, Ю.А. Кравченко, В.В. Марков, А.Э. Саак

БИОИНСПИРИРОВАННЫЙ МЕТОД КЛАССИФИКАЦИИ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ РЕСУРСОВ ДЛЯ ДИСПЕТЧИРОВАНИЯ В ГРИД-СИСТЕМАХ*

Статья посвящена решению задачи диспетчирования распределенных вычислительных ресурсов на основе их классификации методом биоинспирированного поиска для повышения эффективности функционирования грид-систем. Актуальность задачи обоснована значительным ростом востребованности парадигмы распределенных вычислений в условиях информационного переполнения и неопределенности. В статье рассмотрены проблемы диспетчирования гетерогенных вычислительных ресурсов при решении сложных профессиональных и научных задач, поступающих в различные моменты времени, на основе классификации по значимым признакам соответствия и готовности ресурса. Проведен сравнительный обзор существующих аналогов. Сформулирована постановка решаемой задачи в

* Исследование выполнено при финансовой поддержке РФФИ в рамках научных проектов №№ 20-01-00148 и 19-07-00099.

контексте выбранной тематики исследования. Обоснована стратегия выбора биоинспи-рированного моделирования для решения поставленной задачи. Проанализированы аспекты эффективности применения различных децентрализованных биоинспирированных методов. Предложено решать задачу диспетчирования вычислительных ресурсов на основе определения соответствия ресурса необходимому классу. Классификация проводиться на основе применения биоинспирированного метода оптимизации, построенного на основе алгоритма поиска косяком рыб. Использование популяционного биоинспирированного метода позволяет обеспечить беспрецедентный параллелизм получения альтернативных решений и оптимизировать распределение имеющихся вычислительных ресурсов в зависимости от наборов значимых признаков. Объектом исследования являются процессы классификации данных, включающие в себя упорядоченные последовательности действий, направленных на распределение вычислительных ресурсов по классам решаемых задач. Предметом исследования являются биоинспирированные методы решения задачи классификации данных в грид-системах. Для оценки эффективности предложенного метода разработано программное приложение и проведен вычислительный эксперимент с разным количеством сформированных классов вычислительных ресурсов. Каждый вычислительный ресурс имеет определенный набор атрибутов, являющийся вектором его признаков. Косинусная мера сходства вектора признаков ресурса и вектора признаков определенного класса является критерием классификации. Для повышения качества процесса диспетчирования задача классификации вычислительных ресурсов решена для множества вариантов организации потоков сложных решаемых задач в грид-системах. Полученные количественные оценки демонстрируют экономию времени при решении задач диспетчирования распределенных вычислительных ресурсов на основе их классификации методом биоинспирированного поиска не менее 7 %. Временная сложность в рассмотренных примерах составила 0(п2). Описанные исследования имеют высокий уровень теоретической и практической значимости и напрямую связаны с решением классических задач искусственного интеллекта.

Диспетчирование; параллельные вычисления; grid-системы; распределенные вычислительные ресурсы; биоинспирированный поиск; популяционные методы; децентрализованный поиск.

D.Yu. Kravchenko, Yu.A. Kravchenko, V.V. Markov, A.E. Saak

BIOINSPIRED METHOD FOR CLASSIFICATION OF DISTRIBUTED RESOURCES FOR DISPATCHING IN GRID-COMPUTING

The article is devoted to solving the problem of scheduling distributed computing resources based on their classification by the bioinspired search method to improve the efficiency of grid-computing functioning. The relevance of the problem is justified by a significant increase in the demand for the paradigm of distributed computing in conditions of information overflow and uncertainty. The article deals with the problems of scheduling heterogeneous computing resources when solving complex professional and scientific problems arriving at different points in time, based on the classification according to significant signs of resource compliance and readiness. A comparative review of existing analogues is carried out. The formulation of the problem to be solved in the context of the selected research topic is formulated. The strategy of choosing bioinspired modeling for solving the problem has been substantiated. The aspects of various decentralized bioinspired methods effectiveness of the use are analyzed. It is proposed to solve the problem of scheduling computational resources based on determining the correspondence of the resource to the required class. The classification is carried out on the basis of the bioinspired optimization method application, built on the basis of the Fish School Search algorithm. The use of the population bioinspired method allows us to provide unprecedented parallelism in obtaining alternative solutions and to optimize the distribution of available computing resources depending on the sets of significant features. The object of the research is the processes of data classification, which include ordered sequences of actions aimed at the distribution of computing resources by classes ofproblems to be solved. The subject of the research is bioinspired methods for solving the problem of data classification in grid-computing. To evaluate the effectiveness of the proposed method, a software application was developed and a computational experiment was carried out

with a different number of computing resources generated classes. Each computing resource has a certain set of attributes, which is a vector of its features. The cosine measure of the similarity between a resource attributes vector and a certain class attributes vector is a classification criterion. To improve the quality of the dispatching process, the task of classifying computing resources is solved for a variety of options for organizing the flows of complex tasks to be solved in grid-computing. The obtained quantitative estimates demonstrate the time savings in solving the problems of scheduling distributed computing resources based on their classification by the bioinspired search method at least 7 %. The time complexity in the considered examples was 0(n2). The described studies have a high level of theoretical and practical significance and are directly related to the solution of artificial intelligence classical problems.

Dispatching; parallel computing; grid-computing; distributed computing resources; bioinspired search; population methods; decentralized search.

Введение. В настоящее время проблема эффективного диспетчирования с оптимизацией распределения используемых вычислительных ресурсов до конца не решена. Не предложен формальный аппарат среды диспетчирования, который позволит выявить закономерности распределения ресурсов, провести их классификацию и предложить эффективные методы решения данных задач, обеспечивающие параллелизм выполнения и оптимальное использование вычислительных ресурсов. Разработка такого формального аппарата является актуальной задачей.

От эффективности метода распределения вычислительных ресурсов зависит надежность и быстродействие всей грид-системы в целом. Например, неоптимальное распределение вычислительных ресурсов всегда влечет за собой риск выхода информационного процесса из активной фазы вычислений и перевода в состояние ожидания на неопределенное время. Такое событие, называемое «отстранением», является следствием возникновения ошибок в оперативном диспетчировании распределенных вычислительных ресурсов. Группировка гетерогенных вычислительных ресурсов постоянно меняет свой количественный и качественный состав. Когда информационные процессы используют несколько вычислительных ресурсов, возможны следующие нежелательные последствия [1-7]:

1. Неопределенная по времени взаимная блокировка нескольких информационных процессов, каждый из которых ждет появления свободных вычислительных ресурсов. Избыточное число запросов на некоторые классы гетерогенных вычислительных ресурсов приводит к ухудшению качества системы в целом;

2. «Живая» блокировка представляет собой явление, когда один информационный процесс получил доступ какому-либо вычислительному ресурсу, но из-за отсутствия других ресурсов находится в режиме ожидания, тем самым переводя в режим ожидания другие информационные процессы, стоящие в очереди на получение доступа к данному ресурсу.

Учитывая наличие изменений состава гетерогенных вычислительных ресурсов в динамике, решение задачи предварительной классификации ресурсов по ряду значимых для текущих информационных процессов признаков повысит эффективность процедур диспетчирования в грид-системах [8-10]. В данной статье при разработке метода классификации распределенных вычислительных ресурсов для диспетчирования в грид-системах предлагается использовать биоинспирирован-ный алгоритм поиска косяком рыб, имеющий ряд преимуществ перед другими методами классификации, например, перед такими как - наивный Байесовский классификатор или метод k-средних. Среди основных преимуществ биоинспири-рованных алгоритмов отмечается децентрализованная схема прараллельного поиска решений и наличие процедур диверсификации пространства решений для выхода из локальных оптимумов.

1. Постановка задачи. Представим постановку задачи классификации для диспетчирования в грид-системах на основе применения признакового описания распределяемых вычислительных ресурсов в векторном виде.

Предположим, что имеется N вычислительных ресурсов, каждый из которых представлен M признаками. Признаки пронумерованы счетчиком m (m= 1, ..., M), а ресурсы счетчиком n (n = 1, ..., N). Имеется Kнаименований классов решаемых грид-системой задач, к которым необходимо отнести распределяемые ресурсы. Каждый класс так же как и ресурс задан M признаками. Признаки классов пронумерованы счетчиком m (m= 1, ..., M) соответственно, а классы - счетчиком k (k = 1, ..., K). Для ресурса с номером n обозначено через xm,n - значение признака m, а через ym,k - значение целевого признака m для класса k. Тогда постановка задачи классификации распределенных вычислительных ресурсов будет выглядеть следующим образом. Рассмотрим ресурс X п и класс решаемых задач Y к:

Хп = (х1,п'Х2,п'ш ■ ■'хм,п) ; (1)

К=(У 1,к-У 2 ,к,- ■ -,Ум,к) . (2)

Скалярное произведение векторов и косинус угла в между ними связаны следующим соотношением:

(Хп.Гк) = | | Хп | | ■ I I Yk| | ■ cos OCX); (3)

I I Хп 11 = J х1,п + х2п + ■ ■ ■ + х2м п; (4)

II Yk 11 = J У1 ,к + У 2 ,к + ■ ■ ■ + У2м,к. (5)

Расстояние между рассматриваемым ресурсом и классом задач определяется следующим выражением:

| | Хп ~ Y к| ^ J (ХЬп - У1 к)2 + (Х2,п - У2,к)2 + ■ • • + (х м,п - Ум,к)2. (6)

Введено пороговое значение А максимального расстояния, превышение которого исключает возможность использования ресурса для решения задач класса . Для представленного случая оптимизационная задача классификации примет следующий вид:

Г = агдттк 11 Хп-Yk 11; (7)

Г\\Хп - ГII < Л, Y* - определен для Хп 1 o therw is е,Хп — н е кл ас си ф и ц и р о в а н ' ( )

Предложенная постановка задачи задает целевую функцию, минимизация которой позволяет уменьшить число случаев блокировки гетерогенных вычислительных ресурсов, благодаря проведению предварительной классификации для построения классов применяемых ресурсов, наиболее соответствующих определенных типам решаемых информационными процессами задач.

2. Разработка метода классификации вычислительных ресурсов на основе алгоритма биоинспирированной оптимизации. Для нахождения минимального расстояния между ресурсом и классом решаемых задач используется косинусная мера сходства. Поиск квазиоптимального решения предложено проводить с помощью метаэвристического алгоритма поиска косяком рыб [11].

В алгоритме поиска косяком рыб каждая особь является реактивным агентом, обладающим собственной памятью, где хранится информация о его весе и лучшем положении или текущем векторе решений в поисковом пространстве, т.е. области допустимых решений. Данная особенность разработанного алгоритма позволяет

отказаться от необходимости искать и фиксировать глобально лучшие решения. Разработанный алгоритм поиска косяком рыб соответствует следующим правилам [11, 12]:

♦ этапами алгоритма являются операторы кормления и плавания, которые применяются ко всей популяции;

♦ процесс кормления в алгоритме моделирует решение задачи оптимизации с целевой функцией /(х). Вес рыбы рассчитывается как разница между значениями целевой функции на текущем и предыдущем шаге. Алгоритм предусматривает, что у каждой отдельной рыбы вес ограничивается свободным параметром Ютах и оценивается один раз в каждом цикле алгоритма;

♦ этап плавания представляет собой процесс миграции агентов с шагом у((), что является взвешенной суммой индивидуальных перемещений, направленых на подражание коллективному движению рыб. Процесс плавания управляется кормлением и состоит из последовательных процессов индивидуального, коллективно-инстинктивного и коллективно-волевого движения.

Схема индивидуального перемещения рыбы представлена на рис. 1. Рыба показана окружностью, и чем больше радиус окружности, тем более подходящим является местоположение рыбы. На этом рисунке рыба X/ ищет наиболее подходящее местоположение в своем рое и случайным образом с равномерным распределением выбирает координаты одной из соседних особей. Следующей позицией этой рыбы, если произошло улучшение значения целевой функции, будет точка в 2D-квадратном пространстве назначения, где центром этого пространства является выбранное местоположение, выделенное на рис. 1 «жирным» контуром. После вычисления местоположения У сначала проверяются все его параметры, чтобы проверить, находится ли оно в области поиска. Если какой-либо из параметров находится вне этой области, он будет установлен в ее границах. После изменения несоответствующих параметров У будет оценено значение пригодности данного местоположения, и если новое положение ближе к целевой функции, чем исходное, агент переместится в положение У/, в противном случае агент-рыба продолжит индивидуальный поиск.

I Feasible Destinations

Рис. 1. Схема индивидуального перемещения агента

Для минимизации функции потерь при построении матрицы отношений ресурсов и классов и определения прогноза оценки распределения используется среднеквадратичная ошибка обучения - Root Mean Square Error (RSME) [11-13].

RSME = J^Zx,yl(rx,y~rXiy)^l (9)

где rv^y и r^y - прогнозируемые и наблюдаемые оценки распределения ресурсов X по классам Y соответственно, к - число контрольных точек. Прогнозируемое значение определяется следующим образом:

fVy=Xf Yj и ^ = (10)

Размер популяции поисковых агентов S и их позиции qi (x, y) ЕX х Y задаются случайным образом. Начальное значение веса агента rni задается согласно следующей формуле:

<»¡¿ = 1 + 4 I г*,у-г*,у | , (11)

где 4 - коэффициент сглаживания.

Соседняя позиция qi рассчитывается с учетом вероятности распределения р на интервале [-1, 1] как:

q ¡ ( t) = q i ( O + p-fti „d ( t) ■ (12)

Индивидуальное плавание создает новую позицию для дальнейшего исследования. Вычисление шага миграции производится согласно следующей формуле:

fti„d (t + 1 ) = fti„d (t)-^A (13)

lmax

иде hind - шаг перемещения, который является равномерно распределенной величиной в интервале [hi=0; hf], hf= tmax, максимальному номеру итерации алгоритма.

Оператор кормления обновляет вес агента mi на каждой итерации. Изменение веса рассчитывается на основе значения пригодности с учетом изменений значений целевой функции текущей и соседней позиций согласно:

л/ i ( t) = / [ q i ( t) ]-/ [ q i ( t) ] . (14)

Расчет веса в новом положении происходит по следующей формуле:

< i ( t + i )=в. (15)

|V J max[Af(t)] v '

С точки зрения оптимизации на данном этапе проверяется, находится ли точка в области допустимых значений и лучше ли в этой точке значение целевой функции [11-13]. Коллективно-инстинктивное плавание реализуется после завершения индивидуальных перемещений всеми агентами. Смещение движения определяется по формуле, представленной ниже:

7 ( 0 = ZS=1 A/i(t) ' (16)

где - это индивидуальное движение рыбы в течение одной

итерации. Данное уравнение показывает, что шаг миграции максимально зависим

от влияния наиболее эффективных агентов в косяке, которые имеют успешные

индивидуальные перемещения. После выполнения миграции позиции косяка об-

новляются согласно .

Далее для корректировки позиции рыб выполняется коллективно-волевое

плавание. На этом этапе происходит смещение всех агентов в направление теку-

щего центра тяжести популяции B(t). Если стая рыб набирает вес, т.е. происходит успех поиска, тогда все агенты смещаются в B(t), а если теряет вес, тогда - в противоположном от центра тяжести направлении. Данный центр тяжести вычисляется по следующей формуле:

ВГ<Л _ Y.Sl=1Aqj(t)Mi(t)

В ( С) = -VS -. (17)

Коллективно-волевое движение выполняется по формуле:

q[(t + 1) = q;(t) ± Vvolrand[0,1] ■ (q;(t) - B(t)),

(18)

где УУо1 определяет размер шага перемещений агентов и является случайной величиной.

Когда проанализированы все агенты, вычисляется значение ЯЕМЕ, к каждому из агентов применяется новое вычисленное местоположение с заданной вероятностью и происходит расчет целевой функции. Условием окончания работы алгоритма является свободный параметр количества итераций

Разработанный авторами метод классификации распределенных вычислительных ресурсов для диспетчирования в грид-системах реализует предложенный алгоритм в структуре информационных процессов, предложенной в [7] и проиллюстрированной на рис. 2.

Рис. 2. Структура информационных потоков в грид-системе

В данной работе использован целенаправленный тип интеллектуальных агентов. Коалиция агентов моделирует процесс рассуждений референтной группы в процессе решения задачи классификации потоков параллельных заявок при диспе-черизации в грид-системах. В исследовании решена задача создания классификаторов в виде агентов с заданными условными атрибутами.

Заданы два типа агентов: для организации распределенной классификации входных потоков заявок использованы агенты обучения классификатора (АОК); для централизованного распределения вычислительных ресурсов между альтернативными наборами заявок - агент-диспетчер комбинирования классификатора (АДКК).

Задача диспетчирования решена на основе комплексного применения коалиции интеллектуальных агентов и событийной имитационной модели. Использована комбинированная распределенно-централизованная схема поиска решений при диспетчеризации [14-20], что позволило уменьшить размерность задачи. Классификация поступающих на вход заявок проводится на основе применения модифицированного биоинспирированного метода оптимизации поиском кукушки.

3. Экспериментальные исследования. Для подтверждения эффективности разработанного метода классификации распределенных вычислительных ресурсов для диспетчирования в грид-системах было доработано программное приложение, описанное в [7], которое включало в себя функции поэтапного решения задач классификации входных заявок на основе модифицированного биоинспирирован-

ного метода оптимизации поиском кукушки и централизованного распределения вычислительных ресурсов на основе применения генетического алгоритма, описанного в [14]. В новой версии программного приложения вместо генетического алгоритма для распределения вычислительных ресурсов использован разработанный метод диспетчирования на основе классификации алгоритмом косяка рыб. В качестве значений атрибутов применены показатели, полученные для проведения прошлого вычислительного эксперимента. Сравнение проведено на основе оценки результатов применения методов роя частиц, генетического алгоритма и предложенного авторами метода классификации ресурсов.

В результате проведенных комплексных исследований получена временная сложность предложенного метода (рис. 3). Временная сложность в рассмотренном примере составила в худшем случае 0(п2), где п - количество анализируемых методом входных данных, которым в данном случае является число входных заявок (задач).

Экспериментальные исследования разработанного метода проводились на вычислительной системе с производительностью порядка 109 (гигафлопс) операций в секунду. В этом случае, например, при п = 50000 вершин, время выполнения алгоритма не превысит 2,5 секунды, при п = 200000 вершин - 40 секунд, при п = 500000 вершин - 250 секунд, что наглядно иллюстрирует представленная на рис. 3 полученная зависимость времени выполнения предложенного метода от числа входных вершин.

Рис. 3. Временная сложность в зависимости от числа входных вершин

Исследование скорости работы метода классификации распределенных вычислительных ресурсов для диспетчирования в грид-системах, разработанного на основе алгоритма поиска косяком рыб, проводилось в сравнении с генетическим алгоритмом, применяющим модифицированные генетические операторы кроссинговера и мутации, предложенным в [14], и каноническим методом роя частиц (табл. 1).

Таблица 1

Сравнение времени работы методов

Размерность задачи (количество задач, шт) Метод на основе поиска косяком рыб (время работы, с) Генетический алгоритм (время работы, с) Метод роя частиц (время работы, с)

50000 1.78 1.91 2.37

200000 35.14 38.54 44.87

500000 212.95 229.18 259.33

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из анализа приведенных графика временной сложности и таблицы сравнения времени работы методов видно, что предложенный метод показал лучший результат по сравнению с генетическим алгоритмом и каноническим методом роя частиц. Отметим, что при относительно небольших размерностях задачи (от 50000 до 200000 вершин) время работы оцениваемых методов соизмеримо: от 1,78-35,14 секунды в предлагаемой модификации алгоритма поиска косяком рыб, до 1,91-38,54 и 2,37-44,87 секунды соответственно для генетического алгоритма и метода роя частиц. Наибольший прирост скорости предложенные процедуры распределения вычислительных ресурсов при диспетчировании входных информационных потоков позволили достичь при решении задач с размерностью не менее 500000 входных заявок. Из табл. 1 видно, что в этом случае, если принять за 100 % время работы наиболее медленного роевого метода, тогда генетический алгоритм затратил на решение этой же задачи менее 89 % времени от максимального, а предложенный биоинспирированный метод на основе поиска косяком рыб - менее 82 %. Эффективность предложенного биоинспирированного метода повышена за счет улучшения способа определения траектории передвижения агента в пространстве поиска, позволяющего обеспечить не только достаточное число итераций локального поиска, но также создать необходимые условия для выхода из локальных оптимумов [21-24].

Заключение. В данной работе представлена разработка метода классификации распределенных вычислительных ресурсов для диспетчирования в грид-системах. Задача диспетчирования решена на основе комплексного применения коалиции интеллектуальных агентов и событийной имитационной модели. Использована комбинированная распределенно-централизованная схема поиска решений при диспетчи-ровании, что позволило уменьшить размерность задачи. Предложено решать задачу диспетчирования вычислительных ресурсов на основе определения соответствия ресурса необходимому классу. Классификация проводиться на основе применения биоинспирированного метода оптимизации, построенного на основе алгоритма поиска косяком рыб. Использование популяционного биоинспирированного метода позволяет обеспечить беспрецедентный параллелизм получения альтернативных решений и оптимизировать распределение имеющихся вычислительных ресурсов в зависимости от наборов значимых признаков.

Для оценки эффективности предложенного метода разработано программное приложение и проведен вычислительный эксперимент с разным количеством поступающих на вход заявок. Проведенные экспериментальные исследования подтвердили эффективность разработки в сравнении с генетическим алгоритмом и каноническим методом роя частиц. Каждый вычислительный ресурс имеет определенный набор атрибутов, являющийся вектором его признаков. Косинусная мера сходства вектора признаков ресурса и вектора признаков определенного класса является критерием классификации. Для повышения качества процесса диспетчи-рования задача классификации вычислительных ресурсов решена для множества вариантов организации потоков сложных решаемых задач в грид-системах.

Полученные количественные оценки демонстрируют экономию времени при решении задач диспетчирования распределенных вычислительных ресурсов на основе их классификации методом биоинспирированного поиска не менее 7 %. Временная сложность в рассмотренных примерах составила . Описанные

исследования имеют высокий уровень теоретической и практической значимости и напрямую связаны с решением классических задач искусственного интеллекта.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Magoulès F., Nguyen T., Yu L. Grid resource management: toward virtual and services compliant grid computing, Numerical analysis and scientific computing. - CRC Press, UK, 2009.

2. Magoulès F. (ed.). Fundamentals of grid computing: theory, algorithms and technologies, Numerical analysis and scientific computing. - CRC Press, UK, 2010

3. Patel S. Survey Report of Job Scheduler on Grids, International Journal of Emerging Research in Management &Technology, 2013, No. 2 (4), pp. 115-125.

4. Li M., Baker M. The grid: core technologies. - John Wiley & Sons Ltd, England, 2005.

5. Saak A.E., Kureichik V.V., Kravchenko Y.A. Scheduling quality of precise form sets which consist of tasks of circular type in GRID systems, Journal of Physics: Conference Series, 2018, 1015 (4).

6. SaakA.E., Kureichik V.V., LezhebokovA.A. Scheduling of parabolic-type tasks arrays in GRID systems, Advances in Intelligent Systems and Computing, 2017, pp. 292-298.

7. Saak A., Kureichik V., Kravchenko Y. To scheduling quality of sets of precise form which consist of tasks of circular and hyperbolic type in grid systems, Advances in Intelligent Systems and Computing, 2016, pp. 157-166.

8. Saak A.E., Kureichik V.V., Kuliev E.V. Ring algorithms for scheduling in grid systems, Advances in Intelligent Systems and Computing, 2015, pp. 201-209.

9. Kravchenko Y.A., Kravchenko D.Y., Kursitys I.O. Architecture and method of integrating information and knowledge on the basis of the ontological structure, Advances in Intelligent Systems and Computing. 1st International Conference of Artificial Intelligence, Medical Engineering, and Education, AIMEE 2017. Moscow: 2018, Vol. 658, pp. 93-103.

10. Kravchenko Y.A., Kureichik V.V. Knowledge management based on multi-agent simulation in informational systems, Conference proceedings. 8th IEEE International Conference "Application of Information and Communication Technologies - AICT 2014". 15-17 October 2014, Astana, Kazakhstan, pp. 264-267.

11. Monteiro R.P., Verçosa L.F.V., Bastos-Filho C.J. A. Improving the Performance of the Fish School Search Algorithm, International Journal of Swarm Intelligence Research (IJSIR), 2018, No. 9 (4), pp. 21-46.

12. Lima Neto F.B.D., LacerdaM.G. Weight based fish school search, IEEE International Conference Systems, Man and Cybernetics (SMC), 2014, pp. 270-277.

13. Bastos-Filho C.J.A., Lima-Neto F.B., Lins Sousa M.F.C., Pontes M.R. On the influence of the swimming operators in the fish school search algorithm, IEEE International Conference on Systems Man and Cybernetics, 2009, pp. 5012-5017.

14. Kravchenko Y.A., Bova V.V., Kursitys I.O. The development of genetic algorithm for semantic similarity estimation in terms of knowledge management problems, Artificial Intelligence Perspectives in Intelligent Systems. Proceedings of the 6th Computer Science On-line Conference 2017 (CSOC2017), Vol. 1. Springer, 2017, pp. 84-93.

15. Soliman O.S. and Adly A. Bio-inspired algorithm for classification association rules, 8th International Conference on Informatics and Systems (INFOS), Cairo, 2012, pp. 154-160.

16. Bova V., Zaporozhets D., and Kureichik V. Integration and processing of problem-oriented knowledge based on evolutionary procedures, Advances in Intelligent Systems and Computing, 2016, Vol. 450, pp. 239-249.

17. Semenova A.V. and Kureichik V.M. Ensemble of classifiers for ontology enrichment, Journal of Physics: Conference Series, 2018, Vol. 1015, Issue 3, article id. 032123.

18. Kureychik V.M. Overview and problem state of ontology models development, 9th International Conference on Application of Information and Communication Technologies, AICT

2015 - Proceedings 9, 2015, pp. 558-564.

19. Semenova A.V. and Kureychik V.M. Application of swarm intelligence for domain ontology alignment, Proceedings of the First International Scientific Conference "Intelligent Information Technologies for Industry" (IITI'16), 2016, Vol. 1 , pp. 261-270.

20. Bova V., Kureichik V. and Zaruba D. Heuristic approach to model of corporate knowledge construction in information and analytical systems, 2016 IEEE 10th International Conference on Application of Information and Communication Technologies (AICT), Baku, 2016, pp. 1-5.

21. Kureichik V., Zaporozhets D., and Zaruba D. Generation of bioinspired search procedures for optimization problems, Application of Information and Communication Technologies, AICT

2016 - Conference Proceedings, 2016. Vol. 10.

22. Pulyavina N., Taratukhin V. The Future of Project-Based Learning for Engineering and Management Students: Towards an Advanced Design Thinking Approach, ASEE Annual Conference and Exposition, Conference Proceedings, 2018, No. 125.

23. Becker J., Pulyavina N., Taratukhin V. Next-Gen Design Thinking. Using Project-Based and Game-Oriented Approaches to Support Creativity and Innovation, Proceedings of the 1st International Conference of Information Systems and Design, 2020.

24. Bova V. V., Nuzhnov E. V., Kureichik V.V. The combined method of semantic similarity estimation of problem oriented knowledge on the basis of evolutionary procedures, Advances in Intelligent Systems and Computing, 2017, Vol. 573, pp. 74-83.

Статью рекомендовал к опубликованию к.т.н. С.Г. Буланов.

Кравченко Даниил Юрьевич - Южный федеральный университет; e-mail: kravchenkodanil122@gmail.com; г. Таганрог, Россия; тел.: 88634371651; кафедра систем автоматизированного проектирования; студент.

Кравченко Юрий Алексеевич - e-mail: yakravchenko@sfedu.ru; кафедра систем автоматизированного проектирования; доцент.

Марков Владимир Васильевич - e-mail: vvmarkov@sfedu.ru; кафедра систем автоматизированного проектирования; доцент.

Саак Андрей Эрнестович - e-mail: aesaak@sfedu.ru; тел.: 88634393373; кафедра государственного и муниципального управления; зав. кафедрой.

Kravchenko Daniil Yurievich - Southern Federal University; e-mail: kravchenkodanil122@gmail.com; Taganrog, Russia; phone: +78634371651; the department of computer aided design; student.

Kravchenko Yury Alekseevich - e-mail: yakravchenko@sfedu.ru; the department of computer aided design; associate professor.

Markov Vladimir Vasilievich - e-mail: vvmarkov@sfedu.ru; the department of computer aided design; associate professor.

Saak Andrey Ernestovich - e-mail: aesaak@sfedu.ru; phone: +78634393373; the department of state and municipal management, head of department.

i Надоели баннеры? Вы всегда можете отключить рекламу.