АВТОМАТИЗАЦИЯ ВЫБОРА ЭФФЕКТИВНОЙ КОНФИГУРАЦИИ
ГРИД-СИСТЕМ
С.Н. Ефимов, к.т.н.; Е.С. Семенкин, д.т.н.; В.В. Тынченко, к.т.н.; В.С. Тынченко
(Сибирский государственный аэрокосмический университет им. академика М.Ф. Решетнева,
г. Красноярск, 051301@mail.ru)
Ключевые слова: распределенные компьютерные сети, удаленные вычислительные ресурсы, сетевая технология Грид, многокритериальный генетический алгоритм, клиентский узел.
Повсеместное использование высокопроизводительных и доступных по стоимости персональных компьютеров, разработка и массовое практическое применение сетевых информационных технологий различного уровня и назначения позволяют говорить о распределенных компьютерных сетях как об эффективной и значительно более дешевой альтернативе многопроцессорным и многомашинным вычислительным системам в качестве аппаратных средств реализации параллельных вычислений при решении сложных и ресурсоемких задач. Однако основной проблемой широко распространенных технологий глобальных компьютерных сетей является невозможность универсально и эффективно использовать удаленные вычислительные ресурсы, поскольку изначально так называемые интернет-технологии ориентировались на доступ к данным, а не к вычислительным мощностям.
Преодолеть ограничения существующих в этой области решений позволяют интенсивное развитие и внедрение перспективной сетевой технологии Грид, в основе которой лежит идея создания географически распределенной вычислительной инфраструктуры, объединяющей ресурсы различных типов с коллективным доступом к этим ресурсам в рамках виртуальных организаций, состоящих из предприятий и специалистов, совместно использующих эти общие ресурсы. На основе этой технологии можно реализовать ту или иную Грид-систему, предназначенную для решения того или иного класса прикладных задач [1].
Автоматизация распределения ресурсов Грид-системы и их координация в процессе решения сложных научно-технических задач требуют разработки и применения формальных методов моделирования и оптимизации для формирования эффективной конфигурации вычислительных ресурсов Грид-системы, реализующей основные функции.
Предлагаемая система поддержки принятия решений (СППР) «Формирование эффективной конфигурации Грид-системы» для автоматизации выбора эффективной по производительности, надежности и стоимости структуры Грид-системы разработана на основе предложенного авторами комплекса математических моделей оценки производительности и надежности функционирования Грид-систем [2].
Постановка оптимизационной задачи выбора эффективной конфигурации Грид-системы для решения сложных задач определенного класса имеет следующий вид: -1
£ • (^ -
i=l
max,
- > Korp,
tNT t1
N . .
Csrv . v"* t^cl L off a on t _•
k + Z Ci ■ zi ■ ti - ti ^ min
i=1 1 1 z
при условиях:
NT-1
z Kr(nk, a - akub, ^hub,z) ■ (ti+1 - ti)
i=1_
tNT — t1
min n(ti,nk,®krv,z) > Погр,
i={1,..., Nt —1}
N— < Z zi < N + .
i=1
Здесь П(-) - критерий производительности Грид-системы, настроенной на решение сложных задач определенного класса; Погр - минимально необходимый уровень производительности Грид-системы; Kr(-) - коэффициент готовности Грид-системы; K0rp - предельно допустимый уровень коэффициента готовности Грид-системы; N - количество клиентских ресурсов Грид-системы; M - количество доступных для включения в рассматриваемую конфигурацию Грид-системы серверных узлов; k - номер серверного узла, включенного в рассматриваемую конфигурацию
Грид-системы (k = 1,M); nk - количество процессоров k-го серверного узла Грид-системы; ю^ -производительность каждого процессора k-го серверного узла Грид-системы (flops); Akrv и ^k™ -соответственно интенсивности отказов и восстановления процессоров k-го серверного узла Грид-системы; Ahub и - соответственно интенсивности отказов и восстановления концентратора при k-м серверном узле Грид-системы; z - вектор показателей включенности клиентских узлов Грид-системы в рассматриваемую конфигурацию:
1, когда i — й клиентский узел : =j включен в рассматриваемую : ' = конфигурацию Грид, 0, в противном случае,
N
I = ; 1 - точки упорядоченного по возрастанию множества моментов времени включения и выключения ресурсов Грид-системы, включая начало и конец интервала времени, 1 = 1, N ; N1 -количество точек в упорядоченном по возрастанию множестве моментов времени включения и выключения ресурсов Грид-системы, включая на-
N
чало и конец интервала времени, N = 22 г, + 2;
j=l
СЦ™ - стоимость аренды к-го серверного узла Грид-системы в сутки; СС' - стоимость аренды 1-го клиентского узла Грид-системы в час, 1 = ; N и N - соответственно максимально и минимально возможное количество клиентских узлов Грид-системы.
Для решения данной оптимизационной задачи в программной системе используется многокритериальный генетический алгоритм (ГА), эффективность которого слабо зависит от свойств оптимизируемых функций, что позволяет справляться с решением сложных задач глобальной оптимизации [3].
Обобщенная структурная схема СППР «Формирование эффективной конфигурации Грид-системы» представлена на рисунке 1.
В данной программной системе реализованы следующие функциональные возможности:
• настройка аппаратных характеристик имеющихся для использования в Грид-системе клиентских и серверных узлов;
• настройка расписания работы имеющихся для использования в Грид-системе клиентских узлов;
• настройка параметров алгоритма решаемого класса задач;
• настройка параметров ГА для выбора эффективных конфигураций Грид-системы;
• визуализация информации, характеризующей процесс решения задачи;
• изменение параметров ГА в процессе решения задачи;
• визуализация результатов выбора эффективных конфигураций Грид-системы;
• сохранение результатов в текстовых и графических файлах.
Результаты работы программной системы:
- множество недоминируемых конфигураций проектируемой Грид-системы, каждая из которых имеет свой состав и свойства (аппаратные характеристики клиентских узлов и сервера, значение коэффициента готовности);
- аппроксимация Парето-оптимального фронта;
- графики пригодности лучшего и худшего индивидов, а также средняя пригодность популяции ГА при решении оптимизационной задачи выбора эффективных конфигураций Грид-системы.
Разработанная программная система использовалась в ООО «Региональные информационные технологии-системы» (г. Красноярск) для распределенного решения задачи выбора эффективной структуры централизованной Грид-системы, настроенной на решение вычислительно сложной задачи нейросетевого моделирования со следующими характеристиками: средняя вычислительная сложность одной итерации вычислений на одной ветви алгоритма решения задачи - 10 000 операций; средняя вычислительная сложность алгоритма управления одной ветвью алгоритма решения задачи - 5 000 операций; средний объем данных клиент-серверного обмена - 200 Кб.
Для построения Грид-системы имелись 153 клиентских узла с заданным расписанием работы и следующими параметрами: производительность - от 4 200 до 17 345 ИАорГ; скорость каналов передачи данных - от 10 Мбит/сек. до 27 Мбит/сек.; стоимость аренды за 1 час использования - от 1,03 руб. до 3,82 руб.; по надежности все клиентские узлы разбиваются на 2 группы с интенсивностями отказов 0,00001 и 0,000001. Выбор серверного узла проектируемой Грид-системы не производился по причине того, что предприятие-заказчик предоставляет свой серверный узел со следующими параметрами: количество процессоров - 2; производительность каждого процессора сервера -11 500 Mflops; стоимость аренды - 0; интенсивность отказов процессоров сервера - 10-6. На проектируемую Грид-систему накладывались следующие ограничения: количество клиентских узлов Грид-системы - от 15 до 20; коэффициент готовности Грид-системы - не менее 99,9 %; минимальная производительность Грид-системы - не менее 50 Gflops.
При решении задачи была получена аппроксимация Парето-множества конфигураций Грид-системы, состоящая из 6 точек, а также его фронта. Аппроксимация фронта Парето представлена на рисунке 2.
По значениям стоимости и производительности полученных конфигураций Грид-систем был выбран следующий вариант: средняя произво-
дительность - 81,522 Gflops; стоимость - 466,71 руб. в сутки; коэффициент готовности - 99,92 %; минимальная производительность - 51 Gflops.
Таким образом, с использованием разработанной СППР была выбрана эффективная конфигурация Грид-системы централизованного типа, по-
зволяющая осуществлять распределенные вычисления по заданному алгоритму.
Результаты практической апробации свидетельствуют о том, что разработанное программное обеспечение позволяет успешно решать задачи проектирования вычислительных систем на базе технологии Грид, предназначенных для решения сложных научно-технических задач.
Литература
1. Кирьянов А.К., Рябов Ю.Ф. Введение в технологию Грид: Учеб. пособ. - Гатчина: ПИЯФ РАН, 2006. - 39 с.
2. Ефимов С.Н., Тынченко В.С. Модели и алгоритмы формирования GRID-систем для структурно-параметрического синтеза нейросетевых моделей. // Вест. Сиб. гос. аэрокосмич. ун-та. - 2008. - Вып. 4 (21). - С. 18-22.
3. Zitzler E., Thiele L. Multiobjective evolutionary algorithms: A comparative case study and the strength Pareto approach. // IEEE Transactions on Evolutionary Computation. -1999.
ВЕРОЯТНОСТЬ ОШИБОЧНЫХ ИДЕНТИФИКАЦИЙ В ТРАНСПОРТНЫХ СИСТЕМАХ
В. Пасевич
(Институт инженерных процессов, Сельскохозяйственная академия, Польша, tmp@nwpi.ru)
Ключевые слова: интеллектуальные транспортные системы, ционная функция, вероятность ошибочной классификации.
В основе организации и в управлении транспортными системами заложены принципы сетевых процессов, которые интегрируют в себе основные целевые функции реализации доставки грузов по схеме «производитель-потребитель». Это позволяет достигать поставленных целей, выбирая рациональные решения в так называемых интеллектуальных транспортных системах. В данной работе автор предлагает метод идентификации ошибочных решений в транспортной системе.
Совершенствование работы транспортных систем рассматривается в [1-4]. Особенно это касается так называемых интеллектуальных транспортных систем. Интеллектуальная транспортная система [3] - это комплекс современных информационных и телекоммуникационных технических средств, объединенных с процессами принятия решений, задачей которых является оптимизация работы транспортной системы в целом. Базовым элементом интеллектуальных транспортных систем является соответствующая технологическая и информационная инфраструктура.
К основным проблемам относятся организация, управление и координация грузопотоков в транспортных системах и узлах (ТУ). Информация, локализованная в диспетчерской системе ТУ, и принятые методы расчета могут служить основой для принятия рациональных решений в организации технологических процессов. В работе [2] представлен метод идентификации (классифика-
правило идентификации наибольшей достоверности, дискриминации) согласно квадратичной дискриминационной функции. Неизвестные параметры данной функции заменены соответствующими параметрами, где проведено исследование традиционных характеристик подобной зависимости. В работе [4] были найдены вероятности ошибочной линейной классификации дискриминационной функции и вероятности ошибочной классификации квадратичной дискриминационной функции в случае одномерного нормального распределения, в котором была принята известность данных параметров.
Следует добавить, что в общем случае дискриминационной функции при неизвестности параметров вероятности ошибочной классификации не были обнаружены. Допустим, что в классификации параметров при использовании линейной дискриминационной функции данные известны частично, найдем для такой ситуации вероятность ошибочной классификации.
Примем, что в ТУ дано наблюдение х случайного вектора X, происходящее с одной из двух р-размерных нормальных популяций = N1^, Е,), 1=1,2, с известными вероятностями априори q1 (Ч1+Ч2=1), где ^ - р-размерный вектор средних, а Е1 дополнительно является определенной матрицей ковариации с размерами (рхр).
В случае известности параметров ^ и £1 квадратичная дискриминационная функция определяется формулой