Научная статья на тему 'Формирование оптимальной конфигурации распределенной информационной системы железнодорожного транспорта с использованием эволюционных алгоритмов'

Формирование оптимальной конфигурации распределенной информационной системы железнодорожного транспорта с использованием эволюционных алгоритмов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
167
21
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Землянская С.Ю.

В статье предложен подход к оптимизации конфигурации распределенной информационнойсистемы железнодорожного транспорта как распределенной корпоративной информационной системы, заключающийся в совместном использовании объектной модели и аппарата генетических алгоритмов. Дано определение критерия оптимальности функционирования информационной системы. Проведены вычислительные эксперименты, которые показали, что применение предложенного подхода к оптимизации конфигурации РИСЖТ позволяет повысить эффективность ее работы с точки зрения предложенного критерия эффективности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Railway transport distributed information system optimal configuration formation with the use of evolutionary algorithms

The approach to optimization of distributed information systems of railway transport (DISRT) as a distributed enterprise information system configuration is proposed. The approach is to use the object model and machine genetic algorithms. The distributed information system optimal functioning criterion is defined. Computational experiments showed that the proposed approach to the DISRT configuration optimization improves the efficiency of its work from the point of view of the proposed efficiency criterion.

Текст научной работы на тему «Формирование оптимальной конфигурации распределенной информационной системы железнодорожного транспорта с использованием эволюционных алгоритмов»

УДК 004.691.54

ЗЕМЛЯНСКАЯ С.Ю., к.т.н. (ГОУ ВПО «ДонНТУ»)

Формирование оптимальной конфигурации распределенной информационной системы железнодорожного транспорта с использованием эволюционных алгоритмов

Zemlyansky S.Y. Cand. Sci. (Tech.) (Donetsk National Technical University)

Railway transport distributed information system optimal configuration formation with the use of evolutionary algorithms

Введение

Информационная система

железнодорожного транспорта (ИСЖТ) относится к классу больших распределенных корпоративных

информационных систем (РКИС) и предназначена для решения как информационных задач, так и задач управления отраслью [1]. Основная цель ИСЖТ состоит в повсеместном обеспечении информацией

технологических процессов и сфер деятельности железнодорожного

транспорта, в создании информационной основы для достижения максимальной эффективности его работы в условиях рыночной экономики.

Распределенную информационную систему железнодорожного транспорта (РИСЖТ) можно представить укрупненно в виде двухуровневой структуры. Первый уровень - обеспечивающий, представлен информационной средой и

инфраструктурой информатизации, второй уровень - прикладной, реализуется путем формирования новых информационных технологий, использующих

высокотехнологичные методы управления.

Информационную среду образует информация, реализованная в системе баз данных и знаний, которая обеспечивает функционирование объектов, органов управления и отдельных пользователей, связанных с железнодорожным

транспортом. Информационная среда создает единое прозрачное

информационное пространство, в котором все заинтересованные пользователи обеспечены необходимой им и достоверной информацией в нужное время и в удобной форме. Инфраструктура информатизации железнодорожного транспорта включает в себя:

- главный вычислительный центр (ГВЦ) МПС, объединяющий и поддерживающий информационные базы данных и хранилища информации для проведения общесетевой маркетинговой, финансовой и экономической деятельности и управления перевозочным процессом;

- информационно-вычислительные центры (ИВЦ) на дорогах, реализующие комплексы информационных услуг для управлений и отделений дорог;

- системы передачи данных, устройства автоматического съема информации с подвижного состава, вычислительное, телекоммуникационное оборудование, обеспечивающее выполнение основных операций над информацией.

На современном этапе существуют следующие функции управления железнодорожным транспортом:

- управление перевозочным процессом;

- управление маркетингом, экономикой и финансами;

- управление инфраструктурой железнодорожного транспорта;

- управление непроизводственной сферой.

Задача определения оптимальных параметров РКИС, подобных РИСЖТ, необходимых для достижения

максимальной производительности

системы при ограниченных финансовых затратах в настоящее время не получила окончательного решения и требует проведения дальнейших исследований. Указанную задачу можно решить путём использования современных методов моделирования и оптимизации [2-4].

Основная часть

Краткий анализ проведенных исследований по оптимизации РКИС.

В проведенных ранее исследованиях, в основном создавались модели для несложных компьютерных систем, построенных на локальных сетях, или же для построения моделей более сложных систем применялся ряд допущений, Для оптимизации таких систем использовались традиционные методы исследования операций: линейное, динамическое и дискретное программирование, различные модификации этих методов [4]. Применение таких методов для оптимизации РКИС ограничено большой размерностью, неоднородностью

структуры РКИС, а также вычислительной сложностью расчётов.

Выбор оптимальной или «близкой» к оптимальной структуры такой системы можно осуществить с помощью одного из подходов научного направления Natural Computing, основанного на принципах природных механизмов принятия решений и включающего нейросетевые вычисления, жадные алгоритмы, муравьиные

алгоритмы, табуированный поиск, генетические алгоритмы и другие [5].

Муравьиные и жадные алгоритмы хорошо себя зарекомендовали при оптимизации систем, характеризуемых набором однородных параметров (РКИС

описывается большим количеством несвязанных параметров) или же если необходимо выбрать оптимальную последовательность действий, в то время как в РКИС все события имеют случайный характер.

Табуированный поиск (Tabu Search) представляет собой вариацию известного метода градиентного спуска с памятью. В процессе поиска ведётся список табуированных (запрещённых для перехода) позиций из числа уже рассчитанных и осуществляются операции включения в запрещённый список состояний вокруг текущего состояния, что добавляет фактор случайности в процесс поиска. Критическими параметрами алгоритма является диапазон запретов. Для оптимизации РКИС этот метод труднореализуем в связи с необходимостью определения множества состояний вокруг текущего, которое характеризуется большим количеством не связанных параметров

Генетические алгоритмы (ГА), используя аналогию между естественным отбором и процессом выбора наилучшего решения из множества возможных, являются одним из самых

распространённых вариантов реализации эволюционных вычислений. Моделируя отбор лучших вариантов как процесс эволюции в популяции особей, можно получить решение задачи оптимизации, задав начальные условия эволюционного процесса. Преимуществом генетических алгоритмов перед другими является простота их реализации, относительно высокая скорость работы, параллельный поиск решения сразу несколькими особями, позволяющий избежать попадания в «ловушку» локальных оптимумов. При применении ГА возникает проблема выбора схемы кодирования параметров и вида кодирования параметров РКИС в «хромосомах», проблема выбора генетических операторов и схемы выполнения самого ГА [6].

Обоснование критерия

эффективности ИСЖТ. Основная цель создания ИСЖТ - обеспечение возможности оперативного принятия управляющих решений, доступа пользователей к необходимым данным и предоставление возможности быстрого и безопасного обмена данными в рамках ИСЖТ как корпоративной организации [1]. Таким образом, одно из главных требований к ИСЖТ с точки зрения ее эффективности - обеспечение наиболее быстрой реакции на запросы пользователей [2,3]. Следовательно, критерий

эффективности функционирования ИСЖТ можно представить как время реакции системы на запросы пользователей [3].

Рассмотрим, как определяется время реакции системы. Запросы, как правило, формируются пользователями на рабочих станциях и затем передаются по каналам связи узлам обработки, которые могут включать сервер баз данных и сервер приложений для обработки сложных запросов, после чего ответ по каналам связи передаётся пользователю. Тогда время выполнения запроса пользователя Tresp определяется следующим образом:

Tresp = Tt + Tp + Tw + max Tg,}, (1)

i=1,Nsq

где Tt - время передачи запроса, Tp - время обработки запроса, Tw - время задержки при передаче и обработке запроса,

Tsqt - время выполнения i-го подзапроса,

Nsq - количество подзапросов данного запроса.

При оценке производительности РКИС используем пороговый критерий Tri, который отражает наихудшее время реакции системы на запрос пользователя и гарантирует всем пользователям некоторый удовлетворительный уровень реакции системы на их запросы:

TrL = max{TresPi} (2)

i=1,Nq

где Trespi - время реакции системы на /-ый запрос пользователя,

Ыд - количество пользовательских запросов, выполненных в системе за время исследования.

РИСЖТ как распределённая корпоративная информационная система (РКИС) включает в себя компоненты физической и логической архитектуры [4]. Физическую архитектуру составляют множество узлов, на которых размещаются серверы баз данных, серверы приложений и рабочие станции, подключенные к сетевым устройствам; узлы РКИС соединяются между собой каналами связи. Логическую архитектуру определяют таблицы базы данных и приложения, используемые в РКИС, а также запросы, порождаемые рабочими станциями.

Постановка задачи оптимизации РКИС.

Одну из возможных конфигураций РКИС можно получить, если каждому из серверов поставить в соответствие определенный тип сервера, каждому сетевому устройству - определенный тип сетевого устройства и каждому каналу связи - определенный тип канала связи. Кроме того, необходимо задать вариант размещения фрагментов наборов данных на серверах баз данных и приложений на серверах приложений.

Задачу оптимизации РИСЖТ можно сформулировать следующим образом [7]: пусть {ВСШр\р=1,ЫР} - множество всех возможных вариантов конфигураций РКИС, где ЫР - количество вариантов построения РКИС. Необходимо найти такой вариант построения РКИС БСШх среди всех возможных вариантов, для которого критерий эффективности (2) имеет минимальное значение:

Tropt = min (max(Trespi}} (3)

{DCISp|p=1,NP} i=1,Nq

где Nq - количество пользовательских запросов, требующих ответа системы.

При этом необходимо учитывать ряд ограничений, накладываемых

используемыми в системе данными и приложениями, а также финансовыми возможностями организации, в рамках которой функционирует или проектируется РКИС.

При этом необходимо учитывать ряд ограничений, накладываемых

используемыми в системе данными и приложениями, а также финансовыми возможностями организации, в рамках которой функционирует или проектируется РКИС. Рассмотрим эти ограничения:

1. Ограничение на размещение данных. Объём дискового пространства помещённого в данном узле сервера БД должен быть достаточным для размещения необходимых наборов данных.

2. Каждый из наборов данных должен быть размещён хотя бы на одном сервере баз данных.

3. Объём оперативной памяти серверов приложений должен быть достаточным для выполнения размещённых на нём приложений.

4. Стоимость аппаратно-технического обеспечения системы не должна превысить сумму, выделенную организацией на закупку аппаратных средств

Сформулированная выше задача построения оптимальной конфигурации РКИС относится к ЫР-полным задачам перебора [5]. Данная задача не может быть решена классическими аналитическими методами в связи с большим количеством и разнородностью входных параметров, а также невозможностью точного

определения значения целевой функции в связи со случайностью процессов, происходящих в системе. Поэтому для оптимизации параметров РКИС

предлагается использовать новый подход, основанный на совместном использовании объектной модели РКИС и аппарата генетических алгоритмов (ГА), суть которого состоит в следующем [8].

Начальный вариант РКИС

формируется на основе информации о её структуре. Параметры отдельных

компонентов РКИС (типы серверов, рабочих станций, каналов связи, а также размещение наборов данных на серверах баз данных и приложений на серверах приложений) кодируются в виде хромосом ГА. Популяция ГА представляет собой набор некоторых точек пространства поиска.

В процессе оптимизации с помощью операторов ГА генерируются хромосомы, то есть различные варианты построения системы. Полученные схемы являются исходной информацией для объектной модели РКИС. Имитационное

моделирование работы РКИС на основе объектной модели позволяет получить оценку критерия эффективности РКИС (2). Эта оценка, в свою очередь, является значением функции приспособленности ГА (фитнесс-функции) для данного варианта решения. Этот процесс повторяется до тех пор, пока не будет достигнут критерий останова генетического алгоритма.

Объектная модель РКИС ЖТ

Для построения имитационной модели РИСЖТ был выбран объектно-ориентированный подход в связи с тем, что он позволяет представить РИСЖТ в виде совокупности объектов заранее созданных классов, включающих свойства

описываемых объектов методы,

реализующие взаимодействие объектов системы. Такой подход позволяет строить и модифицировать модели РКИС

произвольной сложности.

Проведенный анализ показал, что в составе РКИС можно выделить следующие группы типовых компонентов, параметры которых влияют на производительность системы [7]: компоненты технического обеспечения (компьютерное и сетевое оборудование), программное обеспечение, данные. Для этих типовых компонентов разработаны классы объектов.

Компоненты технического

обеспечения: рабочая станция (класс Т'^гк^айоп) - место формирования пользовательских запросов; сервер приложений (класс TAppserver) - сервер, хранящий и выполняющий сложные

приложения; сервер БД (класс TDBServer) - используется для обработки и чтения/записи информации; узел компьютерной системы (класс TNode) -совокупность серверов и /или рабочих станций и сетевых устройств, территориально расположенных в одном месте; сетевое устройство (класс TNetDevice) - коммутатор, маршрутизатор; канал передачи (класс TChannel)-физическая среда передачи данных.

Компоненты программного

обеспечения: приложение (класс

TCISApplication) - пользовательское приложение, запускаемое с определённой периодичностью на рабочей станции, характеризуется набором формируемых запросов; запрос (класс TQuery), который выполняет модификацию, чтение и обновление данных и может инициировать последовательность подзапросов.

Данные: набор данных (класс TDataSet) - логический набор данных.

Для унификации объектов модели введен абстрактный класс TBaseObject, включающий свойства, общие для всех объектов модели: идентификатор объекта (ID) и его наименование (Name). Все остальные классы модели являются производными от класса TBaseObject и наследуют эти свойства.

Модель РКИС представляет собой совокупность взаимодействующих

объектов разработанных классов. В модели реализован алгоритм моделирования, управляемый событиями, при котором в качестве следующего значения модельного времени выбирается минимальное время события из списка событий [7].

Модификация генетического

алгоритма для оптимизации РИСЖТ

При использовании генетического алгоритма для оптимизации РИСЖТ необходимо кодировать большое количество разнородных параметров, таких как серверы, сетевые устройства, каналы связи, наборы данных. В связи с этим применение классического генетического алгоритма для определения оптимальной конфигурации РИСЖТ не представляется

возможным [9]. Рассмотрим предлагаемые модификации способов кодирования хромосом и реализации операторов генетического алгоритма, учитывающие специфику решаемой задачи.

Кодирование структуры и параметров РИСЖТ.

Информацию о структуре РИСЖТ предлагается кодировать в виде набора из 4 мультихромосом [8]:

1. Параметры технических средств типы (серверов баз данных и приложений, сетевых устройств) на узлах РКИС;

2. Типы каналов связи, соединяющих узлы системы;

3. Размещение приложений в узлах системы;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Размещение наборов данных в узлах системы.

Хромосомы, кодирующие типы серверов БД, серверов приложений, каналов связи и сетевых устройств, имеют однородную структуру, поэтому рассмотрим структуру для кодирования в системе условного устройства, различные типы которого используются узлами системы.

Пусть имеем г типов устройства и, которое нужно разместить в п узлах системы. Расположим типы устройства по порядку, тогда каждый тип устройства кодируется двоичной комбинацией (порядковый номер данного типа), длина р которой определяется по формуле:

Р =

log 2 r

4)

На узле S может использоваться несколько различных устройств: Ui.Uk, каждое из которых может иметь определённый тип, причём количество типов каждого из устройств обозначим Г]...Гк соответственно. Тогда использование различных устройств узлом £ системы можно представить в виде битовой строки (рис. 1).

Здесь (Ь1...Ьр) - двоичное представление порядкового номера типа устройства и из общего списка. Если на

каком-либо узле отсутствует устройство Ц то соответствующая этому устройству битовая строка заполняется нулями.

и

и

из

ик

Ъ Ър Ъ1 Ър2 Ъ1 Ърз Ъ1 Ър

1 1 к

Узел Тип сервера БД Тип сервера приложений Тип сетевого устройства

81 Ъ11 Ъ1 р1 ЪИ Ъ1 р2 Ъп Ъ1 рз

52 Ъ2 1 Ъ1 р1 Ъ21 Ъ2 р2 Ъ21 Ъ2 рз

Ъп 1 Ъп р1 Ъп1 Ъп р2 Ъп1 Ъп рз

Р1 = 1(^2 МЬ,

Р2 = 1°§2

Р3 = 1(^2 №пё

Здесь ЫёЪ - количество типов серверов БД, Nsa - количество типов серверов приложений; Nnd - количество типов сетевых устройств, р1, р2 и рз -длины битовых строк, используемых для кодирования типов серверов БД, серверов приложений и сетевых устройств соответственно.

Типы каналов связи, соединяющих между собой узлы РИСЖТ, закодированы в виде матрицы, строками и столбцами в которой выступают узлы системы, а на пересечении строки и столбца зададим тип канала связи (в виде битовой строки), используемого между этими узлами. Получим мультихромосому Хс, структура которой приведена в таблице 2, где Су -битовая строка, задающая тип канала связи между узлами & и Sj: Су=(с1 ...Сс), Си=(0...0), где й = 1о§2Мс, Nс - количество

типов каналов связи, используемых в РИСЖТ.

Таблица 2. Структура

мультихромосомы Хс для кодирования типов каналов связи между узлами РИСЖГ

Рис. 1. Кодирование использования условного устройства и узлами РКИС

Если РИСЖТ состоит из ^ узлов, то для кодирования ее структуры потребуется ^ хромосом, каждая из которых описывает состав технических средств определённого узла системы. Таким образом, получаем мультихро-мосому XI структура, которой представ-лена в таблице 1.

Таблица 1. Структура

мультихромосомы XI для кодирования параметров устройств, используемых узлами РКИС

Nodes 81 82

81 Си С12 Сшп

82 С21 С22 С2Ш

Ст1 Сш2 С^ш

Размещение приложений на серверах приложений также целесообразно закодировать в виде мультихромосомы. Пусть в системе используется Na приложений. Тогда размещение

приложений на сервере приложений 8а; кодируется битовой строкой длины ^. Использование ^ приложений №а серверами кодируется Nsa строками длиной ^ Вид полученной мультихромосомы представлен в таблице 3.

Таблица 3. Структура

мультихромосомы Ха для кодирования размещения приложений на серверах

риложений

АррИсаИот Арро^-^ сайоп А1 А2 Аш

8а1 ац а12 аша

8а2 а21 а22 а2т

аша1 а^а2 а^аШ

ау ="

| 1, если приложение.А у используетя / - м сервером 10, если приложениеАу не используетя / - м сервером

Пусть в РИСЖТ имеется наборов данных и ШЪ серверов баз данных. Тогда размещение у-го набора данных на /-ом сервере баз данных SdЪi кодируется битовой строкой длиной Nds. Кодирование размещения наборов данных (Д) на серверах БД (SdЪ) представлено мультихромосомой Xd - таблица 4.

Таким образом, конфигурация РКИС кодируется набором из 4 мультихромосом, определяющих типы серверов и сетевых устройств на узлах системы, типы каналов связи между узлами, размещение приложений системы на серверах

приложений и размещение наборов данных на серверах БД.

Таблица 4. Структура мультихромосомы Хё для кодирования размещения наборов данных на серверах БД

Наборы ^ч. данных Серверы4^ БД \ ВБ! ВБ2 ВБтх

БёЬ1 йп ё12

БёЬ2 ё22

БёЬмь ёты ёшЬ2 ёшьт!

1, еслиDSj размещён на 1 - ом сервере 0, еслиDSj отсутствут на 1 - ом сервере

родительскими особями. Обмен

происходит с вероятностью Рк1. Схема выполнения оператора рекомбинации для двух особей, представленных набором из 4-х мультихромосом (Х^ - мультихромосома, в которой закодированы типы серверов и сетевых устройств, Хс - мультихромосома, в которой закодиро-ваны типы каналов связи между узлами РИСЖТ, Хё -мультихромосома, в которой закодировано размещение наборов дан-ных на серверах БД, Ха - мультихромосома, в которой закодировано размещение приложений на серверах приложений), представлена на рис. 2.

а

и

Генетические операторы

Стратегия отбора для оператора отбора является составной частью ГА и определяет особи для скрещивания. Из популяции, содержащей N особей, выбирается случайным образом I особей и среди них - лучшая, для которой значение фитнесс-функции максимально:

Рис. 2. Схема выполнения оператора рекомбинации

Г(Л) - тах{)} V = (5)

Отобранная особь записывается в промежуточный массив. Эта операция повторяется к раз. В предлагаемой реализации генетического алгоритма к=2. Особи из полученного промежуточного массива затем используются для скрещивания.

Оператор рекомбинации реализует обмен соответствующими

(гомологичными) хромосомами между парами особей с заданной вероятностью Рк1, что соответствует обмену серверами и сетевыми устройствами различных типов на одном узле между двумя модификациями РИСЖТ, а также изменению размещений наборов данных и приложений на серверах баз данных и приложений. Выбор родительских особей для рекомбинации осуществляется с помощью оператора отбора. Из каждой пары родительских особей формируется пара дочерних путём обмена гомологичными хромосомами между

Оператор скрещивания реализует обмен участками хромосом между родительскими особями, что соответствует изменению типов серверов, сетевых устройств, используемых в узле РИСЖТ, типов каналов связи между узлами, а также наборов данных и приложений, размещаемых на серверах в новом варианте РКИС в соответствии с одним из родительских вариантов. Выбор родительских особей для скрещивания производится при помощи оператора отбора. Особенность оператора

скрещивания заключается в том, что применяются различные модификации оператора скрещивания к различным мультихромосомам, а именно: к мультихромосоме, кодирующей типы устройств применяется двухточечный оператор скрещивания, а к остальным -однородный. Скрещивание производится с вероятностью Рк2,

При двухточечном скрещивании две точки скрещивания разбивают хромосому на три части, и родительские хромосомы

обмениваются сегментом, который находится между точками разрыва. Схема выполнения оператора скрещивания для двух мультихромосом, кодирующих типы устройств в узлах РКИС, приведена на рисунке 3.

Рис. 3. Схема оператора двухточечного скрещивания

При однородном скрещивании значение каждого бита в хромосоме потомка определяется случайным образом из соответствующих битов родителей. Для этого используется маска, представляющая собой битовую строку, которая имеет такую же длину, что и хромосомы, проходящие скрещивание. Для

определения каждого из разрядов маски формируется случайное число Ре[0;1], причём /-й разряд маски принимает единичное значение, если Р>Рк2, и нулевое в противном случае. Если случайное число больше Рк2, то на п-ю позицию первого потомка попадает п-й ген первого родителя, а на п-ю позицию второго - п-й ген второго родителя. В противном случае к первому потомку попадает ген второго родителя, а ко второму - первого. Такая операция проводится для всех генов хромосомы. Схема однородного скрещивания для хромосомы, кодирующей размещение наборов данных на одном из серверов БД, приведена на рис. 4.

В результате скрещивания две родительские особи порождают две дочерние особи. Скрещивание

родительских особей выполняется до тех пор, пока количество потомков не станет равным количеству родителей, то есть размер популяции удвоится.

Рис. 4. Схема оператора однородного скрещивания

Оператор мутации применяется ко всем членам промежуточной популяции, сформированной с помощью оператора скрещивания. Оператор мутации с вероятностью Ршиг инвертирует биты в хромосоме каждой особи. При применении оператора мутации необходимо проверять полученное решение на соответствие условиям ограничений.

Оператор селекции применяется после скрещивания для выбора особей, которые войдут в следующее поколение. Создается промежуточная популяция, которая включает в себя как родителей, так и их потомков. Члены этой популяции оцениваются, а затем из них выбираются N самых лучших, которые и войдут в следующее поколение.

Алгоритм оптимизации

конфигурации РИСЖТ. Каждая мультихромосома в многохромосомном представлении структуры РИСЖТ отвечает за определённый аспект решения (параметры технических средств системы, размещение наборов данных или приложений). Это позволяет

комбинировать наборы мультихромосом в одном решении, что является приближением к естественной эволюции. С другой стороны, представление решения набором мультихромосом дает

возможность организации поиска решений в различных постановках, то есть по определённому набору параметров, оставляя отдельные виды мультихромосом неизменными в процессе генетического поиска. Фиксация отдельных хромосом приводит к сужению пространства поиска, при этом возможна потеря оптимальных решений. Поэтому представляется

целесообразным комбинирование

отдельных постановок при поиске оптимального решения.

Поскольку изменение параметров устройств РИСЖТ может существенно повлиять на эффективность размещения данных и приложений на серверах и скорость выполнения запросов,

целесообразно применить

последовательный подход при реализации генетического алгоритма оптимизации, который заключается в последовательной реализации эволюционного процесса в четыре этапа. При этом на каждом этапе модифицируется одна из мультихромосом: устройств Х^, каналов Хс, наборов данных Хё и приложений Ха. Таким образом, в наборы модифицируемых МБ/ входит по одному типу мультихромосом: МБ1 (Х^, МБ2 ^ (Хс}, МБз (Хё}, МБ4 ^ (Ха}.

На первом этапе последовательного генетического алгоритма в качестве исходной служит популяция Ос, на втором - популяция О1, сформированная после отработки первого этапа, и так далее.

Схема реализации последовательного генетического алгоритма для оптимизации РИСЖТ представлена на рисунке 5.

Рис.5. Схема реализации последовательного генетического алгоритма для оптимизации РИСЖТ

В начале оптимизации происходит формирование структуры РИСЖТ, для которой используется информация об узлах РИСЖТ и размещаемых в них устройствах и связях между ними. Затем производится ввод параметров генетического алгоритма: РБ - размер популяции , ЕБ - размер выборки для элитного отбора , Рк1 -вероятность рекомбинации , Рк2 -вероятность скрещивания, РшШ -вероятность мутации, GQ - количество поколений.

Затем формируется начальная популяция О, каждая особь которой состоит из 4 мультихромосом. При создании особей каждая из них проверяется на попадание в область допустимых решений (АУЯ}, т.е. на соответствие ограничениям, указанным в постановке задачи.

Эволюционный процесс для набора хромосом МБ/ состоит в следующем.

1. Для каждого генотипа популяции, задаваемого набором мультихромосом, рассчитывается значение фитнесс-функции

ш

2. Далее на каждом поколении (N0) последовательно реализуются операторы комбинированного кроссинговера (рекомбинация и скрещивание) и мутации. Каждый раз для выполнения кроссинговера оператором отбора выбирается родительская пара (А1 и А2). Скрещивание происходит с вероятностью Рк2 между модифицируемыми хромосомами данного узла алгоритма, а остальные подвергаются рекомбинации в дочерних особях с вероятностью Рк1 .

3. Полученная в результате выполнения кроссинговера дочерняя пара хромосом В1 и В2 включается в дочернюю популяцию (В}, если параметры этих особей удовлетворяют ограничениям (5)-(8).

4. Хромосомы дочерней популяции (В} подвергаются мутации с вероятностью Ршм, при этом образуется популяция мутантов. Родительская популяция и популяция мутантов объединяются в промежуточную популяцию (Р}.

5. Для всех новых членов популяции рассчитывается значение фитнесс-функции

6. Выбирается лучшее решение, которое запоминается в массиве ВР.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Последним этапом в пределах одного поколения является реализация процесса "естественного отбора", т.е. сокращения популяции {Р} до размеров начальной популяции РБ при помощи селекционного отбора.

Таким образом, происходит процесс эволюции. Популяция, полученная в результате эволюции на этом этапе, является входной для следующего поколения (цикла генетического алгоритма). Алгоритм завершает работу по достижении заданного количества поколений GQ и из лучших особей выбирается особь с минимальным значением фитнесс-функции. Параметры этой особи представляют собой субоптимальное решение задачи оптимизации РКИС.

Оценка полученного с помощью генетического алгоритма субоптимального решения может быть проведена путем сравнения с решением, полученным с использованием метода полного перебора.

Для проведения экспериментальных исследований с использованием

разработанной модели и алгоритма оптимизации рассмотрим ИС РЖД. Наличие 17 ЖД предполагает 17 вычислительных центров, сейчас их число уменьшено до 8, но вычислительной мощности вычислительных центров ЖД, построенных на основе использования различных мэйнфреймов, должно быть достаточно для обеспечения потребностей в поддержке РЖД. Вдоль линий РЖД в России проложено оптоволокно (компания «Транстелеком»). Осуществляется

кольцевание оптоволоконных линий связи на многих топологических участках ЖД, поскольку один кабель проложен вдоль одного, а другой - вдоль другого пути. Для того чтобы все железнодорожные системы стран СНГ были друг с другом состыкованы, создан межгосударственный уровень управления - специальный вычислительный центр (ИВЦ ЖА -Информационно-вычисли-тельный центр железнодорожных администраций) Это верхний уровень, который находится над уровнем систем ЖД и координирует информационный обмен между разными ЖД. Вся информация, которая необходима для расчёта провозной платы, использования чужого подвижного состава, штрафов и т. д. - всё стекается в этот ИВЦ.

Информационно-аналитическая система с элементами прогнозирования продвижения вагонов и грузов до пунктов назначения (крупных промышленных предприятий, портов, погранпереходов) на базе Автоматизированной Системы Управления станциями» разработана Центром Информационных Технологий на Транспорте (ЦИТТранс) в рамках программы «Грузовой экспресс» -автоматизированной системы обеспечения своевременной и адресной доставки грузов - и является ее компонентом

Автоматическая обработка, архивация и хранение данных о погрузке грузов, их продвижении и выгрузке с целью формирования полной модели подхода поездов, порожних вагонов, контейнеров, местного и экспортного груза с анализом выполнения срока доставки и последующего предоставления различных типов информационных выборок этих данных в регламенте и по запросу в любой момент времени

Свежая информация о

местонахождении и состоянии груза в вагоне, контейнере поступает в АСУ станции от системы вышестоящего уровня дороги (АСОУП) при отправлении груза в составе поезда со станции погрузки, при проходе междорожных стыков, при бросании поезда независимо от того, является ли станция бросания стыковой или нет, при проследовании крупных (или важных с точки зрения дороги) станций своей дороги

Для организации информационного обмена между АСУ станциями и грузоотправителем на территории клиента устанавливается система АРМов АСУ станциями (АС ОПД), а при наличии у грузоотправителя локально работающей АСУ реализация информационного обмена происходит посредством специально разработанного сообщения 500, которое по окончании подготовки перевозочного документа формируется и передается в АСУ станциями.

Взаимодействие с клиентом включает в себя также тесно связанные с

описываемым другие комплексы задач, такие, как: информирование получателя о погруженном в его адрес грузе в объеме перевозочных документов,

информирование грузополучателя и грузоотправителя о местонахождении груза

Для функционирования

информационной системы используется единая база данных, таблицы которой горизонтально фрагментированы. С данными работают пользователи, обращаясь через клиентские приложения к базе данных, что приводит к появлению распределенных запросов.

Данная распределенная

информационная система имеет размер и характеристики, позволяющие

использовать ее в качестве объекта экспериментальных исследований с помощью разработанных объектной модели и оптимизационного алгоритма с целью выявления «узких мест» системы. Анализ загруженности каналов связи позволяет определить, какие из каналов являются наиболее загруженными и являются «узкие места» системы.

Для вычисления критерия

эффективности каждый вариант

конфигурации моделировался с помощью объектной модели в течение 10 дней модельного времени. Данный период времени был выбран, так как из результатов проведенных экспериментов видно, что значение среднего времени выполнения запросов стабилизируется после 9-10 дней моделирования и по прошествии такого периода времени значение критерия эффективности практически не подвержено влиянию отдельных редко возникающих запросов. Также увеличение времени моделирования приводит к значительному росту временных затрат на оптимизацию.

Была проведена оптимизация с помощью разработанного алгоритма оптимизации и с помощью процедуры полного перебора (с учетом ограничений).

В ходе процедуры полного перебора происходило моделирование каждого из возможных вариантов распределения

данных и состава технических средств в течение десяти дней модельного времени.

В результате процедуры полного перебора были получены результаты, представленные на рисунке 6. Полученные в ходе моделирования данные о времени выполнения запросов позволяют сделать вывод, что в исследуемой РИСЖТ время выполнения запросов в целом распределено равномерно, и нет запросов, время выполнения которых значительно больше или меньше времени выполнения других запросов. Таким образом, все запросы влияют на значение критерия эффективности в равной степени.

Время выполнения запросов при полном переборе

Рис. 6 - Время выполнения запросов

Было получено оптимальное решение, при котором максимальное значение времени выполнения запроса на обновление, выбранного в качестве критерия эффективности, равно 56,79 сек. При этом прирост эффективности составляет 23%, а сокращение среднего времени выполнения запросов на 17 секунд, по сравнению с исходной системой с неоптимизированными параметрами.

Время поиска оптимального решения с использованием процедуры полного перебора с использованием ПЭВМ с процессором AMD Intel Core 2 Duo 3,2 GHz составило приблизительно 12 суток.

Наилучшее субоптимальное решение, полученное с помощью генетического алгоритма, составляет 57,12 секунд, что на 0,5 секунды больше глобального оптимума полученного с помощью алгоритма полного перебора. Относительное отклонение составило 0,99%.

Выводы

Сформулирована задача поиска оптимальной конфигурации РИСЖТ. В качестве критерия оптимизации предложено использовать максимальное время выполнения пользовательского запроса.

Для оптимизации конфигурации РИСЖТ предложен новый подход, основанный на взаимодействии объектной модели и генетического алгоритма, в результате работы которого определяются параметры серверов, сетевых устройств, каналов связи РИСЖТ, а также способы размещения наборов данных и приложений на серверах БД и приложений. Разработаны модификации генетического алгоритма для нахождения субоптимального решения задачи оптимизации РИСЖТ.

Проведенные вычислительные

эксперименты показали, что применение предложенного подхода к оптимизации параметров РИСЖТ позволяет повысить эффективность ее работы. Полученное при данных параметрах оптимизационной модели время выполнения самого длительного запроса составило 57,12 сек, что отличается от оптимального решения, полученного методом полного перебора (56,79 сек) всего на 0,99 % , то есть субоптимальное решение достаточно близко к глобальному оптимуму. Таким образом, оптимизация распределения таблиц базы данных и приложений, а также параметров серверов, каналов связи и сетевых устройств обеспечивает повышение эффективности работы РИСЖТ за счет сокращения времени доступа к системе и модернизации оборудования при минимальных затратах со стороны железной дороги.

Список литературы:

1. Исаков О.А. Информационные системы на железнодорожном транспорте: опыт проектирования и развития [Текст] / О.А. Исаков // Информационно-экономические аспекты стандартизации и

технического регулирования, 2013.- № 4. -19 с.

2. Lynda M. Applegate, James L. McKenney, F. Warren McFarlan. Corporate information systems management: The challenges of management in an information age. [Текст] / Lynda M. Applegate, James L. McKenney, F. Warren McFarlan // McGraw-Hill Higher education, 1999. - 312 p.

3. Tervonen I. Towards deeper co-understanding of software quality [Электронный ресурс] / I. Tervonen, P. Kerola // Information and Software Techno-logy, 1999. - vol. 39, No 14-15. - Режим доступа: http://www. sciencedirect.com/science/article/pii /S0950584997000608

4. Агибалов Г.П., Скутин А.А. Математическая модель и технология разработки безопасных корпоративных информационных систем. [Электронный ресурс] / Г.П. Агибалов, А.А.Скутин // Электронный журнал «Исследовано в России»: Томский государственный университет, 2001. с. 1739-1750. Режим доступа: http: //zhurnal.ape.relarn.ru/articles/2001.151.pdf

5. Лаздынь С.В., Землянская С.Ю. Многокритериальная оптимизация корпоративных информационных систем // Науковi пращ ДонНТУ. Серiя "Обчислювальна техшка та автоматиза-щя" -Випуск 12(118). - Донецьк: ДонНТУ, 2007. -С. 74 - 82.

6. Скобцов Ю.А. Основы эволюционных вычислений [Текст]: Монография/ Ю.А. Скобцов - Донецк: ДонНТУ, 2008. - 326с.

7. Землянская С.Ю. Объектная модель распределённой компьютерной информационной системы. [Текст] /С.Ю. Землянская, С.Ю. Лаздынь // Науковi пращ ДонНТУ. Серiя "Обчислювальна техшка та автоматизащя" - Випуск 14(129). - Донецьк: ДонНТУ, 2008. - С. 107-116.

8. Землянская С.Ю. Оптимизация распределённых корпоративных информационных систем с использованием генетических алгоритмов и объектного моделирования [Текст] /С.Ю. Землянская, С.В. Лаздынь // Науковi пращ ДонНТУ.

Серiя "Обчислювальна техшка та автоматизащя" - Випуск 16(147). - Донецьк: ДонНТУ, 2009. С. 83-95.

9. Kalyanmoy Deb. Understanding interactions among genetic algorithm parameters [Электронный ресурс] / Deb. Kalyanmoy, Agrawal Samir // Foundations of Genetic Algorithms, 1999. pp. 265-286. -Режим доступа: www. iitk. ac.in/kangal/papers/k99003.pdf

10. Божич В.И. Методы генетического поиска для решений представимых мультихромосомами / В.И. Божич, В.Б. Лебедев // Перспективные информа-ционные технологии и интеллектуальные системы. -2002. - № 3. - С. 38 - 44.

Аннотации:

В статье предложен подход к оптимизации конфигурации распределенной информационной

системы железнодорожного транспорта как распределенной корпоративной информационной системы, заключающийся в совместном использовании объектной модели и аппарата генетических алгоритмов. Дано определение критерия оптимальности функционирования информационной системы. Проведены

вычислительные эксперименты, которые показали, что применение предложенного подхода к оптимизации конфигурации РИСЖТ позволяет повысить эффективность ее работы с точки зрения предложенного критерия эффективности.

The approach to optimization of distributed information systems of railway transport (DISRT) as a distributed enterprise information system configuration is proposed. The approach is to use the object model and machine genetic algorithms. The distributed information system optimal functioning criterion is defined. Computational experiments showed that the proposed approach to the DISRT configuration optimization improves the efficiency of its work from the point of view of the proposed efficiency criterion.

i Надоели баннеры? Вы всегда можете отключить рекламу.