Научная статья на тему 'Адаптивное управление структурой сложных стохастических систем на основе сетей Петри'

Адаптивное управление структурой сложных стохастических систем на основе сетей Петри Текст научной статьи по специальности «Математика»

CC BY
166
72
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Качур Светлана Александровна

Рассматривается задача оптимального управления структурой стохастических систем и их соединений по квадратичному критерию с ограничениями на управление. Приводятся алгоритмы решения задачи для двух вариантов управления: терминального и нетерминального

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Universal adaptive algorithm of optimum control by structure on the Petri nets basis for no terminal and terminal control on the square-law criterion is offered. The algorithm allows to synthesis control action on the variable range for complex systems, than function under large prior uncertainty conditions.

Текст научной работы на тему «Адаптивное управление структурой сложных стохастических систем на основе сетей Петри»

УДК 681.5

АДАПТИВНОЕ УПРАВЛЕНИЕ СТРУКТУРОЙ СЛОЖНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ НА ОСНОВЕ СЕТЕЙ ПЕТРИ

КАЧУР С.А.________________________________

Рассматривается задача оптимального управления структурой стохастических систем и их соединений по квадратичному критерию с ограничениями на управление. Приводятся алгоритмы решения задачи для двух вариантов управления: терминального и нетерминального.

1. Введение

Основой синтеза оптимального управления, производимого в процессе функционирования объекта в реальном времени, является модель данного объекта и критерий оптимальности. В зависимости от модели и критерия осуществляется выбор алгоритма адаптации, позволяющего восполнять недостаток априорной информации текущей информацией о функционировании управляемого объекта[1].

Цель исследования - разработка моделей и адаптивных алгоритмов управления структурой сложных стохастических систем в условиях неопределенности с использованием аппарата сетей Петри.

Актуальность исследования. Сложность модели определяется сложностью объекта управления (ОУ) и требованиями к адекватности отображения процесса его функционирования. В работах, посвященных уп-р авлению космическими или летательными аппаратами, обычно в качестве модели ОУ принимается математическая модель движения аппарата [2,3]. Ведутся разработки алгоритмов оптимального управления, позволяющих эффективно решать задачи управления движением [4,5], прогнозирования траектории движения космического аппарата (КА)[6]. Однако управление полетом КА требует целостного рассмотрения функционирования всего комплекса бортовых систем.

Одна из проблем управления полетом - обеспечение устойчивости всех звеньев контура управления полетом, контура в целом и алгоритма его функционирования по отношению к возмущениям [7]. Такая устойчивость обеспечивается обычно комплексом организационно-технических мероприятий. В частности, во всех звеньях контура должно быть предусмотрено резервирование на различных уровнях (от элементов до блоков), а также функциональное резервирование, при котором функции какой-либо системы при выходе из строя могли бы выполняться другой системой, работающей на иных принципах.

Предложенный в работе [8] подход к построению модели КА на базе расширения сетей Петри (СП) позволяет использовать формализм СП для организа-

3 8

ции поиска оптимальной структуры контура управления полетом КА. Данное расширение СП в значительной степени определяет особенности и достоинства (снижение размерности задачи за счет сокращения рассматриваемых в текущий момент времени множе-ств(классов) структур) адаптивного алгоритма оптимального управления структурой объекта управления с точки зрения рассмотренного выше подхода к резервированию.

2. Постановка задачи адаптивного управления структурой в терминах сетевой модели

Пусть множество связей между элементами системы (стохастическими подсистемами), функционирующими в текущий момент времени, включает некоторое

подмножество b(b с B, где в - множество управляемых дуг), которое может изменяться в течение времени. Тогда можно говорить о локальном управлении структурой объекта на малом интервале времени

[ti; t2 ], заданном моментами наблюдения. Предполагается, что на данном интервале подмножество управляемых дуг, по которым осуществляется передача информации, постоянно.

Модель стохастической системы с локальным управлением структурой, т.е. с формированием сигналов для включения /отключения некоторого подмножества каналов передач внутри системы, описывается СП с управляющим воздействием US:

Cus = (M,US),

где M - маркированная стохастическая сеть с сдерживающими событийными гипердугами [9].

Маркированная СП описывает состояние объекта и задается двенадцатью атрибутами:

M = (P, T, I,O,MB, FY, PI, PIG, VZS, MVT, щ At),

где T - множество переходов - множество стохастических подсистем (элементов моделируемой системы); P - множество позиций - множество наборов выходов элементов; I - входная функция-отображение из переходов в комплекты позиций - множество наборов входов элементов системы; O - выходная функция-отображение из переходов в комплекты позиций - множество наборов выходов элементов системы; MB - множество моделей, сопоставленных переходам; FY - функции, определяющие срабатывание переходов; PI - множество векторов вероятностей передачи сигналов между элементами системы; PIG - множество векторов разрешения передачи информации между элементами в текущий момент времени; VZS - множество векторов значений внешних для элементов сигналов; MVT - множество матриц значений фазовых координат элементов за указанное число тактов моделирования; ц - множество маркеров - множество векторов сигналов; At -задержка распространения маркера.

BE, 2005, 1 4

Определим вектор управления US как d -мерный вектор (d - количество выходных дуг переходов СП), элементы которого могут принимать значения из множества {0,1,х}, где 0 - управляемая дуга запрещена (канал передачи отключен), т.е. плотность вероятности передачи информации по каналу имеет математи-

2

ческое ожидание m = 0 и дисперсию ст = 0; 1 -

2

управляемая дуга разрешена, т.е. m = 1 и ст = 0; х -дуга не является управляемой, плотность вероятности передачи информации определяется в процессе моделирования. В процессе моделирования системы сетью Петри управляемым дугам сопоставляются вероятности передачи информации, равные 0,5 (m = 0,5 ; ст2 = 0). Ограничение на управление задается сдерживающими событийными гипердугами. Управляемые дуги, одновременное подключение которых не допускается, охватываются сдерживающей событийной гипердугой.

Наблюдения осуществляются с шагом т >> At. Измеритель является линейным и безинерционным.

Задача оптимального управления структурой стохастических систем на базе СП состоит в определении вектора US, характеризующего класс структур s є S на интервале времени [ti; t2 ] и удовлетворяющего заданному критерию оптимальности.

Рассмотрим оптимизацию структуры по критерию минимума среднего квадрата ошибки [1]:

1о - min M[(Y(t2) - Yx(t2))T(Y(t2) US(t2)

-YT(t2)) US(t2),Z(t1),t1 <t2]5

(1)

где Y(t2) - прогнозируемый вектор состояния системы; Yt (t 2) - прогнозируемый теоретический требуемый вектор состояния системы; Z(t1) - вектор наблюдения; US(t2) - прогнозируемый вектор управления.

Используя результаты статистического эксперимента, можно записать критерий (1) в следующем виде:

Iо = min zI <^*(l)(Y,t)|p(l)(s,t},t1 <t< t2,(2)

s(t)eS(t)les(t)

здесь cr*(l)(Y,t) - центрированный относительно Y т (t 2) вектор оценок средних квадратичных отклонений выходных сигналов для l -й структуры; p(l)(s,t) - оценки вероятности l -й структуры внутри класса структур s(t) є S(t).

3. Адаптивный алгоритм структурной оптимизации стохастических систем

Исходные данные для адаптивного алгоритма оптимального управления включают результаты статистического эксперимента, проводимого на основе имитационного моделирования сетью Петри. В процессе

эксперимента, кроме функций плотностей вероятностей сигналов на выходах элементов системы, определяются подмножества управляемых дуг, каждое из которых задает один класс моделируемых структур. Вероятность класса структур есть суммарная вероятность структур, принадлежащих данному классу.

Исходная для статистического эксперимента структура является результатом структурной идентификации по значению вектора наблюдения Z(t1) с учетом вектора USOr). Кроме того, производится идентификация вектора внешних случайных воздействий V(t1), которая осуществляется аналогично идентификации случайных параметров и выполняется одновременно с идентификацией структуры. Закон распределения внешних случайных воздействий известен.

Для описания внешних воздействий примем регрессионную модель вида [9]

V(t) = ц + Rcos(rot + ф) + e(t),

где Ц - среднее значение ( для центрированного белого гауссовского шума ц = 0); ю - угловая частота (ю = 2к/ T, T - период, определяемый по данным идентификации); R - амплитуда; ф - фаза; e(t) -ошибка.

Определив A = R cos^) и B = -R sin(ф), получим уравнение линейной регрессии с двумя векторами-регрессорами [9]:

V(t) = Acos(rot) + Bsin( rot). (3)

По результатам идентификации внешних воздействий на интервале времени Д0Д1] производится оценка параметров уравнения регрессии (3). Прогнозируемое значение вектора V(t2) принимается постоянным на интервале Д1Д2].

Таким образом, априорной информацией для алгоритма являются:

1) структура lnOr) системы, определенная в результате работы алгоритма идентификации;

2) прогнозируемый вектор внешних воздействий

V(t2);

3) оценка вектора Y(t1) значений сигналов на выходах переходов структуры lH(t!);

4) ограничения на значения Y или мера расхождения

|Y - Yt |<є.

Адаптивный алгоритм включает перечисленные ниже этапы.

1. Начальная установка.

а) Установка начальной маркировки СП, соответствующей структуре 1н0д); t:= t1.

б) Определение начального шага моделирования

3 9

BE, 2005, 1 4

At = (t2 - t)/ni(t), nj(t) = k(t)2n2(t), ti < t < t2, (4)

где k(t) - заданное минимальное число тактов моделирования; П2 (t) - число дуг в структуре СП, изменивших в текущий момент времени t свое состояние (n2(ti) = 0).

в) Множество запрещенных классов ZS(ti) = 0.

2. Моделирование сетью Петри поведения объекта на интервале [t;t + At] с учетом множества ZS(t), т.е. при появлении набора состояний управляемых дуг из множества ZS переходят к следующей генерации вероятностей передачи сигналов по управляемым дугам.

3. Определение n2(t + At) и ni(t + At) ;

k(t + At) := k(t) -1.

4. Проверка ограничений на значения вектора у. В случае их невыполнения по матрице маркировки определяется текущая структура, порождающая запрещенные значения вектора y . Класс структур, в который входит данная структура, заносится в множество ZS.

Определение матрицы маркировки [10].

Матрица маркировки - это таблица, в которой количество строк определяется числом тактов моделирования, а количество столбцов - числом позиций СП. Элемент матрицы маркировки является списком позиций, наличие маркеров в которых в предыдущий (i -1) такт моделирования вызвало появление маркера в j -й позиции в текущий такт моделирования i. Каждому г -му элементу данного списка сопоставлен вектор значений сигналов VZSr(ti). Кроме того, позициям сопоставлена строка наблюдаемых сигналов.

5. Модификация матрицы маркировки. Из матрицы маркировки удаляются все структуры классов, входящих в множество ZS .

6. Изменение временного интервала: t := t + At; расчет по формуле (4) At. Если t<t2,то выполняем п.2.

7. Определение по матрице маркировки: а) структур, полученных в результате моделирования; б) классов структур; в) вероятностей структур внутри классов.

8. Выбор на основе критерия (3) класса структур s опт и формирование вектора US^ (t2).

Применение переменного шага моделирования позволяет осуществить неявный переход от синхронного моделирования сигналов к событийному.

Предложенный алгоритм является нетерминальным.

Интегральный критерий оптимальности для терминального упр авления имеет вид:

4 0

1ок 2 тахр^(копт ,ti) i l

где p(l)(sопт ,ti) - оценка вероятности появления структуры l є s^ на интервале времени [ti; ti + т]; s опт - класс структур, определенный в результате работы нетерминального варианта адаптивного алгоритма оптимизации.

Задача терминального управления состоит в определении наиболее вероятной последовательности структур на интервале времени [to;t^], для которых выполняется нетерминальный критерий оптимальности

(3) на интервалах, задаваемых сменой классов структур.

В терминальном варианте рассматривается не одно прогнозное значение вектора V(t2), а множество Mv векторов V(ti), где ti = t0 + ix (i = 1, m), x -заданный шаг прогноза (m = (tK -10) /x, tK > tK). Для каждого i -го интервала [ti; ti +x] выполняется нетерминальный вариант адаптивного алгоритма. Управление объектом осуществляется событийно, т.е. поступление вектора управления на объект в момент ti+1 происходит при изменении ^опт

(Шопт (ti+1) Ф USопт (ti)). Наиболее вероятная структура lопт(ti) для выбранного класса sопт(ti) является исходной для следующего шага алгоритма терминального управления. Маркеры помещаются в позиции структуры lопт(ti). Сигналы, сопоставленные этим позициям, принимают средние значения. Правый конец временного интервала tK не фиксирован и определяется временем очередного поступления информации от измерителей. Начальные значения t0, s(t0) и распределения шумов заданы. В результате работы терминального алгоритма на интервале [t0;tK] выдается последовательность управляющих воздействий US^(ti)(t0 < ti < tK) с переменным шагом, отражающим изменения ^опт.

4. Заключение

Научная новизна. Предложенный алгоритм позволяет выполнить изменения структуры при заданных ограничениях в условиях структурной неопределенности при наличии случайных внешних воздействий. Сложность алгоритма - это временные и емкостные затраты в наихудшем случае как функция от размерности задачи (модели). Применение предложенного расширения СП дает возможность снизить сложность без снижения точности отображения реальных процессов.

Практическая значимость состоит в том, что появляются новые возможности описания различных классов объектов, позволяющих увеличить мощность моделирования и, следовательно, эффективность алгоритмов управления.

ВЕ, 2005, 1 4

Выводы

Представленный адаптивный алгоритм позволяет решать задачи управления структурой для целого этапа функционирования управляемого объекта(пуск или останов, выход в заданную навигационную точку с заданными навигационными параметр ами и т. д.) оптимальным образом в условиях априорно не заданной ситуации. Его применение предполагает использование многопроцессорных систем, которые позволяют эффективным образом реализовать моделирующие возможности СП.

Алгоритм оптимизации структуры требует разработки сложного программного обеспечения, целесообразность применения которого связана с высоким уровнем сложности объекта управления.

Литература: 1. Казаков И.Е., Артемьев В.М. Оптимизация динамических систем случайной структуры. М:Нау-ка, 1980. 384с. 2. Морозов Л.В. Нелинейное адаптивное терминальное управление наведением малоразмерного планирующего космического аппарата // Космические исследования. 1996. 34, №2. С.197-206. 3. Левский М.В. Оптимальное управление пространственным разворотом космического аппарата // Космические исследования. 1995. 33, №5. С.498-502. 4. Кумков С.И., Пацко В.С., Пятко С.Г., Решетов ВМ., Федотов А.А. Информационные множества в задачах наблюдения за движением самолета в горизонтальной плоскости // Изв. Академии наук. Теория и системы управления. 2003. №4. С.51-61.5. Сиро-

УДК519.81 "

ПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ АДДИТИВНОМУЛЬТИПЛИКАТИВНЫХ МОДЕЛЕЙ МНОГОФАКТОРНОГО ОЦЕНИВАНИЯ

БЕСКОРОВАЙНЫЙ В.В., ТРОФИМЕНКО И.В.

Рассматривается применение подхода компараторной идентификации для решения задачи синтеза моделей многофакторного оценивания. Предлагается метод решения задачи параметрической идентификации для аддитивно-мультипликативных моделей, позволяющий свести ее к задачам линейного или нелинейного математического программирования.

1. Введение и актуальность исследования

Важнейшей задачей формализации процесса выбора решений в многофакторных ситуациях считается определение метрики для ранжирования альтернатив. В качестве методологической основы для построения метрики традиционно используется теория полезности [1-2], в соответствии с которой для каждой из альтернатив x из допустимого множества X может быть определено значение ее полезности (ценности) P(x). При этом считается, что для всех x,y є X : из x « y следует P(x) = P(y); из x ^ y следует P(x) >P(y); из x > y следует P(x) іP(y).

тин А.Н. Об условиях разрешимости класса задач управления скалярными дискретными системами с аддитивными случайными возмущениями // Изв. Академии наук. Теория и системы управления. 2003. №3. С.17 -29. 6. Зелык Я.И., ЛычакМ.М., Шевченко В.Н. Моделирование и идентификация объектов управления с применением INTERVAL-SET ANALYSYS MATLAB TOOLBOX // Проблемы управления и информатики. 2003. №2. С.42-57. 7. Кравец В.Г., Любинский В.Е. Основы управления космическими полетами. М.: Машиностроение, 1983. 224с. 8. Качур С.А. Модель стохастических систем и их соединений на основе сетей Петри // Проблемы управления и информатики. 2002. №1. С.93-98. 9. Справочник по прикладной статистике.В 2-х т.Т.2: Пер. с англ/Под ред. Ллойда Э.,Ледермана У., Айвазяна С.А.,Тюрина Ю.Н. М.:Финан-сы и статистика,1990. 523с. 10. Качур С.А. Структурная и параметрическая идентификация стохастических систем и их соединений на основе сетей Петри//Проблемы управления и информатики. 2003. №3. С.56 -62.

Поступила в редколлегию 18.10.2005

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рецензент: д-р физ.-мат. наук Тимченко И.Е.

Качур Светлана Александровна, канд. техн. наук, доцент кафедры менеджмента и экономико-математических методов Севастопольского национального технического университета. Научные интересы: сети Петри, модели, моделирование, управление сложными техническими системами, управление экономическими системами. Адрес: Украина, 99029, Севастополь, пр. Острякова, 74, кв. 9, тел. (0692) 57-09-92.

Определение метрики для ранжирования альтернатив представляет, по сути, решение задачи идентификации функции общей полезности (ФОП) P(x). В общем

случае в процессе идентификации P(x) требуется решение вопросов, связанных с выбором критериев подобия модели, входных сигналов, структуры и параметров модели, оценки ее точности и адекватности. При выбранной структуре модели задача сводится к определению наилучших значений ее параметров.

В качестве критериев идентификации (подобия моделей) в зависимости от условий задачи используются: минимум суммарной (средней, максимальной, суммарной квадратичной) абсолютной, относительной погрешности оценки общей полезности P(x), максимум силы предпочтений, средней точки, максимум функции пр авильности выбора или минимум погрешности восстановления порядка альтернатив [3].

Модели многокритериального оценивания и выбора строятся на основе аддитивных, мультипликативных или смешанных ФОП. На практике чаще всего используются аддитивные ФОП, представляемые в виде

m

P(x) = £Х i § i(x), (1)

i=1

где P(x) - полезность альтернативы x; m - количество частных критериев; X i - коэффициент важности

критерия ki, выбираемый с учетом условий i = 1

i

4 1

BE, 2005, 1 4

i Надоели баннеры? Вы всегда можете отключить рекламу.