РЕШЕНИЕ ОПТИМИЗАЦИОННОЙ ЗАДАЧИ НА СЕТЕВОЙ МОДЕЛИ ТЕХНОЛОГИЧЕСКОГО ПРОЦЕССА

Шмелев Валентин Валерьевич

www.mai.ru/science/trudy/

Труды МАИ. Выпуск № 88

УДК 681.513.5

Решение оптимизационной задачи на сетевой модели технологического процесса

Шмелев В.В.

Военно-космическая академия имени А.Ф. Можайского, Ждановская ул., 13, Санкт-Петербург, 197198, Россия e-mail: valja1978@yandex.ru

Аннотация

Рассматривается структурно-логический подход к синтезу, верификации, контролю и управлению моделями технологических процессов в сложных технических системах. Процессы представляются в виде сетевой структуры (модели), построенной на принципах сетей Петри. Моделирующие возможности инструмента сетей Петри с учетом вводимых модификаций в достаточной степени соответствуют разнообразию и сложности технологических процессов. Сетевая структура рассматривается в нотациях сетей Петри и с помощью теоретико-множественного подхода к изображению моделей. Показывается вариант математической структуры выбора оптимального управления на моделируемом процессе. Рассматриваются особенности применения метода динамического программирования для решения оптимизационной задачи для процесса, модель которого представлена сетевой структурой.

Ключевые слова: модель технологического процесса, сети Петри, математическая структура выбора, метод динамического программирования.

Введение

Практическая реализация автоматизированного управления технологическими процессами функционирования и обработки информации сложных технических систем обеспечивается формированием следующих составляющих.

1. Цели. Целевой анализ начинается с формулировки глобальной цели управления технологическим процессом. Глобальная цель конкретизируется путем указания подчиненных ей главных целей. Дальнейшая конкретизация цели осуществляется с помощью формулирования задач, общих и частных.

2. Ограничения (ресурсы). Автоматизированное управление реальными техническими процессами должно осуществляться с учетом ограничений различного рода. Тем самым обеспечивается максимальная адаптация модели технологического процесса, в общем-то, именно с моделью осуществляется работа при автоматизированном управлении, событиям и состояниям реальной технической системы.

3. Альтернативы. При автоматизированном управлении должны быть выявлены (сконструированы) допустимые с учетом введенных ограничений альтернативы и, в дальнейшем, выделена из них наилучшая с известной точки зрения. Каждой альтернативе сопоставляется вариант управляющих воздействий на процесс в местах ветвления его фазовой траектории.

4. Критерии. Критерий - это правило, по которому осуществляется выбор или сравнение альтернатив. В качестве критерия выбора выдвигаются условия принадлежности альтернативы к множеству, обладающему определенными свойствами,

или достижения при этой альтернативе экстремума по некоторому показателю эффективности управляемого технологического процесса.

5. Модели. Исследование альтернатив производится на моделях. Эффективность управленческих решений обеспечивается достаточной адекватностью используемой модели технологического процесса.

Все рассмотренные элементы являются важными. Однако, представляется особенно значимой задача выбора адекватного способа моделирования, т.к. от него зависит, вообще, соответствие наблюдаемого состояния процесса реальному его состоянию и, следовательно, зависит эффективность принимаемых решений по управлению, и, в конечном счете, эффективность самого процесса.

В работе [1] предлагается подход к моделированию технологических процессов, в полной мере отвечающий особенностям технических процессов в такой сложной предметной области, как функционирование космических средств. Сетевая модель технологического процесса, созданная в соответствии со структурно -логическим подходом в достаточной степени адекватно способна представлять и процессы функционирования космических средств, и процессы обработки их информации. Это показывается в работе [2].

Однако, в указанных работах не рассмотрен вопрос формирования математической структуры выбора оптимального решения по управлению процессом, модель которого представлена предложенной в работе [1] сетевой структурой. Кроме того, актуально рассмотреть особенности применения метода динамического программирования, как одного из наиболее мощных и широко известных математических ме-

тодов современной теории управления. В настоящей статье устраняется указанный пробел.

1. Математическая модель технологического процесса

Рассмотрим формальное описание технологического процесса. Напомним, что структурно-логический подход предполагает использование в качестве модели управляемого процесса модифицированную сеть Петри [3], известную под названием G-сети [4].

В соответствии с этим подходом структура технологического процесса представляется в виде совокупности неделимых операций с наложенными связями. Каждая операция представляет собой неизменную (универсальную) G-сеть. Связи между операциями являются отображением всех ограничений технологического процесса (технологических, краевых и др.). Реализуются связи с помощью инструмента сетей Петри. Таким образом, с помощью связей моделируется логика технологического процесса.

На первом этапе формального описания модели технологического процесса необходимо рассмотреть модель технологической операции, которая представляет собой атомарные, неделимые элементы, «кирпичики», из которых строится технологический процесс. На втором этапе в модель операции будет добавлено описание логики технологического процесса в виде описания связей между операциями.

Первый этап. Модель технологической операции удобно представить в графическом виде модифицированной сети Петри (рис. 1).

ОС

Старт

Приостановка

Продолжение

Стоп

УСТО <ЗН> <Длит> <ЗК>

ИндЗадНач

VI

ИндНач

ИндВып

Л

ИндЗадКон

<а

ИндКон

Л

Рисунок 1 - Обобщенная схема операции

По причине универсальности схемы технологической операции, совокупность элементов сети Петри, за исключением входных и выходных позиций, может быть заменена специальным переходом-процедурой, который и является, по сути, универсальной схемой технологической операции (УСТО). Раскрывать внутреннюю структуру схемы в данном материале нет необходимости. Структура УСТО с описанием функционирования схемы представлена в работе [1].

УСТО обозначена прямоугольником с двойными линиями. В левой части приведены входные позиции, формирующие траекторию развития данной технологической операции и, следовательно, всего процесса в целом. В правой части приведены все выходные (индикаторные) позиции, отражающие траекторию развития данной технологической операции и, следовательно, всего процесса в целом. Внутри пря-

моугольника приведены значения длительностей задержки начала выполнения (<ЗН>), задержки окончания выполнения (<ЗК>) и непосредственно выполнения операции (<Длит>). Переход-процедура является удобным средством компактного отображения процессов. Вместо громоздкого объема внутренних позиций и переходов схемы модели ТП (смотри схему сети Петри в работе [1]) используется упрощенное изображение операции.

В позиции «Старт», «Стоп», «Приостановка» и «Продолжение» поступают управляющие сигналы. Получение фишек данными позициями приводит к началу выполнения операции («Старт»), к окончанию выполнения («Стоп»), к временной приостановке («Приостановка») и продолжению выполнения («Продолжение»). Данные позиции, совместно с выходными, обеспечивают выполнение требования управляемости модели операции. Позиция «ОС» (отсчет событий) содержит информацию о наступлении очередного элементарного события, используемого в качестве «счетчика» степени выполнения операции. В качестве элементарных событий могут использоваться как временные метки, так и события невременного характера, например, результаты телеизмерений технической системы.

Позиции «ИндЗадНач» (индикация значения задержки начала выполнения операции), «ИндНач» (индикация непосредственного начала выполнения операции), «ИндВып» (индикация значения степени выполнения операции), «ИндЗадКон» (индикация значения задержки окончания выполнения операции) и «ИндКон» (индикация факта окончания выполнения операции) являются индикаторными и обеспечивают наблюдаемость модели операции. Индикаторные позиции «ИндЗадНач», «Ин-

дВып» и «ИндЗадКон» являются счетными, т.к. содержат количество отсчетов событий, полученных за интервал отсчета, соответственно, задержки начала выполнения, непосредственного выполнения и задержки окончания выполнения операции. Позиции «ИндНач» и «ИндВып» являются бинарными и «сигнализируют» о фактах, соответственно, начала и окончания выполнения операции.

Функционирование УСТО может быть проверено, например, в среде CPN Tools [5, 6].

С позиций теоретико-множественного подхода к описанию математических моделей можно описать модель операции как сеть Петри следующими множествами:

- Р = {Рвн,р,Рои/} = |p |i е /р | - конечное непустое множество позиций сети Петри S, 1Р - множество номеров позиций сети, Рвн, Pin, - множества, соответственно, внутренних, входных и выходных позиций сети;

- T = {tj \j е /г | - конечное непустое множество переходов сети Петри S,

/г - множество номеров переходов сети;

- F: Р х T ^ N - входная функция инцидентности, описывающая кратность входной дуги от позиции p к переходу t. сети S и ставящая в соответствие

каждой паре < p, t . >, i е /р, j е /т элемент множества целых неотрицательных чисел N;

- B: Р х T ^ Nb - входная функция инцидентности, описывающая сбрасывающую дугу от позиции p к переходу t сети S и ставящая в соответствие каж-

дой паре < р., Г >, / е , j е 1Т элемент бинарного множества ЫЬ = {0,1};

- Н+ : Т х Р ^ N - выходная функция инцидентности, описывающая кратность выходной «классической» дуги от перехода в позицию р1 сети 5 и ставящая в соответствие каждой паре < tJ, р. >, / е , j е 1Т элемент множества целых неотрицательных чисел Ы;

- Н- : Т х Р ^ N - выходная функция инцидентности, описывающая кратность выходной извлекающей («неклассической») дуги от перехода в позицию р сети и ставящая в соответствие каждой паре < t , р. >, / е , j е 1Т элемент

множества целых неотрицательных чисел Ы;

- М: Р ^ N - функция разметки, которая каждому элементу р. е Р ставит в соответствие элемент множества целых неотрицательных чисел N.

Таким образом, модель отдельной операции можно описать следующим выражением:

Б = {Р,Т, ^, В, Н+, Н -, М} (1)

При формальном описании технологического процесса необходимо дополнить выражение (1) логическими связями между операциями и ограничениями на траекторию развития процесса. Логические связи между операциями целесообразно описать с помощью функций инцидентности, а ограничения - с помощью отношений, уменьшающих множество допустимых альтернатив развития процесса. В соответствии с выбранными способами представления логики и ограничений процесса модель

технологического процесса ^ может быть представлена следующим множеством:

K = {S, 3, Q}, где (2)

- S = {s к = 1, card (/^ )} - множество операций технологического процесса ^, S^ - k-я операция, входящая в технологический процесс ^, /^ - целочисленное положительное не пустое ограниченное множество номеров операций, тогда card (/^) - мощность множества операций;

- 3 = {3 |k = 1, card (/^ )} - множество функций инцидентности технологического процесса ^, описывающее логику процесса, 3k - функция инцидентности

операции S^, где 3k : P'к) х P^m) ^ N описывает «склеивание» выходных позиций операции Sl и входных позиций операции S^, а также выходных позиций операции S^ и входных позиций операции Sm, m, l е /^. Перечень «склеиваемых» входных позиций из множества P(l,к) ={«ОС», «Старт», «Стоп», «Приостановка», «Продолжение»} и выходных из множества P^m)={«ИндЗадНач», «ИндНач», «ИндВып», «ИндЗадКон», «ИндКон»} определяет логику движения моделируемого технологического процесса. С учетом ограниченности количества входных и выходных позиций (мощности множеств P(l, к) и P^m)) можно утверждать, что N является множеством натуральных чисел, ограниченным сверху числом 5 включительно;

- Q = {Q |к = 1, card (/^)} - множество ограничений технологического

процесса ^, Q - множество отношений, ограничивающий выбор альтернативы развития k-ой операции (например, запуска операции), естественно, что данное

множество может быть и пустое при отсутствии альтернатив, в свою очередь ограничение Qk операции ^ также является множеством Q = jg(k) c = 1, card(Q)|, где

q(k) - c -й вид ограничения операции ^, c - порядковый номер ограничения, card (Q) - количество накладываемых ограничений.

2. Математическая структура выбора оптимального варианта выполнения технологического процесса

Технологический процесс подразумевает выполнение определённой последовательности действий, предусмотренных прикладной технологией проведения операций, позволяющей перевести процесс из некоторого начального состояния в требуемое. Множество вариантов развития процесса, позволяющих осуществить такой переход, образуют множество Л^ допустимых альтернатив выполнения процесса. При этом на процесс накладывается ряд условий и ограничений, речь о которых шла выше, обусловленных особенностями структурного и логического построения процесса, спецификой цели выполнения процесса, а также возможным влиянием факторов неопределенности среды. Для задания множества Лл может быть использовано отношение:

Лп :ЛхМ ,хМ ,хQ^Лп, где (3)

D нач out кон out ^ D ' ^ V /

- Л - множество всех вариантов развития технологического процесса;

- М , - множество начальных (исходных) состояний технологического

нач out V ^ у

процесса;

- MKOH out - множество требуемых состояний технологического процесса;

- Q - множество отношений, ограничивающих выбор.

Требуется дополнительное пояснение структуры элементов выражения (3). В теории сетей Петри одним из способов описания смены состояний сети является траектория смен разметок сети [3], на основе, например, дерева достижимости. Некоторый элемент множества M можно использовать как отражение текущего состояния технологической операции. Обозначим через Mt некоторую разметку

сети Петри или некоторое состояние операции, тогда M = |m, t = 1, card(M)| будет

являться множеством всех возможных состояний разметок сети или множеством всех возможных состояний операции. Так как множество P состоит из трех непересекающихся подмножеств PeH, Pn и Poui, то правомерным будет записать

M :M х M. х M ,,

вн т out'

причем card(M) = card(Мвн )• card(М.и)• card (Моц/), где MgH, Mm и Mout - множества возможных разметок фрагментов УСТО, состоящих из, соответственно, только внутренних, входных и выходных позиций PeH, Poui и Pn, т. е. MeH: PH ^ N - функция разметки, которая каждому элементу p. е Ph ставит в соответствие элемент множества целых неотрицательных чисел N, Min : Pn ^ N - функция разметки, которая каждому элементу p. е Pin ставит в соответствие элемент множества целых неотрицательных чисел N и Mout: P^ ^ N - функция разметки, которая каждому элементу p. е ставит в соответствие элемент множества целых неотрицательных чисел N.

Из всей совокупности множества позиций P = {p. |i е /р} = {PeH,Pin,Рои/} необходимо выделить множество Poui, т.к. именно это множество отражает состояние операции, и по смене разметок только этих позиций будет приниматься решение о наблюдаемом (текущем) состоянии моделируемой операции. Среди элементов множества М , должны находиться и некоторые элементы M , и M ,, обозначаю-

out а нач out кон out

щие, соответственно, начальное и конечное (требуемое) состояние технологической операции. Данные разметки должны входить, как минимум, в один кортеж разметок сети. При наличии нескольких подобных кортежей, содержащих разметки Мнач оШ и

М_ оut, операция должна допускать альтернативы в своем выполнении. Для всего технологического процесса:

^^нач out нач k out

{Мпачкой, \к = ^ Card (/s )} : = {MKонkout \к = Ъ card(/s )} .

М - М ,

кон out I кон k out

Последние выражения обозначают начальные и конечные разметки выходных позиций обобщенных схем всех операций технологического процесса. Данные множества могут иметь как единичную мощность, так и мощность более единицы. В первом случае краевые условия задаются точечно, во втором случае краевые условия на состояния технологического процесса задаются в виде интервала значений.

Изменение состояния технологической операции произойдет после подачи управляющих сигналов на входные позиции Ри или формирования некоторой разметки МПп еМ.и. Вследствие срабатывания разрешенных переходов сети [3] будет

сформирована новая разметка сети /Ц, = /Ц, tm U /Ц, ш IJ /Ц, оШ и технологическая

операция перейдет в новое состояние, т.е. операция будет выполняться. Таким образом, элементарный кортеж {Mt, M,,) описывает минимальный фрагмент траектории

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

выполнения или развития технологической операции. Однако, в выражении (3) для составления множества А целесообразно использовать только «управляющую» часть кортежа разметок Mt, = Mt, вн U Mt, in U Mt, oiii , а именно кортежи множеств разметок М.и : ^ N входных позиций Pin по причине выбора именно среди них оптимального управления моделируемым процессом.

Таким образом, множество А содержит все варианты выполнения технологического процесса, т.е. все возможные кортежи допустимых разметок входных позиций, обеспечивающих переход управляемого процесса из начального Мнач out в требуемое состояние MKOHOut. В рамках моделей (1) и (2) такое множество будет содержать возможные кортежи разметок входных позиций обобщенной схемы операции (рис. 1) применительно к каждому элементу множества S = |s k = 1, card (/^ )j. В

итоге можно записать:

А = {А = (Мпч mt, MKaHm)t , t = 1, Card ( А )} , причем

V t:

r M . „M (еМ

нач in t ? кон in t in

M • M M t

нач in t нач in t нач out

у^^кон in t : ^^кон in t ^ r> ^^кон out J

Множество отношений Q = {q|£ = 1, card (/5 )}, ограничивающих выбор среди элементов множества А, содержит ограничения различного рода на выполнение

13

процесса. Рассмотрим порядок использования ограничений процесса в модели процесса (2).

Придерживаясь концепции использования сетевой структуры для моделирования технологической операции, в рамках модели (1) разрешение для срабатывания перехода tJ задается неравенством:

т(р)>(/(<р,tJ >) + Ь(<р, >)), (4)

где т (р ) - значение функции разметки М: Р ^ N для позиции р е Р, / е ; / (< р, ^ >) - значение функции инцидентности Р: Р х Т ^ N между элементами Р е Р и tJ е Т, I е , j е 1Т или кратность дуг от позиции р к переходу tJ ; Ь (< р, ^ >) - значение функции инцидентности ^: Р х Т ^ N между элементами р е Р и tj е Т, / е , j е 1Т, или значение функции Ь(< р,^ >) = 1 при наличии сбрасывающей дуги от позиции р к переходу ^ .

Вообще, существование задачи выбора обеспечивается наличием нескольких (более одного) вариантов выполнения технологического процесса. В случае использования инструмента сетей Петри для моделирования процесса существование нескольких вариантов выполнения процесса интерпретируется как конфликтная ситуация. Простейшим вариантом конфликтной ситуации является следующая модификация выражения (4):

(т(р)>(/(<р,tj >) + Ь(<р,tj >)))&(т(р)>(/(<р,^ >) + Ь(<р,^ >))),

j Ф к;г е 1Р;_/,к е 1Т .

Последнее выражение означает, что маркировка позиции р одновременно разрешает срабатывание переходов tJ и ^.

Наиболее общим вариантом конфликтной ситуации (вторым вариантом) является следующая модификация выражения (4):

(т(р)>(/(<р,tj >) + Ь(<р,tj >)))&(т(рк)>(/(<рк,^ >) + Ь(<рк,^ >))),

I Ф к; j ФI; ¡, к е ; у', I е .

Выражение формализует маркировку сети, при которой одновременно разрешены для срабатывания более одного перехода. Рассмотренные выражения могут быть распространены на случай конфликта более двух переходов и позиций соответствующим увеличением количества аргументов в выражениях. Таким образом, показана математическая интерпретация выбора на классических сетях Петри и возможные варианты разрешения названного конфликта.

Необходимо интерполировать неравенство (4) на модель операции (выражение (1)), затем технологического процесса в целом (выражение (2)). Разрешение на изменение состояния операции:

т(р) > (/(< р,tj >) + Ь(< р,tJ >))|р е Рт ^ ^ (1) ^ ^ (2), (5)

где ^ (1) и ^ (2) - текущее и следующее состояния к-ой операции технологического процесса ^, к е 18, т (р ) - значение функции разметки М.и : Ри ^ N для позиции р е Рп, \е 1Р; / (< р, ^ >) - значение функции инцидентности Р: Ри х Т ^ N между элементами р е Рш и t еТ, / е /р, у е 1Т или кратность дуг от

позиции p к переходу t}; b (< pt,ty. >) - значение функции инцидентности B: р x T ^ N между элементами p e Pin и tj e T, i e /p, j e /t .

Выражение (5) интерпретируется следующим образом. Операция St сменит свое состояние из S (1) в S (2) при условии наличия хотя бы в одной из входных позиций хотя бы одной управляющей фишки.

Множество отношений Q = {q |k = 1, card(/5 )} содержит дополнительные

множители, которые должны входить в (5) следующим образом:

Qk • m(p ) > (f (< p,tj >) + b(< p,tj >))|p e Pm ^ Sk (1) ^ Sk (2). (6)

Элементы Qk = 1, card (/^ ) могут принимать только два значения: 0 и 1. Первое значение означает, что операция не может выполняться вследствие применения того или иного ограничения. Второе - ограничений на операцию не наложено. Оче-

card (Q)

видно, что Qk = ^ q(^, значение каждого вида ограничений k-ой операции также

может принимать значения лишь 0 или 1 по аналогичному положению. Формализация рассматриваемых типов ограничений приведена, например, в работе [7].

Интерполяция выражения (4) на весь технологический процесс в целом может быть осуществлена следующим образом:

33, : Р[';к х Р,к^ N,N > 0

к аиХ г п 3' 3

: Р(1,к)х Р(1,к) ои гп

ак • т> (р) > (/(к> (< р, ^ >)+> (< р, ^ >))| р е РПк >, ^ ^ (1) ^ ^ (2)

сатй (2)

а (тк'(р))— П £)=1

С—1

2)

Интерпретируется данное выражение следующим образом. Технологический процесс переходит из состояния ^(1) в состояние 2) вследствие смены состояния операции ^ при условиях:

1) при условии существования функции инцидентности между некоторой операцией и операцией ^, I, к е ,1 ф к, данное условие определяет «причину» смены состояния самой операции ^;

2) при условии разрешения смены состояния операции ^;

3) при условии отсутствия ограничений на смену состояний операции ^.

Таким образом, рассмотрены все элементы выражения (3). Множество Лд содержит только те кортежи из множества Л, которые удовлетворяют множеству отношений 2 и имеют в первым элементом ШначоиП а последним - Мконом,. Вполне возможно, что мощность множества кортежей Лд будет больше 1. В этой связи обоснована постановка вопроса выбора наилучшего варианта выполнения процесса в смысле некоторого множества Ж заданных показателей качества процесса. Для определения соответствия «результат - показатель» при реализации допустимых вариантов выполнения процесса вводится оператор ^ [8]:

17

¥ : ДпхМ ,хМ х Q ^W.

D нач out кон out

С учетом всех введенных в рассмотрение множеств и отношений можно сформулировать обобщенную модель П проблемной ситуации:

П: {Ж Маач(ш1, М KOHOUt, Д л }, позволяющую вплотную подойти к постановке задачи выбора оптимального варианта Д* выполнения технологического процесса Ж на множестве допустимых альтернатив:

W

П ^ K: Дд ^ Д* (7)

где K - критерий выбора оптимального варианта выполнения процесса. На практике множество показателей эффективности содержит более одного элемента. Неодномерность множества показателей эффективности, определяющих выбор оптимального варианта выполнения процесса, порождает задачу многокритериального выбора. Решение данной задачи составляет отдельное направление исследований.

Таким образом, математическая структура выбора может быть представлена в

виде:

Д* = K (Ж, Д, Q, R), (8)

где K - некоторая функция, значением которой является оптимальный кортеж Д* разметок входных позиций обобщенных схем операций технологического процесса, а аргументами которой являются следующие множества: Ж - модель технологического процесса, Д - множество вариантов кортежей разметок входных пози-

ций обобщенных схем операций технологического процесса; 2 - множество отношений, ограничивающих выбор и отражающих технологические, технические, краевые, ресурсные, пространственно-временные требования и другие требования,

Я — , г — 1, сатй(Я )| - множество отношений предпочтения (показателей эффективности), определяющих выбор оптимального кортежа Л* разметок входных позиций обобщенных схем операций технологического процесса.

3. Обоснование метода динамического программирования

После формирования математической структуры выбора (8) необходимо рассмотреть непосредственно применение известных инструментов нахождения оптимального кортежа Л* разметок входных позиций обобщенных схем операций технологического процесса. Для решения задач управления в динамической интерпретации к настоящему времени разработан достаточно мощный методологический аппарат анализа и синтеза, который имеет множество примеров практической реализации в авиационно-космической отрасли [9, 10]. Из всего многообразия методов решения задач такого типа наиболее часто используется принцип оптимальности, положенный в основу метода так называемого динамического программирования [11]. Условиями применения такого метода является следующее.

Во-первых, желаемым условием является дискретность функционирования обобщенных схем операций технологического процесса и, следовательно, модели всего процесса в целом. Именно для задач оптимального управления с дискретным временем метод динамического программирования наиболее хорошо проработан.

19

Для задач оптимального управления с непрерывным временем, описываемым дифференциальными управлениями, теория нахождения решений разрабатывается активно в последние годы. При этом функционирование технических систем зачастую удобнее рассматривать именно в дискретной постановке, приближаясь к непрерывной уменьшением периода дискретизации времени.

Во-вторых, необходимым условием применения метода динамического программирования являются ограниченность количества card (Моц/) возможных состояний модели процесса и, кроме того, закрепление левого MHOTOMi и правого Мконои1 концов фазовой траектории моделируемого процесса. Обоснованность выдвижения данного условия заключается в необходимости построения, так называемой, обратной процедуры динамического программирования.

В-третьих, необходимым условием является аддитивность показателя оптимальности. В рассматриваемой структуре выбора (8) результирующим показателем

оптимальности является некоторая функция от элементов r., i = 1, card (R) множества

R. Известно [11], что принцип оптимальности является следствием аддитивности показателя оптимальности и не имеет места в случае неаддитивного критерия.

Необходимо подробно рассмотреть интерпретацию метода динамического программирования для случая представления управляемого процесса моделью (2) и структуры выбора множеством (8).

4. Многошаговый процесс управления

Рассмотрим управляемый процесс Ж, состояние MOHi которого характеризует

ся разметками Mkoutk = 1, card (/^) выходных позиций Рои{ обобщенных схем

Sk

k = 1, card (/^ ) операций процесса Ж. Для определенности примем, что смена состояния процесса происходит с получением отсчетов событий OC (см. рис. 1). Предполагаем, что на каждом шаге на процесс оказывается управляющее воздействие, заключающееся в изменении разметки М.и(OC) входных позиций Рт обобщенных схем. Таким образом, в каждый момент OC состояние процесса характеризуется разметкой MOH t (OC), а управляющее воздействие - разметкой Mtn (OC). Так

как нами используются только факты получения OC , то можем считать, что переменная OC изменяется дискретно и принимает целочисленные значения 0, 1 и т.д, имеющие смысл порядковых номеров отсчетов. На выбор управления наложены ограничения Q , которые в достаточно общей форме можно представить в виде

q(OC)еQ, OC = 0,1,... (9)

Под влиянием выбранного при получении очередного OC управления (принятого решения) процесс переходит в новое состояние. Этот переход можно описать

соотношением

( ОС+1) = / (мш (ОС) ,Мги (ОС )). (10)

Здесь /(Моц/(ОС),М1п (ОС)) - функция, характеризующая динамику рассматриваемого процесса, определяемая моделью Ж технологического процесса. Эта

функция предполагается известной (заданной) и отвечает принятой математической модели рассматриваемого управляемого процесса. Зададим еще начальное состояние системы

мш (0)=м„. (11)

Таким образом, многошаговый процесс управления описывается соотношениями (9) - (11). Процедура расчета конкретного процесса сводится к следующему. Пусть с получением некоторого отсчета ОС состояние Мои{(ОС) процесса известно. Тогда для определения состояния МоШ(ОС +1) необходимо выполнить две операции: 1) выбрать допустимое управление М.и(ОС), удовлетворяющее условию (9); 2) определить состояние Моц/ (ОС +1) перед получением следующего отсчета ОС.

Так как начальное состояние процесса известно, то описанную процедуру можно выполнить последовательно для всех ОС = 0,1,...

5. Задача оптимального управления

Пусть задан некоторый критерий качества процесса управления (критерий оптимальности) вида

N-1

^ = X к(Мои((ОС),М1п(ОС)) + -1)) . (12)

ОС=0

Выражение (12) - это способ представления элемента J структуры выбора (8).

Здесь я(Мои((ОС),Мп(ОС)) и -1)) - заданные скалярные функции

своих аргументов, N -1 - момент окончания процесса, N > 0. При этом функция Я

- показатель эффективности, определяющий выбор оптимального управления, а функция F характеризует оценку конечного состояния процесса или точность приведения в заданное состояние М , (N -1) = М ,.

out \ / кон out

Задача оптимального управления формулируется как задача определения допустимых управлений (кортежа) А* = ^Min (0), М .и (1),..., М .и (N -1)^, удовлетворяющих ограничениям (9), и соответствующей траектории, т. е. последовательности (кортежу)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Im t(0) = M „M ,(1),...,M t(N-1) = M X

\ out \ / нач out' out V /' ' out \ / кон out / '

которые в совокупности доставляют минимальное (максимальное) значение критерию (12) для процесса (10) и (11). Можно записать

А* ={Mm ( 0), Mm (1),..., Mm (N -1)) = arg min ( max ) J.

(Mout(0)=Мнач out > MoutW ...,Mout(n-1)=mkoh out)

6. Элементарный подход

Решить рассматриваемую задачу возможно элементарным подходом или простым перебором. При помощи соотношения (10) состояние процесса после поступления очередного OC выражается через его состояние до поступления и управление, сформированное поступившим OC . Применяя это соотношение многократно, можно выразить состояния процесса после каждого OC только через начальное состояние Мнач out и управления после предшествующих OC. В результате получим из

J = Я(м_, м 1п (0))+Я(м_, м 1п (0), М 1п (1))+... = = ф(м_, М п (0), М п (1),..., Мп( N -1)) .

Здесь Ф - некоторая громоздкая, но, вообще говоря, известная функция своих аргументов. Таким образом, поставленная задача оптимального управления свелась к задаче минимизации (максимизации) функции Ф от переменных Мнач оШ, М.и (0),

Мш(1), ..., -1), т. е. от 10^ переменных, где 10 - количество входных и

выходных позиций обобщенной схемы одной операции, к - количество операций в процессе ^. При больших N и к эта задача о минимизации (максимизации) функции большого числа переменных представляет трудности даже при использовании мощных компьютеров. Дополнительное осложнение вызвано тем, что переменные Мт (ОС) должны удовлетворять ограничениям (9).

Принципиально иной подход к поставленной проблеме дает метод динамического программирования.

7. Принцип оптимальности

Сформулированный Р. Беллманом принцип оптимальности гласит [11]: отрезок оптимального процесса от любой его точки до конца сам является оптимальным процессом с началом в данной точке.

Рассмотрим тривиальное доказательство принципа оптимальности от противного в приложении к рассматриваемой модели технологического процесса. Пусть Мои/(ОС *) - некоторая точка оптимальной траектории после получения ОС *,

0 < OC* < N -1. Рассуждая от противного, предположим, что отрезок этого процесса от момента получения OC* до окончания процесса не является оптимальной траекторией для процесса (10) с ограничениями (9), в смысле критерия качества

N-1

J = X R(OC),M т (OC)) + F(Mout (N)) (13)

OC=OC*

при начальном условии M*Ha40ut = Moî/i (OC* ). Значит, существуют допустимое управление M.w (OC*), Mtn (OC* +1),..., M.w (N -1) и соответствующая ему траектория Mout (OC* ) = Ka4oUt,M L (OC* +1) ^...Mou, (N -1) = MKonout, для которых критерий (13) принимает меньшее (большее) значение, чем на исходном оптимальном процессе. На рис. 1 исходная оптимальная траектория Mohî(OC) показана линией

большей толщины, а траектория M*out ( OC ) - меньшей.

Наряду с исходным оптимальным процессом MOH Д OC ), OC = 0,...,N-1, рассмотрим процесс, состоящий из двух участков: части исходного процесса Mohî( OC ) , OC = 0,..., OC*, и подозреваемого на «улучшение» участка M*out (OC ),

OC = OC*,...,N-1. Для этого составного процесса критерий J из (12) будет иметь меньшее (большее) значение, чем для исходного процесса, т.к. сумма первых t слагаемых в (12) для составного процесса останется той же, что и для исходного про-

т-*

цесса, а сумма остальных слагаемых, равная J из (13), уменьшится по сравнению с исходным процессом. Данное утверждение означает, что исходный процесс не является оптимальным, а это противоречит сделанному предположению.

Таким образом, принцип оптимальности доказан. 8. Метод динамического программирования

Обозначим: J^n (МоШ(ОС*) ,ОС*) - минимальное значение критерия качества

J из (13) для оптимального процесса, начинающегося при получении ОС в состоянии МоШ(ОС *). Здесь и далее в качестве экстремального значения будет рассматриваться минимальное значение функции (13). Этот процесс можно представить состоящим из двух участков: первого шага, на котором выбирается управление

Мт (ОС*), и остальной части (от момента (ОС * +1) до конца процесса). Вклад в показатель качества первого участка равен я(Мом/(ОС*), М.и(ОС*)), а вклад второго

участка можно, согласно принципу оптимальности, выразить через введенную выше функцию J^n в виде J^n (М^ДОС* +1) ,ОС*+1). Учитывая, что управление на первом участке должно выбираться из условия минимизации критерия J* при ограничениях (9), получим равенство

[Мои\ОС *) ,ОС* ) =

= Ш1П

МЫ[ОС' )еМ ,

~я(Мои, (ОС *), М т (ОС *)) + JШш [Мош (ОС * +1) ,ОС* +1)"

Здесь М т - множество всех возможных состояний разметок входных позиций

фрагмента сети, допустимых с учетом (9).

Подставляя в полученное соотношение равенство (10), получим основное соотношение метода динамического программирования

JШ1П( МЛОС ) ,ОС)= ^

Я(МШ(ОС), М т(ОС)) + +JШп(/(Мои<(ОС), Мт(ОС)) ,ОС+1)

(14)

Для оптимального процесса, начинающегося при получении последнего ОС = N -1, критерий оптимальности (13) сводится к одному последнему слагаемому. Поэтому имеем

Jшln {Ми^ -1),N -1) = -1)) . (15)

Соотношение (14) и условие (15), играющее роль начального условия, дают возможность последовательно определить функции ^¡„(М^ДОС), ОС) при ОС = N -1,...,0, а также рассчитать оптимальное управление и оптимальные траек-

тории. Это достигается при последовательной реализации обратной и прямой процедур динамического программирования.

9. Обратная процедура

При вычислении минимума (максимума) функции по некоторому аргументу определяются две величины: минимальное (максимальное) значение функции и значение аргумента, при котором этот минимум (максимум) достигается. Последнее значение, которое может быть и не единственным, обозначается символом arg min для варианта поиска минимума функции и arg max для варианта поиска максимума функции.

Положим OC = N -1 в (14) и воспользуемся условием (15). Получим

^ (Мои, ( n -1), n - 0=^^ [R(M™< о)' Mn о))+Лмлос))] ■

Вычисляя этот минимум, найдем функцию /min (Мои/ (N -1), N -1) и значение Мт (OC), доставляющее данный минимум:

м n (OC) = Un-1 (Mout (OC)) = arg min [r(Mout (OC),Min (OC)) + F (Мш (OC))"

M n (N-1)eMn [ '

Запись Mou/(OC)) означает, что значение Mtn (OC) зависит от

MOHi( N -1) как от параметра. Определив ymin (M out( N -1), N -1) и полагая OC = N - 2, найдем из (14) функцию /min (Moui (N - 2), N - 2) и соответствующее

значение аргумента Mtn (OC ) = и_2 (M^ ( OC )) ■

Продолжая этот процесс в сторону уменьшения OC, получим из (14) последовательно функции Jmn (Mout ( OC ), OC ) и

"ос (Мш(OC))= arg mm Гр{Мш(OC),Min(OC)) + Jmin {Мш(OC),OC) +1] (16)

M in (OC )eMn L ]

при OC = N -1, N - 2, ...,1,0. Функция vocMout (OC) определяет оптимальное управление при получении OC при условии, что процесс находится в состоянии

Mout (OC).

Таким образом, обратная процедура состоит в построении функций

Jmin [Mout (OC), OC) и &OC (Mu (OC)) для всех Mout (OC) и OC = 0,1,..., N-1. Это

построение в наилучшем случае может быть выполнена аналитически, но, как правило, является трудоемкой вычислительной процедурой.

10. Прямая процедура

Воспользуемся результатами обратной процедуры для решения исходной задачи, т.е. для построения оптимального управления и оптимальной траектории при заданном начальном условии (11).

Полагая ОС = 0 и МогД 0) = Мначоц/ в (16), найдем управление при получении

первого ОС : Мш (0) = ^0(Мначоц/). Далее из соотношения (10) определим состояние

МоШ (!) = / (МначоШ , Мп (0)) . Продолжая этот пPоЦесс, найдем Мт (1 ) = Ц (МоШ (1)) ,

Мон ((2), Мп (2 ) и т. д. Вообще имеем

М1П (ОС) = ^с (МоШ (ОС)), МоШ (ОС+1) = /(МоШ (ОС),Мт (ОС)), Мш(0)=Мначоа, ОС = 0,1,..., #-1.

Соотношения (17) определяют прямую процедуру и позволяют полностью рассчитать оптимальное управление и оптимальную траекторию. Минимальное (максимальное) значение критерия оптимальности, отвечающее этой траектории,

- = Лш, (МиачоиГ,0) •

Таким образом, обратная и прямая процедуры метода динамического программирования в совокупности дают способ решения поставленной задачи оптимального управления технологическим процессом, модель которого представлена совокупностью обобщенных схем операций.

11. Проклятие размерности

При реализации этого метода получен значительно более общий и универсальный результат. В ходе обратной процедуры построено оптимальное управление по обратной связи (16), т. е. управление как функция иос( МоШ( ОС)) текущего состояния процесса. Теперь нетрудно дать решение задачи оптимального управления при любом начальном условии вида М*начои1= МоШ (ОС*): для этого нужно просто

реализовать прямую процедуру для этого начального условия. Реализация прямой процедуры не предоставляет серьезных трудностей и сводится, согласно (17), к вычислению известных функций при конкретных значениях аргументов.

Наибольшую сложность представляет обратная процедура, включающая минимизацию функции J по аргументу Min (OC). Размерность аргумента Min (OC) определяется величиной card (/5 ) - количеством операций в процессе, а также ко-

личеством входных позиций в одной операции Sk к = 1, card (). Определенно можно сказать только о количестве входных позиций: обобщенная схема операции содержит пять входных позиций. Поэтому размерность аргумента Min (OC) равна произведению 5 и card(/5 ). Итак, здесь нужно, согласно (14), выполнить N процедур минимизации функции от (5 • card (/5)) переменных. Это значительно более

простая задача, чем минимизация одной функции J по (N • 5 • card (/5)) переменным, что требуется при элементарном подходе.

Однако указанная простота не сводит осуществление обратной процедуры к тривиальной задаче. Дело в том, что обратная процедура предусматривает построение функций J^n(Моц/(OC),OC) и voc(Mout(OC)), зависящих от аргумента

MOMi (OC). Размерность аргумента MoHi( OC) точно такая же, как и размерность аргумента Min (OC) при осуществлении обратной процедуры. По аргументу MoHi( OC) не нужно выполнять операций минимизации, но даже простое табулирование и хранение функций (5 • card (/5)) переменных представляют большие трудности. На-

пример, если количество OC, ожидаемых к поступлению, ограничено 10 значениями, то, учитывая, что из выходных позиций обобщенной схемы две являются счетными, а три - бинарными, обратная процедура, в которой участвуют функции

(OC),OC) и ^с (Mout (OC)), потребует

5 • card (/^ )• N -(10 -10 -10 • 2 • 2 )card( 1) ячеек памяти. В указанном количестве необходимых ячеек памяти первый и второй множители определяются размерностью аргумента Min (OC), третий - длительностью процесса в единицах OC, четвертый - количеством вариантов разметки выходных позиций всех обобщенных схем.

Отсюда понятно, что вычислительная реализация метода динамического программирования сталкивается с большими трудностями. Эти трудности Р. Беллман назвал проклятием размерности. Очевидно, что данное затруднение сопровождает применение метода динамического программирования и для оптимизации технологического процесса, модель которого построена на обобщенной схеме операции. Для преодоления этих трудностей могут быть предложены подходы [12], позволяющие сократить объем вычислений и потребности в памяти при построении оптимального управления. При этом, однако, приходится либо существенно пожертвовать точностью вычислений, либо отказаться от построения управления, оптимального в глобальном смысле, и ограничиться нахождением управлений и траекторий, оптимальных в локальном смысле, т.е. по отношению к малым (локальным) вариациям этих траекторий.

Заключение

Развитие информационных технологий на сегодняшний момент позволяет реализовать концепцию Единого информационного пространства [13], в том числе и в такой технически и организационно сложной области деятельности, как космическая деятельность. Это соответствует перспективным направлениям развития ракетной отрасли. Одной из основных проблем при этом является автоматизация оптимального управления технологическими процессами.

В статье рассмотрено общее содержание проблемы автоматизированного управления технологическими процессами. При этом с позиций системного подхода сама проблема структурирована в виде 5 основополагающих элементов, требующих обязательного рассмотрения при автоматизации: цели, ограничения, альтернативы и критерии принимаемых решений при автоматизированном управлении, а также модели управляемого процесса.

В качестве одного из вариантов модели управляемого процесса предлагается модель на основе модифицированной сети Петри, созданная на основе структурно -логического подхода. В соответствии с этим подходом структура процесса представляется в виде совокупности неделимых операций с наложенными связями. Каждая операция представляет собой неизменную (универсальную) сеть, построенную на основе О-сетей. Связи между операциями являются отображением логики процесса и всех ограничений выполнения технологического процесса.

Применительно к предложенной модели управляемого процесса сформулирована математическая структура выбора оптимального варианта выполнения процесса. Введены необходимые множества и отношения с адаптацией к применению

структурно-логического подхода к моделированию процесса. Показано, что задача выполнения технологического процесса может быть поставлена как оптимизационная задача многокритериального выбора варианта его выполнения на множестве допустимых альтернатив. Полученная математическая структура выбора имеет предельно общий характер и при практическом применении требует конкретизации введенных множеств и отношений между ними.

К настоящему времени разработан достаточно мощный методологический аппарат анализа и синтеза для решения оптимизационной задачи управления в одно-критериальной постановке. В статье рассмотрены особенности применения метода динамической однокритериальной оптимизации при использовании структурно-логического подхода к моделированию технологического процесса. В качестве основы используется метод динамического программирования.

В дальнейшем представляется важным рассмотрение особенностей применения методов многокритериальной оптимизации при аналогичных условиях.

Библиографический список

1. Шмелев В.В. Модели технологических процессов функционирования космических средств // Авиакосмическое приборостроение. 2015. №4. С. 78-93.

2. Шмелев В.В., Мануйлов Ю.С. Применение модифицированных сетей Петри к моделированию процесса послеполетного анализа телеметрической информации // Труды МАИ, 2015, № 84: http:

3. Котов В.Е. Сети Петри. - Л.: Наука, 1984. - 160 с.

4. Охтилев М.Ю. Основы теории автоматизированного анализа измерительной информации в реальном времени. Синтез системы анализа: Монография. - СПб.: ВКА имени А.Ф. Можайского, 1999. - 162 с.

5. URL: http://cpntools.org/download.

6. Kristensen L.M., Christensen S., Jensen, K. The Practitioner's Guide to Coloured Petri Nets. Int. J. Softw. Tools Technol. Transf. 2(2), 98-132 (1998).

7. Шмелев В.В., Мануйлов Ю.С., Рахимов Р.Р., Богданов А.В. Формализация технологического процесса на основе сетевой модели // Научное обозрение. 2015. №19. С. 156 - 161.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Резников Б.А. Системный анализ и методы системотехники. Часть 1. Методология системных исследований, моделирование сложных систем. - М.: МО СССР, 1990. - 522 с.

9. Закиров Р.Г. Оптимизация алгоритмов диагностики состояния бортового радиоэлектронного оборудования // Труды МАИ, 2014, № 78: http: http://www.mai.ru/science/trudy/published.php?ID=53665.

10. Родионова Д.А. Синтез оптимальных детерминированных систем с полной обратной связью методом итерационного динамического программирования // Труды МАИ, 2015, № 84: http: http://www.mai.ru/science/trudy/published.php?ID=63137

11. Черноусько Ф.Л. Динамическое программирование // Соросовский образовательный журнал. 1998. №2. С. 139 - 144.

12. Управление космическими аппаратами и средствами наземного комплекса управления / Под ред. Ю.С. Мануйлова - СПб.: ВКА имени А.Ф. Можайского, 2010. - 609 с.

13. Сырин С.А., Терещенко Т.С., Шемяков А.О. Анализ прогнозов научно-технического развития России, США, Китая и Европейского Союза как лидеров ракетно-космической промышленности // Труды МАИ, 2015, № 82: http://www.mai.ru/science/trudy/published.php?ID=58745

РЕШЕНИЕ ОПТИМИЗАЦИОННОЙ ЗАДАЧИ НА СЕТЕВОЙ МОДЕЛИ ТЕХНОЛОГИЧЕСКОГО ПРОЦЕССА Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шмелев Валентин Валерьевич

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шмелев Валентин Валерьевич

THE SOLUTION OF THE OPTIMIZATION PROBLEM ON THE NETWORK MODEL PROCESS

Текст научной работы на тему «РЕШЕНИЕ ОПТИМИЗАЦИОННОЙ ЗАДАЧИ НА СЕТЕВОЙ МОДЕЛИ ТЕХНОЛОГИЧЕСКОГО ПРОЦЕССА»