Научная статья на тему 'Алгоритм локально-оптимального управления комплексом операций'

Алгоритм локально-оптимального управления комплексом операций Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
265
132
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМИЗАЦИОННАЯ ЗАДАЧА / МАТЕМАТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ / ПРИБЛИЖЕННОЕ РЕШЕНИЕ / ФУНКЦИЯ ГАМИЛЬТОНА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мануйлов Ю.С., Шмелев В.В.

В статье ставится, формализуется и приближенно решается задача оптимального управления комплексом операций в некоторой технической системе с целью достижения заданного эффекта. Особенностью постановки и формализации задачи является обеспечение учета при планируемом управлении безразличия, совместимости, несовместимости или следования операций. Модель комплекса операций представляется в виде линейной нестационарной дифференциальной динамической системы в модифицированной форме Коши. Оптимизируемым показателем комплекса операций выбрана близость финального состояния каждой операции к требуемому значению при соблюдении ограничений на технологию управления, затрачиваемые время и ресурсы. Под состоянием операции в отдельности понимается степень ее выполнения. Управляющее воздействие состоит в выполнении одной или ряда выбранных операций и, следовательно, увеличении степени их выполнения. Для решения вводится вектор сопряженных переменных и с его помощью создается функция Гамильтона, значения которой и предлагается использовать в качестве критерия выбора оптимального плана управления. В такой постановке задача может быть решена известными методами математического программирования, например методом динамического программирования (задача набора высоты и скорости летательным аппаратом). Однако получение решения указанным методом сопряжено с большими вычислительными затратами, так как необходимо проанализировать всю возможную траекторию развития комплекса операций при различных вариантах допустимых управлений. В статье предлагается вариант приближенного решения поставленной задачи в виде алгоритма локально-оптимального управления. Алгоритм заключается в таком представлении вектора сопряженных переменных, который может быть рассчитан на каждом шаге выработки управляющих воздействий. Для отдельной операции такой вектор будет равен разности требуемого и текущего состояний операции с учетом ее важности. В этом случае закон оптимального управления вербально интерпретируется следующим образом: на каждом шаге выбора управляющих воздействий среди допустимых альтернатив должна выполняться та операция, состояние которой максимально далеко от заданного (требуемого) значения с учетом интенсивности и важности данной операции. Алгоритм может быть применен для планирования комплекса операций в сложных технических системах при значительном (более 20) количестве дискретно выполняемых операций (управляемых элементов, агрегатов системы) и выдвижении ряда ограничений на технологию, временной интервал и ресурсоемкость достижения цели.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мануйлов Ю.С., Шмелев В.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Алгоритм локально-оптимального управления комплексом операций»

АЛГОРИТМ ЛОКАЛЬНО-ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

КОМПЛЕКСОМ ОПЕРАЦИЙ

Мануйлов Ю.С., д.т.н., профессор, Военно-космическая академия имени А.Ф. Можайского, kotmanoff@rambler.ru

Шмелев В.В., к.т.н., Военно-космическая академия имени А.Ф. Можайского, valjal978@yandex.ru

Ключевые слова:

оптимизационная задача, математическое программирование, приближенное решение, функция Гамильтона.

АННОТАЦИЯ

В статье ставится, формализуется и приближенно решается задача оптимального управления комплексом операций в некоторой технической системе с целью достижения заданного эффекта. Особенностью постановки и формализации задачи является обеспечение учета при планируемом управлении безразличия, совместимости, несовместимости или следования операций.

Модель комплекса операций представляется в виде линейной нестационарной дифференциальной динамической системы в модифицированной форме Коши. Оптимизируемым показателем комплекса операций выбрана близость финального состояния каждой операции к требуемому значению при соблюдении ограничений на технологию управления, затрачиваемые время и ресурсы. Под состоянием операции в отдельности понимается степень ее выполнения. Управляющее воздействие состоит в выполнении одной или ряда выбранных операций и, следовательно, увеличении степени их выполнения.

Для решения вводится вектор сопряженных переменных и с его помощью создается функция Гамильтона, значения которой и предлагается использовать в качестве критерия выбора оптимального плана управления. В такой постановке задача может быть решена известными методами математического программирования, например методом динамического программирования (задача набора высоты и скорости летательным аппаратом). Однако получение решения указанным методом сопряжено с большими вычислительными затратами, так как необходимо проанализировать всю возможную траекторию развития комплекса операций при различных вариантах допустимых управлений.

В статье предлагается вариант приближенного решения поставленной задачи в виде алгоритма локально-оптимального управления. Алгоритм заключается в таком представлении вектора сопряженных переменных, который может быть рассчитан на каждом шаге выработки управляющих воздействий. Для отдельной операции такой вектор будет равен разности требуемого и текущего состояний операции с учетом ее важности. В этом случае закон оптимального управления вербально интерпретируется следующим образом: на каждом шаге выбора управляющих воздействий среди допустимых альтернатив должна выполняться та операция, состояние которой максимально далеко от заданного (требуемого) значения с учетом интенсивности и важности данной операции.

Алгоритм может быть применен для планирования комплекса операций в сложных технических системах при значительном (более 20) количестве дискретно выполняемых операций (управляемых элементов, агрегатов системы) и выдвижении ряда ограничений на технологию, временной интервал и ресурсоемкость достижения цели.

us

RESEARCH

Введение

Все элементы и комплексы любой сложной технической системы (ТС) объединяются в некоторый аппаратурный комплекс (АК). Выполнение целевой задачи ТС требует слаженного функционирования АК, как единого кибернетического организма. Задача формализации оптимального планирования работы, как в целом АК, так и его отдельных составляющих является актуальной в свете разработки моделей и методов автоматизации планирования, контроля и корректировки технологических операций, выполняемых ТС.

Содержательная постановка задачи

Многообразие входящих в АК приборов и агрегатов, зачастую, многофункционально, то есть, имеет возможность функционировать в различных режимах, а также в составе различных подсистем, а результаты их работы также могут использоваться другими подсистемами. Сложная логика взаимодействия различных комплексов, систем и информационно-управляющих контуров в процессе решения основных задач функционирования ТС определяется технологией выполнения этих задач. Вся совокупность действий, необходимых для решения той или иной задачи или достижения определенного целевого эффекта называется комплексом операций (КО) [1], выполняемым по определенной технологии. При этом концепт (понятие) «операция» используется для агрегированного описания (обозначения) вполне определённой совокупности более мелких действий, связанных с достижением вполне определённого эффекта или результата. При этом операция, как правило, не является «одноактным» действием и, поэтому, степень её выполнения может характеризоваться таким понятием как «состояние операции» или «состояние выполнения операции».

На порядок выполнения операций, входящих в КО, для обеспечения требуемой эффективности технологией предусматривается определённая система ограничений, называемая технологическими ограничениями. Технологические ограничения, как правило, устанавливают так называемую систему (множество) технологических отношений между операциями. При этом множество отношений может включать в себя четыре вида технологических отношений:

- отношение совместности (С), означающее, что объединённая данным отношением группа операций должна выполняться строго одновременно;

- отношение несовместности (Н), означающее, что операции объединённые данным отношением по тем или иным причинам вместе (одновременно) выполняться не могут;

- отношение следования (Б), означающее, что объединённые данным отношением операции должны быть разделены на две группы - предшествующие и следующие с обязательным условием, что выполнение следующих операций может быть начато только после полного завершения выполнения группы предшествующих операций;

- отношение безразличия (Б) дополняет систему отношений до полной за счёт объединения данным отно-

шением в одну группу операций, не вошедших ни в одну из ранее перечисленных групп.

Кроме технологических ограничений на выполнение КО могут накладываться также ресурсные ограничения. При этом ограничения могут накладываться как на скорость, так и на объём расходования технического (аппаратно-программного), различных видов энергетического, специального и временного ресурсов. Ограничения на расходование технического ресурса обусловлены тем, что приборы и агрегаты в значительной степени являются многофункциональными и могут работать в нескольких режимах. При этом они могут задействоваться в работе нескольких комплексов или систем, а также использоваться при выполнении совершенно различных операций.

Кроме этого, предусмотренное функциональное резервирование, позволяет для выполнения отдельных операций использовать несколько функционально совместимых приборов или их совокупности (комплексов), способных выполнять операцию с различной интенсивностью (скоростью). Совокупность совместимых приборов и агрегатом может быть названа операционным каналом (ОК). При этом каждый ОК характеризуется своим ресурсопотреблением и обеспечиваемым (гарантированным) временным ресурсом работы, называемым потенциалом доступности, а также интенсивностью выполнения соответствующей операции. При возможности формирования в ТС более чем одного ОК для выполнения конкретной операции возникает вопрос о возможности их совместного задействования для выполнения операции с более высокой интенсивностью или оптимизации процесса выполнения операции на основе решения задачи выбора (формирования) ОК. Математические модели, описывающие процессы выполнения КО с использованием ОК, определяют систему функциональных ограничений, которые также должны учитываться при планировании выполнения КО.

Перечисленное многообразие ограничений, накладываемых на процесс выполнения КО, сужает множество допустимых альтернатив реализации этого процесса. Однако, если множество допустимых альтернатив содержит более одного варианта, то задача выполнения КО может быть сформулирована и в оптимизационной постановке, в которой предъявляются дополнительные требования к качеству процесса, например по расходованию тех или иных видов ресурсов или степени полноты выполнения объёма КО. Эти требования формализуются в виде системы так называемых показателей качества.

Для разработки рациональной или оптимальной (в том или ином смысле) программы выполнения КО, а тем более формирования оперативного управления выполнением КО необходимо провести формализацию задачи управления КО в ТС.

Формализация задачи оптимального

планирования выполнения комплекса операций

Для формализации задачи оптимального планирования осуществим необходимые теоретико-множествен ные построения. Введем в рассмотрение:

HiS

RESEARCH

множество л-

включен-

Я={о„, V = 1, л) опеРаЦий,

ных в КО подготовки и выполнения определённой целевой задачи в ТС, характеризующихся интенсивностями своего выполнения ю V = 1, л, структурированными в диагональную матрицу о = diяg{ю /V = 1, п) интенсив-

ностей выполнения КО;

- множество (={^ , ц = 1,т) видов бортовых ресурсов, используемых для выполнения КО, выделенный объём и скорость расходования которых при выполнении КО ограничены векторами, соответственно,

( = соЩЦ, ц = 1, т) и ( = соЩ, ц = 1, т).

Временной ресурс задается временным интервалом Т= , отведенным на выполнение КО, а также

множеством интервалов времени так называемых контактного потенциала Я, потенциала доступности 5 и канального потенциала Е. Контактный потенциал

Я= ётв{гу(А XV, 0: Г е {0;1}, V = Щ А^ е т)

представляет собой математическую конструкцию [2] из селектирующих функций {г('), V = 1, л), определённых на множестве {дт V = 1л} временных интервалов

целесообразного выполнения соответствующих операций. Потенциал доступности

Б= diag{sv(АQv, t); sv е{0;1)^ = Щ Аev е т)

представляет собой математическую конструкцию из селектирующих функций (•),V = 1, л), определённых

на множестве {дд V = Гл) временных интервалов допустимого выполнения соответствующих операций, определяемых готовностью необходимых систем, приборов и агрегатов, а также наличием требуемых для выполнения операции ресурсов.

Канальный потенциал (1) представляет собой математическую конструкцию из селектирующих функций, {е (.) V = 1"л), определённых на множестве

{а? V = 1,л) временных интервалов возможного (допустимого и целесообразного) выполнения КО:

ЯхБхБ^ Е = diag{&v (Аху, 0: е^, 0) =

= (Дт,, СК^, 0 е {0; 1), V = Щ)), (1)

Анализ возможных подходов к построению математической модели рассматриваемого процесса показал целесообразность применения динамической интерпретации концепта «операция», связанной с введением понятия состояния операции х(?), V = 1, л, представ-

ляющего собой неотрицательную переменную, отражающую зависимость объема её выполнения от времени.

Основой для формирования функциональных пространственно-временных ограничений является комплекс математических моделей, описывающих исследуемый управляемый процесс. Для составления модели управляемого процесса выполнения КО достаточно удобно использовать линейную нестационарную дифференциальную динамическую систему в модифицированной форме Коши [3]:

X?) = Б(()и(() , (2)

где:

X?) = со!(х?)^ = 1,л) - л-мерный вектор переменных состояния КО;

Б? = ЕП= = (Атv, í)Юv, V = ~л)

л х л -мерная диагональная матрица потенциальной эффективности выполнения КО, определяемая канальным потенциалом Е с учетом интенсивности

О = diag(юv,v = 1, л) выполнения соответствующих операций;

и?) = со1{иу?)^ = 1л) е и =

= со1{и^(?): и, е {0;1)^ = 1л)

- л-мерный булев вектор управляющих параметров, принадлежащих области и допустимых управлений.

Локально-оптимальное управление комплексом операций в сложных технических системах

Предположим, что комплекс операций (КО) в некоторой технической системе состоит из п операций и при их выполнении расходуется только один вид энергоресурса (ЭР).

Модель (3) расхода-пополнения ЭР может быть представлена в упрощенном виде.

q(t) = PU(t) - LU(t) = -LU(t) ,

(3)

где q - параметр состояния ЭР, = со1(ю„,V = 1,л) и Р=0 - 1хп - мерные матрицы-строки параметров интенсивности расходования и пополнения ЭР при выполнении соответствующих операций КО.

На процесс выполнения КО в ТС может накладываться целый спектр ограничений, которые могут классифицироваться как технические, технологические, ресурсные и краевые. Формализуются ограничения на основе уравнения (2) следующим образом.

1. Технологические ограничения, сужающие область допустимых управлений КО

и = со1и?) :^е{0;1)^ = 1^)

представлены отношениями следования

HiS

RESEARCH

двдг)=(х()- хг )тни(1)

совместности /(Х,и,Т) = кТи(() и несовместности /( Х,и,Т) = ит (¿)Ки( () выполнения операций, где Н

и Я - (пх п)-мерные булевы матрицы, к - п-мерный булев вектор, определяющие логико-математические конструкции.

2. Ресурсные ограничения представлены дифференциальными ограничениями

А(д* , и, Т) = Ш(() <д* ^ д- Ш(() > 0 на скорость расходования ЭР и интегральными ограничениями

1(ц\и,Т) = ц - \ш(т)<к > 0

Т

на общий объём его расходования, где ц и д - предельно допустимые скорость и объём расходования ЭР.

3. Ограничения на временной ресурс заданы временными границами цикла работы составляющих управляемой ТС - ( е Т= [(' , (г\ ;

4. Краевые условия, определяющие границы возможного изменения состояния КО заданы соотношениями х(() е X, х(*г) е X, где Х= -область допустимых вариаций вектора параметров состояния КО, V = 1, п.

Требования по качеству процесса управления КО в ТС зададим функционалом Майера

J - (хX(tf) - X3f)T • Л • (X(tf) - X}}

(4)

H(t) - pT(t)X (t) - pT(t)B(t)U(t) -

=Ip(tK(AT,tKu(t)

(6)

V-1

Тогда критерий (4) может быть преобразован к виду: Uopt(t) - arg max{ H(X,P, U,t)}

UeU4

= arg max{ PT(t)B(t)U(t)} , VteT,

UU4

(7)

используемому для формирования структуры оптимального управления и поиска оптимальных альтернатив управления для соответствующих моментов времени, удовлетворяющих ограничениям на временной ресурс.

В качестве первого приближения решения оптимизационной задачи (7) можно использовать результат работы алгоритма локально-оптимального управления [1, 5]. В этом случае вектор сопряженных переменных P(t)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

может оцениваться на каждом шаге при планировании очередного управляющего воздействия по формуле

гжл \l v3 v/aV При этом алгоритм локально-

P(t)-Л1 Xf - X(t)

оптимального управления будет иметь вид

Uo0pt(t) - arg max{(X3f -X(t)f ЛTB(t)U(A-U i= U lv '

UeU4 lv-1

= arg max -j ^ (xlf -

xv(0)avev(4Tv,t)avuv(i)L VteT.

(8)

характеризующим близость достигнутого объема выполнения КО X(tf) на конечный (финальный) момент

времени tf к заданному (требуемому) X3f, где

Л = diag(av, v = 1, n) - диагональная матрица коэффициентов относительной важности выполнения соответствующих (V -ых) операций из всего КО.

Критерий, обеспечивающий максимальный объём его выполнения, может быть задан в виде:

Uopt = arg min {j{x(tf),x3f)} . (5)

UUA

Для поиска оптимального плана (5) управления КО применим формализм принципа максимума Л.С. Пон-трягина [4], который позволяет задачу выбора управления на, вообще говоря, континуальном множестве альтернатив, свести к стандартной краевой задаче, обеспечивающей получение оптимального решения за конечное число итераций. В соответствии с формализмом принципа максимума введем в рассмотрение n - мерный вектор сопряженных переменных P(t) = c0l(p ,V = 1,n), и сформируем функцию Гамильтона с учетом соотношения (2) в следующем виде:

Закон (7) оптимального управления может быть вербально интерпретирован следующим образом: на каждом шаге выбора управляющих воздействий среди допустимых альтернатив должна выполняться та V -ая операция, состояние которой максимально далеко

от заданного (требуемого) значения с учетом интенсивности юу и важности данной операции. Формула (6) позволяет оценить численно близость состояния Ху(() к заданному состоянию .

В результате получен закон управления в форме обратной связи: и1ор((() = и1ор((Х((1_1)), - < (, кот°рый

говорит о том, что предстоящий вариант локально оптимального управления зависит только от текущего состояния КО. Данный закон имеет несомненное преимущество перед программным управлением, формируемым в результате итерационного процесса поиска строго оптимального решения с использованием метода, например, динамического программирования и т. п. Указанное преимущество заключается в гораздо меньшем количестве вычислений.

us

RESEARCH

Литература

1. Мануйлов Ю.С., Калинин В.Н., Гончаревский В.С. и др. Управление космическими аппаратами и средствами наземного комплекса управления: Учебник. - СПб.: ВКА имени А.Ф. Можайского, 2010. - 609 с.

2. Мищенко В.А. Метод селектирующих функций в нелинейных задачах контроля и управления. -М.: Советское радио, 1973. - 184 с.

3. Резников Б.А., Делий И.И. Математическое обеспечение управления подвижными объектами. - Л.: МО СССР, 1986. - 345 с.

4. Калинин В.Н., Резников Б.А., Варакин Е.И. Теория систем и оптимального управления. Часть 1. Основные понятия, математические модели и методы анализа систем. Л.: ВИКИ имени А.Ф. Можайского, 1989. - 417 с.

5. Мануйлов Ю.С., Птушкин А.И., Стародубов В.А. Алгоритмическая и программная реализация гибкой стратегии управления космическим аппаратами. Учебное пособие. - МО РФ, 2002. - 39 с.

6. Легков К.Е., Донченко А.А. Беспроводные MESH сети специального назначения // T-Comm: Телекоммуникации и транспорт. - 2009. - Т. 3, № 3. - С. 36-37.

LOCALLY-OPTIMUM CONTROL A COMPLEX OF OPERATIONS

Manuylov Y., Doc.Tech.Sci., professor,

Military Space Academy,

kotmanoff@rambler.ru;

Shmelev V., Ph.D,

Military Space Academy,

valja1978@yandex.ru.

Abstrae

In paper it is put, formalized and approximately the problem of optimum control of a complex of operations in some engineering system for the purpose of achievement of certain effect dares. Feature of statement and problem formalisation is account maintenance at volplaned management of indifference and obligatory compatibility, incompatibility and following of operations.

The model of a complex of operations is represented in the form of linear non-stationary differential dynamic system in the inoculated form of Koshi. The optimised parametre of a complex of operations chooses affinity of a final condition of each operation to demanded value at observance of restrictions on the management production engineering, spent a time and resources. The operation condition separately is fathomed as extent of its performance. Control action consists in performance of one or of some the chosen operations and, hence, increase in extent of their performance. For the solution the vector of the interfaced variables is inducted and with its help the Hamiltonian function which values are offered to be used in the capacity of criterion of sampling of the optimum management plan is created. In such statement the problem can be solved known methods of mathematical programming, for example a dynamic programing method (a problem of climb and speed the aircraft). However solution reception by the specified method is interfaced to the big computing expenses as it is necessary to analyse all possible path of development of a complex of operations at various alternatives of admissible managements.

In paper the alternative of an approximate solution of a task in view in the form of algorithm locally-optimum control is offered. The algorithm consists in such representation of a vector of the interfaced variables which can be counted on each step of development of control actions. For separate operation such vector will be equal to a difference of demanded and leaking conditions of operation taking into account its importance. In this case the optimum control law is verbally interpreted as follows: on each step of sampling of control actions among admissible alternatives that operation which condition is as much as possible far from the set (demanded) value taking into account intensity and importance of the given operation should be carried out. The algorithm can be applied to planning of a complex of operations in difficult engineering systems at considerable (more than 20) quantity of discretely carried out operations (controlled elements, system assemblies) and pulling out of some restrictions on production engineering, a time interval and ресурсоемкость purpose achievements. Keywords: an optimising problem, mathematical programming, an approximate solution, a Hamiltonian function.

References

1. Manuylov Yu.S., Kalinin V.N., Goncharevskiy V.S., 2010. Management of space vehicles and means of a land complex of management.

2. Mishchenko V.A., 1973. Method селектирующих functions in nonlinear problems of control and management.

3. Reznikov B.A., Deliy I.I., 1986. Management software mobile objects.

4. Kalinin V.N., Reznikov B.A., Varakin Ye.I., 1989. The theory of systems and optimum control. A part 1. The basic concepts, mathematical models and methods of the analysis of systems.

5. Manuylov Yu.S., Ptushkin A.I., Starodubov V.A., 2002. Algorithmic and program realisation of flexible strategy of management space devices.

6. Legkov K.E., Donchenko A.A., 2009, 'Wireless MESH networks of a special purpose', T-Comm: Telecommunications and transport, vol. 3, no. 3, pp. 36-37.

i Надоели баннеры? Вы всегда можете отключить рекламу.