Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении

Гомоюнов Михаил Игоревич

Известия Института математики и информатики УдГУ

2015. Вып. 1 (45)

УДК 517.977.1/.5 © М. И. Гомоюнов

ЛИНЕЙНО-ВЫПУКЛЫЕ ЗАДАЧИ ОПТИМИЗАЦИИ ГАРАНТИИ ПРИ ЗАПАЗДЫВАНИИ В УПРАВЛЕНИИ1

Рассматривается задача об управлении в условиях помех движением линейной динамической системы, содержащей запаздывание в управлении. Оптимизируемый показатель качества является нетерминальным и содержит оценку движения системы по совокупности отклонений в заданные моменты времени от заданных целевых точек. В зависимости от структуры показателя качества устанавливается существование оптимальных стратегий управления в подходящих классах стратегий обратной связи. Для приближенного вычисления величины оптимального гарантированного результата и нахождения оптимальных законов управления предлагается процедура попятного построения выпуклых сверху оболочек вспомогательных функций. В случае позиционного показателя качества проводится редукция этой процедуры, существенно понижающая размерность областей определения овыпукляемых функций.

Ключевые слова: теория управления, дифференциальные игры, запаздывание в управлении, позиционные стратегии.

Введение

В статье в рамках теоретико-игрового подхода [1-5] рассматривается следующая задача об управлении с оптимальным гарантированным результатом. Движение динамической системы, подверженной воздействиям полезного управления и неконтролируемой помехи, описывается линейными по фазовому вектору дифференциальными уравнениями. Воздействия управления и помехи стеснены известными геометрическими ограничениями. Промежуток времени процесса управления зафиксирован. Целью управления является минимизация значения показателя качества, включающего в себя оценку нормы совокупности отклонений движения системы в заранее заданные моменты времени от заданных целевых точек. Такая по существу нетерминальная структура показателя качества, то есть присутствие в нем оценки состояния динамической системы не только в конечный, но и в промежуточные моменты времени, составляет первую особенность рассматриваемой задачи. Вторая особенность заключается в наличии в системе запаздывания в управлении. При этом основной упор делается на разработку конструктивных методов решения таких задач.

Нетерминальные показатели упомянутой структуры используются для оценки качества во многих реальных процессах управления (см., например, [6-8]). Теоретические основы исследования позиционных дифференциальных игр с такими показателями качества были заложены в работах [4,9-12]. Были выделены различные типы показателей качества и для каждого из них указаны подходящие классы позиционных стратегий игроков, в которых соответствующие дифференциальные игры имеют цену и седло-вую точку. Отдельно были изучены показатели качества, имеющие так называемую позиционную структуру [4, р. 41]. Типичными примерами таких показателей являются, например, суммарное или максимальное отклонение движения системы в заданные моменты времени от заданных целевых точек, а также евклидова норма совокупности таких отклонений. Были намечены основные подходы к приближенному решению рассматриваемых задач.

1Работа поддержана РНФ (грант № 15-11-10018).

Эффект запаздывания в управлении характерен для многих прикладных задач. Этот эффект может быть обусловлен различными задержками в каналах цепи обратной связи, а также временными затратами, необходимыми для формирования оптимального управления. Присутствие в динамической системе запаздывания в управлении наделяет ее рядом существенных особенностей как по сравнению с системами без запаздывания, так и по сравнению с системами с запаздыванием по состоянию. Наиболее сильно эти особенности проявляются как раз для задач управления в условиях неконтролируемых помех. Системы с запаздыванием в управлении активно исследуются начиная с 1960-х годов по настоящее время (см., например, работы [13-29] и библиографию к ним), В основном эти исследования посвящены задачам об устойчивости и стабилизации, управляемости и наблюдаемости в таких системах, задачам оптимального управления и синтеза с выходом к соответствующим уравнениям Гамнльтона-Якобн-Беллмана, В результате сложились следующие два основных подхода к решению задач управления при запаздывании в управлении. Первый подход, которому идейно следует настоящая работа, основан на их сведении к подходящим вспомогательным задачам управления конечномерными системами без запаздывания (см, например, работу [20] и библиографию в ней). Согласно второму подходу системы с запаздыванием в управлении трактуются как, по сути, бесконечномерные системы в подходящем функциональном пространстве состояний (см., например, работу [26] и библиографию в ней). Дифференциальные игры в системах с запаздыванием в управлении изучались в работах [18,22,25], где, в частности, был получен аналог теоремы об альтернативе, доказано существование цены и сед-ловой точки в дифференциальных играх с терминальной платой.

Несмотря на то что задачи оптимизации гарантии и дифференциальные игры имеют широкий круг приложений, возможности применения теоретических методов исследования во многом ограничены их принципиальной сложностью и трудоемкостью в реализации, Выписать решения в явном виде удается крайне редко, поэтому продвижение в этом направлении во многом связано с развитием численных методов, В настоящее время имеется достаточно большое количество численных методов решения дифференциальных игр. Большинство из них так или иначе опираются на попятные рекуррентные конструкции, восходящие к работам [1,3,30-35], Среди них весьма условно можно выделить методы, основанные на аппроксимации множества позиций разрешимости дифференциальной игры (множества уровня функции цены) (см., например, [36-44]), и методы, в которых приближенно строится функция цены игры как обобщенное (минимаксное, вязкостное) решение соответствующего уравнения Гамильтона-Якоби-Айзекеа-Беллмана (см., например, [45-49]), Отдельное место занимают также методы, основанные на итерационных процедурах (см., например, [50-52]),

Разрабатываемые в работе конструкции приближенного решения линейно-выпуклых задач оптимизации гарантии в системах с запаздыванием в управлении и нетерминальными показателями качества относятся ко второй группе и восходят к методу выпуклых сверху оболочек [4,12,53,54], Ядро этого метода составляет процедура рекуррентного попятного построения выпуклых сверху (вогнутых) оболочек вспомогательных программных функций, которая для линейно-выпуклого случая реализует идеи стохастического программного синтеза [3,55-57] и тесно связана с известными в теории дифференциальных игр попятными макеиминными конструкциями (см., например, [3,30,34]), Результатом работы метода является репрезентативная формула для приближения функции цены игры. Эта формула позволяет достаточно просто построить оптимальные законы управления методом экстремального сдвига на сопутствующие точки (см., например, [3,4]), что составляет одну из главных особенностей метода.

Метод выпуклых сверху оболочек был впервые предложен в работе [53] для решения линейно-выпуклых дифференциальных игр с геометрическими ограничениями на

управляющие воздействия игроков и терминальными показателями качества. Для случая интегрально-квадратичных ограничений на реализации управлений игроков он был модифицирован в работе [58], для смешанного случая геометрических и дополнительных интегрально-импульсных ограничений — в работе [59], В [4, 12] этот метод был развит для ряда типичных нетерминальных показателей качества, содержащих оценки движения в промежуточные моменты времени.

Самой трудоемкой частью метода является построение выпуклых сверху оболочек функций, а эффективность такой операции определяется прежде всего размерностью множества их определения. Из-за наличия в показателе качества оценок движения в промежуточные моменты времени эта размерность, вообще говоря, может быть весьма большой даже при малой размерности фазового вектора системы. Однако во многих случаях эта размерность может быть понижена. Например, как показано в [54,60] для задач без запаздывания, в случае позиционного показателя качества конструкции метода всегда можно редуцировать так, чтобы размерность переменных, по которым требуется проводить овыпукление, совпадала с размерностью фазового вектора системы. Такая редуцируемоеть обуславливает эффективность метода и составляет другую важную его особенность. Одной из основных задач настоящей работы является разработка подобных редуцированных конструкций для решения линейно-выпуклых задач оптимизации гарантии с учетом запаздывания в управлении.

Следует также подчеркнуть, что, несмотря на имеющуюся трудоемкость и ресурсоемкое! ь метода выпуклых сверху оболочек в реализации, современный уровень развития вычислительной техники и технологий позволяет использовать его для численного решения достаточно широкого круга линейно-выпуклых задач управления и дифференциальных игр. За последнее время была установлена [61] устойчивость редуцированной процедуры [54] к вычислительным и информационным погрешностям, была дана и протестирована [62] численная реализация этой процедуры, основанная на «пиксельной» аппроксимации областей определения овыпукляемых функций и приближенного построения выпуклой сверху оболочки функции как нижней огибающей конечного набора опорных гиперплоскостей к ее подграфику, была доказана [63] сходимость получаемого численного метода. Была обоснована возможность применения метода выпуклых сверху оболочек для решения линейно-выпуклых дифференциальных игр в случае, когда не выполнено условие седловой точки в маленькой игре [3, с, 79], или, в другой терминологии, условие Айзекса [64, с, 54], при формализации как в классах «стратегии-контрстратегии» [65], так и в классах смешанных стратегий игроков [66], Эти исследования последних лет и проведенные численные эксперименты подтвердили работоспособность метода выпуклых сверху оболочек, поэтому этот метод и был выбран в качестве основы для построения приближенного решения линейно-выпуклых задач оптимизации гарантии при запаздывании в управлении.

Статья состоит из четырех частей. Первая часть носит вспомогательный характер, В ней приводятся необходимые сведения из теории позиционных дифференциальных игр, на которые опирается последующее изложение. Она написана по результатам работ [3,4,12,56] и содержит два раздела, В разделе 1,1 дается постановка линейно-выпуклой задачи оптимизации гарантированного результата для динамической системы без запаздывания при показателе качества в виде суммы нормы отклонения движения системы в терминальный момент времени от заданной целевой точки и интегральной оценки реализаций управления и помехи. Задача вкладывается в антагонистическую позиционную дифференциальную игру двух лиц. Приводится теорема о существовании цены и седловой точки в этой игре, В разделе 1,2 для приближенного вычисления цены и построения оптимальных законов управления игроков в рассматриваемой дифференциальной игре применяется метод выпуклых сверху оболочек. Указываются свойства

разрешающих конструкций.

Вторая часть состоит из четырех разделов, В разделе 2,1 рассматривается задача об управлении в условиях помех движением линейной динамической системы с запаздыванием в управлении при показателе качества в виде суммы нормы совокупности отклонений движения системы в заданные моменты времени от заданных целевых точек и интегральной оценки реализаций управления и помехи, В рамках теоретико-игрового подхода ставится задача об оптимизации гарантированного результата управления, вводятся понятия оптимальной минимаксной стратегии и оптимального закона управления. При этом информацией, доступной стратегии для назначения управляющего воздействия, являются текущий момент времени, история управления длины запаздывания и история движения системы, сформировавшиеся к этому моменту. Дополнительно формулируется задача о формировании самых неблагоприятных с точки зрения целей управления (контроптимальных) воздействий помехи. Симметричным образом определяются величина контроптимального гарантированного результата, оптимальная макеиминная стратегия и оптимальный закон формирования помехи, В разделе 2,2 на основе функциональной трактовки процесса управления, близкой [12] и восходящей к функциональному подходу, предложенному для систем с запаздыванием по состоянию в [67], исходная задача оптимизации гарантии сводится к вспомогательной линейно-выпуклой дифференциальной игре без запаздывания и с терминальной оценкой движения в показателе качества. При этом устанавливается равенство оптимального и контроптимального гарантированных результатов, а также существование оптимальных стратегий управления и формирования помехи. Структура вспомогательной дифференциальной игры определяется при помощи своеобразных прогнозов движения системы на каждый из оценочных моментов времени в исходном показателе качества. Поэтому размерность фазового вектора вспомогательной игры пропорциональна числу этих моментов и может быть весьма большой даже при малой размерности фазового вектора исходной системы, В разделе 2,3 на основе применения метода выпуклых сверху оболочек во вспомогательной дифференциальной игре для приближенного решения задачи предлагается рекуррентная процедура попятного построения выпуклых сверху оболочек вспомогательных функций. Однако многоразмерность вспомогательной игры приводит к многоразмерности множества определения этих функций, что во многом ограничивает использование процедуры при численном построении требуемых выпуклых оболочек, В разделе 2,4 описывается один нетривиальный класс задач, в которых эти оболочки удается выписать в явном виде, и предложенные конструкции приводят к эффективному решению. Рассматривается модельный пример, приводятся результаты численных экспериментов. Третья часть посвящена дальнейшему развитию предложенного подхода к решению задачи оптимизации гарантии при запаздывании в управлении в случае, когда показатель качества является позиционным. Она состоит из четырех разделов, В разделе 3,1 описываются дополнительные предположения относительно структуры показателя качества, которые обеспечивают его позиционность, С учетом этих предположений в разделе 3,2 задача оптимизации гарантии сводится к каскаду вспомогательных линейно-выпуклых дифференциальных игр уменьшающейся размерности. При этом доказывается существование таких оптимальных стратегий, которые из всей истории движения, сформировавшейся к текущему моменту времени, используют только текущее значение фазового вектора. Каждая из вспомогательных игр каскада отвечает своему оценочному моменту времени из показателя качества и определяется при помощи прогнозов движения системы только на этот и последующие оценочные моменты времени. Подходящий показатель качества извлекается из позиционной структуры исходного показателя, В разделе 3,3 на основе применения метода выпуклых сверху оболочек в каждой из вспомогательных игр каскада приближенное решение задачи оптимизации гарантии ево-

дится к соответствующей процедуре попятного построения выпуклых сверху оболочек подходящих вспомогательных функций. При этом уменьшающаяся размерность дифференциальных игр каскада влечет уменьшающуюся размерность множеств определения этих функций, что повышает эффективность процедуры по сравнению с разрешающими конструкциями из второй части. Однако более существенным является тот факт, что эта процедура допускает дальнейшую редукцию, еще сильнее понижающую размерность переменных, по которым требуется проводить овыпукление. Описанию и обоснованию этой редукции посвящена четвертая часть, В разделе 3,4 работоспособность предложенной процедуры иллюстрируется на двух модельных примерах, В первом примере нужные выпуклые оболочки удается выписать в явном виде. Во втором примере в динамической системе отсутствуют помехи, что гарантирует вогнутость вспомогательных функций, поэтому их выпуклые сверху оболочки строить не требуется. Приводятся результаты численного моделирования.

Как отмечалось выше, для задач без запаздывания при позиционном показателе качества разрешающую процедуру построения выпуклых сверху оболочек вспомогательных функций можно редуцировать так, чтобы размерность множеств определения этих функций совпадала с размерностью фазового вектора системы и, стало быть, не зависела от числа оценочных моментов времени из показателя качества, В четвертой части предлагается аналог такой редукции для задач с запаздыванием в управлении. Четвертая часть состоит из шести разделов, В разделе 4,1 выделяются некоторые характерные особенности исходной задачи и каскада вспомогательных дифференциальных игр, обуславливающие возможность редукции разрешающей процедуры из третьей части, Сама редукция, понижающая размерность областей определения овыпукляемых функций, описывается в разделе 4,2, В разделе 4,3 устанавливается связь получаемой редуцированной процедуры с исходной процедурой из третьей части. Разделы 4,4 и 4,5 посвящены обоснованию применимости редуцированной процедуры для приближенного решения рассматриваемой задачи оптимизации гарантии при запаздывании в управлении и позиционном показателе качества. Следует отметить, что, в отличие от задач без запаздывания в управлении, здесь размерность областей определения овыпукляемых функций в общем случае не удается свести к какой-либо постоянной величине: она зависит от связи расположения оценочных моментов времени из показателя качества и величины запаздывания в управлении. Тем не менее во многих типичных случаях эта размерность по-прежнему не зависит от числа оценочных моментов времени. Приводится пример, когда обсуждаемая размерность совпадает с удвоенной размерностью фазового вектора исходной системы. Пониженная размерность редуцированных конструкций позволяет использовать их для эффективного решения исходной задачи оптимизации гарантии и при численном построении требуемых выпуклых оболочек. Два соответствующих примера приведены в разделе 4,6,

Отдельные результаты, вошедшие в работу, были опубликованы в [68-71],

§ 1. Вспомогательные сведения из теории позиционных дифференциальных игр

В этой части рассматривается задача об управлении в условиях помех движением динамической системы при показателе качества в виде суммы нормы отклонения движения системы в терминальный момент времени от заданной целевой точки и интегральной оценки реализаций управления и помехи, В рамках теоретико-игрового подхода задача формализуется как антагонистическая позиционная дифференциальная игра двух лиц в классах чистых стратегий. Приводится теорема о существовании цены и седловой точки в этой игре. Для приближенного вычисления цены и построения оп-

тимальных законов управления игроков применяется метод выпуклых сверху оболочек. Указываются свойства разрешающих конструкций. Подробное изложение результатов этой части можно найти в работах [3,4,12,56],

§1.1. Дифференциальная игра

Договоримся о следующих обозначениях. Пусть К — множество действительных чисел, К" — евклидово проетранетво п-мерпых векторов со стандартным скалярным произведением (•, •) и нормой || • ||. При этом, как обычно, полагаем М1 = М. Пусть г1, г2 £ М, ¿1 ^ ¿2, Р С К" и зафиксирована функция / : — Р. Следуя [3], для этой функции

будем использовать следующее обозначение:

/[¿1[-]^2] = {/(¿) е ^ г ^ ¿2}.

По аналогии функцию / : [¿1;г2) — Р будем обозначать через

/№2) = {/(¿) е ^ г <¿2}.

Рассмотрим динамическую систему, движение которой описывается дифференциальным уравнением

аъ(г)/аг = в(г)и(г) + с(г)^(г), г0 ^ г <

ъ е , и е Р с К"", ^ е д с .

Здесь ъ — фазовый вектор, г — текущий момент времени, и — вектор управления, V — вектор помехи; ¿0 и $ — начальный и терминальный моменты времени соответственно; Р и д — заданные компактные множеетва; В (г) и С (г) — ограниченные кусочно-непрерывные па [г0,$] матрицы-функции, непрерывные в точках разрыва справа.

Позицией системы (1,1) называется пара (¿, ъ) е [¿0,$] х Пусть заданы позиция (¿*, ъ*) е [г0,$] х и момент времени ¿* е [г*,$]. Допустимыми реализациями управления и помехи считаем измеримые по Борелю функции и[г* [•]£*) = {и(г) е Р, г* ^ г < г*} и ^[г*[•]£*) = {^(г) е д, г* ^ г < г*} соответственно. Из позиции (г*, ъ*) такие реализации единственным образом порождают движение системы (1.1) — абсолютно непрерывную функцию ъ[г*[-]г*] = {ъ(г) е , г* ^ г ^ г*}, которая удовлетворяет условию ъ(г*) = ъ* и почти всюду па [г*,г*] вместе с и(г) и ■и(г) удовлетворяет уравнению (1.1).

Предположим, что из позиции (г*, ъ*) е [г0,$] х при действии допустимых реализаций управления и[£*[•]$) и помехи сформировалось движепие ъ[г*[-]$] системы (1.1). Качество процесса управления оценивается показателем

7 = 7 (ъ [г* [•]$], и [г* [•]$), и[г*[-]0)) = ^(ъ($) - с) + ^ (а(г,и(г)) + в (М(г)))аг. (1.2)

Здесь с е ^(1) е К, 1 е - норма; а(г,и) е К, (г, и) е [*0,$] X Р, и в (г, V) е К, (г, V) е [г0,$] х д, — непрерывные функции.

Задача управления состоит в том, чтобы доставить показателю 7 как можно меньшее значение. При этом действия помехи неизвестны и, в частности, могут быть нацелены на максимизацию 7.

В рамках теоретико-игрового подхода эта задача вкладывается в антагонистическую позиционную дифференциальную игру двух лиц. Первый игрок, распоряжающийся воздействиями управления и (г), стремится минимизировать показатель 7, второй игрок, распоряжающийся воздействиями помехи ■и(г), — максимизировать. Эту дифференциальную игру формализуем следующим образом.

Стратегией управления u(-) первого игрока называется функция u(t, z, e) G P, (t, z) G [t°, tf] x Rd, e > 0,

где e — параметр точности.

Пусть t* G [t0, tf ] и выбрано разбиение

Afc = Afc{rj} = {г,- : ri = i*, г,- < rj+1, j = 1, к, тк+1 = г?} (1.3)

отрезка времени [t*,tf]. Тройка {«(•), e, Ak} определяет закон управления первого игрока, который по шагам разбиения Ak в цепи обратной связи формирует кусочно-постоянную реализацию u[t*[-]tf) по правилу

и(г) = и(тз,г(тз),е), t G [tj , Tj+1), j = l,k. (1.4)

Гарантированный результат для закона {«(•), e, Ak} и позиции (t*, z*), z* G Rd, определяется равенством

Pu [«(•), e, Afc; t*, z*] = sup y(m(-), e, Afc; v[t*[•jtf); t*, z*),

где 7(u(^),e, Ak; v[t*[^]tf); t*, z*) — значение показателя качества (1.2), отвечающее реализации процесса управления, сформировавшейся из позиции (t*, z*) при действии закона {«(•), e, Ak} в паре с реализацией v[t*[-]tf); точная верхняя грань берется по всем допустимым реализациям v[t*[-]tf). Определим гарантированный результат для стратегии м(-) и позиции (t*, z*):

Ри[и(-)', t*, z*] = lim lim sup pu [u(-), e, Afc; t*, z*],

e^0 ¿4° дк

где точная верхняя грань вычисляется по всем разбиениям Ak вида (1.3) с диаметром 6k = maxj=rfc(ri+1 ~~ rj) ^ & Оптимальным гарантированным результатом управления первого игрока для позиции (t*, z*) называется величина

pU(t*,z*) = inf P«[uO; t*,z*],

где точная нижняя грань берется по всем стратегиям м(-). Если эта нижняя грань достигается, то соответствующая стратегия м°(-) называется оптимальной минимаксной стратегией управления первого игрока.

Будем говорить, что для числа Z > 0 и позиции (t*, z*) закон управления первого игрока {«(•), e, Ak} является Z-оптимальным, если выполняется неравенство

P« [u(-),e, Afc; t*, z*] ^ p«(t*, z*) + Z-

Стратегией управления v(-) второго игрока называется функция

v(t, z,e) G Q, (t, z) G [t°, tf] x Rd, e > 0.

Пусть t* G [t°,tf] и Ak — разбиение вида (1.3). Закон управления второго игрока {v(-),e, Ak} то шагам разбиения Ak в цепи обратной связи формирует кусочно-постоянную реализацию v[t*[-]tf) по правилу

v(t) = v(Tj,x(Tj),e), t G [rj, Tj+\), j = l, к. (1.5)

Гарантированный результат для закона Дк} и позиции (t*, z*), z* G Rd, опре-

деляется равенством

Pv [v(-),£, Дк; t*, z*] = [inf^ Дк; u[t*[-]$); t*, z*),

где y(v(-),£, Дк; u[t* [•]$); t*, z*) — значение показателя качества (1.2), отвечающее реализации процесса управления, сформировавшейся из позиции (t*, z*) при действии закона {v(-), е, Дк} в паре с реализацией u[t* [•]$); точная нижняя грань вычисляется по всем допустимым реализациям u[t*[•]$). Гарантированным результатом для стратегии v(-) второго игрока и позиции (t*, z*) называется величина

Pv[v(-)-, U, zJ = limliminfp J?; (•),£, Ak; i*,zJ, "H0 Afc

где точная нижняя грань берется по всем разбиениям Дк вида (1.3) с диаметром 5к ^ Величина оптимального гарантированного результата управления второго игрока для позиции (t*, z*):

pV(t*, z*) = suppv [v(-); t*, z*] ,

О

где точная верхняя грань вычисляется по всем стратегиям v(-). Если эта верхняя грань достигается, то соответствующая стратегия v0(-) называется оптимальной максиминной стратегией управления второго игрока.

Будем говорить, что для числа Z > 0 и позиции (t*, z*) закон управления второго игрока {v(-),e, Дк} является ^-оптимальным, если выполняется неравенство

Pv [v(-),£, Дк; t*, z*] ^ p°°(t*, z*) - Z.

Если справедливо равенство

pU(t*, z*) = P0(t*, z*), (t*, z*) G [to,0] X Rd,

то говорят, что дифференциальная игра (1.1), (1-2) имеет цену. Величину p(t*, z*) = = pU(t*, z*) = p0(t*, z*) называют ценой игры, а пару {u0(-), v0(-)}, состоящую из оптимальных минимаксной u°(-) и максиминпой v°(-) стратегий, — седловой точкой игры.

Теорема1.1. Дифференциальная игра, (1.1), (1.2) имеет це ну p(-) и еедловую точ,-ку {u0(-),v0(-)}.

Учитывая вид системы (1.1) и показателя (1.2), стратегии u0(-) и v0(-) можно выбрать универсальными и оптимальными равномерно для всего множества позиций (t, z) G G [t0,$] X Rd. А именно, таким образом, чтобы были справедливы следующие утверждения.

Утверждение 1.1. Для любого числа Z > 0 найдутся такие число е* > 0 м функция #*(е) > 0, е G (0, е*], что, каковы бы ни бы,л,и позиция (t*, z*) G [t0,$] X Rd, значение параметра, точности е G (0, е*] и разбиение Дк вид а, (1.3) с диаметр ом, 5k ^ $*(е), закон управления первого игрока, {и0(-),е, Дк} будет (-оптимальным.

Утверждение 1.2. Для любого числа Z > 0 найдутся такие число е* > 0 м функция #*(е) > 0, е G (0, е*], что, каковы бы ни бы,л,и позиция (t*, z*) G [t0,$] X Rd, значение параметра, точности е G (0, е*] и разбиение Дк вид а, (1.3) с диаметр ом, 5k ^ $*(е), закон управления второго игрока, {^0(-),е, Дк} будет (-оптимальным.

§1.2. Метод выпуклых сверху оболочек

Для приближенного вычисления цены и построения оптимальных законов управления игроков в дифференциальной игре (1.1), (1-2) применим метод выпуклых сверху оболочек.

Пусть € и Дк = Дк} — разбиение вида (1.3), удовлетворяющее следую-

щему условию:

матрицы-функции B(t) и С(t) непрерывны на [rj,Tj+i), j = 1 ,к. (1-6) Положим

G = {l G Rd : p*(l) ^ 1}, (1.7)

f Tj+i

A^j(l) = minmax ((l, B(t)u + C(t)v) + a(t,u) + e(t,v))dt,

где • ) — норма, сопряженная к норме • ) из показателя качества (1.2):

^*(l)= max (l, z), l G Rd.

Попятно по шагам разбиения Дк определим функции (1) € К, 1 € С, = 1, к + 1, согласно следующему рекуррентному правилу. При = к + 1 полагаем

№+1(1) = -(1, с), 1 € С, (1.9)

где с — вектор из показателя качества (1.2). При j = 1 ,к определяем

^(1) = Д^-(1) + ъ+1(1), 1 € С, Ъ(1) = ( ■)}^(1), 1 € С,

где символ ■ ( ■ ) означает выпуклую сверху оболочку функции ■ ) на множестве С, то есть минимальную из вогнутых функций, мажорирующих ■ ) на С.

Можно проверить, что для каждого ] = 1, к + 1 функции являются полунепрерывными сверху на С. Кроме того, по построению эти функции являются вогнутыми на С.

Определим систему величин

ез(ъ) = ез(ъ- &к) = тд^({\,ъ) + 1рз(\)), ъ € Е*1, ] = 1,к + 1. (1.11)

Отметим, что имеют место соотношения

вк+1^) = - с), 7 € (1.12)

е^ъ)^ / гшптах(а(г,и) + /?(г,г;))с1г, г е Е'1, ^ = 1,А; + 1. (1.13)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Следующие две леммы устанавливают соответственно свойства и- и ^-стабильности системы величин е^- ( ■ ) (1.11).

Лемма 1,1, Пусть ] = 1, к, г* € Е'1 и V* € <5- Тогда для постоянной реализации помехи [•]г?-+1) = {^*(£) = V*, т^- ^ £ < г,-+1} найдется такая допустимая, реализация управления и[т, [•]т,+1), что из позиции (т,, под действием этих реализаций си,стем,а, (1.1) перейдет в позицию (т,+1, 7(т,+1)), для, которой будет выполнено неравенство

е^+^т,-+1)) + / (а(£,и(£)) + в(М*))^ ^ е,(2*).

j

Лемма 1,2, Пусть ] = 1, к, г, е Ё'1 « и» е Р. Тогда, для постоянной реализации управления м*[т?-[•]т?-+1) = {и*(£) = и*, т, ^ £ < т,+1} найдется такая допустимая, реализация, помехи ^[т, [•]т?-+1), что из пози ции, (т,, 2*) под действием этих реализаций систем,а, (1.1) перейдет в позицию (т,+1, 7(т,+1)), для, которой будет выполнено неравенство

е,+1 (2(т,+1)) + I (а(£,м*) + в(г,г>(г)))ёг ^ е,(2*).

Рассмотрим стратегии управления первого мдк(■) и второго (■) игроков, которые в моменты времени т, разбиения Дк определяются методом экстремального сдвига па сопутствующие точки, выбираемые по величинам е,(■) (1,11):

uAfc(rj, z,£) G argmi^(sju)(z,e), B(rj)u) + /Ju)(z, е)а(т}-,u)).

vAfc(Tj, z,£) G argmax((sj()(z,£), Cfo)v) + /j() (z,e)0(r,,v)), (1.14)

^ Г-ZV 1 f(v),

X (Г

г»€<3 _

j = l,k, z G Ed, e>0,

а в остальные моменты времени доопределяются произвольным образом. Здесь

l(u)(

V1 + ||lju)(z,^)n2 + ||lju)(z,£

Vl + PÍ'W)!!2 yi + llffW)!!2 (1.15)

4и)(г,е) G argmax((l,z) + ^-(1) - r(r„ e)л/l + ||1||2), lee v '

l^(z,e) G argmaxf(l,z) + ^-(1) +r(rJ,e)v/l + ||1||2), leG v__/

r(í, £) = Vе + - to)£, t G [ío, <?]• Имеет место следующая лемма.

Лемма 1,3, Для, любого числа £ > 0 найдется чиело 5 > 0, для, которого будет справедливо следующее утверждение.

Пусть t* G [t0,$) u Ak = Ak {rj} — разбиение вида, (1.3), (1.6) с диаметр ом, 5k ^ 5. Пусть j = zi1"1 G Rd, zi2"1 G Ed, /* G R и при некотором R ^ 1 выполняется неравенство

l|s*||2 + /2 ^ r2(Tj ,£)R, s* = z*1) - z*2).

Пусть движение z(1) [r¿[-]т(+i] системы (1.1) порождено из позиции (rj, z(1)) допустимой реализацией помехи v[rj[•]т(+1) и постоянной реализацией управления u[r¿[•]т(+1) = = {u(t) = ue, Tj ^ t < T(+1}, где

G argmin((s*, B(r¿)u) + /*a(r¿,u)). «eP

Пусть движение г(2)[г?-[ ■ ]т.,+1] системы (1.1) порождено из позиции (т,, г*2)) допустимой реализацией управления и* [т, [ ■ ]т?+1) и постоянной реализацией помехи V* [т, [ ■ ]т?+1) = = = т, ^ £ < т,+1}, где

Vе € а^шах((б*, С(т,Ю + /*в(т,.

V* е^

Тогда имеет место неравенство

117« (т,+1) - 7(2)(т,+1)|2 + (/*)2 ^ Г2(т,+1,в)Д, гТ]+1

/ * = /* + / («(¿,ие)+в - («(¿,и*(*))+в ме))^.

Отметим, что искомое число $ > 0 может быть выбрано из условий

16М2(В(■ ), С(■ ),а(■ ),в( ■ ))$ ^ е, 64(1 + $ - *о)МВ(■ ),а(■ ); $) + ^(С(■ ),в( ■); $))2 ^ е,

где

(1.16)

(В( ■ ), а( ■ ); $) = вир | ||В(^1)и - В(£2)и|| + |а(^1, и) - «(¿2, и)|:

¿1 ,¿2 € [¿о,$], В(г) — непр. на [¿1,¿2), |*1 - 1 ^ $, и € р}, (1.17)

^2(С(■ ),в( ■ ); $) = вир |||С(^ - С(^Н| + |в(¿1^) - в(¿2,^)1:

¿1,¿2 € [¿о,$], С(г) — непр. на [¿1,¿2), |*1 - ¿21 ^ $, V € ф}, (1.18)

М(В(■ ), С( ■ ), а(■ ), в( ■ )) = вир |||В(¿)и + С(*Н| + |а(*, и) + в(¿, v)|:

Ь € [¿о,$],и € Р, V € (1.19)

Приведенные свойства системы величин е, ( ■ ) (1.11) позволяют с опорой на теорему 1.1 и лемму 1.3 установить справедливость следующих теорем.

Теорема 1.2. Для любого числа £ > 0 можно указать такое число $ > 0, что, каковы бы ни были, позиция (¿*, г*) € [¿о,$) х и разбиение Дк вида, (1.3), (1.6) с диаметром ^ $, будет справедливо неравенство

|е1 (г*) - р(£*, г*)| ^ £, где р( ■ ) — цена дифференциальной игры (1.1), (1.2).

Теорема 1.3. Для любого числа ( > 0 найдутся такие число е* > 0 м функция $*(е) > 0, е € (0, е*], что, каковы бы ни были, позиция (¿*, г*) € [¿о,$) х значение па,ра,м,етра, точности е € (0, е*] и разбиение Дк вида, (1.3), (1.6) с диаметром ^ $*(е), законы управления первого [идй( ■ ),е, Дк} и второго ( ■ ),е, Дк} игроков, построенные на основе стратегий идЙ ( ■ ) и vдfc ( ■ ) (1.14), будут (-оптимальными.

Таким образом, приближенное вычисление цены и построение оптимальных законов управления игроков в дифференциальной игре (1.1), (1-2) сводятся к определению в согласии с попятной рекуррентной процедурой (1.7)-(1.10) выпуклых сверху оболочек ( ■ ) вспомогательных функций ф, ( ■ ) на множестве С.

§ 2. Оптимизации гарантии при запаздывании в управлении

В этой части рассматривается линейная динамическая система, подверженная наряду с полезным управлением воздействиям неконтролируемых помех и содержащая запаздывание в управлении. Оптимизируемый показатель качества процесса управления является нетерминальным и представляет собой сумму нормы совокупности отклонений движения системы в заданные моменты времени от заданных целевых точек и интегральной оценки реализаций управления и помехи, В рамках теоретико-игрового подхода ставится задача об оптимизации гарантированного результата. На базе подходящей функциональной трактовки процесса управления задача сводится к вспомогательной дифференциальной игре без запаздывания и с терминальной платой, но в пространстве большой (пропорциональной количеству моментов времени оценки качества движения) размерности. На основе применения метода выпуклых сверху оболочек во вспомогательной игре для приближенного решения задачи предлагается многоразмерная рекуррентная процедура попятного построения выпуклых сверху оболочек вспомогательных функций. Описывается один нетривиальный класс задач, в которых требуемые выпуклые сверху оболочки удается выписать в явном виде, и предложенные конструкции приводят к эффективному решению. Рассматривается модельный пример, приводятся результаты численного моделирования,

§2.1. Постановка задачи

Рассмотрим динамическую систему, движение которой описывается дифференциальным уравнением

ах(г)/аг = А(г)х(г) + в(г)и(г) + в(г)и(г - т) + с(Ф(г), ^ ^ г < X е Е", и е Р с Егаи, V е Q с Е"», т = сог^ > 0.

Здесь х — фазовый вектор, г — текущий момент времени, и — вектор управления, v —

вектор помехи; т — постоянная величина запаздывания; ¿0 и § — начальный и терминальный моменты времени соответственно; Р и Q — заданные компактные множества; А (г), В(г), Вт (г) и с (г) — непрерывные на [¿0,§] матрицы-функции.

Обозначим через Р множество измеримых по Борелю функций р(£) е Р, £ е [—т, 0). Позицией системы (2,1) назовем тройку (г,х,р(-)) е [г0,§] х Е" х Р, где функция р(-)

т,

времени г. Введем множество К = [г0,§] х Е" х Р позиций системы (2,1),

Из позиции (г*, х*,р*(-)) е К допустимые (измеримые по Борелю) реализации управления и[г*[•]£*) = {и(г) е Р, г* ^ г < г*} и помехи v[t*[-]г*) = ^(г) е Q, г* ^ г < г*}, г* е [г* ,§], единственным образом порождают движение системы (2,1) — абсолютно непрерывную функцию х[г*[•]£*] = {х(г) е Е", г* ^ г ^ г*}, которая удовлетворяет условию х(г*) = х* и почти всюду па [г*,г*] вместе с и(г) и v(t) удовлетворяет уравнению (2,1), При этом в согласии с заданной историей р*(-) доопределяем реализацию управления при г е [г* — т, г*) из услов ия и (г) = р*(г — г*). Всюду далее для обозначения истории управления длины т, сложившейся к моменту времени г, будем использовать следующее обозначение:

и*(-) = М£ ) = и(г + £ ),£ е [—т, 0)}.

Предположим, что из начальной позиции (г0, х0,р0(-)) е К при действии допустимых реализаций управления и[г0[-]§) и помехи v[í0[•]§) сформировалось движение х[г0[-]§]

системы (2,1), Качество процесса управления будем оценивать показателем

7 = 7 ИМ ■ ]$],и[М ■ ■ ]$)) =

, ч [V (2.2)

= ) - С1),...,£* ) - )) + J (а(*,и(*)) + в

Здесь ^ € £ = 1,-^", ~~ заданные моменты времени, ^ < $¿+1, г = 1, АГ — 1,

и = Di — (¿г х тг)-матрица, 1 ^ ¿г ^ п, г = 1, Ж; с» € Ега, г = 1, АГ; //(/ь ... ,1м) С Е, (/1,...,/м) € Е^1 х ... х Е^, - норма; а(*,и) € Е, (¿,и) € [¿о,$] х Р, и в(М) € Е, (¿, V) € [¿о,$] х ф, — непрерывные функции.

Цель управления — доставить показателю качества 7 (2,2) как можно меньшее значение, При этом действия помехи неизвестны и, в частности, могут быть нацелены на максимизацию 7.

Перейдем к формализации задачи управления. Стратегией управления и( ■ ) назовем функцию

и (¿,ж[*о [■ ]*],р( ■ ), е) € Р, * € [¿о,$], ж[*о[-М € С [¿о Д р( ■ ) € Р, е> 0,

где функция ж[^о[■ ]£] играет роль истории движения системы (2,1), сложившейся к моменту времени ¿, е — параметр точности, С[¿о,£] — множество непрерывных функций х(£) € Еп, £ € [¿о, ¿].

и( )

разбиения

= = (т.,- : Г1 = ¿о, Ъ < Гу+ь = 1, к, тк+1 = г?} (2,3)

отрезка времени [¿о,$]. Тройка {и( ■ ),е, Дк} определяет закон управления, который по шагам разбиения Дк в цепи обратной связи формирует кусочно-постоянную реализацию управления и[£о[ ■ ]$) согласно правилу

Цг) = Е/(т,,ж[г0[-]т,],игД-)>г)> te[тj,тj+1), з = 1,к, (2.4)

где я[£о[-]т,] — история движения системы (2,1), сформировавшаяся к моменту времени т,. Таким образом, го начальной позиции (¿о,хо,ро(■ )) € К закон управления {и( ■ ),е, Дк} в паре со случившейся допустимой реализацией помехи v[t0[■ ]$) единственным образом определяет движение я[£о[■ ]$] и реализацию управления и^о[-]$). Соотве)-ствующее значение показателя (2,2) обозначим через 7(и( ■ ),е, Дк; v[t0[■ ]$); ¿о,хо,ро( ■ )).

Гарантированный результат для закона управления {и( ■ ),е, Дк} и начальной позиции (¿о,хо,ро( ■ )) определяем равенством

Г« [и( ■ ), е, Дк; ¿о,хо,ро( ■)] = вир 7(и( ■ ),е, Дк; v[tо[■ ]$); ¿о,Хо,Ро( ■)),

где точная верхняя грань вычисляется по всем допустимым реализациям помехи v[t0[■ ]$). Гарантированным результатом для стратегии управления и( ■ ) и позиции (¿о,хо,ро(■ )) называем величину

Г„[[/(•); Ь,х0,р0(-)] = ИтИтвирГад[[/(•),е,Ак-, г0,х0,р0(-)],

е|о д|о

где точная верхняя грань берется по всем разбиениям Дк вида (2.3) с диаметром = = тах^у-^т)-!-! — г^) ^ 8. Непосредственно из данного определения следует справедливость следующего утверждения.

Утверждение 2,1, Для любых начальной позиции (t0, x0,p0(^)) G K и числа, Z > 0 найдутся такие число е* > О и функция ^*(е) > 0, е G (0,е*], что, каковы бы ни были, значение параметра, точности е G (0, е*] и разбиение Ak вида (2.3) с диаметром ^ £*(е), при любой допустимой реализации, помехи v[i0[-]-$) закон управления {U(•), е, Ak} будет обеспечивать неравенство

Y ^ ги[иО; ¿о,хо,РоО] + С

Значение Гад[U(•); i0,x0,p0(^)] есть наименьшее из чисел, обладающих подобным свойством,.

Величина оптимального гарантированного результата управления для начальной позиции (t0,x0,p0(-)) определяется следующим образом:

rU(t0,x0,P0(0) = inf} ru [UО; t0, (2.5)

где точная нижняя грань вычисляется по всем стратегиям U(•). Если эта нижняя грань достигается, то соответствующую стратегию U0(•) называем оптимальной минимаксной стратегией управления.

Будем говорить, что для числа Z > 0 и позиции (t0,x0,p0(-)) закон управления {U(• ), е, Ak} является ^-оптимальным, если выполняется неравенство

г„ [и(-),е, Afc; Î0,x0,P0(^^ ^ rU(i0,x0^О) + С-

Цель работы заключается в разработке методов приближенного вычисления величины оптимального гарантированного результата и построения для заданного числа Z > 0 Z-оптимального закона управления.

Рассмотрим дополнительно задачу о формировании самых неблагоприятных с точки зрения целей управления воздействий помехи, то есть воздействий, нацеленных на максимизацию показателя качества (2.2).

Стратегией формирования помехи V(•) назовем функцию

V(t,x[t0[-]i],p(-),е) G Q, t G [t0,tf], x[Î0[^]i] G CM], p(0 GP, е> 0.

Тройка {V(•), е, Ak} определяет закон формирования помехи, который по шагам разбиения Ak в цепи обратной связи формирует кусочно-постоянную реализацию помехи v[t0[-]$) согласно правилу

v(t) = V(Tj,x[tQ[-]Tj],uT.(-),e), t G [tj, Tj_|_i), j = l,k. (2.6)

Из начальной позиции (t0, x0,p0(^)) G K закон {V(•), е, Ak} в паре с допустимой реализацией управления u[t0[-]-$) единственным образом определяет движение x[t0[^]^] и реализацию помехи v[t0 [•]$). Обозначим через y(V(•), е, Ak; u[t0 [•]$); t0,x0,p0(^)) соответствующее значение показателя качества (2.2).

Определим величину гарантированного результата для закона формирования помехи {V(•), е, Ak} и позиции (t0, x0,p0(^)) равенством

Г[V(•),е, Afc; ^,Ж0,Р0(0] = inf t(V(•),е, Afc; ufoHtf); t0,x,P0(-)),

u[to [•]#}

где точная нижняя грань вычисляется по всем допустимым реализациям управления u[t0[•]-$). Гарантированным результатом для стратегии формирования помехи V(•) и позиции (t0,x0,p0(-)) называем величину

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Г„[У(-); t0,x0,'po(-)] = limliminf Afc; t0, х0,'р0(-)],

ô-l-0 Afc

где точная нижняя грань берется по всем разбиениям Ak вида (2.3) с диаметром ^ По аналогии с утверждением 2.1 имеет место

Утверждение 2,2, Для любых начальной позиции (¿о,хо,ро(■ )) € К и числа ( > 0 найдутся такие число е* > 0 и функция (е) > 0, е € (0,е*], что, каковы бы ни были, значение параметра, точности е € (0, е*] и разбиение Дк вида, (2.3) с диаметром, ^ $*(е), при любой допустимой реализации, управления и^о[-]$) закон формирования помехи {V( ■ ),е, Дк} будет обеспечивать неравенство

7 ^ Г* [V( ■ ); ¿о,хо,Ро( ■ ^ - С.

Значение Г [V( ■ ); ¿о,хо,ро( ■ )] есть наибольшее из чисел, обладающих подобным свойством,.

Величина контроптимального гарантированного результата для позиции (¿о, хо,ро(■ )) определяется следующим образом:

Г° (¿о,жо,ро( ■ )) = вир Г [V( ■ ); ¿о,хо,ро( ■)], (2.7)

где точная верхняя грань вычисляется по всем стратегиям V ( ■ ). Если эта верхняя грань достигается, то соответствующую стратегию Vо( ■ ) называем оптимальной макеиминной стратегией формирования помехи.

Будем говорить, что для числа ( > 0 и позиции (¿о,хо,ро(■ )) закон формирования помехи {V( ■ ),е, Дк} является ^-оптимальным, если выполняется неравенство

Г [V( ■ ), е, Дк; ¿о,хо,ро( ■ )] ^ Го (¿о,жо,ро(■ )) - С

Отметим следующий результат, вытекающий из утверждений 2.1 и 2.2.

Лемма 2.1. Каковы бы, ни были, начальная, позиция (¿о,хо,ро( ■ )) € К, стратегия, управления и ( ■ ) и стратегия, формирования помехи V ( ■ ), имеет место неравенство

Г [V( ■ ); ¿о,хо,ро( ■ )] ^ Г« [и( ■ ); ¿о,Хо,ро( ■ )].

Доказательство. Доказательство леммы проводится по схеме из [3, лемма 8.1, с. 82]. Предположим, что для позиции (¿о,хо,ро(■ )) € К, стратегий и( ■ ) и V( ■ ) и числа п > 0 выполняется неравенство

Г [V( ■ ); ¿о,хо,ро( ■ )] ^ Г« [и( ■ ); ¿о,Хо,ро( ■ )] + п (2.8)

По числу £ = п/3 в соответствии с утверждениями 2.1 и 2.2 выберем числа е*1) > 0 и е *2) > 0 и функции ¿(1)(е) > 0, е € (0,е ^^ и (е) > 0, е € (0,е *2)]. Зафиксируем значение параметра точности е = шт{е *1), е*2)} и разбиение Дк вида (2.3) с диаметром

(е)}. Рассмотрим движение х[£о[ ■ ]$] системы (2.1), порожденное из позиции (¿о,хо,ро(■ )) при действии законов {и( ■ ),е, Дк} и {V( ■ ),е, Дк}. Тогда для реализовавшегося значения 7 показателя качества (2.2) имеют место соотношения

Г [V( ■ ); ¿о,хо,ро( ■ )] - п/3 ^ 7 ^ Г« [и( ■ ); ¿о,Хо,ро(■ )] + п/3,

нз которых вытекает оценка

Г [V( ■ ); ¿о,хо,ро( ■ )] ^ Г«[и( ■ ); ¿о,Хо,ро( ■ )] + 2п/3. (2.9)

Полученное неравенство (2.9) противоречит сделанному предположению (2.8). Лемма доказана. □

Из леммы 2.1, если учесть определения оптимального (2.5) и контроптимального (2.7) гарантированных результатов, получаем

Следствие 2.1. Для, любой начальной позиции (¿о,хо,ро(■ )) € К имеет место неравенство

Г(¿о,хо,ро(■ )) ^ Г«(¿о,Хо,ро(■ )).

§ 2.2. Вспомогательная дифференциальная игра

Для описания вспомогательной дифференциальной игры рассмотрим следующие предварительные построения.

Зафиксируем г = Для € К положим

г

= Ах+ ^ Ах,е)вг(еже - т - - е) с (2.10)

где А — матрица го показателя качества (2,2), X(¿,£) — матрица Коши однородной системы dж(í)/dí = А(г)х(г), х(г) — функция Хевисайда:

Г о, г ^ о, х(г) = < г е к.

г> о,

Отметим, что в выражении (2,10) формально могут участвовать значения матрицы-функции Вт (г) при г > В связи с этим при г > $ доопределяем Вт (г) = Вт($). Для (г, х[г0[•]г],р(•)) е [г0,х с[г0,г] х р обозначим

г<(г,*[^]г],р(0)=|г*(г'х(г)'р())' г е [го(2.И)

Рассмотрим вспомогательную ¿¿-систему, движение которой описывается дифференциальным уравнением

dzг(г)^г = А(г)и(г) + сг(гМг), ¿о ^ г<$, 2 е К*, и е Р, V е ф,

где

А(г) = ах($г, г)в(г)х($ - г) + Ах, г + т)в(г + т)х($ - г - т), , ч

(2.13)

сг(г) = ах($г,г)с(г)х($ - г).

Следующая лемма устанавливает связь между изменением вектора гуД-) (2.11) в силу исходной системы (2.1) и подходящим движением вспомогательной ¿¿-системы (2.12).

Лемма 2.2. Пусть г* е [г0,$), ж*[г0[^]г*] = |ж*(г) е г0 ^ г ^ г*} е с[г0,г*] ир»(') е Р .Пусть г* е (г*,$] и движение х[г* [^]г*] системы, (2.1) порождено из позиции (г*,х*(г*),р*0) при действии допустимых реализаций управления и[г*[•]£*) и помехи Пусть г = и = е ^ £ ^ — движение ¿¿-системы (2.12), порожденное из позиции (г*,гДг*,ж*[г0[^]г*],£>*(•))) тем,и же реализациями управления и помехи. Тогда, имеет место равенство

¿¿(г*) = гй(г*,ж[г0Нг*],и4. (•)), (2.14)

где функция х[г0[•]£*] определяется, при г е [г0, г*) из условия х(г) = х*(г).

Доказательство. По формуле Коши для движения х[г* [^]г*] справедливо представление

Х(г) = х (г, г*)х(г*) + /' х (г, е) (в (е )и(е) + с (е Ме)) dе +

гг Л* (2.15)

+ х(г,е)Вт(е)и(е - т)dе, г е [г*,г*].

н

Предположим сначала, что £* ^ Тогда в согласии с соотношениями (2,10), (2,11) и (2,13), учитывая равенство (2,15) при £ = £*, выводим

^ *,х[£о[ ■ ]£ * ],и* ( ■)) = ДХ * )х * (£ *) +

+ £ Ахф, е) (в(еме) + с(еме)) ае +

г и +т

+ ^ ах(^,е)вт(е)р*(е - т - £ *- е)ае + (2,16)

+ Г+т Ах ф, е )вт (е ме - т м^ - е) ае =

Л „ +т +

= (£*,х * [а ■ ]£ * ],Р* ( ■ )) + ^ (в (е ме) + с (е ме)) ае = ^ (¿*).

Далее, рассмотрим случай, когда £ * > и £ * ^ . Принимая во внимание равенства (2,16) при £* = и соотношение (2,11), имеем

[■ ]£* ],Ш* ( ■)) = ■ ( ■)) = ¿г (0 ).

Заметим, что в соответствии с соотношениями (2,13) при £ ^ справедливы равенства Вг(£) = 0 и Сг(£) = 0, го которых вытекает равенство (0г) = (£*), что завершает доказательство равенства (2,14) в рассматриваемом случае,

В случае £ * > , рассуждая аналогичным образом, получаем (£ *) = (£ *), откуда

с учетом соотношения (2,11) следует справедливость равенства (2,14), Лемма доказана,

□

Положим

а = ^ (2.17)

N

¿=1

и рассмотрим информационный образ

(£,х[£о[ ■ ]£],р(■ )) е [£о,0] х С[£о,£] хР,

(2.18)

составленный из векторов ['ИМ')) ^ ^ > ^ = 1, которые определяются в со-

гласии с соотношением (2.11). Здесь и далее подобная запись означает, что первые координат вектора лу(£, х[£о[■ ]£],р( ■)) совпадают с координатами вектора га1(£,х[£о[■ ]£],р(■ )), следующие координат век тора лу (£,х[£о[ ■ ]£],р( ■ )) совпадают с координатами вектора ги2(£, я[£о[- ]£],р( ■)) и так далее; последние ^координат вектора лу(£,х[£о[■ ]£],р(■ )) совпадают с координатами вектора гам(£,х[£о[■ ]£],р(■ ))•

Введем следующую вспомогательную г-систему. Фазовый вектор этой системы г = = {; |..... ; \ } € К'1 составляется из векторов / 1, М, каждый из которых имеет динамику соответствующей вспомогательной ¿¿-системы (2.12). Таким образом, движение ¿-системы описывается дифференциальным уравнением

аг(£)/а£ = В(£)и(£) + С£о ^ £ <

а е Еа, и е Р, V е ф,

где

В(£) = {ЗД),..., ^(£)}, С(£) = {С1(£),..., С^(£)}•

Здесь и далее подобная запись означает, что первые ^ строк матрицы В (¿) совпадают со строками матрицы В1(^), следующие строк матр ицы В (¿) совпадают со строками матрицы В2(£) и так далее; поел едние ^ строк матр ицы В (¿) совпадают со строками матрицы Вм^). Матрица С(£) составляется из матриц Сг(£), г = по такому же

правилу.

Пусть движение 7 [¿0[■ ]"$] = € ¿0 ^ t ^ 7} 7-системы порождено из начальной позиции (¿0, 70), 70 = {710,...,уу0} € К'1, при действии допустимых реализаций и\Ьо[-]7) и ^[£0[-]7). Отметим, что для каждого г = 1, N изменение компоненты % фазового вектора этой системы можно рассматривать отдельно в качестве движения у [¿0[■ ]7] ^-системы, порожденного из начальной позиции (¿0, у0) темп же реализациями управления и помехи. Учитывая вид показателя (2,2), качество процесса управления в 7-системе

будем оценивать при помощи вспомогательного показателя

р $

7 = 7(7 [¿0Н7],«М]7),^[^7)) = МЗД - 7)+ / («(¿,и(*)) + в(2.20)

Ло

где

с = {^1 сь...,£>*} € К11.

Итак, вспомогательная дифференциальная игра рассматривается для 7-системы (2,19) и показателя качества 7 (2,20), По теореме 1,1 эта дифференциальная игра имеет цепу у(¿,7) и седловую точку го оптимальных минимаксной 70(£,7, е) и максимин-ной 70(£,7, е) стратегий.

Установим связь между исходной задачей (2,1), (2,2) и вспомогательной дифференциальной игрой (2,19), (2,20),

Те о р е м а 2,1, Имеют место равенства

,Х0,Р0(■ )) = Г0(¿0,Х0,Р0(■ )) = 7(¿0,Я(¿0,Х0,Р0(■ ))), (¿0,Х0,Р0( ■ )) € К. (2,21) Стратегии управления и формирования помехи

и (¿,ж[*0 [■ ]*],р( ■ ),е) = 7 Я (¿,ж[*0[ ■ ]*],р( ■ )),е),

7 (^ [■ ]*],р( ■), е) = 70 (¿, Я (*,*[*, [■ ]*],р( ■ )),е), (2.22)

* € [¿0,7], ж[*0[-]*] € С[¿0,*], р(■ ) €Р, е > 0,

являются, оптимальными.

Здесь Ги(■ ) и Г ( ■ ) — величины оптимального (2.5) и контроптимального (2.7) гарантированных результатов, У( ■ ) и {70( ■ ),70(■ )} — цена, и седловая, точка вспомогательной дифференциальной игры (2.19), (2.20), Я( ■ ) — информационный образ (2.18).

Доказательство. Зафиксируем число ( > 0. По этому числу, применяя утверждения 1.1 и 1.2 к вспомогательной дифференциальной игре (2.19), (2.20), выберем соответственно числа е(и) > 0 и > 0 и функции ¿(и)(е) > 0, е € (0,е(и)], и (е) > 0, е € (0,е(^]. Положим

е * = шт{е(и\е^}, ¿*(е) = ш1п{^(е), ¿^(е)}, е € (0,е *]. (2.23)

Пусть (¿0,х0,р0(■ )) € К, е € (0,е*] и Дк = Дк{т,} — разбиение вида (2.3) с диаметром ¿к ^ ¿*(е).

Рассмотрим движение я[£0[■ ]7] системы (2,1), порожденное из позиции (¿0,х0,р0(■ )) законом управления { у( ■ ),е, Дк} на базе стратегии у( ■ ) (2.22) в паре с допустимой

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

реализацией помехи [ ■ ]0). Через и[£о[■ ]0) обозначим соответствующую реализацию управления. Определим

У = лл (£о ,хо,ро( ■ )) (2.24)

и рассмотрим движение V[£о[ ■ ]0] г-системы (2.19), сформированное из позиции (£о,го) при действии закона управления {Vо( ■ ),е, Ак} па основе оптимальной минимаксной в дифференциальной игре (2,19), (2,20) стратегии Vо( ■ ) и той же самой реализации помехи -у [¿о [•]"$)• Для каждого г = через ^ [¿о [•]"$] обозначим соответствующее движение ¿¿-системы.

Покажем по индукции, что имеют место равенства

Цтз) = Ъ{тз,х[г0[-]тз\,иг£)), 3 = 1,к + 1. (2.25)

При з = 1 равенство (2.25) справедливо в силу выбора (2.24) начальной позиции. Далее, пусть равенство (2.25) доказано для з = q, q = 1,к. Тогда, учитывая определение (2.22) стратегии И ( ■ ), имеем

а V«, Л(тд ),е) = а о (Т9 , Л (тд ,х[£о[ ■ ]тд],итч ( ■ Й ,е) = Л (Т9 ,х[£о[- ]тд],итч ( ■ , е) ,

откуда, в соответствии с соотношениями (1.4) и (2.4) заключаем, что на промежутке [тд, тд+1) при формировании двнженнй х[£о [ ■ ]0] и а [£о[■ ]0] в исходной спстеме и г-системе действовала одна и та же реализация управления и[тд [ ■ ]тд+1). Кроме того, по построению, на этом промежутке в обеих системах действовала одна и та же реализация помехи ^[тд[ ■ ]тд+1). Таким образом, учитывая равенство (2.25) для з = q и соотношение (2.18), применяя лемму 2.2 для каждого / 1. Л к движению %[тд[-]тд+1], получаем равенство (2.25) для з = q +1.

Используя равенство (2.25) при 3 = к + 1 и принимая во внимание соотношения (2.11) и (2.18), имеем

ад = л(0,х[£о[ ■ ■ )) = {^ад),..., )}.

Более того, при доказательстве равенств (2.25) было установлено, что движение V [£о[ ■ ]0] сформировано при действии реализаций и[£о[-]0) и [■ ]0), определяющих движение х[£о [ ■ ]0], поэтому

7(х[£о[■ ]0],и[£о[- ]0),^о[- ]0)) = а(а [*о[- ]0],и[*о[- ]0),^о[■ ]0)). Отсюда благодаря выбору (2.23) числа е* и функции $* ( ■ ) выводим

7(ж[*о[■ ]0],и[£о[■ ]0),^о[- ]0)) ^ р (£о,Ло) +

Таким образом, с учетом равенства (2.24) и утверждения 2.1 заключаем

Г„[Ц/( ■ ); £о,Хо,Ро( ■)] ^ а (£о,Л(£о,Жо,ро( ■ ))). (2.26)

Справедливость неравенства

Г [V"( ■ ); £о, Хо,ро(■ )] ^ р (£о, Л(£о,жо,ро( ■))) (2.27)

устанавливается аналогичным образом. Для этого следует рассмотреть движение системы (2.1), порожденное из начальной позиции (£о,хо,ро(■ )) законом формирования помехи {У( ■ ),е, Ак} на базе стратегии а( ■ ) (2.22) в паре с допустимой реализацией управления и[£о[■ ]0), и движение г-системы (2,19), сформированное из позиции (£о, го) (2.24) при

действии закона формирования помехи {70( ■ ),е, Дк} на основе оптимальной максимин-пой в дифференциальной игре (2,19), (2,20) стратегии 70( ■ ) и той же самой реализацией управления и[£0[ ■ ]7), и вместо утверждения 2,1 воспользоваться утверждением 2,2,

Из соотношений (2,26) и (2,27), принимая во внимание определения оптимального (2,5) и контроптимального (2,7) гарантированных результатов, получаем цепочку неравенств ^

^(¿0,^0,Р0(■ )) ^ Ги[и( ■ ); ¿0,Х0,Р0(■)] ^ У(¿0,У(¿0,Х0,Р0(■))) ^

^ Г [у( ■ ); ¿0,Х0,Р0(■ )] < Г0(¿0,Х0,Р0( ■ )),

которые с учетом следствия 2,1 обращаются в равенства, что завершает доказательство теоремы, □

§2.3. Приближенное решение задачи

Для приближенного вычисления величины оптимального гарантированного результата и построения оптимального закона управления в исходной задаче (2,1), (2,2) применим во вспомогательной дифференциальной игре (2,19), (2,20) метод выпуклых сверху оболочек.

Пусть Дк = Дк{т,} — разбиение вида (2,3), удовлетворяющее условию

7* € Дк,

(2.28)

7^ — т € Ак, если 7^ — т € [¿о,7], г=

Отметим, что в разбиении Дк содержатся все точки разрыва матриц-функций и СД*), г = Т^У, из (2.13).

Опираясь на соответствующую вспомогательной дифференциальной игре (2.19), (2.20) рекуррентную процедуру попятного построения выпуклых сверху оболочек (1.7)-(1.10), определим в согласии с соотношениями (1.11) и (1.14) систему величин

ъ е Е*1, 2 = 1,к + 1,

и стратегии управления первого и второго игроков

7дк(¿,7,е), 7дк(¿,7,е), (¿,7) € [¿0,7] х К1, е > 0.

В качестве непосредственного следствия из теоремы 1.2, применяемой к дифференциальной игре (2.19), (2.20), и теоремы 2.1 получаем следующий результат.

Теорема 2.2. Для, любого числа £ > 0 можно указать такое число ¿ > 0, что, каковы бы ни были, начальная, позиция (¿0, х0,р0(■ )) € К и разбиение Дк вида, (2.3), (2.28) с диаметром ¿к ^ ¿, будет справедливо неравенство

|у1 (У (¿0, х0, Р0( ■ ЭД - Ги(^0,х0,Р0( ■ ))| ^ ^

где Ги( ■ ) — величина, оптимального гарантированного результата (2.5), У ( ■ ) — информационный образ (2.18).

В согласии с соотношениями (2.22) рассмотрим следующие стратегии управления и формирования помехи:

уДк(7х[£0[- ■ ),е) = уДк У■ )),е^ уДк (¿,2^0 [ ■ М,р( ■ ), е) = 7Дк (¿, У (¿,^[¿0 [ ■ М,р( ■ )), е), £ € [¿0,7], ж[^0[■ ]г] € С[¿0,¿], р(■ ) € Р, е > 0.

Теорема 2,3, Для, любого числа ( > 0 найдутся, такие число е * > 0 и функция (е) > 0, е е (0,е *], что, каковы бы ни были начальная, позиция (£о,хо,ро(■ )) е К, значение параметра, точности е е (0,е *] и разбиение Ак вида (2.3), (2.28) с диаметром ^ £*(е), законы управления {СД( ■ ),е, Ак} и формирования помехи ( ■ ),е, Ак} будут (-оптимальными.

Доказательство. По числу ( > 0, применяя теорему 1,3 к вспомогательной дифференциальной игре (2,19), (2,20), выберем число е * > 0 и функцию $*(е) > 0, е е (0,е *]. Пусть (£о,хо,ро(■ )) е К, е е (0,е *] и Ак — разбиение вида (2.3), (2,28) с диаметром ^ £*(е).

Рассмотрим движение х[£о[■ ]0] системы (2,1), порожденное из позиции (£о,хо,ро(■ )) законом управления {СД( ■ ),е, Ак} в паре с допустимой реализацией помехи ■и[£о[-]0). Обозначим через и[£о[ ■ ]0) соответствующую реализацию управлепня, Рассмотрим также движение/[£о[ ■ ]0] ¡/-системы (2,19), реализовавшееся из позиции (£о, го = лу(£о,хо,ро(■ ))) при действии закона управления {идй ( ■ ),е, Ак} и той же самой реализацией помехи ■и[£о[-]0). По аналогии с доказательством теоремы 2.1 можно показать, что при формировании движения V[£о[■ ]0] в /-системе действовала реализация управления и[£о[ ■ ]0) и имеет место равенство

7(х[£о[■ ]0],и[*о[- ]0),^о[- ]0)) = /(а [*о[- ]0],и[£о[- ]0),^о[■ ]0)),

с учетом которого, по выбору числа е * и функции $* ( ■ ) выводим

7(ж[£о[ ■ ]0],«М ]0),^о[ ■ ]0)) ^ V(£о,Л(£о,Хо,ро( ■ ))) + С

Полученная оценка, если принять во внимание соотношение (2.21), завершает доказательство ^-оптимальности закона управления {ад£( ■ ),е, Ак}.

Аналогичным образом с понятными изменениями устанавливается ^-оптимальность закона формирования помехи {1/д?с(-), е, Ак}. □

Таким образом, приближенное решение исходной задачи (2.1), (2.2) сводится к рекуррентной процедуре попятного построения выпуклых сверху оболочек вспомогательных функций (1.7)-(1.10), отвечающей вспомогательной дифференциальной игре (2.19),

а

ций зависит от количества N оценочных моментов времени 0г из показателя качества (2.2) и поэтому может быть весьма большой даже при малой размерности п фазового вектора исходной системы (2.1). Это во многом ограничивает использование процедуры при численном построении выпуклых сверху оболочек функций. В следующем разделе описывается один класс нетривиальных задач, в которых требуемые оболочки удается выписать в явном виде, и предложенный подход приводит к эффективному решению даже при относительно больших значениях N и п.

§2.4. Пример

В рамках данного раздела будем предполагать, что показатель качества (2.2) удовлетворяет следующим дополнительным условиям: норма ■ ) является евклидовой, а функции а( ■) и в( ■ ) имеют вид

а(£,и) = (и, Ф(£)и>, (£,и) е [£о,0] х Р, в(М) = -(V, Ф(ф>, (М) е [£о,0] х ф,

где Ф(£) и Ф(£) — симметричные непрерывные па [£о,0] матрицы-функции, для которых квадратичные формы (и, Ф(£)и> и (V, Ф(£)^> являются определенно-положительными при £ е [£о ,0]. Кроме того, будем считать, что геометрические ограничения на воздействия управления и помехи в системе (2.1) определяются равенствами

Р = {и е : ||и|| ^ М}, Ф = {V е : |М| ^ М},

где константа M > 0 удовлетворяет соотношению

л тах шах{||Ф-1(Ь)БТ(Ь)'Т||, ||Ф-1(Ь)Ст(Ь)Т||} ^ 2М, Ь € Тек1: ||Ту<1

Здесь и далее верхние символы -1 и т означают обратную и транспонированную матрицы соответственно.

Отметим, что в согласии с результатами монографии [3] при сделанных предположениях решение исходной задачи оптимизации гарантированного результата (2,1), (2,2) совпадает с решением аналогичной задачи, но без геометрических ограничений на воздействия управления и помехи:

u е Rnu, v е Rnv.

Применяя метод выпуклых сверху оболочек к соответствующей вспомогательной дифференциальной игре (2,19), (2,20), получаем [72] следующие репрезентативные формулы для цены Т( ■) и оптимальных минимакеной Т 0( ■) и максиминной Т0 ( ■ ) стратегий в этой игре. Обозначим

1 Г* ^

к(t) = ij {ст-чосчо-вт-'тчо)^,

Пусть A(t) — максимальное собственное число матрицы K(t). Положим

Ao(t) = max А(£), t е [to,tf].

Тогда имеем

Т (to, Т) = max ((Т, Т + с > + (Г, K(to)T)- Ao(to)||Т||2) + Ао(to), TeRd:

u°(t,z,e) = -^"^BT(i)T(it)(i,7, е), v°(t,z,e) = ^Ф-1(i)CT(i)T(")(i,z,e), (2-29)

(t,Т) е [to,7] х RT, е > 0.

Здесь Т — вектор из показателя качества (2,20),

Т {u\t,%£) е argmax (<T,z + с + K(t)T) - A0(i) ||Т||2 - r{t, е) л] I + ||Т||2) , TeRd:||T||sil

l(v){t,z,e) Е argmax (<Т, z + с + K(t)T) - A0(t) ||Т||2 + r{t, £)л]\ + ||Т||2) , T€Rd: |T||<1

где функция r(■ ) определяется в соответствии с (1,15),

Соотношения (2,29) позволяют с опорой на теорему 2,1 получить репрезентативные формулы для величины оптимального гарантированного результата и оптимальных стратегий управления и формирования помехи в исходной задаче (2,1), (2,2),

Проиллюстрируем материал данного раздела на модельном примере. Рассмотрим динамическую систему, движение которой описывается следующими дифференциаль-

ными уравнениями

<

(2.30)

' (£)= Х2(£) - 0.8ад - 1), аж2(£)/& = -х1(£) - 0.1 ад) + х5(£) + 0.8 ^1(£),

= х4 (£),

аж4(£)= -1.5х3(£) - 0.1 х4(£) + х6(£) + (£),

(£)= Хб(£) - 2ад -1), к аХб (£)/а£ = 2 и^) + ад)+ ^з (£),

£о = 0 ^ £ < 10, х = (х1, х2, х3, х4, х5, х6) е К6, и = (и1, и2) е К2, V = (г>ь , ^3) е К3.

Заданы начальная позиция

хо = (0, 1, 0, 0.5, 0, 0), ро(£) = (еов«), яп«)), С е [-1, 0), (2.31)

и показатель качества

7 = (х2(1) + х2(1) + х?(2) + х3(2) + х2(3) + х4(3) + х2(4) + х2(4) + х?(5) +

+ х2 (5) + х3(5) + х4(5) + х2(6) + х4(6) + х2 (7) + х3 (7) + х2(8) +

1/2 (2.32)

+ х4(8) + х2(9) + х3(9) + х2(10) + х2(10) + х3(10) + х2(10) р1о р1о

ад (0.5и1(£) + и2(*))& ад ад) + 0.5v2(t) + V;(£))&.

оо

Задача оптимизации гарантированного результата (2,30)-(2,32) решалась на основе

а

вспомогательной ¡/-системы (2.19) равпа 24.

Приведем результаты численного моделирования. При вычислениях было выбрано равномерное разбиение Ак отрезка времени [0,10] с шагом = 0.002 и значение параметра точности е = 0.02. Априорно посчитанная величина оптимального гарантированного результата:

ГЦ = адо,Хо,ро( ■)) « 2.673.

На рисунке 1 в левой части изображены компоненты движения системы (2.30), сформировавшегося при совместном действии законов управления {и( ■ ),е, Ак} и формирования помехи {а( ■ ),е, Ак} па базе оптимальных стратегий у( ■) и а( ■ ) (2.22), (2.29). При этом светлыми точками показаны значения компонент фазового вектора, по которым в согласии с (2.32) производится оценка движения. В правой части рисунка 1 показаны соответствующие реализации управления и помехи. Реализовавшееся значение показателя качества:

7 « 2.672 « ГЦ.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На рисунке 2 в левой части изображены компоненты движения системы (2.30), реализовавшегося при действии закона управления ( ■ ), е, Ак} и реализации по мехи v(t) = 0. В правой части рисунка 2 показана соответствующая реализация управления. Полученный результат:

7 « 2.121 < ГЦ.

Рис. 1. Результат симулирования процесса управления в задаче (2,30)-(2,32) при действии оптимальных законов управления { и( ■ ),е, Ак} и помехи {Vй( ■ ),е, Ак}

Рис. 2. Результат симулирования процесса управления в задаче (2.30)-(2.32) при действии оптимального закона управления { и( ■ ),е, Ак} и реализации помехи v(í) = 0

§ 3. Случай позиционного показателя качества

Эта часть посвящена дальнейшему развитию предложенного во второй части подхода к решению линейно-выпуклой задачи оптимизации гарантии при запаздывании в управлении (2,1), (2,2) в случае, когда показатель качества (2,2) удовлетворяет дополнительным предположениям, которые обеспечивают его позиционность [4, р, 41], С учетом этих предположений задача (2,1), (2,2) сводится к каскаду из N (по числу оценочных моментов времени в показателе (2,2)) вспомогательных дифференциальных игр в фазовых пространствах уменьшающейся размерности. На основе применения метода выпуклых сверху оболочек в каждой из вспомогательных игр каскада для приближенного решения задачи (2,1), (2,2) предлагается рекуррентная процедура попятного построения выпуклых сверху оболочек подходящих вспомогательных функций. При этом уменьшающаяся размерность дифференциальных игр каскада влечет уменьшающуюся размерность множеств определения этих функций, что повышает эффективность процедуры по сравнению с разрешающими конструкциями из второй части. Рассматриваются два модельных примера,

§3.1. Позиционный показатель качества

Всюду далее относительно структуры показателя качества (2,2) будем дополнительно предполагать, что отсутствует интегральное слагаемое:

а(Ь,и) = 0, (Ь,и) € [Ь0,7] х Р, в(М) = 0, (М) € [Ь0,7] х ф, (3.1)

и для нормы м( • ) можно подобрать нормы

.. ,1М) е Е, (!!)...)ЩеК4х...хК4) и четные по V функции

аг(1г,и)еЖ, Е, г = - 1, (3.2)

так, чтобы выполнялись равенства

М(/Ь ... ) = М*!,...,^), (¿1,...,^) € Е^1 х ... х ,

и

мг(1г) ¿г+1) . . . ) ) = (¿г) ^г+1 (1г+1, . . . )

(Ь,...,1М) 6М4 х ... х!^, г = 1.

Из этих равенств следует [54], что для любого / = 1. Л 1 функции стг(') являются нормами, не убывающими по V при V ^ 0, а показатель (2.2), принимающий теперь вид

7 = 7(ж[Ьо[ • ]7]) = М1 () - С1),) - с*)) , (3.4)

является позиционным.

Ниже будет показано, в частности, что в задаче (2.1), (3.4) существуют оптимальные стратегии управления и формирования помехи, которые из всей истории движения х[Ь0 [ • ]Ь] системы (2.1), сформировавшейся к текущему моменту времени Ь, используют информацию только о текущем значении х(Ь) фазового вектора. Таким образом, будут рассматриваться стратегии следующего вида:

[/(¿,ж,р( • ),е) € Р, V(Ь,х,р(• ),е) € ф, (Ь,х,р(• )) € К, е> 0.

В согласии с соотношениями (2,4) и (2,6) основанные на таких стратегиях законы {U( ■ ), в, Ak} и {V( ■ ), в, Ak} формируют кусочно-постоянные реализации u[t0 [■ ]0) и v[t0 [ ■ ]0) соответственно по правилу:

u(t) = и (■),£), te[Tj,Tj+1), j = l,k, (3.5)

v(t) = У(тз,х(тз),иг.(-),е), te[Tj}Tj+i), j = l,k. (3.6)

§3.2. Каскад вспомогательных дифференциальных игр

Каждая из вспомогательных дифференциальных игр каскада отвечает своему оценочному моменту времени 0j из показателя качества (3.4) и определяется по такому же принципу, как и вспомогательная дифференциальная игра (2.19), (2.20). Обозначим 0О = ¿съ зафиксируем г = 1, iV, положим

N

d[i] = dh (3.7)

h=i

и рассмотрим отвечающий индексу i информационный образ

wt%x,p( ■ )) = {Wi(t,x,p( ■ )),..., wn(t,x,p( ■ ))} G Rd" (t,x,p( ■ )) G K, t G [0г-Ь0г)

(3.8)

составленный из векторов х,р(-)) € к = г, М, которые определяются в согласии с соотношением (2.10).

Введем вспомогательную г^-систему. Фазовый вектор г[г] = {¿|г],..., } С этой системы составляется из векторов € К'1'1, // = г, И, каждый из которых имеет динамику соответствующей ¿^-системы (2.12). Движение 2[г]-еиетемы описывается дифференциальным уравнением

агИ (¿) /а* = в[г] (¿ад) + с[г] (¿ад), ¿с ^ * < 0,

и (3-9)

гй С , и С Р, V С Q,

где

В[г](*) = {Бг(*),Бм(*)}, С[г](*) = {Сг(*),(*)}. (3.10)

Пусть движение г[г] * [ • ]0] = {г[г](*) С , * * ^ * ^ 0} 2[г]-еиетемы порождено из позиции (**, г *г] = {¿г*], • • •, *}) С [¿с,0] х при действии допустимых реализаций гф*[-]0) и Отметим, что для каждого к = г, N изменение компоненты фазово-

го вектора этой системы можно рассматривать отдельно в качестве движения ¿^[^ * [ • ]0] ¿^-системы, порожденного из позиции (**,2т\*) темп же реализациями управления и помехи. В соответствии с позиционной структурой (3.1)—(3.3) показателя качества (3.4) движение * [ • ]0] будем оценивать показателем

7и = 7и (ад*[ • ]0]) = адад - с[г]), (з.и)

где

СИ = {Дсг,...,^ С^} • (3.12)

Таким образом, г-ая вспомогательная дифференциальная игра каскада рассматривается для 2[г]-еиетемы (3,9) и показателя качества 7[г] (3.11). В согласии с теоремой 1.1 эта дифференциальная игра имеет цену р[г](*, г[г]) и седловую точку из оптимальных стратегий и[г]с(*, г[г], е) и v[г]с(í, г[г], е).

Цены г-ой и (г + 1)-ой вспомогательных дифференциальных игр каскада связаны следующим образом.

Лемма 3.1. Пусть г = - 1 и (¿^ = {гЦ,... е х №<1М- Тогда пРи

[1+1] г [г] [г] т та^+Ч

ъ* = {гг+1 *,..., г* *} € Ки имеет место равенство

р[г](Ь *, ъИ) = а^- Дс,р[1+1](Ь *, ъ[1+1])), где аг( • ) — норма из (3.2).

Доказательство. Зафиксируем число ( > 0. По этому числу, во-первых, применяя утверждение 1.1 к г-ой вспомогательной дифференциальной игре (3.9), (3.11), выберем число е*] > 0 и функцию 8[1](е) > 0, е € (0,е*]], и, во-вторых, применяя утверждение 1.2 к (г + 1)-ой вспомогательной дифференциальной игре (3.9), (3.11), выберем число е*+1] > 0 и функцию 8[1+1](е) > 0, е € (0,е*+1]]. Положим

е = тт{е[г], е[г+1]}, 8 = шт^е^+^е)} (3.13)

и зададимся разбиением Ак = Ак{т,} вида (1.3) с диаметром 8к ^ 8.

Пусть ъ[г][Ь *[• ]7] — движение ъ[г]-системы (3.9), порожденное из позиции (Ь*, ъ *1]) законом управления {и[г]0( • ),е, Ак} на базе оптимальной минимаксной в г-ой дифференциальной игре стратегии и[г]0( • ) и законом формирования помехи {^[г+1]( • ),е, Ак}, где стратегия Цг+1]( • ) определяется па основе оптимальной макеиминной в (г + 1)-ой дифференциальной игре стратегии ^[1+1]0( • ) по правилу

(3.14)

V [г+1] (Ь, ъ[г] = ... = ^+1]0 (Ь, {^1+11, ...,^},е),

(Ь, ъ[1]) € [¿0,7] х е8

7[1](ъ[%*[ • ]7]) = мг(ъ[1](7) - с[1]) ^ р[1](Ь *, ъ[1]) + (. (3.15)

Пусть ъ[1+1] [Ь * [ • ] 7] — угажен ие ъ[1+1]-системы (3,9), порожденное из позиции (Ь *, ъ*+1]) законом управления {и*]( • ),е, Ак}, где стратегия и*](• ) определяется на основе оптимальной минимаксной в г-ой дифференциальной игре стратегии и[г]0( • ) по правилу

[г и *

(Ь, ъ[1+1] = {г1+11] ,...„гГ]} ,е) = и[1]0 (Ь, {*£, ^ ,...„гГ]} ,е),

г , (3.16)

(Ь, ъ[1+1]) € [Ь0,7] х Е^+1],

и законом формирования помехи {^[1+1]0( • ),е, Ак} па базе оптимальной макеиминной в (г + 1)-ой дифференциальной игре стратегии ^[1+1]0( • ). По выбору (3.13) чисел е и 8 получаем

7

[1+1] (ъ[1+1][Ь *[ • ]7]) = М1+1 (ъ[1+1](7) - с[1+1]) ^ р[1+1](Ь *, ъ *г+1]) - С (3.17)

Рассмотрим дополнительно движения // /. А', н Н = г + 1, К,

¿^-систем (2.12), которые отвечают движениям ъ[г][Ь *[ • ]7] и ъ[1+1][Ь*[ • ]7] соответственно.

Так как Ь* ^ 7г, то в силу соотношений (2.13) имеем Вг(Ь) = 0 и Сг(Ь) = 0 при Ь ^ Ь*. Поэтому справедливо равенство

гГ(Ь) = гЦ, Ь € [Ь*,7]. (3.18)

Покажем по индукции, что при ] = 1, к + 1 имеют место равенства

= н = ттт^. (з.19)

Действительно, при ] = 1 равенства (3,19) вытекают непосредственно из определения вектора Далее, пусть равенства (3,19) доказаны для j = q, q = 1,к. Тогда, учи-

тывая определения стратегий и*]( • ) (3.16) и v*+1]( • ) (3,14), а также равенство (3,18), получаем

и[г]С(т«, ),е) = и^, г[г+1](тд),е), v^1](тq, г[г](тд),е) = v[г+1] с(тд, г[г+1](тд),е).

Таким образом, в соответствии с соотношениями (1.4) и (1.5) для каждого И = г + 1, N движения [** [ • ]0] и г|г+1] [* * [ • ]0] ¿^-системы та промежутке [тд, тд+1] сформированы при действии одинаковых реализаций управления и помехи. Поэтому с учетом равенств (3.19) для ] = ^ ^^^^^^^^^^ ^^^^^^^^^тость равенств (3.19) для ] = q +1.

Используя равенства (3.19) при ] = к + 1, принимая во внимание соотношения (3.3), (3.12) и (3.18), получаем

^(0) - С[г]) = аг (2$ - А Сг ,^+1 ^ (0) - С[г+1])). Опираясь па неравенства (3.15) и (3.17) и свойства нормы аг( • ), выводим

рМ(**, г1г]) + С ^ аг (¿г*' - ДСг,р,г+1^г+1](0) - С[г+1]) + <) - ^(0,<) ^ ^ аг (¿г*' - РгСг,р[г+11 (* *, 2 ^ )) - (0, 1),

откуда в силу произвольности числа ( > 0 заключаем

Р[г] (* *, ^ аг (гй - А Сг ,р[г+1](**, г^г^1')).

Справедливость неравенства

р[г](**, г^) ^ аг(2Й- А Сг ,р[г+1] (* *, г^1'))

проверяется аналогичным образом с понятными изменениями. □

Установим связь между задачей оптимизации гарантии (2.1), (3.4) и каскадом вспомогательных дифференциальных игр (3.9), (3.11).

Теорема 3.1, Имеют место равенства

Г^(*с,хс,рс( • )) = ГС(¿с,хс,Рс( • )) = р[1] (¿с, ^[1](¿с,хс,рс( • ))), (¿с,хс,рс( • )) С К. (3.20) Стратегии управления и формирования помехи

и (г,ж,р( • ), е) = и[г] с(*, w[г] (¿,ж,р( • )), е),

и (¿, х,р( • ), е) = V [г]с (* , w[г](í,ж,p( • )),е), (3.21)

(ь,х,р(-)) е К, £>о, г = мт,

являются, оптимальными.

Здесь Ги(• ) и Г ( • ) — величины оптимального (2.5) и контроптимального (2.7) гарантированных результатов, р[г]( • ) и {и[г]с( • )Мг]С( • )} — цена и седловая точка г-ой вспомогательной дифференциальной игры, (3.9), (3.11), w[г]( • ) — информационный образ (3.8), г =

Доказательство. Отметим, что в соотношениях (3,21) не определены значения стратегий и( • ) и и( • ) при £ = Однако в силу соотношений (3,5) и (3,6) при формировании соответствующих реализаций эти значения не участвуют, поэтому будем считать их заданными произвольно.

Для доказательства теоремы, следуя схеме обоснования теоремы 2,1, достаточно установить для заданной позиции (¿о,хо,ро(•)) ^ К справедливость неравенств

Ги [и( • ); £о,Хо,ро( • )] ^ Р[1] (¿0, w[1](íо,Xо,Ро( •))) ^ Г [и( • ); ¿о,Хо,Ро( •)]. (3.22)

Докажем первое из них.

Зафиксируем число ( > 0. Положим

<т = тах{1, тах_<Тг(0,1)}, (о = </(1 + я)"'1- (3.23)

г=1,ЛГ-1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для каждого i = 1, N то числу Zo, применяя к i-ой вспомогательной дифференциальной игре (3,9), (3,11) утверждение 1,1, выберем число £[i] > 0 и функцию (е) > 0, где £ £ (0, £*]], Определим число $[0] > 0 из условия

8® ^ min -дг-г). i=l,N

Положим

е* = min еИ, 8*{е) = min^01, min ^(е)}, е £ (0,£*]. (3.24)

i=l,N i=l,N

Пусть выбраны значение параметра точности £ £ (0,£ *] и разбиение Ak = Ak(Tj} вида (2.3) с диаметром ^ (е).

Рассмотрим движение x[t0[• ]7] системы (2,1), порожденное из позиции (t0,x0,p0(• )) законом управления (U( • ),£, Ak} на базе стратегии U( • ) (3.21) в паре с некоторой допустимой реализацией помехи v[t0[-]■$). Через u[t0[• ]■$) обозначим соответствующую реализацию управления. Положим

j[i] = min{j = l,k + 1 : Tj ^ А-1}, г = 1,N+1. (3.25)

Отметим, что в силу выбора (3.24) функции $*(•) для каждого г = имеют место неравенство < ][г+1] и включения

Tj £ j = j[il,j[i+Ч - 1. (3.26)

Для сокращения записи для каждого г = 1, N введем обозначения

Wh = Wh (TjW > ), Ит.й (•)) > h = i, N, w[i] = wM j, x(Tj-[i]),ur,[i] ( • ^ = (w'i],...,

Vi = Vi(D(x($i) - Ci), ... (x(#n) - Cn)) . Установим справедливость неравенств

<Тг(А(ж(й) - сг),р[г+11(т^+1Ьw^1!)) ^ рИ(г,н,wN) + (о, г = l,iV- 1,

VN ^ P[N(Tj[N], w[N) + Z0.

(3.27)

Зафиксируем г = 1, АГ. Пусть г^т^-м [•]$] — движение / ; -сппе.мы (3.9), порожденное из позиции (т^[г], w[г^) законом управленпя |м[г]о( • ), е, Дк} на базе оптимальной минимаксной в г-ой дифференциальной игре стратегии м[г]о( • ) и реализацией по мехи г^-и [ • ]7), которая действовала в системе (2.1) при формировании движения х[£о[• ]7] на промежутке

Для каждого // /. Л рассмотрим движение ^[т^м [•]$] ¿^-системы (2,12), соответствующее этому движению г[г][г?-[¿] [ • ]0].

Отметим, что в силу соотношений (2,11) и (3,26) справедливы равенства

=ь)Н(тз,х{тз),иг.{-)), 1г = г^, ^ = - 1. (3.28)

Проверим по индукции что при ] = з[г], з[г+1] выполняются равенства

= = (3.29)

При з = з[г] равенства (3.29) следуют из выбора исходной позиции для движения г[г][г?[4] [ • ]0] и равенств (3.28) при з = з[г]. Далее, пусть равенства (3.29) доказаны для 3 = q, q = з[г],з[г+1] - 1. Тогда в силу равенств (3.28) для з = ^ ^^^чаем г[г](тд) = = w[г](тд,ж(гд),иг?( • )), откуда, учитывая определение (3.21) стратегии и( • ) и включение (3.26) для з = q, выводим

и[г]с(тд, г[г](тд),е) = и[г]с(тд, w[г](тq,х(тд),иТд( • )),е) = и(тд,х(тд),ит,( • ),е).

Таким образом, в соответствии с соотношениями (1.4) и (3.5) заключаем, что при формировании движений х[*с[• ]0] и г[г][т,и [ • ]0] в исходной системе и г[г]-системе на промежутке [тд, тд+1) действовала одна и та же реализация управления и[тд[ • ]тд+1). Кроме того, по построению, на этом промежутке в обеих системах действовала одна и та же реализация помехи v[тq[• ]тд+1). В итоге, учитывая равенства (3.29) для ] = q и применяя лемму 2.2 к каждому движению ¿^[т^т^х], I/ /. Л . получаем, что равенства (3.29) справедливы для з = q + 1.

С учетом соотношений (2.11) и (3.25) равенства (3.29) при з = з[г+1] можно переписать в виде

^ (т-^+ц) = Вгх{{}г), 4г] ) = 4г+1] , Ъ, = iПл •

Далее, в случае г = N принимая то внимание равенство т,^+1] = 0, краевое условие для функции цены

р[м](0, г[м]) = ^(г[м] - С[м]), С

а также соотношение (3.12), выводим

р[м](т^+1], г[м](т,[N+1])) = ^(г[м](0) - С[м]) = ^,

а при г = 1, N — 1, опираясь с учетом соотношений (3.25) на лемму 3.1, получаем

р[г](т^+1], г[г](т^+1])) = р[г] (т,-[¿+1], {Ргх(0г),^¡[!+11],... ,^+1]}) = = аг (Рг(х(0г) - Сг),р[г+1](т,[¿+1] , W[г+1]))•

Таким образом, для доказательства неравенств (3.27) достаточно установить справедливость неравенств

рИ(г,[г+1ЬгИ(г,[г+1])) ^ р1Чт3+ Со, г = МУ.

Зафиксируем г = 1Д и предположим, что для некоторого числа ( > О выполняется неравенство

р[г] (.¿+1], г[г](т,[¿+1])) > р[г] (т,[¿], w[г]) + (с + С (3.30)

По этому числу у > 0, применяя утверждение 1,2 к г-ой дифференциальной игре, выберем число и|г] > 0 и функцию у *[г](е), е Е (0,и|г]]. Зафиксируем значение параметра точности и Е (0,и|г]] и разбиение

Д = Д£{У} = {У : и1 = Т?[г+1 ] , и < У + 1> ^ = 1 У ^+1 = 7} отрезка времени [т^г+1] ,7] с диаметром

8к = тах(г?+1 - т^ ^

3=1,к

Рассмотрим движение и^[т^-и [• ]7] = {и[г](£) Е , т^-и ^ £ ^ 7} и[г1-системы, порожденное из позиции (т^[г], w[г^) законом управления {м[г]о( • ),е, Дк}, при этом па промежутке [т?-[г], т^[г+1]) действовала реализация помехи г[т^[г] [ • ]т?-[г+1]), а на промежутке [т^г+ц ,7) помеха формировалась в согласии с законом {г[г]о( • ),и, Д^} на базе оптимальной макси-мпнной в г-ой дифференциальной игре стратегии г[г]о( • ). Тогда, во-первых, благодаря выбору (3,24) числа е * и функции ( • ) справедливо неравенство

7И(и%нН7]) = рИ(У(7) - сИ) ^ рИ (т^, w[i1) + (о, а во-вторых, по выбору числа и|г] и функции у[г1( • ) имеет место оценка

7и(иИ[т^,г+1][^ ]7]) = рИ(и(7) - с[*]) ^ р%^+1],и,+ц)) - С Таким образом, получаем неравенство

рИ (^ [г+1], С И (^ [г+1])) ^ р[^] (^ [г], W ) + <о + С

которое с учетом равенства и[г] (т^г+1]) = и[г] (т^г+1]), справедливого по построению движения У[г] [т^г] [ • ]7], противоречит сделанному предположению (3,30), Таким образом, неравенства (3,27) доказаны.

Наконец, покажем по индукции, что для каждого / 1. А выполняется неравенство

Щ ^ РИ(т,-[г], w[i]) + иг = (1 + -гСо- (3.31)

При г = N неравенство (3.31) совпадает с последним из неравенств (3.27). Далее, пусть неравенство (3.31) доказано для г = д+1, д = 1, N — 1. Тогда с учетом соотношений (3.3), свойств нормы а,( • ) и неравенства (3.27) при г = д выводим

^ = ^(Д,(ж(7,) - с,),^,+1) ^ ^(Д,(ж(7,) - с,),р[,+1](т,-[,+ц, w[q+11)) + (0,1) ^ ^ рМ(т^-ы, w[q1) + (о + (0,1) ^ рМ(т^-ы, w[q1) + ^.

В итоге из неравенства (3.31) при г =1, если принять во внимание определение (3.23) числа Со и равенетво т^ц = £о, вытекает оценка

7(ж[*о[• ]7]) ^ р[11(т^[1], w[11) + = р[1] (¿о, w[1](íо,xо,pо( • ))) + С,

из которой с учетом утверждения 2.1 следует первое из неравенств (3.22). Второе из неравенств (3.22) доказывается аналогичным образом с понятными изменениями. Теорема доказана. □

§3.3. Разрешающая процедура

Для приближенного вычисления величины оптимального гарантированного результата и построения оптимального закона управления в задаче (2,1), (3,4) для каждого г = 1,N применим в г-ой вспомогательной дифференциальной игре (3,9), (3,11) метод выпуклых сверху оболочек.

Пусть г = 1,N и Ак = Ak{rj} — разбиение вида (2,3), (2,28), В согласии с попятной рекуррентной процедурой (1,7)-(1,10) для i-ой вспомогательной дифференциальной игры (3,9), (3,11) определим множество G[i] С RdW и функции ^ji](l[i]) Е R, l[i] Е G[i], j = i. /,• . i. Для удобства дальнейших рассуждений приведем здесь соответствующие формулы. Положим

G[i] = {l[i] Е RdW : ^(l[i]) ^ 1}, (3.32)

A^f (\®)= [ 3+1 ттптах{\®,В®(t)u +С®(t)v) dt, l[t]eRdW, j = l^k, (3.33)

JTj ueP veQ

где ( • ) — норма, сопряженная к норме • ) из показателя качества (3.11). При j = k + 1 определяем

^k+i(l[i]) = -<l[i],c[i]), l[i] Е G[i]. (3.34)

При j = 1, к имеем

^i](l[i]) = A^ji](l[i]) + ^ii+1(l[i]), l[i] Е G[i],

jl[i]) = { j • )}Gw(l[i]), l[i] Е GW. (3'35)

Далее, в согласии с соотношениями (1.11) и (1.14), с учетом равенств (3.1) определим соответственно систему величин

ef(z®) = ef(z®-, Afc) = max «Iй,z^) + rfV1)), z^ E RdW, j = l,fc + l, (3.36) J J lMgGM

и стратегии управления первого и второго игроков

^(t, z[V), (t, z[i],e), (t, z[i]) Е [to,0] X Rd[i], e> 0. (3.37)

Отметим, что вспомогательная дифференциальная игра (2.19), (2.20) для рассматриваемой задачи (2.1), (3.4) совпадает с первой (при i =1) вспомогательной дифференциальной игрой (2.12), (3.11) каскада. Поэтому в качестве непосредственного следствия из теоремы 2.2, если учесть справедливое в силу соотношений (2.18) и (3.8) равенство

w(to,Xo,Po( • )) = w[1](to,Xo,Po( • )), (to,Xo,Po( • )) Е K,

получаем следующий результат.

Теорема 3.2. Для, любого числа £ > 0 можно указать такое число 6 > 0, что, каковы бы ни были, начальная, позиция (to, xo,po(• )) Е K и разбиение Ak вида (2.3), (2.28) с диаметром 6k ^ 6, будет справедливо неравенство

|e!1](w[1](to,xo,po( • ))) - rU(to,xo,po( • ))| ^ £,

где rU(• ) — величина, оптимального гарантированного результата (2.5), w[1]( • ) — ин-

(3.8).

В согласии с соотношениями (3,21) рассмотрим следующие стратегии управления и формирования помехи:

yAfc■ ),е) = «¿k (i, w[i](t,x,p( ■ )),£),

= (3.38)

{t,x,p{-)) e K, te[i)t.e>0, г = Щ

Теорема 3,3, Длл любого числа Z > 0 найдутся такие число £ * > 0 м функция (£) > 0, £ £ (0, £ * ], что, каковы бы ни были начальн ая позиция (t0,x0,p0( ' )) £ K, значение параметра точности £ £ (0,£*] и разбиение Ak вида (2.3), (2.28) с диаметром 8k ^ (£), законы управления {yAfc ( ■ ),£, Ak} и формирования помехи {VAk( ■ ),£, Ak} будут (-оптимальными.

Доказательство. По числу Z > 0 определим число Z0 в согласии с соотношением (3.23). Для каждого / 1. А по этому числу , применяя к г-ой вспомогательной дифференциальной игре теорему 1.3, выберем число £*i] > 0 и функцию (£), £ £ (0,£ *i]]. Положим

е* = min е^, ö*(e) = min ^(е), е £ (0,£*].

г=1 ,N г=1 ,N

Пусть (t0,x0,p0( ■ )) £ K, £ £ (0, £ * ] и Ak — разбиение вида (2.3), (2.28) с диаметром

Пусть x[t0[■ ]■$] — движение системы (2.1), порожденное из позиции (t0,x0,p0( ■ )) при действии закона управления { yAfc( ■), £, Ak} на базе стратегии yAfc( ■ ) (3.38) в паре с некоторой допустимой реализацией помехи v[t0[■ ]-$), и u[t0[■ ]"$) — соответствующая реализация управления.

Дальнейшие рассуждения проводятся по аналогии с доказательством теоремы 3.1. Сначала устанавливается справедливость неравенств (3.27). При этом для каждого i = 1, Ж рассматривается движение zM[-$i_i[ ■ ]-$] z^-системы (3.9), порожденное из позиции w[i!(7j_1, ( ■ ))) законом управления {«Ak( ■ ),£, Ak} на базе стратегии

«Ak( ■ ) (3.37) и реализацией помехи v[7i-1[ ■ ]-$). Здесь учтено, что моменты времени Tj[¿] (3.25) специально вводить не нужно, так как в силу включений (2.28) имеют место равенства Tj\i\ = г?г-ъ i = 1,-/V+ 1. После этого с опорой на полученные неравенства выводится оценка

7(x[t0 [ ■ ]#]) ^ р[1] (¿0, wW(i0,X0,P0( ■ ))) + Z,

из которой с учетом соотношения (3.20) следует ^-оптимальность закона управления {yAk (■),£, Ak}.

Аналогичным образом с понятными изменениями устанавливается ^-оптимальность закона формирования помехи {VXfc(-), е, Ак}. □

В согласии с соотношениями (3.38) для построения искомых стратегий yAfc ( ■ ) и VAk ( ■ ) для каждого г = 1,N необходимо знать значения стратегий «д (•) и (•) (3.37) при t £ ). В соответствии с соотношениями (1.14) и (1.15) для определения этих зна-

чений требуется найти функции при j = jW, jN-1! — 1, где индексы и 1 (3.25)

определяются из условий Tj и = ^^ и Tj[i+i] = .В согласии с попятной рекуррентной процедурой (3.34), (3.35) для нахождения указанных функций нужно сначала построить функции при всех j = к + 1. Следующее утверждение позволяет в предполо-

жении о том, что на предыдущем шаге (для i + 1) уже была найдена функция ■ ),

избежать этих дополнительных построений и определить функцию ^г+ц ( ■ ) непосредственно, Искомые же функции ] = ' — 1, можно после этого построить по формулам (3,35) уже па базе функции ( ■).

Утверждение 3,1, Пусть h = 1, N — 1 и = А k{i~j} — разбиение вида (2.3), (2.28). Тогда множества и

G[h+1]

и функции <р) (■) и р) '(•), j = l,k + l, определяемые по формулам (3.32)-(3.35) при i = hui = h +1 соответственно, связаны, соотношениям,и

G[h] = {l[h] g Rd[h : M[h](l[h]) = 0}, (3.39)

<Al[h]) = max Wh+1](l[h+1]*) -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Здесь индекс j[h+1] определяется в согласии с соотношением, (3.25) из условия Tj[h+i] = 0h, и

M[h] (l[h] = |/h,... , /n}) = {(v, l[h+1]* = {/h+1,..., IN}) G R x G[h+1]:

u^O, a*h(lh, , k = ul*i} г = h+ 1, iv}, (3.41) gcte ah( ■) — норма, сопряженная, к норме ah( ■) из (3.2).

Доказательство. Прежде чем переходить к доказательству утверждения, приведем два факта, которые будут использоваться ниже. Во-первых, по следствию из теоремы Кара-теодори [73, с. 199] для выпуклой сверху оболочки <^(l) = ■ )}G(l), l G G, полунепрерывной сверху функции ^(l) G R, l G G, на выпуклом компактном множестве G С Rd справедливо представление

d+l

^(1) =max| J]A(rV(l(r)) : (A(r), l(r)) G [0,1] x G, r= l,d + l,

r=1

d+1 d+1

Y, A(r) = 1, A(r)l(r) = l}, l G G, (3.42)

Г=1 Г=1

из которого, в частности, вытекает неравенство

р(1) ^ ^(1), 1 С С. (3.43)

Во-вторых, в силу соотношений (3.3) имеют место равенства

Я* (1г, 1г+1, . . . , ) = а* (1г, ^*+1(1г+1, • • • , ^ ,

и нормы а*(/¿, V), , V) С х К, те убывают по V при V ^ 0.

Проверим справедливость равенства (3.39). Обозначим через множество, стоящее в правой части этого равенства. Пусть

ь} с и (V, 1[Ь+1]*) С

М[Ь1(1[Ь]). Имеем

^(1[Ь1) = ^+1(^+1, • • •, ^)) = аЬ(гЛ, ^+1(1[Ь+11*)) ^ V) ^ 1,

откуда выводим l[h] g G[h].

С другой стороны, пусть l[h] = ..., /N} G G[h]. Тогда для v = • • •, 1N)

получаем

ah(1h, v) = ah(1Л, Vh+i(1h+i,In)) = Vh(l[h) ^ 1.

В случае v = 0 имеем li = 0, г = h + 1, iV, поэтому справедливо включение (и, l[/l+1l* = 0) G 1^1), а значит, G G^. В случае v > 0 положим I* = 1/vk, i = h + 1, N. Тогда имеем

Vh+i(l[h+1] * = {O+i>... , ¿N}) = 1/vVh+1(1h+1, ... ) = 1,

откуда l[h+i]* G G[h+i]. В итоre (v, l[h+i]*) G M[h](l[h]), и поэтому l[h] G G[h].

Перейдем к доказательству равенств (3,40), Прежде всего отметим, что для любых j = + l и G G^l из полунепрерывности сверху функции на множестве G[h+i] следует полупепрерывпость сверху функции v^jh+i] (l[h+i]*) g R, (v, l[h+i]*) g M[h](l[h]). Поэтому с учетом компактности множества M[h](l[h]) максимум в выражении (3,40) действительно достигается.

Так как в силу соотношений (2,13) при t ^ 7h справедливы равепства Bh(t) = 0 и Ch(t) = 0, то, учитывая неравенства Tj ^ 7h, j = j[h+i], k, в соответствии с соотношениями (3,10) и (3,33) получаем

AVf](lИ = {/,,...,/W}) = AVf+11({Wi,---,^}), l[/l]GEdW, j = (3.44)

Зафиксируем l[h] = {/h,...,/N} G G[h]. В согласии с соотношениями (3,12) и (3,34), какова бы ни была пара (v, l[h+i]*) g M[h](l[h]), имеют место равенства

4+i(l[h]) = -<l[h], c[h]) = -v<l[h+i]*, c[h+i]) - (Zh,DhCh) = v^Jh+Z1 (l[h+i]*) - (Zh,DhCh),

из которых следует справедливость равенства (3,40) при j = k +1. Далее, предположим, что равенство (3,40) доказано для j = q + 1, q = j[h+i], k, и докажем его для j = q.

Обозначим функцию, стоящую в правой части равенства (3,40) при j = q, через ~qh+i]( _ ). QnHpaaCb на соотношения (3,35) и (3,42), выберем числа A(r) G [0,1] и векторы = ■ ■ ■, 1$} G г = 1, dM + 1, исходя из условий

dM + i dthl +i dthl+i

^h](l[h]) = E A(rVf](l(r)), J] A(r) = 1, J] A(r)l(r) = l[h]. (3.45)

При этом будем считать, что А(г) > 0 при г =1, в[Щ] + 1. В противном случае в рассуждениях ниже следует рассматривать только те значения индекса г, при которых А(-г-) > 0. Для каждого г =1, в[Щ] + 1, используя равенство (3.40) при ] = д + 1, выберем пару

(^г), 1(г) *) е М[Щ](1(г)) (3.46)

так, чтобы выполнялось равенство

^+1(1(г)) = *(г)^+1](1(г) *) - (3.47)

Отметим, что для удобства записи в обозначениях 1(г) и 1(г)* опущены верхние индексы [Щ] и [Щ+1] соответственно, Из соотношений (3.44) при ] = д, (3.45) и (3.47) выводим

^(1^) = Е А(г)V(Г)4Щ+1](1(Г) *) -</щ,ДЩСЩ>.

г=1

Далее, если v(r) = 0 при всех г =1, в[Ь1 + 1, то в силу включения (3,46) для каждого г = 1, (¿И + 1 имеем = 0, г = И + 1, N. С учетом соотношений (3,45) выводим = О, г = к + 1, N, откуда (0,1[/1+11* = 0) € Таким образом, в рассматриваемом случае

получаем

?№) = -(/адад ^ ЙЬ+11(1[Ь1).

В случае когда V(г) > 0 при некотором г =1, вМ + 1, положим

аМ+1 +1

V = ^ А(г^(г) > 0, 1[Ь+11* = ]>] А(г)V(г)/V 1(г)*

Г=1 Г=1

Тогда в силу включения (3,46) для каждого г = 1, в[Ь1 + 1 и соотношения (3,45) выводим (V, 1[Ь+11*) с М[Ь1(1[Ь1). В итоге, учитывая неравенство (3,43) и вогнутость функции

[Ь+1Ь ч

^ ( ■ ), имеем

аМ+1

^(1И) ^ V ^ (г)/^ад *) - (/ь^> ^

^ ^+1Г(ад 1 *) - (/адад ^ ^ 1 (1[Ь1).

Таким образом, установлена справедливость неравенства

^ (1[Ь1) ^ (1[Ь1). (3.48)

С другой стороны, выберем пару (1[Ь+11 *,v) С М[Ь1 (1[Ь1) из условия

^+11(1[Ь1) = ^ад^11 *) - (/Ь, ^>• (3.49)

С учетом соотношений (3.35) и (3.42) выберем числа А(г) С [0,1] и векторы 1(г) *

(г)*

Ь+1, • • •, 1

{1^1*1, ■ ■ ■, ^м*} £ г = 1, с!^1] + 1, так, чтобы выполнялись равенства

ИТ1 1 (

а[ь+1]+1 а[ь+1]+1 а[ь+1]+1

1(1[Ь+11 *)= ^ А(Г)^;Ь+11 (1(г) *), ]>] А(г) = 1, ]>] А(г)1(г) * = 1[Л+Ч*. (3.50)

Г=1 Г=1 Г=1

Для каждого г = 1,с1[/1+1] + 1 положим = ... Тогда, во-первых,

при любом г = 1,с1[/1+1] + 1 имеем (г/, 1^*) € а значит, 1(г) С С[Ь1, поэтому

с использованием соотношений (3.40) при ] = д + 1 и (3,44) при ] = д выводим

*) - (/адСЬ> ^ ^ (1(г)), (3.51)

а во-вторых, в силу равенств (3.50) и включения (1[Ь+11 *, V) С М[Ь1 (1[Ь1), получаем

^+1]+1

1[Ь1 = ^ А(г)1(г). (3.52)

Г=1

В итоге из соотношений (3,49)-(3,52), используя неравенство (3.43) и вогнутость функции ^ ( ■ ), заключаем

^+1]+1

^(1^)= А(г)и;ад1(г) *) -(/Л,ЯЛсъ» ^

а[лГ-=11+1 (3-53)

Г=1

Справедливость равенства (3,40) при ] = д следует из соотношений (3,48) и (3,53), Утверждение доказано, □

В качестве следствия из утверждения 3,1 отметим связь между системами величин в[г]( ■) и в[г+1]( ■ ) (3,36), которая согласуется с леммой 3,1,

Утверждение 3,2, Пусть h = 1, N — 1 и Ак = Ak{rj} — разбиение вида (2.3), (2.28). Тогда системы величин е^(-) и j = 1,к + 1, определяемые по формуле

(3.36) при i = hui = h +1 соответственно, связаны, соотношениям,и

ef1 (z[hl = {Zh,.. }) = - DhCh,ej/l+1l({Zh+1,.. })),

__(3,54)

zWeRdW, j=fih+v,k + i, где индекс j[h+11 определяется в согласии, с (3.25) из условия Tj[h+i] =

Доказательство. Доказательство проводится по схеме из [54],

Пусть zW = {zh, ...,zN}e RdW, z^1! = {zh+1,..., zN} и j = jM,k + l. Выберем вектор l[h+1]0 = {/h+1,..., IN} £ G[h+11 из условия

ejh+1l(z[h+11) = (i[h+110, z[h+1]) + <^+11 (l[h+110). (3.55)

С учетом неравенства ejh+11(z[h+11) ^ 0, справедливого в силу соотношений (1.13) и (3.1), выберем пару , v0 х R, v0 ^ 0, , v0) ^ 1, так, чтобы имели место равенства

^ - Dhch,eih+11(z[h+11)) = max(ih,v) ((k- D^) + vef+^z^11)) = = (#- Dhch) + v0ef+11(z[h+11),

где максимум вычисляется по всем парам Е х К, удовлетворяющим условию ) ^ 1. Положим 1[Щ] = , v0^h+1,..., v0^N}• Тогда в согласии с соотношениями (3.39) и (3.41) имеем (V0,1[Щ+1] 0) е М[Щ](1[Щ]) и 1[Щ] Е С[Щ]

еМ(2[Щ]) ^ <1[Щ], 2[Щ] > + ^Щ](1М). (3,56)

Кроме того, учитывая равенство (3.40), получаем

<1[Щ], z[h1> + ^](1[Щ]) ^ </° ,*Л - Дщсщ > + ^«1[Щ+1] 0, z[h+11> + ^+1](1[Щ+1] 0)).

в итоге, принимая во внимание соотношения (3.55)—(3.56), заключаем

е^[Щ]) ^ - ^в^11^11)). (3.57)

С другой стороны, рассмотрим вектор 1[Щ]0 = ,..., } Е С[Щ], для которого выполняется равенство

еМ) = <1[Щ]0, z[h1 > + [ (1[Щ]0). (3.58)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

в согласии с соотношением (3.40) выберем пару (V0,1[Щ+1] 0) е М[Щ](1[Щ]0) из условия

^](1[Щ] 0) = ^^О^1 1 0) - </Щ, £щсщ>. (3.59)

в силу включения 1[Щ+1] 0 е с[щ+1] имеет место неравенство

е[Щ+1]^[Щ+1]) ^ <1[Щ+1] 0, z[h+11 > + [+1](1[Щ+1] 0). (3,60)

Принимая во внимание соотношения (3.41) и (3.59), выводим

<1[Щ] 0, z[h1 > + ^](1[Щ] 0) = </Щ ,*Л - Дщсщ > + ^«1[Щ+1] 0, z[h+11> + ^+1](1[Щ+1] 0)), откуда, если учесть соотношения (3.56), (3.58) и (3.60), получаем

е^[Щ]) ^ - Я^,^11^11)). (3.61)

Неравенства (3.57) и (3.61) доказывают равенство (3.54). □

Кроме того, утверждение 3,1 е учетом теорем 3,2 и 3,3 позволяет объединить процедуры (3.32)-(3.35) для каждого г = 1. Л г, единую разрешающую задачу (2,1), (3,4) процедуру попятного построения выпуклых сверху оболочек подходящих вспомогательных функций.

Рассмотрим функцию

hi(t) = min{i = 1,N : t ^ i)i}, te[t0,i)], (3.62)

где / = 1,./У, — оценочные моменты времени из показателя качества (2.2). Через (Ь - 0) (соответственно /^(Ь + 0)), обозначим предел функции в точке Ь С [¿0,0] слева (соответственно справа), полагая при этом ^(¿0 - 0) = ^(¿0) = 1 и + 0) = = ^(0) = N.

Зафиксируем разбиение Дк = Дк{т,} вида (2.3), (2.28). Отметим, что для любого ] = 1, к имеют место равенства

(т, + 0) = Мт,+1 - 0) = +l),

[^(т, - 0), т, = (г,), (3.63)

+0) = <

1Мт, - 0) + 1, т, = (г,).

Определим множества С 1( т± )] и функции Ф±(1[Ь1(т?±0)1) с К 1[Ь1(тз±0)1 с для каждого у 1./,- 1 по следующему правилу. Положим

ДФ,(1^ +0)1) = Г'+1 ш1пшах(1[Ь1(т^' +0)1, Б[Ь1(т^'+0)1 (Ь)и + С^' +0)1 (¿)^> аь,

Л, иеР ^ (3.64)

При ] = к + 1 определяем

ад = ад с ^Г1) ^ 1},

ф±+1(1^) = _<1[^>, Г1 С ь±+1.

При ] = 1, к имеем

(3.65)

L+ =

Ф3(l[hi(rj +0)]) = ДФ3(lIhi(Tj+0)]) + ф-+1 (i[hi(Tj+0)]jM-Tj+0)] G L+, (з gg)

ф+ (l[hi(Tj +0)]) = ( . (l[hl(Tj +0)]), l [hi (Tj +0)] G L+.

Далее, если т, = , = (т,), то есть момент времени т, не совпадает ни с одним из моментов 0 из показателя качества (3.4), то определяем

L- =

ф-(l[hi]) = Ф+(1[ад l[hi] g L-

(3.67)

з ^ / ] у л з '

иначе в соответствии с равенствами (3.39) и (3.40) полагаем

L- = {l[hi G Rd[hi] : M[hi](l[hi]) = 0}, Ф-(1^) = +я max ( ( (l[hi+1]*) - (/hi,Dhichl), (3.68)

(v,i[hi+i] * )eM [hi](i[hil)

l[hi] = {/hi}G L-,

где множество МЩ ](1[Щ1]) определяется в согласии с соотношением (3,41) с заменой множества С[Щ-1+1] на множество (см, ниже следствие 3,1),

В согласии с соотношением (3,36) рассмотрим систему величин

Е±^[Щ1]) = Е±^[Щ,1]; Дк) = тах №1], z[hl1> + Ф±(1[Щ1])),

___(3.69)

Ъ[Н\ е ^["1] > ^ = ^(^.±0), з = 1,к + 1.

Из утверждения 3,1 вытекает следующая связь между конструкциями (3.64)-(3.69) и процедурами (3.32)-(3.36) при г =

Следствие 3,1, Пусть Дк = Дк(т?-} — разбиение вида, (2.3), (2.28). Тогда, для каждого з = 1, к + 1 имеют место равенства,

= £[Щ1(Г, ±0)],

ф±(1[Щ1(т^±0)]) = ^±0)](1[Мг,±0)]), 1[Мт,±0)] е £±, (3.70)

^(^(т,- ±0)1) = еМт; ±0)](2;[Щ1(т, ±0)1), ^(т,- ±0)1

Е

3 '

±0)]

Учитывая утверждение 3.2, получаем следующее свойство системы величин Е[±( ■ ) (3.69).

Следствие 3.2. Пусть Ак = — разбиение вида (2.3), (2.28), з = 1,к,

^ = ^1(г[) (3.62) И 1 — , . . . , } Е . Тогда имеют место следующие соотношения:

если Т[ = , то

Е"^1) = £+^[Щ1]);

если Т[ = , то

£"^[Щ1]) = ^(¿щ - ВКгсЩ^/({г^+ь...,^})),

где ощ ( ■) — норма из (3.2).

Далее отметим, что в согласии с соотношениями (1.14), (1.15) и (3.70), с учетом сделанных относительно показателя качества предположений (3.1) стратегии ( ■ ) и ^ ( ■ ) (3.38) могут быть определены (с точностью до выбора аргументов соответствующих минимумов и максимумов) на основе процедуры (3.64)-(3.68) построения множеств Ь^ и функций Ф^(-)> 3 = 1) к, исходя из условий

^д,(Т[,х,р( ■ ),е) Е а^тт^11(и)(ж,р( ■ ),е), В[Щ1](т[)и>,

где

[

_ «еР

(Т[,х,р( ■ ),е) Е а^тах^11^,^ ■ ),е), С[Щ11(т[)и>, (3.71)

__5

= жей", р(-)еГ, £>о, г(т[ ,е)1[/11](и) (х,р( ■ ),е)

^1 + ||1^11Ы(ж,р(-),е)1|2

|/1 + ||1^)(х,р(.),в)||2' _

1/11]Ы(ж,р(-), е) € аг§тах(<1[/11], + Ф+(1[/11]) - г (г,, е)АД + рМ ||2), 1^11 4 V /

4 V у

w[hl1 = w[hl1(ri ,х,р( ■ )), = Л-1 (т[ + 0).

В итоге в соответствии с теоремами 3,2 и 3,3, следствием 3,1 и соотношениями (3,71) в случае позиционного показателя качества (3,4) вычисление величины оптимального гарантированного результата (2,5) и построение оптимального закона управления сводятся к определению в согласии с попятной рекуррентной процедурой (3,64)-(3,68) множеств и выпуклых сверху оболочек Ф± ( • ) вспомогательных функций Ф, ( • ). Уменьшающаяся с ростом индекса г размерность в[г1 (3,7) вспомогательных дифференциальных игр (3,9), (3,11) влечет уменьшающуюся с ростом индекса ] размерность множеств , что повышает эффективность процедуры по сравнению с разрешающими конструкциями из второй части. Более того, как будет показано в четвертой части, процедура (3,64)-(3,68) допускает дальнейшую редукцию, еще сильнее понижающую размерность переменных, по которым требуется проводить овыпукление,

§ 3.4. Примеры

В настоящем разделе приведены два примера, в которых использование разрешающей процедуры (3,64)-(3,68) приводит к эффективному решению, В первом примере все параметры задачи подобраны таким образом, чтобы функции Ф± ( • ) можно было выписать в явном виде. Во втором примере предполагается, что в системе (2,1) отсутствуют помехи (С(Ь) = 0), что заранее гарантирует вогнутость вспомогательных функций Ф,( • ), поэтому их выпуклые сверху оболочки Ф+ ( • ) строить не требуется,

В качестве первого примера рассмотрим динамическую систему, движение которой описывается дифференциальными уравнениями

аадад = х2(Ь) + ьт (Ь)и(Ь - 0.5), аадад = б(Ь)и(Ь) + с(ьИь),

¿0 = 0 ^ Ь < 2,

(3.72)

х = (жьж2) С К2, и С Р = [-1,1], V С Q = [-1,1],

где

Ь С [0, 0.5],

2Ь,

Ь С [0, 0.5],

Ь(Ь) = < 2Ь - 1, Ь С (0.5,1], Ьт(Ь) = <2 - 2Ь, Ь С (0.5,1.5],

Ь С (1, 2],

с(Ь) =

Н - 0.5, -2Ь2 + 3Ь - 1, Ь - 1, 0.5,

2Ь - 4, Ь С (1.5, 2],

Ь С [0, 0.5], Ь С (0.5,1], Ь С (1,1.5], Ь С (1.5, 2].

Задана начальная позиция

Х0 = (-0.5, 0.5), Р0(е) = 1, £ С [-0.5, 0). Показатель качества имеет вид

1=^х\(1)+х\(2).

(3.73)

(3.74)

Задача оптимизации гарантированного результата (3,72)-(3,74) решалась на основе описанных в разделе 3,3 конструкций. Пусть выбрано разбиение Дк = Дк{т,} вида (2,3) отрезка времени управления [0, 2], содержащее моменты 0.5, 1 и 1.5. В данном примере функции Ф]~(-) и Ф^~(-)> ] = 1 ,к, определяемые согласно процедуре (3.64)-(3.68) и требуемые для построения величины Е-( • ) (3,69) и стратегий Цдк( • ) и Т/дк( • ) (3,71), имеют следующий вид:

ФГ(/Ь к) = 0.125 у7! - II - 0.125 + /2|, (1Ъ12) е Ц = {(/ь/2) б!2 : /2 + /2 ^ 1};

0

Рис. 3. Результат симулирования процесса управления в задаче (3,72)-(3,74) при действии оптимального закона управления {/дк( • ),е, Дк} и трех вариантах помех

при ] = 1,з[21 - 1, где индекс ][21 (3,25) определяется из условия т^-и = 1,

Ф+(/ь/2) = 0.125\Ji-l\- [ + (к,к) еь+ = ц,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а при ] = ][21, к

Ф+(*2)=/\(£12 с = {/2 с к : |*21 ^ 1}.

Здесь

(0.5 - Ь, Ь С [0, 0.5], 0, Ь С (0.5,1.5],

Ь - 1.5, Ь С (1.5, 2].

Приведем результаты численного моделирования. При вычислениях было выбрано равномерное разбиение Дк отрезка времени [0, 2] с шагом = 0.002 и значение параметра точности е = 0.02. Априорно посчитанная величина оптимального гарантированного результата:

ГШ = Г^(Ь0,Х0,Р0( • )) - 0.759.

На рисунке 3 изображены первые компоненты движений ж^[0[-]2], г = 1,3, системы (3,72), порожденных из начальной позиции (3,73) законом управления {/дк( • ),е, Дк} на базе стратегии /Дк ( • ) (3,71) при следующих вариантах помех:

1) помеха формируется в согласии с законом {1Д( • ),е, Дк} па базе стратегии 1Д( • ) (3.71);

2) помеха формируется в согласии с законом {V( • ),е, Дк}, где

V(Ь,х = (х1,х2),р( • ),е) = sgn(c(Ь)xl), (Ь,х,р(• )) С К, е> 0;

3) помеха отсутствует: = 0.

<

(3.75)

Реализовавшиеся значения показателя качества (3.74):

7(1) - 0.76 - Г«, 7(2) - 0.243 < Г«, 7(3) - 0.212 < Г«.

Перейдем ко второму примеру. Пусть движение динамической системы описывается дифференциальными уравнениями

ёх^)/^ = х2(£),

(¿)/Л£ = -2х^) - 0.4Х2(¿) + 0.02Жз(*)+ Х5(¿) + 0.4И2(* - 0.4),

ёх3 = х4 (¿),

ах4 (г)/& = 0.01 я1 (¿) - х3(г) - 0.1 ж4(г) + х6(г) - - 0.4),

(г)/& = (5 - ¿ксо,

к ах6(г)/аг = (4 - 0.5г)и2(г),

¿0 = 0 ^ £ < 4, х = (я1, я2, х3, х4, х5, х6) Е К6, и = («1, «2) Е Р = {и Е К2 : ||и|| ^ 2}.

Пусть задана начальная позиция

Х0 = (0, 0, 1, 0, 0, 0), р0(С) = (2яп(2.5<), 2сов(2.5<)), С Е [-0.4, 0), (3.76)

п показатель качества имеет вид

7 = ((х1(0.5) - 0.5)2 + (х2(0.5) - 0.1)2 + (х3(0.5) - 0.5)2 + (х4(0.5) + 0.1)2 + + (х 1 (1) - 1)2 + х3(1) + (х1(1.5) - 0.5)2 + х2(2) + (х3(2.5) + 0.5)2 + х4(3) + (3.77) + (х2(3.5) - 0.1)2 + (х4(3.5) - 0.1)2 + х2(4) + х2(4) + х2(4) + х2(4)Л 1/2

Задача оптимизации гарантированного результата (3.75)-(3.77) решалась на основе описанных в разделе 3.3 конструкций. Так как в системе (3.75) помеха отсутствуют, то вспомогательные функции Ф[ ( ■ ) являются вогнутыми и их выпуклые сверху оболочки строить не требуется.

Приведем результаты численного моделирования. При вычислениях были выбраны равномерное разбиение Дк отрезка времени [0,4] с шагом = 0.005 и значение параметра точности е = 0.05. Априорно посчитанная величина оптимального гарантированного результата:

Г« = Г«(^х0,Р0( ■ )) - 0.978.

На рисунке 4 изображены компоненты движения х[0[-]4] системы (3.72), порожденного из начальной позиции (3.76) при действии закона управления { ^дк( ■ ),е, Дк} на базе стратегии ( ■ ) (3.71). При этом черными квадратами обозначены целевые точки. Реализовавшееся значение показателя качества (3.77):

7 - 0.981 - Г«.

1 о

-1

-2

О 1 2 3 *

Рис. 4. Результат симулирования процесса управления в задаче (3,75)-(3,77) при действии оптимального закона управления {идк(•),£, Дк}

§ 4. Редукция разрешающей процедуры

В предыдущей части для решения задачи оптимизации гарантии при запаздывании в управлении и позиционном показателе качества (2,1), (3,4) была предложена рекуррентная процедура попятного построения выпуклых сверху оболочек вспомогательных функций (3.64)-(3.68). В этой части для повышения работоспособности процедуры дается ее редукция, основанная на оригинальных овыпукляющих свертках и существенно понижающая размерность переменных, по которым требуется проводить овыпукление. Выделяется случай, когда эта размерность не зависит от числа N оценочных моментов времени ^ в показателе качества (3.4) и совпадает с удвоенной размерностью 2п фазового вектора системы (2,1), Рассматриваются два примера,

§4.1. Предварительные построения

Наряду с функцией к1(-) (3,62) рассмотрим функцию

Н2Ц) = гшп{г = 1,^ + 1: г + г ^ ге[г0,Щ, (4.1)

где г = 1, -/V, — моменты времени из показателя качества (3.4) и г?лч-1 = г? + т. Через к2(г — 0) (соответственно к2(г + 0)) обозначим предел функции к2(г) в точке слева (соответственно справа), полагая при этом к2(Ь0 — 0) = к2(г0) и Н2('д + 0) = Н2('&). По аналогии с соотношениями (3.63), каково бы ни было разбиение Дк = Дк{г}} вида (2.3), (2.28), для любого ] = 1 ,к справедливы равенства

МГ} + 0) = МГ}+1 — 0) = ^2(Т>+1),

(МГ} — 0), Г} + Г = ), ^2(г} + 0) = <

(^2(г} — 0) + 1, Т} + Г = ^(т,).

Отметим, что для любой позиции (¿, ж,р(-)) € К векторы (2.10) при г =

= к2(г), N могут быть определены следующим образом:

гиг(1,х,р(-)) = ВгХ('дг,1))гио(г,х,р(-)), г = к2(1),М, (4.2)

где

Г *+т

ад,х,р(• )) = хад)х + у* хад)вт(е)р(е - т - ад0 - е)ае. (4.з)

Рассмотрим соответствующую вспомогательную го-еиетему, движение которой описывается дифференциальным уравнением

аадад = £о(г)и(г) + адм*), ¿о ^ * <

(4.4)

го е Ега, и е Р, V е д,

где

Во(*) = X(0, (*)х(0 - *) + X(0, * + т)ВТ(* + т)х(0 - * - т),

Со(*) = X(0, *)С(*)х(0 - *)•

Имеет место следующая лемма, устанавливающая связь между изменением вектора и>о( • ) (4.3) в силу исходной системы (2.1) и подходящим движением вспомогательной го-системы (4.4).

Лемма 4.1. Пусть * * е [¿о,0), х * е Кга и р * ( • ) е Р .Пусть * * е (* *,0] и движение х[**[• ]**] системы, (2.1) порождено из позиции (* *,х *,р*( • )) под действием допустимых реализаций управления и[* *[ • ]* *) и помехи г>[**[• ]**)• Пусть го[**[• ]**] = {го(*) е Кга, ** ^ * ^ * *} — движение го-системы (4.4), порожденное из позиции (* *,х *,р *( • ))) тем,и же реализациями управления и помехи. Тогда, имеет место равенство

го (* *) = и>о(* *,х(* * ),и* * ( • ))•

Доказательство. По аналогии с доказательством леммы 2.2, учитывая соотношения (4.3) и (4.5) и равенство (2.15) при * = * *, имеем

ад*,х(**),и**( • )) = х(0,* *)х(**) +1** х(0,е)(в(е)и(е) + с(еме)) ае + + Г+Т х (0, е )вт (е )р * (е - т - * * ад - е) ае + Г+т х (0, е )в (е )и(е - т ад - е) ае =

Зг * * * Зг * +т

= ад *,х *,р* ( • )) + / аде )и(е) + со(е ме)) ае = ад *).

Зг *

Лемма доказана. □

Зафиксируем разбиение Дк = Дк{т,} вида (2.3), (2.28). Положим

±о)-1

X] ^ + = 1ад 1, (4.6)

г=^(т, ±о)

где сумма полагается равной нулю в случае ^1(т?- ± 0) > ^2(т, ± 0) - 1, индексы ^1(т?- ± 0) и ^2(т, ± 0) определяются в согласии с равенствами (3.62) и (4.1). Для каждого индекса ] = 1, к + 1 рассмотрим отвечающие моменту времени т.,- редуцированные информационные образы

"±(х,р( • )) = К (т, ,х,р( •)),..., ^-(т, ,х,р( ,х,р( •)),„ . ,

х е Ега, р( • ) еР, = (т, ± 0), = ад, ± 0),

составленные из векторов гуДг,-,€ г = /г-ь/г-г — 1, (2,10) и то(^,х,р(-)) Е Ега (4,3), и определим линейные операторы

(7±) = {^,... ,2^-1,^Хад,0)20... адX(0„е 8

= ад ,...,^2-1,^0 }е , = (т, ± 0), = ^(т, ± 0),

где 2^ € при г = /г-1, Л-2 — 1, ^о € Ега.

Таким образом, в согласии с равенствами (4,2) получаем, что информационные образы • ) (3,8), с опорой на которые было построено решение задачи (2,1), (3,4), связаны с редуцированными информационными образами • ) (4,7) соотношениями

ад^о)](г.>ж>р(.)) = т±^±(ж>р(.)))> р(-)ег, ^=ТадТ. (4.9)

Для каждого ] = 1, к положим = +0) (3,62) и /г2 = + 0) (4,1) и рассмотрим следующую вспомогательную 2,-систему, Фазовый вектор = ,..., 2^2-1, 20} е € этой системы составляется из векторов 2^ € г = /¿1, 1г2 — 1, каждый из которых имеет динамику соответствующей ¿¿-системы (2,12), и вектора 20 е Кга, имеющего динамику 20-системы (4,4), Таким образом, движение 2,-системы описывается дифференциальным уравнением

(гад = в,(г)и(г) + с,-(адг), г0 ^ г < 0,

+ (4-Ю) е , и е Р, V е <,

где

в,(г) = {^1 (г),..., в^2-1 (г), В0(г)}, с, (г) = ад (г),..., сад(г), ад)}, (4.11)

матрицы £>г(£) и Сг(£), г = к\,к2 — 1, определяются в согласии с соотношением (2,13), матрицы В0(г) и С0(г) — в согласии с (4,5),

Пусть * = (2^*,..., *,20*}) е [¿0,0] х , г* е [г *, 0] и движение [г *[• ]г*] = = ^ (г) е , г * ^ г ^ г *} 7:?-системы (4.10) порождено из позиции (г*, *) при действии допустимых реализаций управления и [г * [ • ]г *) и помехи ^[г * [ • ]г *). Отметим, что для каждого г = /г-1,/г.2 — 1иг = 0 изменение компоненты Zi фазового вектора этой системы можно рассматривать отдельно в качестве движения 2^ [г* [ • ]г*] соответствующей ¿¿-системы (2.12) и (4.4), порожденного из позиции (г*,2^*) теми же реализациями управления и помехи.

В согласии с соотношениями (4.9) движения 2[г]-систем (3.9) и 7,-систем (4.10) связаны следующим образом.

Лемма 4.2. Пусть Ак = Ак{т^} — разбиение вида (2.3), (2.28), ] = 1 ,к, = = ад, + 0) (3.62), * е и

я?1 = Т/^- *). (4.12)

Пусть движение [т, [• ]т,+1] -системы (4.10) порождено из позиции (т,, *) допустимыми реализациями управления и[т,[ • ]т,+1) и помехи ^[т,[ • ]т,+1). Пусть движение [т,[ • ]т,+1] Т,^-системы (3.9) порождено из позиции (т,, теми же реализациями управления и помехи. Тогда имеет место равенство

+1)= рад, (т,+1)). (4.13)

Доказательство. Положим к2 = к2(^ + 0) (4,1) и для каждого г = к\, к2 — 1 определим движение г[т}[•]г}-+1] ¿¿-системы (2.12) и движение г0[т}[•]г}-+1] г0-системы (4,4), отвечающие движению Zj[тj[■]тj+l]. Рассмотрим также движения г = к\,М, ¿¿-систем (2,12), соответствующие движению z[hl1[т?• [•]г?-+1].

С учетом определения (4,8) оператора Т+(-) в силу (4,12) получаем

^(т?) = г = къ к2 - 1,

__(4.14)

** Ы = АХ^^о(г,), г = ЛГ. В согласии с соотношениями (2.13) и (4.5) имеем

= СД*) = АВД,0)Со(*), ¿е[г„г,+1), г = к2,М. (4.15)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Принимая во внимание, что движения [т}[•]г?-+1] и 2'^1][г}[•]г}-+1] порождены одними и теми же реализациями управления и помехи, из равенств (4.14) и (4.15) выводим

>1]

2 (г}+1) = 2 (г}+1)> г = къ к2 — 1,

Отсюда с учетом определения (4.8) оператора Т+1(-) вытекает справедливость равенства (4.13). □

Для каждого у = 1, к + 1 рассмотрим соиряжеиные к Т} (■) (4.8) линейные операторы

N

'(1м) = { 1Н1,..., ^-1,5] (^, /<} е Г^, х

1^1 = {/Л1,... } е к = МГ} ± 0), ^2 = МТ} ± 0).

Отметим, что в согласии с соотношениями (4.7) и (4.9) для каждого ] = 1,к + 1 в описываемой ниже редуцированной процедуре будут использоваться двойственные векторы

1± = {/Л1,... ,/л2-1,/0} е , к1 = к1(Г} ± 0), к2 = к2(Г} ± 0),

где и Е при I = к\,к2 — 1 и 1о Е Мга, которые связаны с двойственными векторами 1М е из разрешающей процедуры (3.64)-(3.68) равенствами

= Sf( ) > 3 = 1^ + 1.

§ 4.2. Редуцированная процедура

Зафиксируем разбиение = вида (2.3), (2.28) и для каждого = 1,к + 1

определим множества С и функции (1±) е Е, 1± е , в согласии со следующей рекуррентной процедурой. Положим

Гтз+1 + _

А^(1|) = / тттах(1+, В,-(*)и + С,-(ф) 1+ € Е^' , ] = 1, к. (4.17)

' т «еР ^е^ ' '

т3

При у = к + 1 определяем

= {1±+1 = {^,/0} е : ^(^) ^ 1, /0 = 0},

^±+1(1±+1) = —(/N, ^), 1±+1 = {/NЛ} е С±+1.

82

(4.18)

При j = 1 ,к имеем

= С-+1,

^(1+) = Д^(1+) + ^-+1(1+), 1+ е С++, (4.19)

з

^+(1+) = ( • )};+ (1+1+ е

Далее, определяя индексы = ^1(т,) и Л,2 = Л.2(т,) в согласии с соотношениями (3,62)

и (4,1), полагаем:

если т, = 0^ и т, + т = 0^2, то

С - = С+,

7 7 (4.20)

(1-) = ), 1- е С";

если т, = 0^ и т, + т = 0^2, то

С" = {1" е К1- : М,(1") = 0},

(421)

. ^к 7 v а 7 у ? а 7 ^ 7 )

'Г еМ; ('7)

где

М,(1" = (/*,..., ^2-1,10}) = {1+* = К,..., ^, 1*} е С++ :

и = Гг, г = ЫМ- 1, /о = /о + (4.22)

если т, = 0^ и т, + т = 0^2, то

С" = {17 е Г1;7 : М,(17) = 0},

^ (1" ) = тах _ ад (1+*) - (/^, сЛ1), 1" = (/^1,... , 1^2—1, /0} е С" ,

(4.23)

(^,1+* )€М; (17 )

где

М,(1" = (/^1,..., /Л2"1, /0}) = { (V, 1+ * = (С+1,... , /ад, /*Я е К х С++:

адад ад // ^ оад г = ададад, /о = (4-24)

если т, = 0^ и т, + т = 0^2, то множество С" и функцию ( • ) определяем в согласии с соотношениями (4.23), где

М,(1" = (/Л1,...,ад,/0}) = {(V, 1+* = {/ад,...,/12, /*}) е К х С++:

адад ^ 1, // ^ о, и = л;, ъ = ы +1 ад2 — 1, /0 = + хт(ададад)}. (4.25)

Отметим, что для каждого ] = 1, к + 1 множества С/ • являются непустыми выпуклыми компактами, а функции <^± ( • ) являются полунепрерывными сверху и вогнутыми

на .

± з .

Рассмотрим систему величин

= Д*) = тах± «1± + , 3 = 1, А; + 1. (4.26)

7 еС±

и положим

Обозначим

D = max max ЦД^оЦ (4,27)

rf(e) = r{jj,e)\J(1 + D2)/l2(rj±o)-i) £ > 0> j =T/k, (4.28)

где r(-) — функция из (1.15).

Рассмотрим следующие стратегии управления UAfc(•) и формирования помехи VAk(•), которые в моменты времени Tj разбиения Ak определяются методом экстремального сдвига на сопутствующие точки, выбираемые по величинам e+ (•) (1.11):

UAfc(TjG argmin(sju)(x,p(^),e), Bjfo)u),

«eP

VAfc(Tje argmax(sjv)(x,p(^), e), Cj(Tj)v), (4.29)

j = i,fc, xer, p(-)eV, £>o,

а в остальные моменты времени доопределяются произвольным образом. Здесь

где w+(^) — редуцированный информационный образ (4.7),

з

z(«)(x,p(^),e),/J(u)(x,p(^),e^ G axgmin(e+ (z+) + /).

^pO,^,/ Ч^рО,^) G axgmax(e+(z+) + f).

(4.30)

Минимум и максимум в (4.30) берутся по всем парам (г+, /) е К 3 х К, удовлетворяющим условию

К(*,р(-)) — 2++|2 + /2 ^ (г+)2(в). (4.31)

В согласии с соотношениями (1.14) и (1.15), учитывая вид функции е+(-) (4.26) и опираясь па теорему о минимаксе [74], можно показать, что искомые векторы б'«(■) и б'^-) могут быть найдены исходя из соотношений

вУ(х,р(-),е) = 8М(я. р(.)>е) = _ г] < -)1/I,.,*■). )

1 + \\\{;\х,р(-),е)Г V 1 + ||^(х,р(-),в)||2'

15и)(х,р(-),е) G argmax((l+ w+(x,p(-))) + #(1+) - r+(e)J 1 + Ц1+Ц2),

i+eG+ v 7

3 3

\{;\х,р(-),е) e argmax((l+ w+(x,p(-))) + #(1+) + r+(e)+

l+eG+

Имеют место следующие теоремы.

Теорема 4.1. Для, любого числа £ > 0 можно указать такое число 5 > 0, что, каковы бы ни были, начальная, позиция (г0, я0,р0(-)) е X и разбиение Дк вида (2.3), (2.28) с диаметром 5к ^ 5, будет справедливо неравенство

|е-(™-(ж0,Р0(-))) — г«(г0,х0,Р0(-))| ^ ^ (4.32)

где Г«(■) — величина, оптимального гарантированного результата (2.5), w-(•) — редуцированный информационный образ (4.7).

Теорема 4,2, Для любого числа ( > 0 найдутся такие число е * > 0 и функция (е) > 0, е € (0,е*], что, каковы бы ни были начальная позиция (¿0,я0,р0( • )) € К, значение параметра, точности е € (0,е *] и разбиение Ак вида (2.3), (2.28) с диаметром

^ (е), законы управл,ения {^д( • ),е, Ак} и формирования помехи ( • ),е, Ак} будут (-оптимальными.

Обоснованию этих теорем посвящены разделы 4,3-4,5, §4.3. Связь между процедурами

Установим связь между процедурами (3.64)-(3.68) и (4.17)-(4.25).

Утверждение 4,1, Пусть Ак = Ак{т^} — разбиение вида, (2.3), (2.28) и для, каждого ] = 1, к + 1 множества Ь^ и функции Ф^(-) определены в согласии с соотношениями (3.64)-(3.68), а множества и функции •) — в согласии с (4.17)-(4.25). Тогда, имеют место равенства,

= = + (4-33)

= тах^^о)]^^ !± е с± ^ = 1, /с + 1. (4.34)

Здесь

р±(1±) = П (5±)-1 (1±), где ($±)-1(1±) — прообраз вектора 1± при отображении ( • ) (4.16).

Доказательство. При ] = к + 1 справедливость равенств (4,33) и (4,34) следует непосредственно из соотношений (3,65) и (4,18), Далее, предположим, что равенства (4,33) и (4,34) доказаны для ] = д + 1, д = 1,к, и докажем их для ] = д. В силу соотношений (3,66) и (4,19) получаем

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= ^<7+1 = = (4,35)

Положим Л = + 0). Отметим, что с учетом соотношений (3,64), (4,15) и (4,17) при ] = д имеет место равенство

АФд(1^1) = А^(5+ (1^)), € Е^11. (4.36)

Обозначим функции, стоящие в равенствах (4,34) при ] = д справа, через Ф± ( • ). Зафиксируем вектор 1+ € С+. Опираясь па соотношения (3,42) и (4,19), выберем числа

А(-г-) € [0,1] и векторы € С+, г = 1,(1+ + 1, так, чтобы выполнялись равенства

¿++1 ¿++1 +1 ^+(1+) = X А(гЧ(1+М), £ А(г) = 1, £ А(г)1+(г) = 1+. (4.37)

Г=1 Г=1 Г=1

Для каждого г = 1,(1+ + 1, используя равенство (4.34) при ] = д + 1, выберем вектор 1(г) € (1+(г)) = Р+(1+(г)) исходя из условия

ад(1+(г)) = Ф-+1(1(г)). (4.38)

Отметим, что для удобства записи в обозначении 1(г) опущен верхний индекс [Лй]. Имеем

¿++1

= ^ А(г)1(г) € Р+(1+),

Г=1

откуда, опираясь на равенства (4,36)-(4,38), с учетом соотношений (3,43), (3,66) и вогнутости функции Ф+(-) получаем

<(!+) = Ё А(г)Фд(1(Г)) ^ ф+(1['1]) ^ Ф +(!+)- (4-39)

Г=1

С другой стороны, выберем вектор 1м € ^+(1+) из условия

Ф+ (1+) = Ф+ (1['1])- (4-40)

Учитывая соотношения (3,42) и (3,66), выберем числа А(г) € [0,1] и векторы 1(г) € г = 1, + 1, так, чтобы выполнялись равенства

Ф+ (1М) = Е А(г)Ф,(1(г)), ^ А(г) = 1, ^ А(г)1(г) = 1[Ч (4.41)

Г=1 Г=1 Г=1

Имеем

+1

1+<г> = £+(1(г>) е г = 1, с1М + 1, ^ = 1+

Г=1

Опираясь на соотношения (4,40) и (4,41) и принимая во внимание равенства (4,34) для ] = д + 1 и (4,36), а также неравенство (3,43), соотношение (4,19) и вогнутость функции <£+(•), заключаем

+1

Ф+(1+) = Е А(г)Ф9(1(Г)) ^ Е А(г)^9(1+(г)) ^ ^+(1+ )• (4.42)

Г=1 Г=1

Из неравенств (4,39) и (4,42) выводим

(1+ ) = Ф+ (1+), 1+ € С+. (4.43)

Далее, положим = ^1(гд) и Л,2 = Л.2(тд) и в согласии с соотношениями (4,20)-(4,25) доказательство равенств

С- = ), ^-(1-) = Ф-(1-), 1- € С-, (4.44)

проведем по отдельности в каждом из следующих случаев.

Если тд = ^ и тд + т = , то справедливость равенств (4.44) следует непосредственно из соотношений (3.67), (4.20), (4.35) и (4.43).

Рассмотрим случай тд = ^ и тд + т = . Заметим, что в силу соотношений (3.67), (4.21), (4.22) и (4.35), с одной стороны, для любых векторов 1- € С-, 1+* € Мд(1-) и 1м* € ^+(1+*) имеет место включение

1М* € ^-(1-), (4.45)

а с другой стороны, каков бы ни был вектор 1[^1] € Ь-, если положить 1- = 5-(1[^1]) и 1+* = (1[^1]), то будет выполняться включение

1+* € Мд (1-). (4.46)

Справедливость первого из равенств (4,44) следует напрямую из полученных соотношений, Докажем второе равенство (4,44),

Зафиксируем вектор 1< € С- . В согласии с соотношениями (4,21) выберем вектор 1+* € Мд (1-) из условия

¥-(1-) = *>+(!+*).

Используя равенство (4,43), выберем вектор 1[^1]* € р+(1+*) так, чтобы выполнялось равенство

¥>+(1+*) = Ф+ (1"1]*).

Тогда, учитывая соотношения (3,67) и включение (4,45), получаем

(1-) = Ф-(1М *) (1-). (4-47)

С другой стороны, выберем вектор 1[^1] € р"(1-) исходя из условия

ф- (1-) = Ф-(1^1])

и положим 1+* = 5+(1[^1]). Принимая во внимание соотношения (3,67), (4,21) и (4,43), а также включение (4,46), выводим

ф-(1-) = Ф+ (1М) ^ ¥+ (1+*) ^ ¥-(1-). (4-48)

Таким образом, в рассматриваемом случае второе равенство (4,44) вытекает из неравенств (4,47) и (4,48),

Предположим теперь, что тд = и тд + т = . Доказательство равенств (4,44) проводится по аналогии с рассмотренным выше случаем. Опираясь на соотношения (3,41), (3,68), (4,23), (4,24) и (4,35), получаем, что, с одной стороны, каковы бы ни были вектор 1- = {^1,... А2-1Л} € С-, нар а (V, 1+*) € Мд (1-) и вектор 1[^1+1]* = {/£1+1,... ,/*г} € р+(1+*), для вектора 1[^1] = , v^h1+1,..., V/*} будут иметь место включения

(V, 1[^+1]*) € М[^](1[^]), 1[^1] € Р-(1-), (4.49)

а с другой стороны, для любых вектора 1[^1] € и тары (V, 1[^1+1]*) € М](1[^1]), если положить 1- = 5,г(1[^1]) и 1+* = £+(1[Л,1+1]*), будет справедливо включение

(V, 1+*) € Мд(1-). (4.50)

Первое из равенств (4.44) вытекает непосредственно из приведенных соотношений. Перейдем к доказательству второго равенства (4.44).

Зафиксируем вектор 1- = ,...,/^2-1 ,/0} € С- и, учитывая соотношения (4.23) и (4.43), выберем пару (V, 1+*) € Мд(1-) и вектор 1[^1+1]* = {/£1+1,..., } € Р+(1+*) так, чтобы выполнялись равенства

¥

д (1-) = ^+(1+*) - </Л1 > = VФ +(1["1+1]*) - (/Л1 ),

и положим 1[^1] = {/^, ^+1,..., v/N}. Тогда, учитывая соотношение (3.68) и включения (4.49), получаем

¥-(1-) ^ Ф-(1М) ^ Ф-(1-). (4-51)

С другой стороны, выберем вектор 1[^1] = {/М,...,/М} € (1-) и пару (V, 1[^1+1]*) € из условий

Ф-(1- ) = Ф- (1м) = vФ + (1[^1+1]*) - (С^ СЛ1 >

и положим 1+* = £+(1[Л,1+1]*). С опорой на соотношения (4,23) и (4,43), включение (4,50) 1

и равенство = выводим

Ф-(1-) ^ (1+*) - (^ > ^ р-(1-). (4.52)

Неравенства (4.51) и (4.52) доказывают второе равенство (4.44) в случае тд =

ИТд + Т = ^2 •

В оставшемся случае тд = и тд + т = 0^2 доказательство равенств (4.44) повторяет доказательство для случая тд = 0^ и тд + т = 0^2, только вместо соотношения (4.24) следует использовать соотношение (4.25). □

В качестве следствия из утверждения 4.1 отметим связь между системами величин (•) (3.69) и е±(•) (4.26).

Утверждение 4.2. Пусть = (т.,-} — разбиение вида, (2.3), (2.28). Тогда, системы величин Е^(-) и е^(-), = 1,к + 1, определяемые по формулам (3.69) и (4.26)

соответственно, связаны соотношениями

е?(*?) = Е±(Т?(2*)), з = 1,к + 1. (4.53)

Доказательство. Пусть ] = 1,к + 1, кг = кг{^ + 0) (3.62), г+ е и ^ = Т/~(г+). Проверим справедливость равенства

е+(7+) = (4.54)

Принимая во внимание соотношение (4.34), выберем векторы 1+ € и 1м € ^+(1+)

из условий

е+(2+) = (1+, 7+> + (1+) = (1+, 7+> + Ф+ (1М).

В силу равенства 5+(1[^1]) = 1+ и включения 1м € , с учетом того, что $+(•) — сопряженный к ?,+ (•) линейный оператор, имеем

е+ (7+) = (1м, + Ф+ (1м) ^ ). (4.55)

С другой стороны, выберем вектор 1м € из условия

£+(7М) = (1^, 7М> + Ф+(1М).

Положим 1+ = ). Тогда 1+ € и 1м € ^+(1+), откуда, вновь учитывая, что $+(•)

— сопряженный к Т+() линейный оператор, опираясь па соотношение (4.34), выводим

£+(7^) = (1+,7+) + Ф+(1М) ^ (1+, 7+) + р+(1+) ^ е+ (7++). (4.56)

Равенство (4.54) следует из соотношений (4.55) и (4.56). Равенство

е-(7-) = (7-)), 7- € ,

доказывается аналогичным образом с понятными изменениями. □

Отметим, что, каково бы ни было разбиение Д& = (т,} вида (2.3), (2.28), в силу соотношений (3.70), (4.9) и (4.53) для любой начальной позиции (¿о,яо>РоО) € К имеют место равенства

е- ^-(жо,ро())) = £- ^[1](£о,жо,роО)) = е11](w[11(íо, жо,ро())).

В итоге справедливость теоремы 4.1 вытекает непосредственно из этих равенств и теоремы 3.2.

§ 4.4. Вспомогательные утверждения

Прежде чем переходить к доказательству теоремы 4,2, докажем ряд вспомогательных утверждений.

Лемма 4,3, Для любого числа £ > 0 найдется чиело 5 > 0, для, которого будет справедливо следующее утверждение.

Пусть Дд = Дд(т,} — разбиение вида, (2.3), (2.28) с диаметром 5д ^ 5. Пусть ] = 1,к, (т.,-,ж*,р*(-)) € X, € , € Е, и выполняется неравенство

НЛ2 + /Д ^ (г+)2(£), = ^+(ж*■ )) - г,-*. (4.57)

Пусть движение х[т, [■ ]т,+1] системы, (2.1) порождено из позиции (т,, х*,р*(■ )) допустимой реализацией помехи г>[т, [■ ]т?-+1) и постоянной реализацией управления и[т, [■ ]т?+1) = = (и(£) = ие, т, ^ £ < т?+1}, где

ие € а^тт(Б,*, В,(т,)и). (4.58)

«еР

Пусть движение г, [т, [■ ]т,+1] г,-системы (4.10) порождено из позиции (т,, г,*) допустимой реализацией управления и* [т, [ ■ ]т?+1) и постоянной реализацией помехи V* [т, [ ■ ]т?+1) = = (^*(£) = V е, т, ^ £ < т,+1}, где

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

< € а^тах(э, *, С,(т,)г>*). (4.59)

V* е^

Тогда, имеет место неравенство

К-+1(я(т,+1),и^+1 ( ■ )) - г,(т,+1)Н2 + /* ^ (г"+1)2(£). (4.60)

Здесь величины, г+(£) и г-+1(£) определяются, в согласии, с (4.28).

Доказательство. В соответствии с соотношениями (1,17)-(1,19), учитывая равенства (3.1), для каждого г = 0, N при 8 > 0 определим величины

Ы1(ВД,а(-); 5), ^(ОД,^); 5), М(ВД, ОД, «(■), £(■)),

где В(£) и — матрицы-функции из (2,13) и (4,5), Обозначим

N

и(5) = £ Вг( ■ ),а(■ ); 5) + Сг( ■ ),в( ■ ); 0), 5 > 0,

г=0

N

М = £ М(Вг( ■ ),Сг( ■ ),а(■ ),в( ■ )).

г=0

£ > 0 5 > 0

16М25 ^ £, 64(1 + 0 - £о)и2(5) ^ £.

Благодаря такому выбору числа 8 с учетом равенств (3,1) для любого ] = 1 ,к для матриц-функций В,(£) и С,(£) (4,11) будет выполняться условие (1.16), а, стало быть, для г,-системы (4.10) будет справедливо утверждение леммы 1.3.

Рассмотрим вспомогательное движение г, [т, [ ■ ]т,+1] г,-системы, порожденное из позиции (т,, w+(ж *,р *( ■ ))) реализациями управления и[т,[ ■ ]т,+1) и помехи г>[т,[ ■ ]т,+1), определяющими движение х[т,[ ■ ]т,+1]. Положим = (т, + 0) (3.62) и Л,2 = ^2(т, + 0) (4.1)

и для каждого г = Н\, — 1 рассмотрим движение 2'г[т>'[']т}'+1] ^-системы (2,12) и движение Фо[т,[•]т,+1) ^-системы (4,4), отвечающие движению Ф,[т,[•]т?+1].

В согласии с леммами 2,2 и 4,1, учитывая соотношения (2,11) и неравенства т,+1 ^ 0», г = Н\, 1г2 — 1, имеем

^СГН-!) = ^(г?+ьж(г?+1),Мг,+1(-))> « = - 1, фо(т,+1) = ^о(т,+1,х(т,+1),ит,+1 О) ,

откуда получаем

(т,+1) = ^"+1(х(т,+1),ит,+1 О). (4-61)

Принимая во внимание равенства (3,1), применяя лемму 1,3 к движениям Ф, [т, [•]т,+1] и 7,[т,[•]т,+1] при Я = (1 + Д2)^2-1, где постоянная Д определяется в согласии с (4,27), выводим оценку

||Ф,(т,+1) - (т,+1)||2 + /2* ^ (г"+1)2(в). (4.62)

Неравенство (4.60) следует из соотношений (4.61) и (4.62). □

Лемма 4.4. Для, любого числа £ > 0 найдется число 5 > 0, для, которого будет справедливо следующее утверждение.

Пусть Д^ = (т,} — разбиение вида, (2.3), (2.28) с диаметр ом, ^ 5. Пусть ] = 1,к, (т,, х*,р*()) € К, 7,* € , /* € К, и выполняется неравенство (4.57) при б,* = = 7,* — w+(x*,p*(•))• Пусть движение х[т,[•]т,+1] системы (2.1) порождено из позиции (т,, х*,р*()) допустимой реализацией управления и[т,[•]т?+1) и постоянной реализацией помехи ^[т,[•]т?+1) = = Vе, т, ^ £ < т,+1}, где

Vе € а^тах(Б,*, С, (т, )г>).

Пусть движение 7,[т,[•]т,+1] 7,-системы (4.10) порождено из позиции (т,, 7,*) допустимой реализацией помехи V* [т, [•]т,+1) и постоянной реализацией управления и* [т, [•]т?+1) = = (и*(*) = и*, т, ^ £ < т?-+1}, где

и* € а^тт(Б,*, В,(т,)и*).

Тогда, имеет место неравенство (4.60).

Доказательство. Доказательство леммы повторяет с понятными изменениями доказательство леммы 4.3. □

Далее, пусть Ак = — разбиение вида (2.3), (2.28) и на базе этого разбиения

определена система величин е^(-), ] = 1, к + 1, (4.26). Следующие две леммы устанавливают свойства и- и ^-стабильности этой системы величин относительно вспомогательных 7,-спстем (4.10).

Лемма 4.5. Пусть ] = 1, к, 7,* € К и V* € Тогда, для постоянной реализации помехи ^*[т,[•]т,+1) = (^*(£) = V*, т, ^ £ < т,+1} найдется такая допустимая, реализация управления и[т,[•]т,+1), что из позиции (т,, 7,*) под действием этих реализаций 7,-система (4.10) перейдет в позицию (т,+1,7,(т,+1)), для, которой будет выполнено неравенство

е-+1(7,(т,+1)) ^ е+ (7,*). (463)

Доказательство. Положим = (т, + 0) (3,62) и

г^ = Т,+ (г, *), (4.64)

где линейный оператор Т,+ ( ■ ) определяется в согласии с соотношением (4.8). Используя с учетом равенств (3.1) свойство «-стабильности (см, лемму 1.1) системы величин еМ( ■ ) (3.36) по отношению к вспомогательной г^1]-еиетеме (3.9), выберем реализацию управления и[т,[ ■ ]т,+1) так, чтобы для движения г^^т,[ ■ ]т,+1] этой системы, порожденного из позиции (т,, г ) реализациями и[т, [■ ]т,+1^ V*[т, [■ ]т,+1), выполнялось неравенство

е'/+1(г^(т,+1)) ^ е^(г[Н).

Принимая во внимание соотношения (3.70), имеем

£Я1(гМ(т,+1)) ^ Е+(г[^1]). (4.65)

Опираясь на лемму 4.2, получаем, что для движения г,[т,[■ ]т,+1] г,-еиетемы (4.10), порожденного из позиции (т,, г,*) этими ж реализациями и[т, [ ■ ]т,+0 и V* [т, [ ■ ]т,+1), будет справедливо равенство

г^(т,+1)= Т+1(г,- (т,+1)). (4.66)

Из неравенства (4.65), используя соотношения (4.53), (4.64) и (4.66), выводим требуемое неравенство (4.63). Лемма доказана. □

Лемма 4.6. Пусть ] = 1, к, г, * € К и и * € Р. Тогда, для постоянной реализации управления и *[т,[ ■ ]т,+1) = (и *(£) = и *, т, ^ £ < т,+1} найдется такая допустимая, реализация помехи v[тj• [ ■ ]т,+1), что из позиции (т,, г, *) под действием этих реализаций г,-система (4.10) перейдет в позицию (т,+1, г,(т,+1)), для, которой будет выполнено неравенство

е-+1(г,(т,+1)) ^ е+(г,*). Доказательство. Доказательство леммы проводится по схеме доказательства леммы 4.5 и опирается па свойство (лемма 1.2) системы величин е,г] ( ■ ) (3.36) по от-

ношению к а ; -снск'ме (3.9), г = 1, N. □

Отметим еще одно свойство системы величин е± ( ■ ).

Лемма 4.7. Пусть ] = 1, к + 1, = ^1(т,) (3.62), Л,2 = Л-2(т,) (4.1), и

г- = (2^1,...,2^-1,20} €

а;

Тогда, имеют место следующие соотношения: если, т, = 0и1 и т, + т = 0^2, то

е- (г-) = е+ (г-); (4.67)

если, т, = 0ь1 и т, + т = 0^2, то

е-(г-) = ,... 2о,2о}); (4.68)

если, т, = 0ь1 и т, + т = 0^2, то

е-(г-) = (2^ - с^, е+ ((2^+1,..., 2^_Ь2о})); (4.69)

если, т, = 0ь1 и т, + т = 0^2, то

е-(г-) = (2^1 - сЛ1 ,е+((2Л1+1,... 2о,2о})). (4.70)

Здесь ( ■ ) — норма из (3.2).

Доказательство. Справедливость леммы вытекает непосредственно из следствия 3.2 и соотношений (4.53), если принять во внимание определение (4.8) операторов Т^(-). □

§ 4.5. Доказательство теоремы 4.2

Определим константы ^Вв соответствии с соотношениями (3,23) и (4,27), а функцию г(•) — в соответствии с (1.15). По числу С > 0 выберем число е(1) > 0 так, чтобы для любых векторов г[1] = |г1,..., } € и 2[1] = {21,..., } € , удовлетворяющих условию

выполнялось неравенство

1^1(г[1]) - ^1(2[11)| ^ С/4,

(2)

а число е* > 0 определим по числу ( из условия

хИ-1г(0,42))л/(ГТ1^р ^ с/4.

Положим

е* = ш1п{е(1),е12)}. (4.71)

По числу £ = С/2 выберем число

>0

е € (0, е*] определим чиела $(2) = $(2)(е) > 0 и $(3) = $(3)(е) > 0 так, чтобы выполнялись утверждения лемм 4.3 и 4.4 соответственно. Положим

(е) = ш1п{£(1),£(2)(е),^3)(е)}, е € (0,е*]. (4.72)

Покажем, что указанные число е* и функция (•) удовлетворяют утверждению доказываемой теоремы.

Пусть (¿о,£о,ро(-)) € К, е € (0,е*] и Дк = Дк{т,} — разбиение вида (2.3), (2.28) с диаметром ^ $*(е). Пусть ж[£0 [•]-$] — движение системы (2.1), порожденное из начальной позиции (¿0,я0,р0(0) законом управления {Цдк(),е, Дк} на базе стратегии Цдк(•) (4.29) в паре с некоторой допустимой реализацией помехи г[£0[•]$). Пусть м[£0[•]$) — соответствующая реализация управления.

В согласии с соотношениями (4.7) и (4.30) обозначим

^ = ,

Пусть ] = 1,/с. Положим б.,* = (х{ту), ит. (•),£) = — и определим € <5 из условия (4.59). Для позиции (т,, г(и)) и постоянной реализации помехи г*[т, [•]т?+1) = = {г*(£) = г>е, т, ^ £ < т,+1} подберем допустимую реализацию управления «[т,[•]т?+1) в согласии с леммой 4.5. Рассмотрим движение г,[т, [•]т?+1] г^-системы (4.10), порожден

ное из позиции (т,, ) под действием этих реализаций и*[т, [•]т,+1^ и г*[т, [•]т?+1). По

лемме 4.5 получаем

(т,+1)) ^ в/,), (4.73)

а в силу леммы 4.3, учитывая соотношения (4.29), (4.31) и (4.58) и выбор (4.72) функции $*(•), имеем

К-+1 - г,(т,+1)|2 + (/]и))2 ^ (г-+1)2(е). (4.74)

Ниже в доказательстве будут использоваться отдельные компоненты векторов w-+1 и г, (т,+1), поэтому введем для них специальные обозначения:

^+1 = \ШЛ1(т,.+1), . . . ,адЛ2(гл.+1 )-1,ад0 /, (т, + 1) = 1г^1(г^+1), . . . ,%2(т,+1)-1'г0 /.

Отметим, что в силу неравенства (4,74) имеют место соотношения

,(j+1) Jj+i) I

' - zf ' || ^ r-+i(e), i = hi(r,+i),..., h2(Tj+1) - 1,

(j+1) Ji+1)|| / ^ !«•(«)

Iw0 - z0

^ r-+1(e), j| ^ r-+1(e).

(4.75)

Определим индексы i = 2, N + 1, в согласии с (3,25) и положим

^ = ¡ii{z^+ ]) - Did,... - Dncn), г = 1, N,

u;3 = (N + 1 - ^(r,- + 0))aw-^+°)rfc-+1(e), j = ТД.

Опираясь па соотношения (4,73)-(4,75), покажем по индукции, что для любого j = 1, к справедливо неравенство

e+(z$u)) + j ^ ^ +0) - W. (4.76)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В случае j = k, учитывая равенства (3.70) и (4.53), а также равенство (1.12) для вспомогательной дифференциальной игры (3.9), (3.11) при i = N и системы величин ejN]( ■ ) (3.36), имеем

e-+1(zfc (rfc+1)) = E-+1(z(k+1)) = efc+1(z(v+1)) = ,

откуда выводим

e+ (zkU)) + /u) ^ e-+1(zfc(rfc+1)) + fkU) ^ - W.

Далее, предположим, что неравенство (4.76) верно для ] = д, д = 2, к, и докажем его для = д-1. Положим = (тд) (3,62) и^2 = Л,2(тд) (4.1) и в согласии с соотношениями (4,20)-(4,25) доказательство неравенства (4.76) при = д - 1 проведем по отдельности в каждом из следующих случаев. Если тд = 0^ и тд + т = 0^2, то

4+ = ^ г+(£) =

а следовательно, справедливо неравенство

К - г^т,)Н2 + (/Д)2 ^ (г+)2(£),

из которого, используя равенство (4.67), в силу соотношений (4.30) и (4.31) и предположения индукции получаем

е+.^Л) + /¿«1 ^ е-(гд_1(тд)) + /Д =

= е+(гв_1(тв)) + /Д ^ е+(г(и)) + ^ ^ -Предположим теперь, что тд = 0^ и тд + т = 0^2. Имеем

w+ = ... Д^,«;^}, г+(е) = r^-(в)v/ГT^.

Тогда получаем

К+ - ^ . . . , 2^-1, ^2#, ^Ц2 + (/Д)2 ^ ^ Нw- - г^т,)Н2 + (/((-)1)2 + Р2^ - ^Ц2 ^ (г+)2(£).

Принимая во внимание соотношения (4,68), (4,30) и (4,31), а также неравенство (4,76) для ] = д, выводим

е+^гй) + /Д ^ е^-^)) + =

= е+ (^..., 2^1, ^209), 209)}) + /Д ^ е+(г<и)) + /Д ^ /^ - Ч^. Далее, пусть тд = 0(1 и тд + т = 0(2. Тогда имеем

4+ = ( ™л?+1,..., 1, ™09)}, (£) = (£),

а значит, справедливы неравенства

К ад^,...^-^}!! ^ Нw- - гд-1(тд)Н ^ г+(£),

с учетом которых, принимая во внимание соотношения (4,30) и (4,31) и предположение индукции, получаем

е+ ((2Й)+1,..., 2^-1, 209)}) ^ е+(г(и)) + /Д ^ - и.

В итоге, используя равенство (4,69), свойства нормы ( ■ ) (3,2) и соотношение (3,3), выводим

е+^гД) + /Д ^ е^г^)) + /Д = = ^ (2Й) - с(1, е+((2^+1,..., 2<Д, 209)})) + /Д ^

^ /(1 - (0, и) + / ^ - и-ь

В оставшемся случае тд = 0(1 и тд + т = 0(2 имеем

= {<+1>.. •, А^иЛ, г+(е) =

Тогда получаем

К+ -(2(1+1,..., 2(2-1, ^^ }Н2 ^ ^ к- - г^)Н2 + П2^ - ^Н2 ^ (г++)2(£), откуда, с опорой па соотношения (4,30) и (4,31) и неравенство (4,76) для ] = д, выводим

е+((2 (?) 2 (?) П 2 (?) Г(?) }) > е+(г («)) + / («) > /, и

ед ((2(1 + 1, . . . , П(220 , 20 }) ^ ед (гд М + / ^ ^1+1 - .

Учитывая равенство (4,70), вновь используя свойства нормы ( ■ ) (3,2) и соотношение (3,3), заключаем

е+адДМ /Д ^ еадад)) + /Д

^ ^ - П(1 с(1, е+ ((2(1+1,..., 2(д2-1, П(120д), 20д)}^ +

+ /Д ^ /(1 - (0, ) + /Д ^ /(1 -

Таким образом, неравенство (4,76) доказано для ] = д - 1.

Опираясь на соотношения (4,30) и (4,31) и неравенство (4,76) при ] = 1, принимая

£* ,

е+^+) ^ е+ (г1и)) + /1« ^ /1 - и ^ /1 - С/4. (4.77)

Далее, в еоглаеии с соотношением (2,10) получаем

= = г = СТ,

а значит, в соответствии с неравенствами (4,75) справедлива оценка

_ Огх(т ^ г~[г+1](£), г = МУ,

из которой, с учетом выбора (4,71) числа е*, заключаем, что для значения 7 = 7(я[£0[•] показателя качества (3,4), реализовавшегося па рассматриваемом движении я[£0 [•]$], имеет место неравенство

1^1 - 7| ^ С/4. (4.78)

Из соотношений (4,77) и (4,78), если принять во внимание неравенство (4,32) при £ = С/2 и справедливое в силу леммы 47 и соотношения (4,7) равенство е-^-) = е+^+), выводим оценку

7 ^ ги(¿0,х0,Р0(-)) + С

которая завершает доказательство С-оптимадьноети закона управления {Цдк(),е, Дк}.

Аналогичным образом с попятными изменениями устанавливается ^-оптимальность закона формирования помехи 0,е, Дк} на основе стратегии (•) (4,29), при этом вместо лемм 4,3 и 4,5 используются соответственно леммы 4,4 и 4,6, Теорема 4,2 доказана.

Таким образом, в согласии с теоремами 4,1 и 4,2 решение задачи оптимизации гарантии при запаздывании в управлении и позиционном показателе качества (2,1), (3,4) сводится к определению в соответствии с редуцированной процедурой (4.17)-(4.25) множеств и выпуклых сверху оболочек вспомогательных функций ^(•). Редуцированная размерность (4,6) множеетв позволяет использовать полученные разрешающие конструкции и при численном построении требуемых выпуклых оболочек. Отметим, что в случае, когда моменты времени ^ из показателя качества (3,4) связаны

т

i)i = t0 + ir, i = l,N, (4.79)

и для каждого г = 1, N матрица I), имеет размеры (п х п), упомянутая размерность постоянна и равна 2п.

По аналогии с [62] был разработан численный метод реализации процедуры (4.17)-(4.25), основанный на «пиксельной» аппроксимации областей определения овыпукля-емых функций и приближенном построении выпуклой сверху оболочки функции как нижней огибающей конечного набора опорных гиперплоскостей к ее подграфику. По схеме из [61,63] могут быть обоснованы сходимость и устойчивость этого метода,

§4.6. Примеры

В этом разделе приведены два примера, при решении которых используется редуцированная процедура (4.17)-(4.25).

В качестве первого примера рассмотрим динамическую систему, движение которой описывается уравнением

(4.80)

dx(t)/dt = sin (n(t + 1))x(t) + (1 - 0.1 t)u(t) + 0.1tu(t - 1) + 0.8 v(t), to = 0 ^ t< 10, x G R, u G P = [-1,1], v G Q = [-1,1]. Задана начальная позиция

xo = 1, Po(£) = 0, £ e [-1,0), (4.81)

Рис. 5. Результат симулирования процесса управления в задаче (4.80)-(4.82) при действии оптимального закона управления {Цдк(•),£, Дк} и трех вариантах помех

и показатель качества

10 1/2

7 =(£ х2«) . (4.82)

г=1

Задача оптимизации гарантированного результата (4.80)-(4.82) решалась на основе описанных в разделе 4,2 конструкций, В данном примере выполняется соотношение (4,79) и размерность областей определения овыпукляемых функций равна 2. Отметим, что при использовании для решения задачи (4.80)-(4.82) разрешающей процедуры (3,64)-(3,68) соответствующая размерность менялась бы от 1 до 10.

Приведем результаты численного моделирования. При вычислениях были выбраны равномерное разбиение Дк отрезка времени [0,10] с шагом 5к = 0.005 и значение параметра точности е = 0.05. Априорно посчитанная величина оптимального гарантированного результата:

ГШ = Ги(*о,жо,роО) « 1.808.

На рисунке 5 изображены движения х^ [()[•] 10], г = 1,3, системы (4.80), порожденные из начальной позиции (4.81) законом управления {Цдк(-),е, Дк} на базе стратегии Цдк (•) (4.29) при следующих вариантах помех:

1) помеха формируется в согласии с законом {УДк0,е, Дк} на базе стратегии УДк(•) (4.29);

2) помеха формируется в согласии с законом {У(-),е, Дк}, где

У(¿,х,р(^),е) = — sgn(x), (Ь,х,р(^)) Е К, е> 0;

3) помеха отсутствует: = 0. Реализовавшиеся значения показателя качества (4.82):

7(1) « 1.791 « Ги, 7(2) ~ 1.791 « Ги, 7(3) ~ 0.03 < ГЦ,

Х2 2

1

О

-1

-2

/ /V // // / /

/ / ' л 1 \\\

У 1 1 \г

А \ > \ А \ Уч ¿Г л\ /у

- х(1) (¿) - х(2)(£) < ,—' )

х(3)(;£)

-2 -1 О 1 2 Х1

Рис. 6. Результат симулирования процесса управления в задаче (4.83)-(4.85) при действии оптимального закона управления {Цдк(•),£, Дк} и трех вариантах помех

Рассмотрим второй пример. Пусть движение динамической системы описывается дифференциальными уравнениями

(4.83)

ёл1(г)/аг = 0.1 ^(г) - ж2(*) + и^г) + (0.5 + ¿/6) и2(г - 1) + 0.2 VI(¿), = Ж1(*)+0.05 Ж2(*)+ И2(*)+0.4 ^2(¿) ,

¿0 = 0 ^ ¿< 6, х = (жьж2) е К2, и = (иьи2) е Р = {и е К2: ||и|| ^ 1}, V = е Я = {V е К2: |Н| ^ 1}.

Задана начальная позиция

хо = (1, 2), ро(£) = 0, £ е [-1, 0). (4.84)

Показатель качества имеет вид

/ \ 1/2

7 = (ж?(2)+ х2(3) + (х1(5) - 2)2 + (х1(6) - 1)2 + (х2(6) - 1)2) . (4.85)

Задача оптимизации гарантированного результата (4.83)-(4.85) решалась на основе описанных в разделе 4.2 конструкций. Приведем результаты численного моделирования. При вычислениях были выбраны равномерное разбиение Дк отрезка времени [0, 6] с шагом 5к = 0.05 и значение параметра точности е = 0.5. Априорно посчитанная величина оптимального гарантированного результата:

ГШ = Ги(^о,Хо,РоО) - 1.95.

На рисунке 6 изображены траектории движений [0[-]6], г = 1,3, системы (4.83), порожденных из начальной позиции (4.84) законом управления {Цдк (•), е, Дк} на базе стратегии Цдк(•) (4.29) при следующих вариантах помех:

1) помеха формируется в согласии с законом {V\fc(•),£, Дк} на базе стратегии V\fc(■) (4.29);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2) помеха формируется в согласии с законом {V(•),£, Ak}, где

(sgn(xi), 0),

V (t,x = (xi,x2),p(-),e) =

(0, sgn(x2)) j < (sgn(xi - 2), 0),

(0.2(a;i-l), 0.4(Ж2-1)) k у/0Л(хг - 1)2 + 0.16(ж2 - 1)2;

0 ^ t < 2, 2 < t < 3,

3 < t < 5,

5 < t < 6,

(t,x,p(-)) G K, e > 0;

3) помеха отсутствует: v(t) = 0. Реализовавшиеся значения показателя качества (4.85):

Y(1) - 1.91 - ГЦ, y(2) - 1.27 < rU, Y(3) - 1.07 < ГЦ

Список литературы

1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.

2. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981. 288 с.

3. Красовский Н.Н. Управление динамической системой. М.: Наука, 1985. 516 с.

4. Krasovskii A.N., Krasovskii N.N. Control under lack of information. Berlin etc.: Birkhauser, 1995. 322 p.

5. Subbotin A.I. Generalized solutions of first-order PDEs: the dynamical optimization perspective. Boston etc.: Birkhauser, 1995. 312 p.

6. Бердышев Ю.И., Ченцов А.Г. Оптимизация взвешенного критерия в одной задаче управления // Кибернетика. 1986. № 1. С. 59-64.

7. Бердышев Ю.И. Об одной задаче последовательной оптимизации без декомпозиции во времени // Кибернетика. 1987. № 4. С. 32-35.

8. Бердышев Ю.И. Об одной задаче последовательного сближения нелинейной управляемой системы третьего порядка с группой движущихся точек // Прикл. математика и механика. 2002. Т. 66. Вып. 5. С. 742-752.

9. Красовский А.Н. Дифференциальная игра для позиционного функционала // Докл. АН СССР. 1980. Т. 253. № 6. С. 1303-1307.

10. Красовский А.Н. О позиционном минимаксном управлении // Прикл. математика и механика. 1980. Т. 44. Вып. 4. С. 602-610.

11. Красовский А.Н. Нелинейная дифференциальная игра с интегральной платой // Диффе-ренц. уравнения. 1982. Т. 18. № 8. С. 1306-1312.

12. Красовский Н.Н., Лукоянов Н.Ю. Задача конфликтного управления с наследственной информацией // Прикл. математика и механика. 1996. Т. 60. Вып. 6. С. 885-900.

13. Kharatishvili G.L. A maximum principle in external problems with delays // Mathematical Theory on Control. New York: Academic Press, 1967. P. 26-34.

14. Halanav A. Optimal controls for systems with time lag // SIAM J. Control. 1968. Vol. 6. № 2. P. 215-234.

15. Вежбицки А. Принцип максимума для процессов с нетривиальным запаздыванием управления // Автомат, и телемех. 1970. № 10. С. 13-20.

16. Banks Н.Т., Jakobs .\!.().. Latina M.R. The synthesis of optimal controls for linear, time-optimal problems with retarded controls //J. Optim. Theor. Appl. 1971. Vol. 8. № 5. P. 319-366.

17. Klamka J. Relative controllability and minimum energy control of linear systems with distributed delays in control // IEEE Trans. Autom. Contr. 1976. Vol. 21. № 4. P. 594-595.

18. Осипов Ю.С., Пименов В.Г. К теории дифференциальных игр в системах с последействием // Прикл. математика и механика. 1978. Т. 42. Вып. 6. С. 969-977.

19. Olbrot A.W. Stabilizabilitv, detectabilitv, and spectrum assignment for linear autonomous systems with general time delays // IEEE Trans. Autom. Contr. 1978. Vol. 23. № 5. P. 887-890.

20. Artstein Z. Linear systems with delayed controls: a reduction // IEEE Trans. Autom. Contr. 1982. Vol. 27. № 4. P. 869-879.

21. Kwon W., Pearson A. Feedback stabilization of linear systems with delayed control // IEEE Trans. Autom. Contr. 1980. Vol. 25. № 2. P. 266-269.

22. Осипов Ю.С., Пименов В.Г. О позиционном управлении при последействии в управляющих силах // Прикл. математика и механика. 1981. Т. 45. Вып. 2. С. 223-229.

23. Vinter R.B., Kwong R.H. The infinite time quadratic control problem for linear systems with state and control delays: an evolution equation approach // SIAM J. Control and Optim. 1981. Vol. 19. № 1. P. 139-153.

24. Pritchard A.J., Salamon D. The linear-quadratic control problem for retarded systems with delays in control and observation // IMA J. Math. Control k, Information. 1985. Vol. 2.

P. 335-362.

25. Пименов В.Г. Дифференциальная игра с фиксированным временем окончания для систем с последействием в управлении // Задачи позиционного моделирования. Свердловск, 1986. С. 103-118.

26. Delfour М.С., Karrakchou J. State space theory of linear time invariant systems with delays in state, control, and observation variables, I; II // J. Math. Anal. Appl. 1987. Vol. 125. № 2. P. 361-399; P. 400-450.

27. Pandolfi L. Dynamic stabilization of systems with input delays // Automatica. 1991. Vol. 27. № 6. P. 1047-1050.

28. Mirkin L., Tadmor G. Hcontrol of system with I/O delay: a review of some problem-oriented methods // IMA J. Math. Control & Information. 2002. Vol. 19. P. 185-199.

29. Federico S., Tacconi E. Dynamic programming for optimal control problems with delays in the control variable // SIAM J. Control Optim. 2014. Vol. 52. № 2. P. 1203-1236.

30. Fleming W.H. The convergence problem for differential games //J. Math. Anal. Appl. 1961. № 3. P. 102-116.

31. Понтрягин Л.С. О линейных дифференциальных играх, 1; 2. // Докл. АН СССР. 1967. Т. 174. № 6. С. 1278-1280; Т. 175. № 4. С. 764-766.

32. Пшеничный Б.Н. Структура дифференциальных игр // Докл. АН СССР. 1969. Т. 184. № 2. С. 285-187.

33. Пшеничный Б.Н., Сагайдак М.И. О дифференциальных играх с фиксированным временем // Кибернетика. 1970. № 2. С. 54-63.

34. Friedman A. Differential games. New York: Wiley Interscience, 1971. 368 p.

35. Понтрягин Л.С. Линейные дифференциальные игры преследования // Мат. сб. 1980. Т. 112. № 3. С. 307-330.

36. Ушаков В.Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения // Изв. АН СССР. Техн. кибернетика. 1980. № 4. С. 29-36.

37. Исакова Е.А., Логунова Г.В., Пацко B.C. Построение стабильных мостов в линейной дифференциальной игре с фиксированным моментом окончания // Алгоритмы и программы решения линейных дифференциальных игр. Свердловск: УНЦ АН СССР, 1984. С. 127-158.

38. Григоренко H.Л., Киселев Ю.Н., Лагунова Н.В., Силин Д.Б. и др. Методы решения дифференциальных игр // Математическое моделирование. М.: Изд-во МГУ, 1993. С. 296-316.

39. Пацко B.C., Турова В.Л. Численное решение дифференциальных игр на плоскости. Екатеринбург: Изд-во УрО РАН, 1995. 77 с.

40. Ушаков В.Н., Хрипунов А.П. О приближенном построении решений в игровых задачах управления // Прикл. математика и механика. 1997. Т. 61. Вып. 3. С. 413-421.

41. Половинкин Е.С., Иванов Г.Е., Балашов М.В., Константинов Р.В., Хорев A.B. Об одном алгоритме численного решения линейных дифференциальных игр // Мат. сб. 2001. Т. 192. № 10. С. 95-122.

42. Kumkov S.S., Patsko V.S. Construction of singular surfaces in linear differential games // Annals of the Intern. Soc. of Dynamic Games: Adv. in Dynamic Games and Applications. 2001. Vol. 6. P. 185-202.

43. Михалев Д.К., Ушаков В.И. О двух алгоритмах приближенного построения множества позиционного поглощения в игровой задаче сближения // Автомат, и телемех. 2007. № 11. С. 178-194.

44. Двуреченский П.Е., Иванов Г.Е. Алгоритмы вычисления операторов Минковского и их применение в дифференциальных играх // Журн. вычисл. математики и мат. физики. 2014. Т. 54. № 2. С. 224-255.

45. Тарасьев A.M. Аппроксимационные схемы построения минимаксных решений уравнений Гамильтона-Якоби // Прикл. математика и механика. 1994. Т. 58. Вып. 2. С. 22-36.

46. Тарасьев A.M., Успенский A.A., Ушаков В.И. Аппроксимационные схемы и конечно-разностные операторы для построения обобщенных решений уравнений Гамильтона-Якоби // Изв. РАН: Техн. кибернетика. 1994. № 3. С. 173-185.

47. Bardi M., Falcone M., Soravia P. Numerical methods for pursuit-evasion games via viscosity solutions // Stochastic and Differential Games. Boston: Birkhäuser, 1999. P. 105-175.

48. Иванов Г.Е., Казеев В.А. Минимаксный алгоритм построения оптимальной стратегии управления в дифференциальной игре с липшицевой платой // Журн. вычисл. математики и мат. физики. 2011. Т. 51. № 4. С. 594-619.

49. Botkin N.D., Hoffmann К.-Н., Turova V.L. Stable numerical schemes for solving Hamilton-Jacobi-Bellman-Isaacs equations // SIAM J. Sei. Comput. 2011. Vol. 33. № 2. P. 992-1007.

50. Чепцов А.Г. Об игровой задаче сближения в заданный момент времени // Мат. сб. 1976. Т. 99. № 3. С. 394-420.

51. Чистяков C.B. К решению игровых задач преследования // Прикл. математика и механика. 1977. Т. 41. Вып. 5. С. 825-832.

52. Cardaliaguet P., Quincampoix M., Saint-Pierre P. Set-valued numerical analysis for optimal control and differential games // Stochastic and differential games. Boston: Birkhäuser, 1999. P. 177-247.

53. Красовский A.H. Построение смешанных стратегий на основе стохастических программ // Прикл. математика и механика. 1987. Т. 51. Вып. 2. С. 186-192.

54. Лукоянов Н.Ю. К вопросу вычисления цены дифференциальной игры для позиционного функционала // Прикл. математика и механика. 1998. Т. 62. Вып. 2. С. 188-198.

55. Красовский H.H., Третьяков В.Е. Стохастический программный синтез для позиционной дифференциальной игры // Докл. АН СССР. 1981. Т. 259. № 1. С. 24-27.

56. Красовский H.H., Решетова Т.Н. О программном синтезе гарантирующего управления // Проблемы управления и теории информации. 1988. Т. 17. № 6. С. 1-11.

57. Коврижных А.Ю. К задаче конфликтного управления с квазипозиционным функционалом // Тр. Института математики и механики УрО РАН. 2000. Т. 6. № 2. С. 394-412.

58. Локшин М.Д. О дифференциальных играх с интегральными ограничениями на управляющие воздействия // Дифференц. уравнения. 1992. Т. 28. № 11. С. 1952-1961.

59. Лукоянов Н.Ю. К задаче конфликтного управления при смешанных ограничениях // Прикл. математика и механика. 1995. Т. 59. Вып. 6. С. 955-964.

60. Лукоянов Н.Ю. О построении цены позиционной дифференциальной игры // Дифференц. уравнения. 2001. Т. 37. № 1. С. 18-26.

61. Гомоюнов М.И., Лукоянов Н.Ю. Об устойчивости одной процедуры решения задачи управления на минимакс позиционного функционала // Тр. Института математики и механики УрО РАН. 2014. Т. 20. № 1. С. 68-82.

62. Корнев Д.В. О численном решении позиционных дифференциальных игр с нетерминальной платой // Автомат, и телемех. 2012. № 11. С. 60-75.

63. Гомоюнов М.И., Корнев Д.В., Лукоянов Н.Ю. О численном решении задачи управления на минимакс позиционного функционала // Тр. Института математики и механики УрО РАН. 2014. Т. 20. № 3. С. 58-75.

64. Айзеке Р. Дифференциальные игры. М.: Мир, 1967. 479 с.

65. Гомоюнов М.И., Корнев Д.В. К вопросу вычисления цены дифференциальной игры в классе контрстратегий // Тр. Института математики и механики УрО РАН. 2013. Т. 19. № 1. С. 59-68.

66. Корнев Д.В., Лукоянов Н.Ю. О численном решении дифференциальных игр с нетерминальной платой в классах смешанных стратегий // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки. 2013. № 3. С. 34-48.

67. Красовский Н.Н. Некоторые задачи теории устойчивости движения. М.: Физматгиз, 1959. 211 с.

68. Гомоюнов М.И. К задаче оптимизации гарантии в системе с запаздыванием по управлению // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки. 2011. № 3. С. 21-36.

69. Гомоюнов М.И., Лукоянов Н.Ю. Оптимизация гарантии в функционально-дифференциальных системах с последействием по управлению // Прикл. математика и механика. 2012. Т. 76. Вып. 4. С. 515-525.

70. Гомоюнов М.И. Об оптимизации гарантированного результата при запаздывании в управлении // Прикл. математика и механика. 2013. Т. 77. Вып. 5. С. 643-656.

71. Gomovunov М.. Kornev D., Lukovanov N. Game theory applications to guarantee optimization in dynamical systems with control delays // International Game Theory Review. 2014. Vol. 16. № 2. 1440010 (19 p.).

72. Лукоянов Н.Ю. Об одной дифференциальной игре с интегральным критерием качества // Дифференц. уравнения. 1994. Т. 30. № 11. С. 1905-1913.

73. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974. 480 с.

74. Фань-Цзы. Теоремы о минимаксе // Бесконечные антагонистические игры. М.: Физматгиз, 1963. С. 31-39.

Поступила в редакцию 29.04.2015.

Гомоюнов Михаил Игоревич, научный сотрудник, отдел динамических систем, Институт математики и механики им. И. Н. Красовского УрО РАН, 620990, Россия, г. Екатеринбург, ул. С. Ковалевской, 16.

E-mail: [email protected] M. I. Gomoyunov

Linear-convex guarantee optimization problems with control delay

Keywords: control theory, differential games, control delay, feedback strategies. MSC: 49N35, 49N70, 49L20

A control problem under condition of disturbances is considered for a linear dynamical system with control delay. Optimized quality index is nonterminal and contains the evaluation of the system motion by a set of deviations at given instants of time from given targets. Depending on the structure of the quality index the existence of optimal control strategies in appropriate classes of feedback strategies is established. For

calculating the value of the optimal guaranteed result and finding the optimal control laws a procedure of backward construction of upper convex hulls of auxiliary functions is proposed. In the case of the positional quality index a reduction of this procedure is performed. This reduction significantly reduces the dimension of the domains of covexified functions. Results of numerical simulations are given.

REFERENCES

1. Krasovskii N.N., Subbotin A.I. Game-theoretical control problems, New York: Springer, 1987, 517 p.

2. Subbotin A.I., Chentsov A.G. Optimizatsiya garantii v zadachakh upravleniya (Guarantee optimization in control problems), Moscow: Nauka, 1981, 288 p.

3. Krasovskii N.N. Upravlenie dinamicheskoi sistemoi (Control of a dynamic system), Moscow: Nauka, 1985, 516 p.

4. Krasovskii A.N., Krasovskii N.N. Control under lack of information, Berlin etc.: Birkhauser, 1995, 322 p.

5. Subbotin A.I. Generalized solutions of first-order PDEs: the dynamical optimization perspective, Boston etc.: Birkhauser, 1995, 312 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Berdyshev Yu.I., Chentsov A.G. Optimization of a weighted criterion function in one control problem, Cybernetics, 1986, vol. 22, no. 1, pp. 67-74.

7. Berdyshev Yu.I. Problem of successive optimization without time decomposition, Cybernetics, 1987, vol. 23, no. 4, pp. 474-479.

8. Berdyshev Yu.I. A problem of the sequential approach to a group of moving points by a third-order non-linear control system, J. Appl. Math. Mech., 2002, vol. 66, no. 5, pp. 709-718.

9. Krasovskii A.N. A differential game for the positional functional, Sov. Math., Dokl., 1980, vol. 22, no. 1, pp. 251-255.

10. Krasovskii A.N. On positional minimax control, J. Appl. Math. Mech., 1980, vol. 44, no. 4, pp. 602-610.

11. Krasovskii A.N. Nonlinear differential games with integral payoffs, Differential Equations, 1982, vol. 18, no. 2, pp. 1306-1312.

12. Krasovskii N.N., Lukoyanov N.Yu. Problem of conflict control with hereditary information, J. Appl. Math. Mech., 1996, vol. 60, no. 6, pp. 869-882.

13. Kharatishvili G.L. A maximum principle in external problems with delays, Mathematical Theory on Control, New York: Academic Press, 1967, pp. 26-34.

14. Halanay A. Optimal controls for systems with time lag, SIAM J. Control, 1968, vol. 6, no. 2, pp. 215-234.

15. Verzhbitski A. Principle of maximum for processes with non-trivial delay of control, Avtomat. i Telemekh., 1970, no. 10, pp. 13-20 (in Russian).

16. Banks H.T., Jakobs M.Q., Latina M.R. The synthesis of optimal controls for linear, time-optimal problems with retarded controls, J. Optim. Theor. Appl., 1971, vol. 8, no. 5, pp. 319-366.

17. Klamka J. Relative controllability and minimum energy control of linear systems with distributed delays in control, IEEE Trans. Autom. Contr., 1976, vol. 21, no. 4, pp. 594-595.

18. Osipov Yu.S., Pimenov V.G. On the theory of differential games in systems with aftereffect, J. Appl. Math. Mech., vol. 42, no. 6, pp. 969-977.

19. Olbrot A.W. Stabilizability, detectability, and spectrum assignment for linear autonomous systems with general time delays, IEEE Trans. Autom. Contr., 1978, vol. 23, no. 5, pp. 887-890.

20. Artstein Z. Linear systems with delayed controls: a reduction, IEEE Trans. Autom. Contr., 1982, vol. 27, no. 4, pp. 869-879.

21. Kwon W., Pearson A. Feedback stabilization of linear systems with delayed control, IEEE Trans. Autom. Contr., 1980, vol. 25, no. 2, pp. 266-269.

22. Osipov Yu.S., Pimenov V.G. On positional control under aftereffect in the controlling forces, J. Appl. Math. Mech., vol. 45, no. 2, pp. 223-229.

23. Vinter R.B., Kwong R.H. The infinite time quadratic control problem for linear systems with state and control delays: an evolution equation approach, SIAM J. Control and Optim., 1981, vol. 19, no. 1, pp. 139-153.

24. Pritchard A.J., Salamon D. The linear-quadratic control problem for retarded systems with delays in control and observation, IMA J. Math. Control & Information, 1985, vol. 2, pp. 335362.

25. Pimenov V.G. A differential game with fixed terminal time for systems with aftereffect in control, Zadachi pozitsionnogo modelirovaniya, Sverdlovsk, 1986, pp. 103-118 (in Russian).

26. Delfour M.C., Karrakchou J. State space theory of linear time invariant systems with delays in state, control, and observation variables, I; II, J. Math. Anal. Appl., 1987, vol. 125, no. 2, pp. 361-399; pp. 400-450.

27. Pandolfi L. Dynamic stabilization of systems with input delays, Automatica, 1991, vol. 27, no. 6, pp. 1047-1050.

28. Mirkin L., Tadmor G. Hœ control of system with I/O delay: a review of some problem-oriented methods, IMA J. Math. Control & Information, 2002, vol. 19, pp. 185-199.

29. Federico S., Tacconi E. Dynamic programming for optimal control problems with delays in the control variable, SIAM J. Control Optim., 2014, vol. 52, no. 2, pp. 1203-1236.

30. Fleming W.H. The convergence problem for differential games, J. Math. Anal. Appl., 1961, no. 3, pp. 102-116.

31. Pontryagin L.S. Linear differential games, 1; 2, Sov. Math., Dokl., 1967, vol. 8, pp. 769-771; pp. 910-912.

32. Pschenichnyi B.N. The structure of differential games, Sov. Math., Dokl., 1969, vol. 10, pp. 7072.

33. Pschenichnyi B.N., Sagaidak M.I. Differential games of prescribed duration, Cybernetics, 1970, vol. 6, no. 2, pp. 72-80.

34. Friedman A. Differential games, New York: Wiley Interscience, 1971, 368 p.

35. Pontryagin L.S. Linear differential games of pursuit, Mathematics of the USSR-Sbornik, 1981, vol. 40, no. 2, pp. 285-303.

36. Ushakov V.N. On the problem of constructing stable bridges in a differential game of approach and avoidance, Eng. Cybernetics, 1980, vol. 18, no. 4, pp. 16-23.

37. Isakova E.A., Logunova G.V., Patsko V.S. Computation of stable bridges for linear differential games with fixed time of termination, Algoritmy i programmy resheniya lineinykh differ-entsial'nykh igr, Sverdlovsk: Ural Scientific Center, 1984, pp. 127-158 (in Russian).

38. Grigorenko N.L., Kiselev Yu.N., Lagunova N.V., Silin D.B. et al. Solution methods for differential games, Computational Mathematics and Modeling, 1996, vol. 7, no. 1, pp. 101-116.

39. Patsko V.S., Turova V.L. Numerical .solution of two-dimensional differential games, Yekaterinburg: IMM UrO RAN, 1995. 78 p.

40. Ushakov V.N., Khripunov A.P. Approximate construction of solutions in game-theoretic control problems, J. Appl. Math. Mech., 1997, vol. 61, no. 3, pp. 401-408.

41. Polovinkin E.S., Ivanov G.E., Balashov M.V., Konstantinov R.V., Khorev A.V. An algorithm for the numerical solution of linear differential games, Sbornik: Mathematics, 2001, vol. 192, no. 10, pp. 1515-1542.

42. Kumkov S.S., Patsko V.S. Construction of singular surfaces in linear differential games, Annals of the Intern. Soc. of Dynamic Games: Adv. in Dynamic Games and Applications, 2001, vol. 6, pp. 185-202.

43. Mikhalev D.K., Ushakov V.N. Two algorithms for approximate construction of the set of positional absorption in the game problem of pursuit, Automation and Remote Control, 2007, vol. 68, no. 11, pp. 2056-2070.

44. Dvurechensky P.E., Ivanov G.E. Algorithms for computing Minkowski operators and their application in differential games, Computational Mathematics and Mathematical Physics, 2014, vol. 54, no. 2, pp. 235-264.

45. Tarasyev A.M. Approximation schemes for constructing minimax solutions of Hamilton-Jacobi equations, J. Appl. Math. Mech., 1994, vol. 58, no. 2, pp. 207-221.

46. Tarasyev A.M., Uspenskii A.A., Ushakov V.N. Approximation schemes and finite difference operators for constructing generalized solutions of the Hamilton-Jacobi equations, Journal of Computer and System Sciences Inernational, 1995, vol. 33, no. 6, pp. 127-139.

47. Bardi M., Falcone M., Soravia P. Numerical methods for pursuit-evasion games via viscosity solutions, Stochastic and Differential Games, Boston: Birkhauser, 1999, pp. 105-175.

48. Ivanov G.E., Kazeev V.A. Minimax algorithm for constructing an optimal control strategy in differential games with a lipschitz payoff, Computational Mathematics and Mathematical Physics, 2011, vol. 51, no. 4, pp. 550-574.

49. Botkin N.D., Hoffmann K.-H., Turova V.L. Stable numerical schemes for solving Hamilton-Jacobi-Bellman-Isaacs equations, SIAM J. Sci. Comput., 2011, vol. 33, no. 2, pp. 992-1007.

50. Chentsov A.G. On a game problem of converging at a given instant of time, Mathematics of the USSR-Sbornik, 1976, vol. 28, no. 3, pp. 353-376.

51. Chistyakov S.V. On solving pursuit game problems, J. Appl. Math. Mech., 1977, vol. 41, no. 5, pp. 845-852.

52. Cardaliaguet P., Quincampoix M., Saint-Pierre P. Set-valued numerical analysis for optimal control and differential games, Stochastic and differential games, Boston: Birkhauser, 1999, pp. 177-247.

53. Krasovskii A.N. Construction of mixed strategies on the basis of stochastic programs, J. Appl. Math. Mech., 1987, vol. 51, no. 2, pp. 144-149.

54. Lukoyanov N.Yu. The problem of computing the value of a differential game for a positional functional, J. Appl. Math. Mech., 1998, vol. 62, no. 2, pp. 177-186.

55. Krasovskii N.N., Tretiakov V.E. Stochastic program synthesis for a positional differential game, Dokl. Akad. Nauk SSSR, 1981, vol. 259, no. 1, pp. 24-27 (in Russian).

56. Krasovskii N.N., Reshetova T.N. On the program synthesis of a guaranteed control, Probl. Contr. Inform. Theory, 1988, vol. 17, no. 6, pp. 333-343.

57. Kovrizhnykh A.Yu. On the problem of conflict control with a quasipositional functional, Proceedings of the Steklov Institute of Mathematics, 2010, suppl. 2, pp. 79-93.

58. Lokshin M.D. Differential games with integral restrictions on the controlling actions, Differential Equations, 1992, vol. 28, no. 11, pp. 1602-1610.

59. Lukoyanov N.Yu. The problem of conflicting control with mixed constraints, J. Appl. Math. Mech., 1995, vol. 59, no. 6, pp. 911-919.

60. Lukoyanov N.Yu. How to compute the value of a positional differential game, Differential Equations, 2001, vol. 37, no. 1, pp. 17-26.

61. Gomoyunov M.I., Lukoyanov N.Yu. On the stability of a procedure for solving a minimax control problem for a positional functional, Tr. Inst. Mat. Mekh. Ural. Otd. Ross. Akad. Nauk, 2014, vol. 20, no. 1, pp. 68-82 (in Russian).

62. Kornev D.V. On numerical solution of positional differential games with nonterminal payoff, Automation and Remote Control, 2012, vol. 73, no. 11, pp. 1808-1821.

63. Gomoyunov M.I., Kornev D.V., Lukoyanov N.Yu. On the numerical solution of a minmax control problem with a positional functional, Tr. Inst. Mat. Mekh. Ural. Otd. Ross. Akad. Nauk, 2014, vol. 20, no. 3, pp. 58-75 (in Russian).

64. Isaacs R. Differential games, New York: John Wiley and Sons, Inc., 1965, 384 p. Translated under the title Differentsial'nye igry, Moscow: Mir, 1967, 479 p.

65. Gomoyunov M.I., Kornev D.V. On calculating the value of a differential game in the class of counterstrategies, Tr. Inst. Mat. Mekh. Ural. Otd. Ross. Akad. Nauk, 2013, vol. 19, no. 1, pp. 59-68 (in Russian).

66. Kornev D.V., Lukoyanov N.Yu. On numerical solution of differential games with nonterminal payoff in classes of mixed strategies, Vestn. Udmurt. Univ. Mat. Mekh. Komp'yut. Nauki, 2013, no. 3, pp. 34-48.

67. Krasovskii N.N. Nekotorye zadachi teorii ustoichivosti dvizheniya (Some problems of the theory of stability of motion), Moscow: Fizmatgiz, 1959, 211 p.

68. Gomoyunov M.I. On the problem of optimizing the guarantee in a system with delay in control, Vestn. Udmurt. Univ. Mat. Mekh. Komp'yut. Nauki, 2011, no. 3, pp. 21-36 (in Russian).

69. Gomoyunov M.I., Lukoyanov N.Yu. Guarantee optimization in functional-differential systems with a control aftereffect, J. Appl. Math. Mech., 2012, vol. 76, no. 4, pp. 369-377.

70. Gomoyunov M.I. The optimization of a guaranteed result with a delay in the control, J. Appl.

Math. Mech., 2013, vol. 77, no. 5, pp. 459-469.

71. Gomoyunov M., Kornev D., Lukoyanov N. Game theory applications to guarantee optimization in dynamical systems with control delays, International Game Theory Review, 2014, vol. 16, no. 2, 1440010 (19 p.).

72. Lukoyanov N.Yu. A differential game with integral performance criterion, Differential Equations, 1994, vol. 30, no. 11, pp. 1759-1766.

73. Ioffe A.D., Tikhomirov V.M. Teoriya ekstremal'nykh zadach (Theory of extremal problems), Moscow: Nauka, 1974, 480 p.

74. Fan K. Minimax theorems, Proc. Nat. Acad. Sci. USA, 1953, vol. 39, no. 1, pp. 42-47.

Received 29.04.2015

Gomoyunov Mikhail Igorevich, Researcher, Department of Dynamical Systems, Institute of Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, ul. S. Kovalevskoi, 16,

Yekaterinburg, 620990, Russia.

E-mail: [email protected]

Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Гомоюнов Михаил Игоревич

Похожие темы научных работ по математике , автор научной работы — Гомоюнов Михаил Игоревич

Linear-convex guarantee optimization problems with control delay

Текст научной работы на тему «Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении»