О задачах синтеза управлений по реально доступной ин формации

Куржанский А. Б.

A. Б. Куржанский

О ЗАДАЧАХ СИНТЕЗА УПРАВЛЕНИЙ ПО РЕАЛЬНО ДОСТУПНОЙ ИНФОРМАЦИИ

(кафедра системного анализа факультета ВМиК)

1. Введение. Современная теория процессов управления — сравнительно новая наука, возникшая из потребностей прикладных дисциплин и передовой инженерии. Ее создание было мотивировано задачами управления движением в пространстве и проблемами навигации, а также необходимостью конструировать разнообразные автоматические системы механической, электронной и иной природы. Позднее теория процессов управления нашла применение в исследовании медико-биологических и экологических процессов, а также экономико-математических и финансовых моделей. В настоящее время эта теория находит новые приложения, например в проектировании коммуникационных систем, изучении квантовых процессов и конструировании новых технических средств в сфере высоких технологий.

Теория процессов управления — это прежде всего наука о синтезе управлений, т.е. о построении законов позиционного (основанного на принципе обратной связи) управления динамикой систем по реально доступной текущей и априорной информации о математической модели процесса и о целях управления. Это наука о том, как построить по возможности наилучшие законы управления. Она позволяет, наконец, дать ответ на ключевой вопрос о том, насколько уровень доступной информации об исследуемой системе влияет на качество исполнения предписанных целей управления. К настоящему времени разработаны методы решения задач управления в "классических" ситуациях: теория оптимального управления, опирающаяся на принцип максимума Л. С. Понтрягина; теория игровых задач динамики Н. Н. Красовского; теория динамического программирования Р. Беллмана; вероятностная теория фильтрации А. Н. Колмогорова, Н. Винера и Р. Калмана [1-6].

Полученные "классические" результаты упомянутых авторов и их последователей охватывают системы с полной априорной и текущей информацией или со случайными возмущениями, моделируемыми при помощи вероятностных схем. Однако потребности новых высоких технологий ставят задачи, где информационные условия отличны от классических. Учет более реальных прикладных постановок привел к работам по теории синтеза управлений в условиях конфликта и неопределенности (см. [7-20]).

Решение задач синтеза управлений с учетом условий, указанных выше, и им аналогичных — центральная проблема современной теории управляемых движений. Эта проблема на сегодня чрезвычайно актуальна, но все еще недостаточно разработана, особенно в связи с тем, что задачи высоких технологий непрерывно генерируют новые нерешенные вопросы. Во-первых, реальные системы недоопре-делены, а неопределенные параметры часто не допускают вероятностной интерпретации ввиду отсутствия статистической информации о процессе. Во-вторых, динамика системы может описываться более сложными конструкциями, нежели дифференциальные или разностные уравнения. В зависимости от условий задачи для адекватного описания процессов уместно использовать системы с многозначной, переключающейся или так называемой гибридной динамикой и логически управляемыми узлами, не привлекавшиеся ранее. В-третьих, траектории систем могут быть подчинены сложным фазовым ограничениям. Например, в задаче автоматизации воздушного и наземного (надводного) движения необходимо гарантировать нестолкновение движущегося объекта с другими подобными ему при неполной информации о последних. В-четвертых, текущая информация о процессе может быть искажена возмущениями различной природы, например комбинациями случайных помех с неопределенностями, моделируемыми при помощи многозначных функций; коммуникационными возмущениями, возникающими вследствие ошибок кодирования-декодирования при передаче результатов измерений; запаздыванием или потерей информационных пакетов при использовании компьютерных сетей и т.д. Далее, решения задач желательно доводить до конца, т.е. до уровня алгоритмов и создания программного обеспечения, включающего элементы компьютерно-графической анимации.

Современные задачи синтеза управлений приводят к новым направлениям в аналитической динамике и динамической оптимизации, теории дифференциальных уравнений и дифференциальных включений, в задачах идентификации и оценивания параметров управляемых движений при неопределенности, в вычислительной математике и механике и т.д.

В настоящей статье дается краткое описание тематики, сконцентрированной на кафедре системного анализа факультета ВМиК МГУ и сотрудничающего с ней научного коллектива отдела оптимального управления Института математики и механики УРО РАН. Ввиду ограниченности объема текст статьи, за исключением последнего раздела, не содержит формул. Этот недостаток отчасти компенсируется библиографией, содержащей математические результаты. В заключении статьи приведено обсуждение вариационных неравенств, возникающих при изучении обсуждаемых задач, как пример разрешающих соотношений в системах с полной информацией и как введение в последующие исследования более сложных процессов.

2. Задачи и результаты. Обсуждаемая тематика заключается в систематическом исследовании перечисленных выше нерешенных задач. Сюда входят ключевые задачи синтеза управления в реальных ситуациях — более сложных, нежели классические. Подобные задачи могут сопровождаться требованиями оптимизации некоторых критериев качества синтезируемого процесса, но могут и не сопровождаться такими критериями. Важно подчеркнуть, что в обоих случаях постановку задачи удается, как правило, сформулировать в виде оптимизационной, допускающей описание в терминах гамилътонова формализма.

Примером подобной задачи является построение в прямом и попятном времени областей достижимости нелинейной системы с ограниченными управлениями. Искомые области в общем случае могут быть невыпуклыми и даже несвязными. Несмотря на это, они оказываются представимыми в виде множеств уровня адекватно подобранных функций цены — решений соответствующего уравнения в частных производных типа Гамильтона-Якоби-Беллмана (ГЯБ). Интерес к подобным задачам заметно возрос в последние годы, особенно в связи с потребностью вычислять области достижимости для сложных гибридных систем, сочетающих непрерывные модули с дискретными. Общие схемы вычисления подобных областей приведены в работах [11, 21, 22]. Для линейных систем вычисление областей достижимости при разнообразных ограничениях на управления (когда эти области выпуклы) реализуется при помощи эллипсоидальных или полиэдральных аппроксимаций, о чем будет сказано ниже [23-27].

Особый интерес представляют задачи о достижимости при неопределенности, в которых требуется описать множество состояний, достижимых точно или приближенно, невзирая на неопределенности в системе. Подобные неопределенности могут быть вызваны, например, наличием неизвестных возмущений, информационных помех или неточным знанием параметров математической модели системы. Решение задачи о достижимости при неопределенности зависит от того, в каком классе ищется решение: в классе программных или позиционных, т.е. построенных по принципу обратной связи, управлений. Полное описание решений подобной задачи для линейных систем дано в работах [29-31]. Для линейных систем решение задачи о достижимости описывается при помощи конструкций, аналогичных альтернированному интегралу Л. С. Понтрягина [28, 29], а для нелинейных — при помощи множеств уровня решений уравнения типа Гамильтона-Якоби-Беллмана-Айзекса (ГЯБА), известных в теории дифференциальных игр [7, 10, 17]. В попятном времени знание областей достижимости (как при неопределенности, так и без нее) позволяет оценить, разрешимы ли поставленные задачи о синтезе управлений, и в положительном случае построить решение задач о синтезе целевого управления, позволяющего достичь целевого множества (невзирая на неопределенности, если таковые имеются). Последнее оказывается возможным в силу совпадения трубок достижимости и так называемых стабильных мостов Н. Н. Красовского, определяющих решение многих игровых задач динамики. Решение задач синтеза при неопределенности являет типичный пример "гарантированного" управления.

Особый раздел составляет решение задач достижимости и синтеза, когда управления и неопределенные возмущения подчинены разным типам ограничений (например, геометрическим и интегральным). В последнем случае появляются новые классы уравнений ГЯБ или ГЯБА, подлежащие исследованию [32-34].

Далее следуют задачи синтеза гарантированного управления и навигации при нестандартных фазовых ограничениях, задаваемых в виде нестационарных запретных зон, и осложнениях в виде непредсказуемых возмущений. Подобные задачи в классе программных управлений рассматривались ранее в работе [35]. Однако задачи синтеза требуют перехода к решениям, охватывающим произвольные начальные позиции, и, следовательно, к применению гамильтонова формализма в рамках обобщенного динамического программирования. Задачи с выпуклыми и невыпуклыми фазовыми ограничениями здесь представимы в виде требования оптимизации функционалов типа максимума или минимакса по

времени функций текущих координат системы. Они приводят к нестандартным задачам динамического программирования, решение которых описывается уже при помощи вариационных неравенств типа Гамильтона-Якоби [36, 37]. Их решение — новый вызов для вычислителей.

В центре внимания исследователей уже длительное время находятся задачи синтеза для систем с не полностью доступной или неточной информацией о модели, таких, как априорные и текущие значения ее параметров и ее положение в соответствующем фазовом пространстве (или "пространстве состояний"). Особо выделим задачи синтеза управления по выходу, когда оно формируется по результатам измерений с учетом неопределенных возмущений различной природы, и задачи синтеза систем управления со сложной структурой, таких, как гибридные, в том числе как системы с переключаемой динамикой и т.д. Актуальной частью современной теории управления является задача об оценивании состояния и параметров системы по результатам наблюдений в условиях неизвестных помех (возмущений). Ее решение — важный элемент конструирования стратегии синтеза управления, так как именно текущая информация о положении системы позволяет корректировать движение, "парируя" непредсказуемые возмущения и достигая тем самым предписанной цели. При этом синтезированное управляющее воздействие формируется по ходу процесса, апостериорно, по результатам полученных измерений (наблюдений).

Решение указанной задачи оценивания было получено в работах А.Н. Колмогорова и Н. Винера и далее, в удобной для теории управления рекуррентной форме, в работах Р. Калмана и др. Перечисленные исследования предполагали, что неопределенные помехи допускают вероятностное описание с известными характеристиками (как правило, гауссовыми). Точность оценки здесь определялась при помощи вероятностных критериев. Эти исследования составили важную веху в развитии теории систем. Однако далеко не каждый класс возмущений допускает вероятностное описание упомянутого вида. Часто оказывается, что для внешних возмущений нет какого-либо статистического описания, а информация о них исчерпывается заданием лишь области их допустимых изменений. Может также оказаться, что параметры системы известны лишь с точностью до заданного множества (шара, эллипсоида, параллелотопа и т.д.). Неизвестным может оказаться и управляющее воздействие наблюдаемого объекта. В перечисленных случаях и им аналогичных была необходима иная теория так называемого минимаксного, или гарантированного, оценивания, которая позволила бы формировать стратегии управления в иных, "менее удобных" информационных условиях. Такая теория, мотивированная работой [38], была предложена сразу для непрерывных систем в докладе [39], статье [40], монографии [11] и других работах автора настоящей статьи, опубликованных в начале 70-х гг. (В англоязычной литературе аналогичные подходы были предложены в работах [41, 42].) Оценка здесь выдается в виде "информационного множества" векторов состояния системы, совместимых с полученными измерениями и априорно известными ограничениями на неопределенные возмущения. Это множество формируется по ходу процесса, апостериорно, по мере поступления наблюдений, от которых оно зависит. Для последовательного уточнения оценки был применен "прямой вариант" метода динамического программирования, основанный на формализме Гамильтона-Якоби. Таким образом, в синтезируемой системе управления по результатам наблюдений новым "состоянием системы" оказывается множество векторов (а не изолированный фазовый вектор, как в случае "незашумленных" полных измерений). Поскольку измерения, как правило, не являются полными и передаются с помехами, то теория гарантированного оценивания, разработанная в первую очередь усилиями автора и его учеников во всем мире, получила широкое развитие. Она имеет многих последователей. Ее проблематика регулярно вносится в программы основных конференций по теории управления и математической теории систем.

Теория гарантированного оценивания была разработана для линейных, билинейных и нелинейных систем общего вида (в рамках обыкновенных дифференциальных уравнений и включений), а также для систем с запаздыванием и для уравнений в частных производных. В последнем случае она позволила получить динамическую оценку в форме уравнений гарантированной фильтрации, внеся таким образом элемент динамики и рекуррентности в известные методы регуляризации обратных задач математической физики А.Н. Тихонова и методы квазиобращения Ж.-Л. Лионса [21-47].

Отдельное направление исследований в области задач оценивания составляет изучение систем с комбинированными возмущениями, в которых имеются как стохастические, так и неопределенные помехи, статистическое описание которых отсутствует. К тому же классу относятся и системы с не-доопределенной информацией о статистических характеристиках помех. Систематическое изучение различных аспектов решения подобных задач проводилось авторами работ [49-52]. Вопросам струк-

туры оценок и устойчивости алгоритмов решения задач гарантированного оценивания посвящены работы [53, 54].

Создание теории гарантированного оценивания явилось предпосылкой для построения новых оригинальных методов синтеза стратегий управления по реально доступной информации, где состояния системы представлены в виде информационных множеств, упомянутых выше. Естественным серьезным шагом в этом направлении стала формулировка принципа оптимальности при неопределенности и последующая формулировка общего принципа разделения, позволяющего сводить задачу синтеза по результатам наблюдения к суперпозиции решений задачи оценивания (конечномерной) и задачи синтеза управления в классе трубок траекторий (бесконечномерной). Решение каждой из указанных подзадач достигается путем применения вариантов формализма Гамильтона-Якоби в форме Беллмана или Беллмана-Айзекса. Основы подхода к решению задачи синтеза приведены в статьях [40, 55].

Параллельно с изучением проблемы синтеза естественной была разработка теории трубок траекторий динамических систем — методов их описания и способов управления ими. Среди них отметим использование методов динамической оптимизации для вычисления трубок достижимости систем управления и дифференциальных включений [21, 56-58].

Поскольку решения многих новых задач управления сводятся к изучению трубок траекторий, то оказалось необходимым разработать методы аппроксимации многозначных функций, изображающих указанные трубки. Это позволило проложить путь к разработке численных методов решения соответствующих задач. Было показано, что для систем с исходной линейной структурой и выпуклыми ограничениями на управления указанные аппроксимации могут быть достигнуты при помощи эллипсоидально- или полиэдральнозначных функций. Построение первых осуществляется на основе методов эллипсоидального исчисления, предложенного в монографии [23] и развитого далее в работах [22-31]. Использование эллипсоидального исчисления позволило, в частности, предложить эффективные методы построения прямых и попятных областей достижимости систем "в заданный момент времени" и "в течение заданного интервала времени", равно как и соответствующих трубок достижимости. Предложенные формулы основаны на рекуррентных схемах построения параметризованных семейств внешних и внутренних эллипсоидальных аппроксимаций упомянутых трубок. Параметризации введены так, что увеличение числа эллипсоидов этих семейств до бесконечности устремляет погрешность аппроксимации точной трубки к нулю. Аналогичная схема использована и при построении полиэдральных аппроксимаций при помощи семейств параллелотопов. Разработка алгоритмов параллельных вычислений для данного круга задач включена в соответствующую программу РАН. Среди работ по разработке элементов математических основ эллипсоидальных и полиэдральных алгоритмов отметим [59-66]. Серьезный интерес представляет поиск эффективных методов численного решения уравнений и вариационных неравенств типа ГЯБ. Этому вопросу посвящены работы [67-69].

Предложенные алгоритмы позволили создать эффективное математическое обеспечение для задач синтеза управлений и построения областей достижимости в линейных системах высокого порядка, а также программы численного решения задачи синтеза управлений при неопределенности для линейных систем. В частности, создано математическое обеспечение вычисления многозначных альтернированных интегралов Л. С. Понтрягина для систем до двенадцатого порядка. Полученные решения допускают компьютерно-графическую анимацию путем использования наборов компьютерных окон с изображениями динамики двумерных проекций вычисляемых множеств.

Перечисленные новые классы задач синтеза ставят серьезные вопросы перед вычислителями и разработчиками математического обеспечения, прежде всего в части методов численного решения вариационных неравенств и задач с многозначными разрешающими функциями (трубками траекторий). Указанные классы непрерывно пополняются новыми задачами из области быстро развивающихся высоких технологий. Отсюда видны необъятные просторы, еще не освоенные современными математическими методами.

В заключение обзора обсудим примеры задач синтеза управлений, приводящих к вариационным неравенствам.

3. Задачи управления и вариационные неравенства. Типичная задача о синтезе управлений для непрерывной системы в условиях полной информации заключается в следующем.

Дано обыкновенное дифференциальное уравнение

¿х/сИ = /(£, х, и), (1)

представляющее модель системы. Предполагается, что функция / непрерывна по совокупности переменных и удовлетворяет условиям существования и продолжаемости решений на весь интервал рассмотрения, каковыми бы ни были начальные условия и значения функции и EU. Здесь U — некоторый класс функций и = u(t, х) — "допустимых управлений", зависящих от текущей позиции {t, х} системы. Также даны ограничения на управления и на фазовые координаты системы: u(t,x) G V(t), x(t) G y(t) при t G [си,/3], где V(t), y(t) — многозначные функции со значениями во множестве компактов пространств Rm, Rn соответственно, непрерывные по Хаусдорфу.

Требуется найти функцию цены

ß /\сг

V(t,x) = mjnj J f0(t,x,u) dt + ср0(-д,х(-д)) Aipi(a, ж(ст))|

т

вдоль траекторий системы (1). Здесь (ро, <Pi — терминальные функции. Траектория стартует в момент г из точки х G intj;(i), причем а — первый момент выполнения условия х(а) G дУ(сг), где дУ(сг) — граница множества У(сг)- Тогда при а < д процесс останавливается и интегрирование заканчивается при t = а с терминальной функцией (а, х(а)). В противном случае интегрирование заканчивается в фиксированный момент ■& с терминальной функцией х(-д)).

Для того чтобы функция V(t,x) оказалась искомой функцией цены, достаточно, чтобы она удовлетворяла (в классическом или обобщенном смысле) следующему уравнению ГЯБ:

Vt + min{(K, f(t, х, и)) + f0(t, х, и)} = О

и

с граничными условиями

V(0,x) = сро(0,х), x(t) G inty(t), ie[r,0),

либо

V(a, x) = (рг(а, x), а < ■&, x(t) G int y(t), t£[T,a); x(a) G дУ(а).

Решением задачи синтеза тогда является функция позиции и0 = u°(t,x). При этом система х = f(t,x,u°(t,x)) должна иметь продолжаемое решение в каком-либо корректном смысле.

Существование классического решения указанной выше краевой задачи зависит от свойств функции цены V(t,x), определяемых свойствами /, /о, (р, сро, и ограничений V(t), y(t). Оказывается, однако, что классического решения, как правило, не существует. Указанная трудность преодолевается путем введения понятия обобщенного, "вязкостного" решения. Инициирующие идеи введения такого решения принадлежат O.A. Олейник и С.Н. Кружкову [70, 71]. В завершающей форме эти идеи были разработаны П.-Л. Лионсом, М.Г. Крэндэллом, Л. К. Эвансом [72] и в эквивалентном виде А. И. Субботиным [73]. Таким образом, центр тяжести в нахождении синтезирующего управления ложится на вычисление обобщенного решения уравнения ГЯБ.

Успешное развитие теории динамического программирования позволило сформулировать и решить ряд задач о синтезе управлений при сложных фазовых ограничениях. Решения этих задач достигаются путем рассмотрения прямых и попятных "областей достижимости".

Пусть x[t] = x(t]T,x) — фазовая траектория, выпущенная из позиции {г, ж}, х = ж [г], х G К", множество М. = {х G К" : <-Рм{х) ^ 1} есть целевое множество и многозначные функции yi(t) = {х G К" : <рч(t, х) ^ 1}, i = 1,2, определяют фазовые ограничения. Предполагается, что ip>i(t,x), 1р>м(х) удовлетворяют включениям

ie[io,0], г = 1,2, <рм{-)еФ. (2)

Класс Ф должен обеспечивать ограниченность и компактность множеств уровня (множеств Лебега) функций ip>i(t,x), 1р>м(х) в случае их непустоты.

Задача попадания-уклонения (П-У). Пусть даны интервал [т, и функции ip>i(t,x), ip>2(t,x), 1р>м(х). Требуется найти W[r] — множество всех точек ж, обеспечивающих условие

W[t] = {х G R" : {Зи(-) Ш G [г, 0] : Vl{t,x[t\) <: 1, <p2(t,x[t]) > 1, Ч>м{хЩ) ^ 1}}-

Здесь W\t\ = {ж : V3 (г, ж) ^ 1} — множество уровня функции цены

V(t, х) = min{max{max{(^i (t, x[t]), -^(i, ХШ) + 2 | t £ [r, 1?]}, </?м(ж[$])} | ж[г] = ж}.

г/ £

Это множество всех точек х таких, что существует управление, порождающее траекторию x[t] = ж(£;т, ж), выпущенную из точки х в момент г, достигающую целевого множества М. в момент t = ■& и удовлетворяющую фазовым ограничениям x[t] £ y(t), x[t] £ Z(t) Vi £ [г, Указанное W[r] можно называть множеством разрешимости задачи П-У. Иными словами, W[r] — попятная область достижимости из множества М. при указанных выше фазовых ограничениях. Укажем пути решения последней задачи.

В общем случае функция цены V может быть найдена как обобщенное решение вариационных неравенств типа ГЯБ. Укажем эти неравенства. Рассматривая V(t,x), будем при любом u(s) £ V(s), s £ [t,t + а], иметь следующие соотношения (а ^ 0):

max{max{(,oi(s, ж[й]), — (p2(s, ж[в])+2 | s £ [t, t+cr]} — V(t, ж), V(t+cr, x[t-\-a]) — V\ (t, x) \ x[t] = x} ^ 0 (3)

s

при

(Pi{t,x) iC V(t,x), -ip2{t,x) + 2<: V(t,x).

Соотношение (3) приводит к условиям (и £ V(t)):

(А) при V(t,x) (t,x), V(t,x) ф -ip2{t,x) + 2

V(t1x)+mm(Vxlf(t1x1u)) = 0-1 (4)

U

(Bi) при V(t, х) = (Pi(t, х)

max{7i(t, x, V, и), Hit, x, (pi, и)} ^ H(t, x, V, u°) = H(t, x, <¿>1, и0) = 0;

(B2) при V(t, x) = -<p2(t, x) + 2

max{7i(t, x, У, u),7i(t, x, —<¿>2 + 2, и)} ^ ж, У, и0) = ж, (pi, и0) = 0.

Граничное условие имеет вид

ж) = ж), ж) + 2, ^м(ж)}- (5)

Теорема. Решение задачи П-У определяется условием

W[t] = {ж : V{t,x) iC 1}, г<?е У (г, ж) —решение соотношений (4), (5).

Типичная ситуация состоит в том, что функция V(t, ж) недифференцируема. Тогда приведенные выше рассуждения следует проводить в терминах верхних и нижних производных Дини, заменяющих классическую производную dV/dt. Решения приведенных уравнений и неравенств следует тогда понимать в "вязкостном", или "минимаксном", смысле. Вопросы же численного решения упомянутых систем требуют дополнительного рассмотрения. Здесь обещающими представляются так называемые "методы множеств уровня" [74, 75].

Заметим, что в случае линейных систем функции V можно описать в терминах решений двойственных задач теории математического программирования. В последнем случае функции цены дифференцируемы по направлению и приведенные соотношения типа ГЯБ допускают классическую интерпретацию [36, 37].

Решение задачи синтеза. Коль скоро множества W(t) определены, решение собственно задачи о построении управлений может быть получено по схеме использования "мостов Красовского", ибо многозначная функция W[r] как раз образует такой мост.

Задача синтеза управления. Зная W, найти стратегию управления u(t, ж) (U(t, ж)), переводящую систему (1) из любой позиции {г, ж}, ж £ W(t), в позицию при следующих ограничениях:

(i) (t,x(t)) <С 1, t £ [г,0]; ^ 1;

(ii) <p2(t,x(t)) 2 1, t £ [г,0]; <рм(х(0)) ^ 1-

Каждую из стратегий u(t,x) (U(t,x)) можно искать непосредственно из соответствующих уравнений или неравенств типа ГЯБ, определяющих множества W(t). А именно, рассматривая функции V = d2(x, W(t)), можно ввести либо однозначные стратегии

u°(t, ж) G U(t, ж) = arg min{exp( — 2Xt) (Vx(t, ж), /(í, ж, и)) | и G V(t)},

A > 0, либо многозначные стратегии

U°(t, ж) =U(t, ж)

в зависимости от типа уравнения и используемого определения решения. (Здесь А — константа Липшица по {t, ж} функции /.)

Проблема в том, что предлагаемая стратегия u°(t, ж) (или U°(t, ж)) должна удовлетворять в подходящем смысле уравнению

х = f(t,x,u°(t, ж)), (6)

или дифференциальному включению

ж G f(t, ж, U°(t, ж)). (7)

В общем нелинейном случае решение уравнения (6) может быть определено в смысле [76] или как "конструктивное движение" в смысле [10]. В случае же линейных систем (f(t, ж, и) = A(t)ж + B(t)u) с выпуклыми компактными ограничениями решение U°(t, ж) может быть взято в классе многозначных стратегий и соотношение (7) будет рассматриваться как дифференциальное включение [2, 10].

4. Заключение. В последнем пункте приведены постановка и общее решение задачи синтеза управлений при ограниченных координатах, в условиях полной информации для формирования синтезированной стратегии предполагается, что фазовый вектор известен полностью и точно. Указаны вариационные неравенства, определяющие решения. Между тем в основном пункте "Задачи и результаты" отмечено, что исследования проводятся и по аналогичным задачам для систем с неполными измерениями и недоопределенными (неизвестными) параметрами. В ряде случаев такие задачи уже решены. Они упомянуты в тексте и отмечены в библиографии. Оставляем читателю представить степень трудности исследуемых и еще не решенных задач.

СПИСОК ЛИТЕРАТУРЫ

1. Понтрягин Л. С., Б о л т я н с к и й В. Г., Г ам к р е л и д зе Р.В.,Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1961.

2. Красовский H.H. Теория управления движением. М.: Наука, 1968.

3. Bellman R. Applied dynamic programming. Princeton: Univ. Press, 1957.

4. Колмогоров A. H. Экстраполяция и интерполяция стационарных случайных последовательностей // Изв. АН СССР. Сер. Математика. 1941. 5. С. 18-24.

5. Wiener N. Extrapolation, interpolation and smoothing of stationary time series. Cambridge: MIT Press, MA, 1949.

6. Kaiman R. E. A new approach to linear filtering and prediction problems // Trans ASME. 1960. 82D. P. 35-45.

7. Isaacs R. Differential games. N.Y.: John Wiley, 1965.

8. Понтрягин Л. С. К теории дифференциальных игр // УМН. 1966. 21. № 4. С. 219-274.

9. Красовский H.H. Игровые задачи о встрече движениий. М.: Наука, 1970.

10. Krasovski N.N., Subbotin A.I. Game-theoretical control problems. N.Y.: Springer-Verlag, 1988.

11. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.

12. Черноусько Ф.Л., Меликян A.A. Игровые задачи управления и поиска. М.: Наука, 1978.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

13. Polyak В.Т., Tsypkin Ya. Z. Robust identification // Automatica. 1991. 16. N 1. P. 53-63.

14. Пшеничный Б.Н., Остапенко B.B. Дифференциальные игры. Киев: Наукова думка, 1992.

15. Krasovski N. N., К г as о v s k i A. N. Feedback control under lack of information. Boston: Birkhauser, 1995.

16. Osipov Yu.S., Kryazhimski A.V. Inverse problems of ordinary differential equation: dynamic solutions. London: Gordon and Breach, 1995.

17. Basar Т., Bernhard P. H°° — optimal control and related minmax design problems. Basel: Birkhäuser, 1995.

18. James M.R., Baras J.S. Partially observed differential games, infinite-dimensional Hamelton-Jacobi-Isaacs equations and nonlinear H^ control // SIAM Jounal Control and Optimiz. 1996. 34. N 4. P. 1342-1364.

19. Helton J.W., James M. R. Extending H°° control to nonlinear systems. Philadelphia: SIAM, 1999.

20. Kurzhanski A.B. The principle of optimality in measurement feedback control for linear systems / Eds. A. Rantzer, Ch. Byrnes // Lect. Notes in Control and Inf. Sciences. Springer, 2003. 283. P. 193-202.

21. Kurzhanski А. В., F i 1 i p p о v a T. F. On the theory of trajectory tubes—a mathematical formalism for uncertain dynamics, viability and control / Ed. A. B. Kurzhanski // Advances in Nonlinear Dynamics and Control: a Report from Russia. Ser. PSCT 17. Boston: Birkhauser, 1993.

22. Kurzhanski А. В., V a r ai у a P. On reachability under uncertainty / / SIAM Journal of Control and Optimization. 2002. 41. P. 181-216.

23. Kurzhanski А.В., Valyi I. Ellipsoidal calculus for estimation and control. Boston: Birkhauser, 1997.

24. Kurzhanski А.В., Varaiya P. On ellipsoidal techniques for reachability analysis. Part I: External approximations // Optimization Methods and Software. 2002. 17. P. 177-206; Part II: Internal approximations. Box-valued constraints // Optimization Methods and Software. 2002. 17. P. 207-237.

25. Kosotousova E.K., Kurzhanski A.B. Theoretical framework and approximation technique for parallel computation in set-membership estimation // Proc. Symp. on Modeling, Analysis and Simulation. 1996. 2. CESA-96, IMCS Multiconf. Lille, France. P. 849-854.

26. Костоусова E.K. Внешнее и внутреннее оценивание областей достижимости при помощи параллелотопов // Вычисл. технологии. 1998. 3. № 2. С. 11-20.

27. Kostousova E.K. Control synthesis via parallelotopes: optimization and parallel computations // Optimization Methods and Software. 2001. 14. N 4. P. 267-310.

28. Куржанский А. Б. Альтернированный интеграл Понтрягина в теории синтеза управлений // Труды МИАН. 1999. 224. С. 234-248.

29. Варайя П., Куржанский А. Б. О проблеме достижимости при постоянно действующих возмущениях // Докл. РАН. 2000. 372. № 4. С. 446-450.

30. Kurzhanski А. В., Varaiya P. On reachability under uncertainty / / SIAM Journal of Control and Optimization. 2002. 41. P. 181-216.

31. Kurzhanski А. В., Varaiya P. Reachability analysis for uncertain systems—the ellipsoidal technique // Dynamics of Continuous, Discrete and Impulsive Systems. 2002. Ser. B. 9. N 3. P. 347-367.

32. Дарьи н A.H., Куржанский А. Б. Нелинейный синтез управления при двойных ограничениях // Диф. ур-ния. 2001. 37. № 11. С. 1476-1484.

33. Д ар ь и н А. Н., Куржанский А. Б. Управление в условиях неопределенности при двойных ограничениях // Диф. ур-ния. 2003. 39. № 11. С. 1474-1486.

34. Дарьи н А. Н. Об управлении при двойном ограничении с зависимостью геометрического ограничения от интегрального // Изв. РАН. Теория и системы управления. 2003. 42. № 4. С. 21-29.

35. Гусев М.И., Куржанский А. Б. К оптимизации управляемых систем при наличии ограничений. I, II // Диф. ур-ния. 1971. 7. № 9. Ч. 1. С. 1591-1602; № 10. Ч. 2. С. 1789-1800.

36. Kurzhanski A.B. On the calculation of safety zones in motion planning // Optimization Methods and Software. 2004. 19.

37. Kurzhanski А.В., Varaiya P. On some nonstandard dynamic programming problems of control theory // Variational Methods and Applications / Eds. F. Giannessi, A. Maugeri. N.Y.: Kluwer Acad. Pub., 2004. P. 613-627.

38. Красовский H. H. К теории управляемости и наблюдаемости линейных динамических систем // Прикл. матем. и мех. 1964. 28. Вып. 1. С. 3-14.

39. Куржанский А. Б. Теория наблюдения и дифференциальные игры / / Рефераты докладов V Всесоюзного совещания по проблемам управления. Москва, 1971. Ч. II. С. 141-143.

40. Куржанский А. Б. Дифференциальные игры наблюдения / / ДАН СССР. 1972. 207. № 3. С. 527530.

41. Schweppe F. Uncertain dynamic systems. N.J.: Prentice Hall, 1973.

42. Bertsekas D.P., Rhodes I.B. Recursive state estimation for a set-membership description of uncertainty // IEEE, Trans. Aut. Control. 1971. AC-16. P. 117-128.

43. Ананьев Б. И., Пищулина И. Я. Минимаксная квадратичная фильтрация в системах с запаздыванием // Диф. системы управления. УНЦ. 1979. С. 3-12.

44. Ananiev B.I. A guaranteed filtering scheme for hereditary systems with no information on the initial state // Proc. ECC-95. Rome, 1995. 2. P. 966-971.

45. Куржанский А. Б., Сивергина И.Ф. Метод гарантированных оценок и задачи регуляризации для эволюционных систем // ЖВМиМФ. 1992. 32. № 11. С. 1720-1733.

46. Куржанский А. Б., Сивергина И.Ф. Динамическое программирование в задачах идентификации систем с распределенными параметрами // Прикл. матем. и мех. 1998. 62. № 2. С. 161-166.

47. Kurzhanski А. В., Sorokina М.М. An inverse problem for the telegraph equation / / Proc. of 21st IFIP. TC 7. Conference on System Modeling and Optimization. Sophia. Antipolis. France. July 21-25.

2003.

48. Ананьев Б. И. Минимаксные квадратичные оценки в статистически неопределенных ситуациях // Диф. ур-ния. 1984. № 8. С. 1291-1297.

49. Ананьев Б. И. О схеме нелинейной фильтрации для многошаговых статистически неопределенных систем // Автоматика и телемеханика. 2002. № 5. С. 56-67.

50. Дигайлова И. А. Метод гарантированного оценивания состояния линейной динамической системы со смешанной неопределенностью // Вестн. Моск. ун-та. Сер. 15. Вычисл. матем. и киберн. 2000. № 3. С. 33-37.

51. Дигайлова И. А. Задача фильтрации при смешанной неопределенности // Изв. РАН. Сер. Теория и системы управления. 2001. № 5. С. 16-24.

52. Дигайлова И. А., Куржанский А. Б. О совместном оценивании модели и состояния недоопре-деленной системы по результатам наблюдений // Докл. РАН. 2002. 384. № 1. С. 22-27.

53. Гусев М. И. О структуре оптимальных минимаксных оценок в задаче гарантированного оценивания // Докл. РАН. 1992. 332. № 5. С. 832-835.

54. Гусев М.И. Устойчивость информационных областей в задаче гарантированного оценивания // Тр. МИАН. Доп. вып. 2. Тр. ИММ УрО РАН. 2000. С. 104-118.

55. Куржанский А. Б. О синтезе управлений по результатам измерений // Прикл. матем. и мех.

2004. № 4. С. 547-563.

56. Kurzhanski А.В., Varaiya P. Optimization techniques for reachability analysis // JOTA. 2001. N 2. P. 227-251.

57. Куржанский А. Б., Никонов О. И. О задаче синтеза стратегий управления: эволюционные уравнения и многозначное интегрирование // ДАН СССР. 1990. 311. С. 788-793.

58. Куржанский А. Б., Никонов О. И. Эволюционные уравнения для трубок траекторий синтезированных систем управления // Докл. РАН. 1994. 314. № 3. С. 606-611.

59. Важенцев А. Ю. О внутренних эллипсоидальных аппроксимациях для задач синтеза управлений при ограниченных координатах // Изв. РАН. Сер. Теория и системы управления. 2000. № 3. С. 70-77.

60. Важенцев А.Ю. Проблема внешнего эллипсоидального оценивания объединения двух концентрических эллипсоидов и ее приложения // Прикл. матем. и информ. Труды ф-та ВМиК МГУ. 2003. № 14. С. 18-34.

61. Востриков И. В. Внутреннее эллипсоидальное оценивание множеств достижимости для линейных управляемых систем с запаздыванием // Диф. ур-ния. 2003. 39. № 8. С. 1030-1037.

62. Kirilin M.N., Kurzhanski A.B. Ellipsoidal techniques for reachability problems under nonellip-soidal constraints // Elsevier Science. NOLCOS-Ol. St. Petersburg, 2001.

63. Чебунин И. В. Условия управляемости для уравнения Риккати // Диф. ур-ния. 2003. 39. № 12. С. 1654-1661.

64. Кос тоу сов а Е. К. Параллельные вычисления при оценивании областей достижимости и информационных множеств линейных систем // Алгоритмы и программные средства параллельных вычислений. Вып. 3. Екатеринбург: УрО РАН, 1999. С. 107-126.

65. Костоусова Е.К. О внешних полиэдральных оценках для множеств достижимости систем с билинейной неопределенностью // Прикл. матем. и мех. 2002. 66. Вып. 4. С. 559-571.

66. Kostousova E.K. State estimation for dynamic systems via parallelotopes: optimization and parallel computations // Optimization Methods and Software. 1998. 9. N 4. P. 269-306.

67. Рублев И. В. О связи между двумя понятиями обобщенного решения для уравнения Гамильтона-Якоби // Диф. ур-ния. 2002. 38. № 6. С. 818-825.

68. Roublev I.V. On minimax and idempotent generalized weak solutions to the Hamilton-Jacobi equation // AMS Contemporary Mathematics book series. Vol. "Proceedings of the Conference on Idempotent Mathematics and Mathematical Physics" / Eds. G.L. Litvinov, V. P. Maslov. 2004.

69. Рублев И. В. Множества достижимости в каскадных управляемых системах // Диф. ур-ния. 2004. 40. № 12. С. 1636-1644.

70. Олейник О. А. Разрывные решения нелинейных дифференциальных уравнений // УМН. 1957. № 3. С. 3-73.

71. Кружков С.Н. Обобщенные решения нелинейных уравнений первого порядка со многими независимыми переменными // Мат. сб. 1966. 70. № 112. Вып. 3. С. 394-115.

72. Crandall M.G.,Evans L.С.,Lions P.-J. Some properties of viscosity solutions of Hamilton-Jacobi equations // Trans. Amer. Math. Soc. 1984. 282. N 2. P. 487-502.

73. Subbotin A.I. Generalized solutions of first-order PDE's. The dynamical optimization perspective. Boston: Birkhauser, 1995.

74. Set hi an J. A. Level set methods and fast marching methods. Cambridge: Univ. Press, 1999.

75. Osher S., Fedkiw R. Level set methods and dynamic implicit surfaces. Springer Ser. AMS, 2003. Vol. 153.

76. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. М.: Наука, 1985.

Поступила в редакцию 10.05.04

В. П. Иванников

О РАБОТАХ В ОБЛАСТИ СИСТЕМНОГО ПРОГРАММИРОВАНИЯ

(кафедра системного программирования факультета ВМиК)

1. Введение. Кафедра системного программирования была образована в 1970 г. при создании факультета ВМиК МГУ. Первым заведующим кафедрой являлся профессор М.Р. Шура-Бура, которого в 1993 г. сменил на этом посту профессор, член-корреспондент РАН В. П. Иванников. Основными направлениями научных исследований, проводимых на кафедре совместно с Институтом системного программирования РАН, Институтом прикладной математики им. М.В. Келдыша РАН, ВЦ им. A.A. Дородницына РАН и Научно-исследовательским центром электронной вычислительной техники, являются: разработка систем параллельного и распределенного программирования, развитие технологии Grid для распределенных вычислений, разработа методов верификации, тестирования сложных программных систем и автоматического обнаружения уязвимостей в программах, создание методов автоматического планирования решений сложных задач, систем управления данными и оперативной интеграции информационных ресурсов.

2. Параллельное и распределенное программирование

2.1. Интегрированная среда ParJava. В ИСП РАН под руководством В. П. Иванникова и С. С. Гайсаряна при активном участии А. И. Аветисяна и В. А. Падаряна была разработана интегрированная среда ParJava, поддерживающая разработку и сопровождение программ, параллельных по данным. При разработке и модификации параллельной программы необходимо убедиться не только в ее правильности, но также в ее эффективности и масштабируемости. Однако анализ динамических свойств программы (профилей, трасс, слайсов и т.п.), позволяющий установить ее эффективность и масштабируемость, как правило, бывает связан с необходимостью многочисленных прогонов еще не полностью отлаженной программы на целевом вычислительном комплексе (высокопроизводительном кластере).

О задачах синтеза управлений по реально доступной ин формации Текст научной статьи по специальности «Математика»

Похожие темы научных работ по математике , автор научной работы — Куржанский А. Б.

Текст научной работы на тему «О задачах синтеза управлений по реально доступной ин формации»