Онлайн-доступ к журналу: http://isu.ru/izvest.ia.
Серия «Математика»
2017. Т. 19. С. 26-43
УДК 517.977.5 MSG 34Н05
DOI https://doi.org/10.26516/1997-7670.2017.19.26 Некоторые проблемы теории оптимального управления*
В. И. Гурман
Институт программных систем им. А. К. Айламазяна РАН
Аннотация. Традиционно в математической теории оптимального управления основное внимание уделяется методам исследования готовых математических постановок задач той или иной сложности. Поскольку все внимание сосредоточено на. решении задачи, то вопрос об адекватности используемой математической модели реальному процессу обычно не рассматривается. Сами математические формулировки задач по их практическому содержанию и использование полученных решений, как правило, не обсуждаются, что усугубляет вза.имонепонима.ние теоретиков и практиков и приводит к обесцениванию теоретических результатов. Стандартные предположения о переменных, фигурирующих в постановках задач, полученные путем неизбежной идеализации свойств реальных объектов, не соответствуют поведению и характеристикам этих объектов, для которых строится та. или иная математическая модель.
Математическая идеализация свойств реального объекта, по существу — упрощение реальной задачи с целью ее эффективного исследования математическими методами. С этой точки зрения, решение формальной задачи — заведомо приближенное решение реальной. Сами границы между реальной и формальной задачами условны, как границы между более подробной и менее подробной моделями реального объекта.. Возникает вопрос, нельзя ли упростить готовую формальную задачу по принципу исключения возможных пассивных дифференциальных связей, используемому в теории вырожденных задач? Один из ответов на. него дает магистральный подход к поиску приближенных глобально оптимальных решений. Однако обсуждение подобных методологических проблем, затрагивающих основы теории оптимального управления, практически в литературе отсутствует.
Цель данной работы — привлечь внимание исследователей к указанным проблемам и предложить возможное решение одной из них.
В статье показано, что задача, оптимального управления для дифференциальной системы общего вида, не имеет решения в классическом смысле применительно к моделям реальных объектов, учитывающих непрерывность протекающих в них про-
* Работа, выполнена, при финансовой поддержке Российского фонда, фундаментальных исследований (проекты №15-01-01915 А, 15-01-01923 А).
дессов, но традиционное решение может рассматриваться как приближенное решение магистрального типа меньшего порядка, для «реальной» задачи. Затрагивается связанная с этим проблема существования решений в вариационном исчислении и теории оптимального управления. Приводятся методические и содержательные примеры, иллюстрирующие полученные результаты и выводы.
Ключевые слова: математическая модель, формальная задача, реальная задача, приближенное магистральное решение.
1. Введение
В потоке публикаций по математической теории оптимального управления и ее приложениям основное внимание уделяется методам исследования готовых математических постановок задач той или иной сложности. Однако такие постановки возникают не сами по себе, а в связи с более общими задачами проектирования реальных систем управления и/или режимов их функционирования. Решения для готовых постановок — это лишь надводная часть айсберга, в то время как подводная часть — математические формулировки задач по их практическому содержанию и использование полученных решений, как правило, не обсуждается, что на наш взгляд, усугубляет взаимонепонимание теоретиков и практиков и приводит к обесцениванию теоретических результатов. И речь здесь идет не о пресловутом внедрении, а о методологических проблемах, затрагивающих основы теории оптимального управления.
В данной статье рассматривается одна из проблем такого рода, связанная со стандартным предположением о безинерционности переменных, олицетворяющих управляющие воздействия в моделях реальных объектов и соответствующих задач оптимального управления, представленных дифференциальными системами. Об этом, например, четко говорится в монографии [13]: «Кусочно-непрерывные управления соответствуют предположению о «безинерционности» рулей, так как значения функции могут (в момент разрыва) мгновенно перескакивать из одной точки области управления в другую. Этот класс допустимых управлений, по-видимому, наиболее интересен для технических приложений». Но это предположение, необходимое для существования оптимального элемента в классе допустимых, противоречит действительности, поскольку всякое изменение реально происходит в результате некоторого непрерывного во времени процесса. Даже если оптимальное управление фактически оказывается непрерывным, его значения на границах временного отрезка на практике заданы и не совпадают с предлагаемым. Более того, сам термин «переменная управления» в формальной модели, полученной в результате неизбежной идеализации свойств реального объекта, может не соответствовать этому понятию
применительно к реальному объекту. Например, в типичных задачах о наилучших траекториях пилотируемых летательных аппаратов в атмосфере формальными управлениями служат тяга двигателя и углы атаки и крена, а фактическими — углы наклона-поворота штурвала и сектора газа, связанные с указанными формальными управлениями через сложную многозвенную систему.
Возникает естественный вопрос — можно ли и как устранить отмеченное противоречие? Этот же вопрос связан с вопросами существования решений вариационных задач их представления и реализации, затрагивающих основы математической теории оптимального управления. Данная статья представляет собой попытку ответить на эти вопросы или, по крайней мере, обозначить их более четко. Она мотивирована в значительной мере опытом автора в исследовании прикладных задач из различных областей [2; 10; 11]; некоторые из них используются для иллюстрации изложения как непосредственно, так и в упрощенной форме методических примеров.
2. Математическая задача оптимального управления и ее связь с реальной задачей
Рассматривается дифференциальная управляемая система
х = /($,х,и), гет = [г1,гР}, жеГ, (2.1)
В работах прикладного направления, как правило, рассматриваются множества решений указанных систем (2.1), где функции тх = х(Ь), £ € [¿/,¿7?] (траектории) — кусочно-гладкие, а ти = € (про-
граммы управлений) — кусочно-непрерывные. Для этой системы ставится задача оптимального управления в форме (называемой стандартной).
ж е х(г) с мга, х(ь) = ж/, х(гР) е г с Г, I = Р(х(гР)) ->■ ы
на множестве О допустимых пар функций т = (тх, ти), удовлетворяющих перечисленным условиям.
Систему (2.1) можно представить в виде дифференциального включения
(2.2)
правую часть которого будем называть множеством скоростей.
Предположение о разрывности оптимального управления и его неизбежные разрывы на границах временного отрезка, как уже говорилось, противоречат реальности. Чтобы устранить указанное противоречие, предположим, что функции и(Ь), играющие роль формальных безынерционных управлений в (2.1), непрерывны всюду на и описы-
ваются посредством некоторой дополнительной операторной связи, отражающей количественно их реальную инерцию. Будем предполагать, что эта дифференциальная связь аналогична (2.1):
й = д (¿, х, и, «;) , и) € х, и) С К9, (2.3)
или, иначе,
й € V8 (¿, х,и) = д (¿, х, и, х, и)) . (2.4)
При этом и становится формально переменной состояния (фазовой переменной), и появляется новая формальная переменная управления ии. Полученную таким образом систему (2.1), (2.3) будем рассматривать как некоторую приемлемую модель реального объекта. Эту модель и задачу оптимального управления для нее назовем условно реальными, в отличие от модели (2.1) и соответствующей ей задачи, которые назовем формальными.
В зависимости от располагаемой информации о реальном объекте и целей математического исследования возможны различные виды дополнительной связи и реальной модели в целом. Рассмотрим два характерных взаимосвязанных случая.
1. Множество Vе в (2.4), например, совпадет с пространством Мр. Если изначально нет никакой информации о будущей системе управления, то (2.4) сводится к простейшей дифференциальной связи й = и), W = Кр, что приводит к сужению класса допустимых управлений от кусочно-непрерывных до непрерывных всюду без каких-либо дополнительных ограничений. В этом случае решения реальной задачи в обычном понимании не существует, но может быть построена минимизирующая последовательность путем естественной аппроксимации кусочно-непрерывной и(Ь) последовательностью непрерывных с растущей нормой производной в окрестностях точек разрыва.
2. Предположим, что имеется информация о границах скорости изменения реального управления. Дополнительная связь (2.3) отличается от предыдущей для случая 1 лишь множеством V8: теперь это замкнутая ограниченная область. В этом случае решение реальной задачи может быть получено точно или приближенно также сравнительно простой естественной аппроксимацией оптимального управления формальной задачи (кусочно-непрерывного) в окрестностях точек разрыва конкретной непрерывной и(Ь) с производной на границе W. Она может рассматриваться как член минимизирующй последовательности случая 1.
В случае 1 реальная задача является заведомо вырожденной по определению [3], поскольку связь й = и), W = Кр оказывается пассивной, и целиком сводится к формальной задаче, где эта связь исключена.
В случае 2 реальная задача может иметь оптимальное управление в своем классе допустимых О9, но при этом не разрешает рассматриваемого противоречия, поскольку неизбежна разрывность нового управления ги^).
В общем случае размерность пространства новых управляющих переменных и> может быть меньше размерности пространства и. В этом случае реальная задача может быть существенно более сложной, чем формальная задача. Решение формальной задачи также может быть эффективно использовано для поиска решения реальной задачи с применением процедуры аппроксимации, хотя и более сложной, чем в первых двух случаях. В теории вырожденных задач [3] реальная и формальная задачи соотносятся между собой как исходная и производная задачи соответственно. Производная задача получается исключением связи, которая при неограниченной скорости оказалась бы пассивной. Решение производной задачи названо в [4] магистральным. В соответствии с этим определением, решение формальной задачи следует рассматривать как точное или приближенное магистральное решение реальной задачи, а каждый непрерывный участок формального оптимального управления — как магистраль в этой задаче. Оно состоит из чередования магистралей и участков переходов между магистралями и между граничными точками и ближайшими магистралями. С точки зрения общей теории оптимального управления и вариационного исчисления это означает отсутствие регулярного поля экстремалей (оптимальных траекторий), что не дает возможности применить классические достаточные условия оптимальности и требует специальных методов.
2.1. Теорема о магистрали
Пусть т3 = — решение формальной задачи (2.1) (опти-
мальный элемент или любой член минимизирующей последовательности из О), такое что по крайней мере, кусочно-гладкая, удовлетворяет системе (2.3) и на непрерывных участках определяет идеальное магистральное решение реальной задачи в форме минимизирующей последовательности {тд = С О7-. Оно инвариантно для любой системы вида (2.3), дополняющей формальную, и дает оценку по функционалу любому члену минимизирующей последовательности {тд}: < 1(шд), а если не ограничено (совпадет с
пространством), то т!I = 1{тя). Магистралями служат непрерывные
участки оптимального управления в формальной задаче либо любого члена минимизирующей последовательности.
Замечание 1. Утверждение остается в силе, если вместо дополнительной дифференциальной связи вида (2.3) используется любая другая, допускающая неограниченную скорость й в любой точке (Ь,х,ь).
Приведем для иллюстрации простые примеры.
3. Линейно-квадратические задачи
Простейшая задача АКОР [12]
ь
I
ж2)2 + (u)2)dt —> inf, х = и, ж (О) = с, (3.1)
о
где х и и имеют смысл отклонений состояния объекта и управления (скажем, скорости и ускорения автомобиля) от заданных постоянных значений.
Применив достаточные условия оптимальности Кротова [10], нетрудно получить семейства оптимальных решений для различных начальных условий (значений с).
Для задачи (3.1) tp(t,x) может быть задана как линейная tp(t,x) = фт (t) х. Тогда
R = - ((ж2)2 + (и)2) +ip(t)u + ip(t)x, G = ip(b)x + const. (3.2)
Функция вогнута, максимум достигается в стационарной точке: Rx = 0, Ru = 0. Функция линейна. Отсюда ф = 2х, й = %г, гр (Ь) = 0. Решая эту систему совместно с (3.1), получаем:
Обратим внимание, что оптимальное управление оказывается непрерывным (и сколько угодно раз дифференцируемым), однако если предположить заданным начальное и(0) ф й (0) (что важно для практики, где никакие входящие в модель переменные не могут меняться мгновенно), то при £ = 0 образуется разрыв и(Ь). Скачок управления в единственной точке от и(0) на й(0), как видно, на минимальное значение функционала не влияет в этой модели.
Рассмотрим теперь более точную модель, учитывающую реальную непрерывность и(Ь) посредством дополнительной дифференциальной связи
где IV — новое формальное управление (отклонение секундного расхода бензина от заданного постоянного значения), а и — формальная переменная состояния. Соответствующее множество Ы программ и(Ь)
£ (*) = 7^26 (e_i + e~2bet) > * е (о, ь],
й (t) = 1 Се_2Ь (-е"4 + e"2V) , u(0) = 0.
-t
(3.3)
й = kw, |ги| < d, к = const, d = const
(3.4)
сужается до некоторого множества Ы\ С U. Очевидно г = inf I < i\ =
и
mil. Wi
Если попытаться идеализировать эту модель, сняв ограничение на w, то классический принцип максимума окажется к ней неприменимым, поскольку оптимального режима в такой постановке не существует. Решением служит минимизирующая последовательность, которая получается следующим путем. Новая дифференциальная связь исключается, берется уже найденное прежнее разрывное решение (3.3) и аппроксимируется в окрестности точки разрыва последовательностью непрерывных кусочно-гладких функций us(t).
Us (t) = 1 +Ce_2b (-e~* + e~2V) , te(0,b], u(0)=0. (3.5)
Отсюда
w8 (t) = us (t) /к = (-e~* + e~2V) , i € (0,6], u(0) = 0.
(3.6)
Нетрудно видеть, что Is —>■ inf I. При любом конкретном ds (фактически
и
при любом d) соответствующий член последовательности вида (3.5) оказывается оптимальным. Такое решение названо в [4] магистральным по аналогии с обычным понятием магистрали в транспортном сообщении. Оно состоит из участков скорейшего перехода из начальной точки на магистраль как решение задачи (3.1) и дальнейшем движении по магистрали. Для задачи (3.3) функцию Lp (t, х) зададим в той же линейной форме. Но построим границы решений уравнения ù = w, \w\ < d при заданном и(0) (для определенности положим и(0) = 0, к = d = 1): v4ow = При этом выражения (3.3) сохраняются, но максимум R по и ищется с учетом построенных границ. Отсюда получается следующий оптимальный режим (u* (t) , ж* (t)):
■u*=isignc, ж* = signe, t < t*, u*=u(t), ж* = ж (t),t>U,
(3.7)
где t* — решение уравнения t = u(t), x*(t) — решение уравнения ж = ■u*(t) при ж(0) = с.
Простейшая задача Фуллера [1]. Рассмотрим известную задачу Фул-лера третьего порядка [9]:
• 0 / 1 \ 2 -1 2 -2
/у»1-1 - I /у»-1- /у»-1- - Гр^ Гр^ - I I
ti/ - ( .i-j j , ti/ - .i-j , ti/ - {al ,
1 = ж°(1)-Hnf, te [0,1], (3.8)
ж°(0) = 0, ж1(0) = ж2(0) = 1.
Вначале рассматривается идеальная магистраль второй ступени:
ж1(0) = 1,ж^(i) = 0,te (0,1].
с-0
с-0
==4
с=4
с=4
с=4
Рис. 1.
Она аппроксимируется решением производной системы первой ступени. Для этого строится кусочно-гладкая функция ,t1(î) = —st + 1 при t = [0,i*), ,t1(î) = 0 при t = [i*,l], где t*s = 1 /s. Отсюда из уравнения х1 = X2, x2{t) = —s при t = [0,i*), x2{t) = 0 при t = [i*, 1]. Как видно, x2(t) претерпевает разрывы в точках t = 0 и t = i*. Это идеальное магистральное решение первой ступени. Оно в свою очередь аппроксимируется кусочно-гладкой траекторией исходной системы.
( -qt+1, t£[0,tlç), ( -q, t£[0,tl ),
'2 /,\ _ I ~si t G [tsg^sg), I 0, t G |tsq,tsq),
sqW }qt ~ q/s, t G \t2q, t*), ) q, t G \t2q, t*),
{ 0, tG[t*s, 1]; ( 0, tG[t*s, 1],
где tlq = (s + l)/q, t2q = (q/s — s)/q. В результате получается допустимая двухиндексная последовательность {m} = {xsq(t), usq} и соответствующая последовательность Isq. Из нее выбирается одноиндексная последовательность {m.,} = {w^^}, где q(s) задается по правилу |Is — inf 11 pa \IS — Isq I, где s и q целые.
4. Магистральный подход к приближенной оптимизации управления реальным объектом
Цель математической идеализации свойств реального объекта по существу — упрощение реальной задачи с целью ее эффективного исследования математическими методами. С этой точки зрения решение
формальной задачи — заведомо приближенное решение реальной. Однако границы между реальной и формальной задачами условны (по крайней мере, в нашем понимании как границы между более подробной и менее подробной моделями реального объекта). Возникает вопрос, нельзя ли упростить далее готовую формальную задачу (2.1) по тому же принципу исключения возможных пассивных дифференциальных связей? Ответ на этот вопрос дает магистральный подход к поиску приближенных глобально оптимальных решений, развиваемый в серии работ [1; 6; 7]. Во-первых, задача (2.1) может иметь признаки вырожденности, такие как линейная (аффинная) зависимость правой части (2.1) от переменных управления и/или неограниченность множества скоростей в (2.2), и может быть преобразована непосредственно к производной задаче меньшего порядка, что и означает по существу выявление и исключение скрытой пассивной связи и, следовательно, магистральность решения. Во-вторых, как показано в [1; 6], управляемая дифференциальная система общего вида может быть преобразована к эквивалентным системам с линейно входящими переменными управления, что дает возможность при дополнительных искусственных построениях трактовать ее приближенно как вырожденную и понизить ее порядок. На основе таких комбинированных преобразований предлагаются многоступенчатые процедуры понижения порядка системы (2.1) и соответствующей задачи вплоть до первого, когда она решается непосредственно, и последовательной аппроксимации ее решения допустимыми решениями исходной системы.
Таким образом, с использованием имеющейся у практика информации и описанных преобразований для одного и того же реального объекта может быть построен ряд моделей типа (2.1), (2.4) по принципу расширения множества допустимых элементов, т. е. исключения уравнений описывающих процессы, принимаемые за безынерционные, от более полных и подробных и более точных к более простым и менее точным. Тем самым в математическую постановку задачи, использующую ту или иную модель из указанного ряда, явно закладывается магистральность решения. Поскольку нет априорных критериев для выбора единственной формальной модели, то целесообразно описанную выше процедуру последовательных приближений распространить на весь ряд моделей от более простых, но грубых моделей, к более точным, но сложным.
Эта схема была успешно применена в [16] к исследованию оптимальных маневров вертолета, которое вызывает обычно серьезные трудности из-за большой сложности сравнительно полной модели динамики вертолета (как минимум 14 нелинейных дифференциальных уравнений и разнообразные дополнительные ограничения), разработанной для решения широкого круга задач, возникающих при проектировании и ис-
следовании летных характеристик. Приведем вкратце для иллюстрации основные результаты.
В качестве начальной грубой модели из всех уравнений было выбрано кинематическое соотношение между положением г и скоростью центра масс вертолета V в инерциальном пространстве г = V, и задавалось соответствующее множество 01. Добавление следующего кинематического соотношения V = а, где а — ускорение, давало модель следующего приближения и соответствующее ей множество Ог- При необходимости предполагалось добавлять уравнения углового движения и динамики ротора и т.д. Ограничения на управляющие переменные в указанных выше моделях V, а получались из грубых оценок в тех дифференциальных уравнениях, где они служат переменными состояния в комбинации с заданными конечными ограничениями. Наиболее полная модель вертолета использовалась только для компьютерной имитации при выбранных приближенно-оптимальных траекториях полета и проектных параметрах.
Конкретно проводилась оптимизации маневров по критерию минимума времени при перелете на заданной высоте над рельефом из одной заданной точки А в другую заданную точку В (рис. 2) с заданными скоростями в этих точках и возможными дополнительными ограничениями на траекторию. В данном случае (заданная высота) движение представлялось в проекциях на горизонтальную плоскость, г = (г1, г2), V = (у1^2), а = (а1, а2). Зависимость Ь(г), описывающая рельеф местности (в форме оцифрованной карты), использовалась в комбинации с пространственными ограничениями на скорость вертолета для расчета множества допустимых скоростей (расширенного) \(г) в каждой точке г, которое может быть представлено в следующей форме:
где Ф € [0, 27г] — курсовой угол, и(г, Ф) — некоторая предварительно вычисленная функция. Задача на множестве О^
при заданных га, г в решалась практически методом Беллмана благодаря малой размерности пространства состояний (два). Решение получалось попятным построением (от В к А) характеристик уравнения Беллмана. В результате генерировалось поле оптимальных управлений г>*(г) и выделялось конкретное оптимальное решение т 1* € 01, траектория которого начинается из точки А. Она служит магистралью для следующего более узкого множества Ог, выделяемого из Б1 дополнительной связью V = а.
г = V, V € V(г), ¿а = 0, / = ¿б —> тт
(4.1)
х,км
5 -4 -3 -2 -1 0 1 2 3 4 5 2'т
Рис. 2.
Далее получалось т-2 € Ог как подходящая аппроксимация для г»!*. Вместо индивидуальной аппроксимации было выработано сравнительно простое правило аппроксимации для всего оптимального поля управлений предыдущей задачи, которое использовалось для получения приближенного решения т-2 € Ог (рис. 3).
Окончательно г»2* (или тг) рассматривался как опорный режим управления для получения траектории маневра и законов изменения по времени реальных управляющих переменных с использованием полноразмерной модели. Производилась настройка традиционных ПИД-каналов автопилота на полученные опорные функции, соответствующие г»2* или (тг)) с последующей компьютерной имитацией получающейся замкнутой системы управления.
5. Понятия магистрали для классических и вырожденных
задач
Сразу же отметим радикальное отличие этого понятия магистрали, одного из основных в теории неклассических, вырожденных, задач [3; 4] от фигурирующего под тем же термином понятия в классической «магистральной теории» развиваемой в большой серии работ на основе регулярных классических условий оптимальности вариационного исчисления и ПМП [17; 19; 20; 21; 22].
-1 А 0 1 2 3
Рис. 3.
Предположения этой теории обеспечивают невырожденность задачи, применимость классических методов и существование регулярного поля экстремалей. Спецификой является асимптотическое поведение этого поля (turnpike property), где асимптота и объявляется магистралью. Для вырожденных задач (например, (3.1), (3.3)) такое поле отсутствует, классические условия неэффективны или неприменимы. Специальные методы основаны на преобразованиях вырожденных задач к регулярным задачам меньшего порядка, а магистралями объявляются решения именно этих задач меньшего порядка. В комбинациях с переходными участками они дают точные (а не асимптотические) решения. В то же время, помимо терминологических совпадений, имеется определенная содержательная связь указанных различных понятий. В качестве наглядного примера рассмотрим один из вариантов известной задачи оптимизации долгосрочного экономического роста на однопродуктовой модели с постоянным темпом роста населения п [14]:
К = I = f(K, L) — Lz — /лК, ¡(К,Ь)=Ьф(х),
. 5.1
х = K/L, L = Loe ,
где К и I — капитал, L,Lq — численность населения и его значение в начальный момент времени t = 0, f(K, L) — производственная функция, г — душевое потребление (управление), ¡л — темп амортизации. Максимизируется функционал полезности
оо О
(5.2)
при заданном К(0). Здесь 5 — темп амортизации, р(г) — функция полезности, ф(х) — функция производительности. Предполагается, что р'(г) > 0, р"(г) < 0, ф'(х) > 0, ф"(х) < 0. Это известные обоснованные в экономической теории предположения об убывающей полезности и убывающей производительности.
Применим условия ПМП (для данной линейно-выпуклой задачи они необходимы и достаточны):
ф = ф{^~ц), = —фЬ + е~нр'{х) = 0, (5.3)
где Н = ф(/(К, Ь) — Ьг — /лК) + е~ыр(г). Будем иметь:
Ф = Ф = ~ф\ + I - е~&\-5р' + (5.4)
Исключив отсюда ф, ф, получим
->-«) + % = <>. (5.5)
Представим г в форме г = (1 — з)/(К,Ь)/Ь = (1 — з)ф(х) (8 — норма накопления (сбережения), 0 < в < 1). Тогда
(5.«
и (5.5) переписывается в виде dx —р'
77 (ф'(х)-ё-11-п). (5.7)
dt р"( 1 - а)ф
Отсюда с учетом предположений относительно р{х), ф(х) следует dx
— —> 0, ф'{х) —>• 5 + ц, + п = const. (5.8)
Это уравнение классической (асимптотической) магистрали (термин, введенный П. Самуэльсоном в [18]), известной также под названием «луч Неймана».
Предположим теперь, что p(z) = z(p"(z) = 0). В этом случае задача становится вырожденной, оптимального решения при произвольном начальном К(0) не существует, и классические условия оптимальности не позволяют ее исследовать. Применим специальный метод (кратных максимумов) как способ задания функции Кротова в одноименных достаточных условиях оптимальности, ориентированный на вырожденные задачи [10]. Основные конструкции этих условий для данной задачи:
R(t, К, z) = <pK(f(K, L)) -Lz- цК) + e~Stz + щ, G{K)= lim (<p(tF,K)-<p(0,K(0))). (5'9)
tp —>oo
Функция К, г) исследуется на максимум по К и г, а 0(К) — на минимум при конкретном задании функции Зададим ее так,
чтобы К, г) не зависела от г, <£>(£, К) —>• 0 при £ —>• оо:
+ е~&1 = 0 => ¡р = Ь^е'^^К. (5.10)
При этом получается
-л
Д(*, К) = —(¡(К, Ь)-(5 + » + п)К). (5.11)
Так как функция /(К,Ь)/Ь = ф(х) вогнутая, то максимум К по К достигается в стационарной точке Кк = 0. Отсюда ¡к = ф'{х) = 5 + ц + п. Это уравнение совпадает с уравнением классической магистрали, но в отличие от регулярного случая оно является точным решением задачи независимо от начальных условий и для любого начального значения задает минимизирующую последовательность с одним и тем же значением нижней грани функционала. Иначе его можно трактовать как обобщенное решение с импульсом в начальный момент, обеспечивающим выход на магистраль, и последующим движением по магистрали. Если управление ограничено, то как нетрудно проверить, импульс заменяется переходным участком — решением исходного уравнения (5.1), исходящим из начальной точки, при соответствующем граничном значении управления; в целом же решение получается точным магистральным (а не асимптотическим). Описанная процедура непосредственно обобщается и на многопродуктовую модель экономики, и на более сложные, эколого-экономические, и другие аналогичные модели (см., например, [5; 8; 15]). Если размерность пространства линейно входящих управлений не меньше размерности пространства состояний, то получается, как и в классической теории, единственная магистраль, но не асимптотическая, а точная.
6. Заключение
Что делать в целом? Никто не может знать заранее.
Изложенное выходит далеко за рамки традиционных чисто математических исследований в область методологии междисциплинарных исследований, хотя при этом используются математические методы.
В данном случае — взаимодействия теоретиков и практиков по принципу «исполнителей» и «заказчиков», без «снобизма» первых в отношении вторых.
Математическая задача не решает реальную задачу синтеза системы управления, но помогает.
Минимум в данной модели инвариантен относительно всех более подробных моделей
Нужна (полезна) упорядоченная серия моделей разной степени подробности.
Важны итерационные методы с учетом высокопроизводительной техники.
Решение каждой математической задачи в указанном ряду является магистральным соответствующей ступени для всех более подробных моделей с соответствующей оценкой инвариантной относительно любых дополнительных операторных связей, не только дифференциальных; любая более подробная задача вырожденная.
Магистральный подход — один из возможных принципов построения этого ряда. Но он важен с точки зрения ценности успешного исследования принятой математической модели, его отношения к реальности.
Список литературы
1. Гурман В. И. Преобразования дифференциальных управляемых систем для поиска приближенно-оптимального управления / В. И. Гурман, И. В. Расина, И. С. Гусева // Программные системы: теория и приложения : электрон, науч. журн. - 2014. - Т. 5, №4(22). - С. 123-157.
2. Гурман В. И. Практические методы оптимизации / В. И. Гурман, Е. А. Трушкова. - Переславль-Залесский : УГП им. А. К. Айламазяна, 2009. - 160 с.
3. Gurman V. I. Degenerate Problems of Optimal Control / V. I. Gurman. - Moscow: Nauka, 1977.
4. Gurman V. I. Turnpike Solutions in the Procedures Seeking Optimal Controls / V. I. Gurman // Automation and Remote Control. - 2003. - Vol. 64, N 3. - P. 399-408.
5. Gurman V. I. Models of Natural Resource Control / V. I. Gurman. - Moscow: Nauka, 1981.
6. On Certain Approaches to Optimization of Control Processes. I / V. I. Gurman, I. V. Rasina, О. V. Fesko, I. S. Guseva // Automation and Remote Control. - 2016.
- Vol. 77, N 8. - P. 1370-1385.
7. On Certain Approaches to Optimization of Control Processes. II / V. I. Gurman, I. V. Rasina, О. V. Fesko, I. S. Guseva // Automation and Remote Control. -2016. - Vol. 77, N 9. - P. 1544-1556.
8. Gurman V. I. Turnpike Solutions in Optimization of Regional Development Strategies / V. I. Gurman, M. Y. Ukhin // Automation and Remote Control.
- 2004. - Vol. 65, N 4. - P. 603-611.
9. Zelikin M.I. Optimal Chattering Feedback Control / M. I. Zelikin, V. F. Borisov // Journal of Mathematical Sciences. - 2003. - Vol. 114, N 3. - P. 1227-1344.
10. Krotov V.F. Methods and Problems of Optimal Control / V. F. Krotov, V. I. Gurman. - Moscow : Nauka, 1973.
11. Krotov V.F., Bukreev V.Z., Gurman V.I. New Methods of Variational Calculus in the Flight Dynamics / V.F. Krotov, V.Z. Bukreev, V.I. Gurman. - Moscow: Mashinostroenie, 1969.
12. Letov A. M. Analytic Controller Design. II / A. M. Letov // Automation and Remote Control. - 1960. - Vol. 21, N 5. - P. 389-393.
13. The Mathematical Theory of Optimal Processes / L. S. Pontryagin, V. G. Boltyanskii, R. V. Gamkrelidze, E. F. Mishchenko. - Moscow : Nauka, 1983. -392 p.
14. Stoleryu L. Equilibrium and Economical Growth / L. Stoleryu. - Moscow : Statistics, 1974. - 474 p.
15. Gurman V. I. The Extension Principle in the Problems of Sustainable Development / V. I. Gurman. - Moscow : Fizmatlit, 2005. - 128 p.
16. Gurman V. I. Principle of Expansion in Modeling and Optimal Control: Case Study for Helicopter Maneuvering / V. I. Gurman, L. N. Nikiforova // Proceeding of 10th Workshop IFAC. Haifa, Izrael, 19—21 December, 1995. - London : Elsevier, 1996.
17. McKenzie L. Turnpike Theory / L. McKenzie // Econometrica. - 1976. - Vol. 44, Nov. - P. 841-866.
18. Samuelson P. A. A Catenary Turnpike Theorem Involving Consumption and the Golden Rule / P. A. Samuelson // American Economic Review. - 1965. - Vol. 55. - P. 486-496.
19. Samuelson P. A. Maximum Principles in Analytical Economics / P. A. Samuelson // American Economic Association, American Economic Review. - 1972. - Vol. 62(3), June. - P. 249-262.
20. Trelat E. Optimal control and Applications to Aerospace: Some Results and Challenges / E. Trelat // Springer US. Journal of Optimization Theory and Applications. - 2012. - Vol. 154, N 3. - P. 713-758.
21. Trelat E. The Turnpike Property in Finite-Dimensional Nonlinear Optimal Control / E. Trelat, E. Zuazua // J. Differential Equations. - 2015. - Vol. 258. - P. 81-114.
22. Zaslavski A. J. Turnpike Properties in the Calculus of Variations and Optimal Control / A. J. Zaslavski. - New York : Springer, 2005. - 407 p.
Гурман Владимир Иосифович, доктор технических наук, профессор, Институт программных систем им. А. К. Айламазяна РАН, 152021, г. Переславль-Залесский, ул. Петра Первого, д. 4а, (e-mail: [email protected])
V. I. Gurman
On Certain Problems in Optimal Control Theory
Abstract. Traditionally, in mathematical optimal control theory a significant part in the studies is related to investigation methods of ready mathematical problem settings with various complexity. Since all attention is centered on problem solution then the question of adequateness of used mathematical model to the real process usually is not under consideration. The mathematical problem settings itself in terms of their practical content and application of obtained solutions in general is out of the question; this aggravates mutual understanding between theorists and empirics which leads to depreciation of their results. Standard assumptions for variables in the mathematical problem setting obtained as the result of a certain idealization of the object's real properties do not correspond to behavior and the features of the object for which the mathematical model was constructed.
Mathematical idealization of the object's real properties actually is simplification of the real problem for its effective investigation using mathematical methods. In this light the solution of a formal problem is an approximate solution of a real problem. The
borders between real and formal problems are conditional as the borders between more detailed and less detailed models of the real object. The question now arises of whether it possible to simplify ready formal problem on the principle of elimination of passive differential constraint used in the theory of degenerate problems? One of the answers is the turnpike approach to the search for an approximate globally optimal solutions. However, consideration of such methodological problems dealing with a foundation of the optimal control theory usually not paid enough attention in literature.
The purpose of this work is to attract attention of researchers to these problems and offer a solution to one of them.
In this work, we show that the optimal control problem for differential system in a general form doesn't have a solution in the classical sense in respect to the object's real model taking into account the continuity of proceeding processes in it but traditional solution may be considered as an approximate solution of the turnpike type with less order for the real problem. The existence problem for solutions in variational calculus and optimal control theory is encompassed. We give both methodical and meaningful examples.
Keywords: mathematical model, formal problem, real problem, approximate turnpike solution.
References
1. Gurman V.l., Rasina I.V., Guseva I.S. Preobrazovanija differencial'nyh upravljaemyh sistem dlja poiska priblizhenno-optimal'nogo upravlenija. Program. S'ist.: Teor. i Prilozheniya, Electronic Journal of Ailamazyan Program Syst. Inst. RAS, 2014, no 4(22), pp. 49-72.
2. Gurman V.l., Trushkova E.A. Prakticheskie metody optimizacii. [Practical methods of optimization]. Pereslavl-Zalessky, University of Pereslavl, 2009. 160 p.
3. Gurman V.l. Vyrozhdennye zadachi optimal'nogo upravleniya [Degenerate Problems of Optimal Control]. Moscow, Nauka, 1977.
4. Gurman V.l. Turnpike Solutions in the Procedures Seeking Optimal Controls. Automation and Remote Control, 2003, vol. 64, no 3, pp. 399-408. https://doi.Org/10.1023/A:1023209524049
5. Gurman V.l. Modeli upravleniya prirodnymi resursami [Models of Natural Resource Control]. Moscow, Nauka, 1981.(in Russian)
6. Gurman V.l., Rasina I.V., Fesko O.V. et al. On Certain Approaches to Optimization of Control Processes. I. Automation and Remote Control, 2016, vol. 77, no 8, pp. 1370-1385. https://doi.org/10.1134/S000511791608004X
7. Gurman V.l., Rasina I.V., Fesko O.V. et al. On Certain Approaches to Optimization of Control Processes. II. Automation and Remote Control, 2016, vol. 77, no 9, pp. 1544-1556. https://doi.org/10.1134/S0005117916090034
8. Gurman V.l., Ukhin M.Y. Turnpike Solutions in Optimization of Regional Development Strategies. Automation and Remote Control, 2004, vol. 65, no 4, pp. 603-611. https://doi.Org/10.1023/B:AURC.0000023537.36821.97
9. Zelikin M.I., Borisov V.F. Optimal Chattering Feedback Control. Journal of Mathematical Sciences, 2003, vol. 114, no 3, pp. 1227-1344. https://doi.Org/10.1023/A:1022082011808
10. Krotov V.F., Gurman V.l. Metody i zadachi optimal'nogo upravleniya [Methods and Problems of Optimal Control]. Moscow, Nauka, 1973.
11. Krotov V.F., Bukreev V.Z., Gurman V.l. Novye metody variatsionnogo ischisleniya v dinamike poleta [New Methods of Variational Calculus in the Flight Dynamics]. Moscow, Mashinostroenie, 1969.
12. Letov A.M. Analytic Controller Design. II. Automation and Remote Control, 1960, vol. 21, no 5, pp. 389-393.
13. Pontryagin L.S., Boltyanskii V.G., Gamkrelidze R.V., Mishchenko E.F. The Mathematical Theory of Optimal Processes. Fourth edition. Moscow, Nauka, 1983. 392 p.
14. Stoleryu L. Equilibrium and Economical Growth. Moscow, Statistics, 1974. 474 p.
15. Gurman V.l. The Extension Principle in the Problems of Sustainable Development. Moscow, Fizmatlit, 2005. 128 p.
16. Gurman V.l., Nikiforova L.N. Principle of Expansion in Modeling and Optimal Control: Case Study for Helicopter Maneuvering. Proceeding of 10-th Workshop IFAC. Haifa, Izrael, 19—21 December, 1995. London, Elsevier, 1996.
17. McKenzie L. Turnpike Theory. Econometrica, 1976, vol. 44, pp. 841-866. https://doi.org/10.2307/1911532
18. Samuelson P.A. A Catenary Turnpike Theorem Involving Consumption and the Golden Rule. American Economic Review, 1965, vol. 55, pp. 486-496.
19. Samuelson P.A. Maximum Principles in Analytical Economics. American Economic Association, American Economic Review, 1972, vol. 62(3), pp. 249-262.
20. Trelat E. Optimal Control and Applications to aerospace: Some Results and Challenges. Journal of Optimization Theory and Applications, 2012, vol. 154, no 3, pp. 713-758. https://doi.org/10.1007/sl0957-012-0050-5
21. Trelat E., Zuazua E. The Turnpike Property in Finite-Dimensional Nonlinear Optimal Control. J. Differential Equations, 2015, vol. 258, pp. 81-114. https://doi.Org/10.1016/j.jde.2014.09.005
22. Zaslavski A.J. Turnpike Properties in the Calculus of Variations and Optimal Control. New York, Springer, 2005. 407 p.
Gurman Vladimir Iosifovich, Doctor of Sciences (Technical Sciences), Professor, Ailamazyan Program Systems Institute RAS, 4a, Peter I st., Pereslavl-Zalessky, 152021, (e-mail: [email protected])