Научная статья на тему 'Теория оптимального управления'

Теория оптимального управления Текст научной статьи по специальности «Математика»

CC BY
1936
268
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / УСТОЙЧИВОСТЬ РЕШЕНИЙ / ОБРАТНАЯ СВЯЗЬ

Аннотация научной статьи по математике, автор научной работы — Костюкова Ольга, Курдина Мария

Статья посвящена истории развития теории оптимального управления, приведены основные результаты белорусской школы оптимального управления, функционирующей на базе Института математики; обозначены перспективы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The optimal control theory

The history, progress and outlooks of the optimal control theory and the main results of Belarusian optimal control scientists working at the Institute of Mathematics are presented in the article.

Текст научной работы на тему «Теория оптимального управления»

24

пространствах. В качестве ведущего рассматривается винеровский процесс со значениями в гильбертовом пространстве.

В заключение приведем пример расширения сферы использования функциональных квадратурных формул, связанный с применением хаотических разложений функционалов от случайных процессов. Этот вид впервые был получен в 40-е гг. как разложение в ряд Фурье суммируемых с квадратом по мере Винера нелинейных функционалов на пространстве непрерывных функций по функциональным многочленам Эрмита. Обнаруженная затем связь этих разложений с разложениями нелинейных функционалов от гауссовых и пуассоновского процессов по кратным стохастическим интегралам Ито повлекла за собой развитие огромного направления в анализе случайных процессов. Активно развивается направление, связанное с использованием хаотических разложений при решении стохастических дифференциальных уравнений, с использованием подхода аналогичного методу Галеркина для детерминированных уравнений. После нескольких лет освоения этой новой области возникла идея соединения новых знаний и построения квадратурных формул. В итоге недавно были построены приближенные формулы для вычисления математических ожиданий функционалов от случайных процессов, основанные на использовании хаотических разложений Винера и Винера - Пуассона по кратным стохастическим интегралам.

Возвращаясь к мысли, высказанной в начале данной статьи, зададим вопрос: можно ли отказаться от чего-либо полученного на этом пути как от устаревшего и можно ли было обрести приведенные результаты без непрерывного освоения знаний во многих других областях математики? Кажется, ответ очевиден, и из него следует, насколько стоимостно важно время, затрачиваемое на поддержание уровня, способного породить инновации. СП

http://innosfera.by/2017/07/integral

ЛИТЕРАТУРА

1. Egorov A.D., Sobolevsky P.I., Yanovich L.A. Functional Integrals: Approximate evaluations and applications.- Kluwer Academic Publishers, 1993.

2. Егоров А.Д., Жидков Е.П., Лобанов Ю.Ю. Введение в теорию и приложения функционального интегрирования.- М., 2006.

3. Егоров А.Д. Приближенные формулы для вычисления математического ожидания функционалов от решения уравнения Ито в гильбертовом пространстве // Доклады НАН Беларуси. 2016. Т. 60, № 6. С. 7-13.

4. Егоров А.Д. О приближенных формулах для вычисления одного класса функционалов от пуассоновского процесса // Весц НАНБ. Сер. ф1з.-мат. навук. 2017, № 1. С. 7-13.

Теория

оптимального управления

Ольга Костюкова,

главный научный сотрудник Института математики НАН Беларуси, доктор физико-математических наук, профессор

Мария Курдина,

научный сотрудник Института математики НАН Беларуси, кандидат физико-математических наук

8

Прогнозирование, планирование и управление технологическими, социальными, экономическими и другими процессами требует разработки математических методов и моделей для решения задач в различных прикладных областях, которые во второй половине ХХ в. продемонстрировали большой прогресс. Соответственно, их потребности начали расти, что стало отправной точкой активного исследования и развития нового класса экстремальных задач в теории оптимизации - оптимального управления. По сути это яркий пример того, как запросы практики порождают новые теории.

Задачи оптимального управления - это выбор наиболее выгодных режимов управления сложными динамическими объектами, к примеру:

■ в механике полета (решение задач оптимизации траекторий полета самолетов и космических кораблей);

■ в технике (улучшение технологических процессов, режимов работы роботов);

■ в энергетике (оптимизация ядерных реакторов, передача электроэнергии);

■ в экономике (оптимальное функционирование макро-и микромоделей экономики);

■ в медицине (необходимые программы лечения

на основе математических моделей функционирования иммунной, сердечно-сосудистой систем).

Теория оптимального управления включает элементы теории управления движением, функционального анализа, исследования операций, математического программирования, теории игр.

В широком смысле решить задачу оптимального управления значит разработать для заданного объекта или процесса наилучший закон управления или набор управляющих воздействий. Для этого строится математическая модель объекта или процесса, описывающая его поведение с течением времени под влиянием управляющих воздействий и текущего состояния. Она включает в себя цель управления, выражающуюся через критерий качества; динамику объекта в виде дифференциальных, интегральных, конечно-разностных или других уравнений, описывающих способ движения объекта управления; ограничения на используемые ресурсы в виде уравнений или неравенств.

Приведем иллюстративный пример задачи оптимального управления.

Однопродуктовая модель оптимального развития экономики

Обозначим через X количество валового объема продукции, производимого в единицу времени (интенсивность выпуска валовой продукции), через С - интенсивность потребления. Однопродуктовая динамическая макроэкономическая модель Леонтьева представляет собой балансовое соотношение

Х=аХ + Ь—+ С. Л

Первое слагаемое - это производственные затраты, пропорциональные выпуску продукции (а - коэффициент производственных материальных затрат), второе - прирост основных производственных фондов. В этой модели предполагается, что амортизационные отчисления отсутствуют и все валовые капитальные вложения идут на ввод в действие новых основных производственных фондов. При этом считается, что капиталовложения пропорциональны приросту выпуска продукции в данном году (Ь - коэффициент приростной фондоемкости).

Третье слагаемое С - это непроизводственное потребление.

Предположим, что рассматривается развитие экономики на отрезке времени от ^ до ^ (за ^ - и лет) Тогда, согласно балансовому соотношению, при каждом значении t экономический процесс на макроуровне может быть описан обыкновенным дифференциальным уравнением

л ъ w ъ w

(1)

Так как количество производимой продукции определяется потреблением, непроизводственное потребление можно считать движущей силой экономического процесса. В уравнении 1 С(£) - это управляющее воздействие, Х(£) -состояние экономической системы. Естественно считать, что известно начальное состояние системы, то есть интенсивность валового выпуска в начальный момент времени. Также ясно, что переменные состояния Х(£) будут неотрицательными, а величина потребления С({) может изменяться только в каких-то заданных границах. Перекладывая эти условия на язык математики, получаем ограничения:

ХЦй) = Хй , хсо^сие^] , С^ССО^.Ге^г,] .

(2)

Рассматриваемый процесс должен организовываться так, чтобы потребление было как можно больше и в то же время в конечный момент должна быть высокой интенсивность выпуска продукции, что означает накопление производственного потенциала. Критерий качества, предусматривающий такие требования,

можно выразить в виде функционала fj

aj e~s'C(t)dt+РХЦХ) max. (3)

<0

Здесь первое слагаемое - суммарное взвешенное потребление, второе - интенсивность выпуска в конечный момент времени, а, в - весовые коэффициенты. Если предпочтение отдается потреблению, то а > в, если наоборот - накоплению производственного потенциала, то а < в. Подынтегральное выражение e~StC(t) - дисконтированное потребление, e-St- взвешивающая функция, S - коэффициент дисконтирования.

Таким образом, мы рассмотрели экономическую задачу управления процессом распределения валового продукта с макроэкономической моделью Леонтьева. Если при этом поставить целью рост потребления и наращивания экономического потенциала, то получаем задачу оптимального управления, которая состоит

в нахождении состояния Х({) и управления С^), удовлетворяющих дифференциальному уравнению (1), условиям (2), при этом функционал (3) достигает своего максимального значения. Это один из простейших примеров задач оптимального управления. Реальные задачи намного сложнее.

Фундаментальные основы общей теории оптимального управления были заложены в 1956-1961 гг. школами Л.С. Понтрягина [1] и Р. Беллмана [2], хотя, безусловно, на практике задачи оптимального управления встречались и ранее. Центральный результат математической теории оптимального управления - принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в задаче оптимального управления, был высказан автором в качестве гипотезы в 1955 г., а затем доказан его учениками (Р.В. Гамкрелидзе - для линейного случая, В.Г. Болтянским - для общей нелинейной задачи с функциональными ограничениями). Принцип максимума Понтрягина послужил мощным толчком к пересмотру базовых понятий теории экстремума, к ее развитию и лег в основу огромного количества исследований и новых результатов.

Коллектив американских ученых во главе с Р. Беллманом разработал метод динамического программирования. Он состоит в том, что оптимальное управление строится поэтапно, но при этом на каждом из них будет оптимальным и с точки зрения процесса в целом. Это основное правило динамического программирования, сформулированное Беллманом, и называется принципом оптимальности.

Следует отметить, что практическое применение теории оптимального управления сталкивается с большими трудностями вычислительного характера. Они обусловлены и громоздкостью математических моделей отдельных процессов, и сложностью нахождения аналитических решений. Эти трудности приводят к тому, что построение оптимальных управлений для каждого класса объектов является самостоятельной творческой задачей. Ее решение требует учета специфических особенностей объекта, опыта и интуиции разработчика, в связи с чем мощный толчок получило развитие вычислительных методов в теории оптимального управления. Огромный вклад в их развитие внесли Р.П. Федоренко, Б.Т. Поляк [3], Э. Полак [4], в нашей стране - Е.А. Барбашин, Р.Ф. Габасов и Ф.М. Кириллова. Отечественная

школа, функционирующая на базе Института математики НАН Беларуси и БГУ, получила ряд фундаментальных результатов, которые отличаются:

■ разработкой теории необходимых условий для особых оптимальных управлений;

■ доказательством условий оптимальности высокого порядка;

■ созданием конструктивной теории оптимального управления на базе нового, предложенного Р.Ф. Габасовым и Ф.М. Кирилловой подхода к построению алгоритмов линейного, квадратичного, кусочно-линейного программирования;

■ оптимизацией процессов управления в условиях неопределенности;

■ решением проблемы синтеза оптимальных систем.

Это дало толчок к появлению нового направления, получившего название конструктивной оптимизации. Белорусская школа оптимального управления и конструктивной оптимизации завоевала признание мирового научного сообщества [5-7].

Но несмотря на значительные успехи в этой области, остается много нерешенных задач. Создание новых методов оптимального управления динамическими системами сопряжено с существенными трудностями: неточностями в описании модели, наличием внешних возмущений, помех в устройствах управления и другими факторами. Кроме того, для адекватного моделирования многих современных динамических объектов (в робототехнике, медицине, экономике, народном хозяйстве) требуется использование сложных динамических систем, в частности гибридных систем с разрывной динамикой и систем с распределенными параметрами.

Актуальны исследования, связанные с изучением структурных свойств различных классов динамических систем и разработкой на их основе методов управления, учитывающих наличие неточностей и помех и допускающих коррекцию управляющих воздействий в процессе функционирования системы. Поскольку для осуществления коррекции важно быстро проводить вычисления, учитывающие изменения в динамике объекта, то особенно востребована разработка эффективных вычислительных методов, их построение требует развития новых подходов анализа свойств динамических систем.

Неудивительно, что усилия специалистов во многих мировых научных центрах, в том числе и в Институте математики НАН Беларуси,

направлены на решение указанных задач. Сотрудники института получили новые глубокие результаты, представленные в публикациях в зарубежных журналах, на международных научных конференциях.

Доказаны новые условия наблюдаемости и управляемости. Разработаны основанные на идеях современной алгебры, функционального анализа и топологической динамики методы для изучения свойств робаст-ности, устойчивости, стабилизируемости различных классов динамических систем [8-11]. Получены новые достаточные условия устойчивости и асимптотической устойчивости решений уравнений с отклоняющимся аргументом, на основе которых доказаны новые признаки оптимальной стабилизации решений систем с запаздывающим аргументом и систем нейтрального типа [12, 13]. Исследованы свойства решений задач оптимального управления динамическими системами с разрывной правой частью, предложены новые условия оптимальности [16].

Разработаны конструктивные методы и алгоритмы построения оптимальных программ и позиционных решений в реальном времени для различных классов систем управления с неточными входными и выходными данными. Они основываются на принципе разделимости процесса управления, выделяющем сопровождающие задачи оптимального наблюдения, идентификации и руководства детерминированной системой. Это позволило создать специальные вычислительные процедуры, способные быстро корректировать воздействия с учетом нового состояния системы, в котором она оказалась под воздействием помех [14, 15].

Для управления динамическими системами с неопределенностями и возмущениями обоснованы алгоритмы гарантированного ведения по принципу замыкаемой обратной связи по состоянию. Здесь в отличие от классической обратной связи при построении управляющего воздействия учитывается информация не только о текущем реальном состоянии системы, но и о том, что в будущем будет осуществляться корректировка воздействия. Использование этого принципа позволяет расширить класс допустимых действий и улучшить значение критерия качества [17]. Разработаны методы коррекции управляющих воздействий на основе дифференциальных свойств решений параметрических задач с нерегулярными структурами.

Выполнен ряд работ по математическому моделированию задач диагностики и управления тепловыми процессами [18]. Обоснованы алгоритмы идентификации функциональных параметров линейных и нелинейных уравнений теплопроводности, основанные на поэтапной субоптимальной оптимизации с предварительной фильтрацией зашумленных данных [19].

Перспективы теории оптимального управления оптимистичны, от нее отпочковались новые направления исследований - теория автоматического регулирования, робаст-ное управление стохастическими объектами, интеллектуальные, многоканальные, многокритериальные, с нечеткой логикой системы управления, теория устойчивости, стабилизации, наблюдаемости. И поскольку научно-технический прогресс ставит задачи и требует новых подходов к их решению, круг требований в теории оптимального управления постоянно расширяется. И практический, и теоретический интерес к нему не иссякает, это направление получает очередной виток развития, все теснее вплетаясь в инновационные отрасли науки, такие как теория катастроф, нейронные сети и создание нейрокомпьютеров, авиационно-космические и нанотех-нологии, разработка искусственного интеллекта. Под влиянием запросов практики теория оптимального управления бурно развивается, и есть все основания предполагать, что это только начало. СИ

http://innosfera.by/2017/07/optimal_control

ЛИТЕРАТУРА

1. Понтрягин Л.С. Математическая теория оптимальных процессов.- М., 1969.

2. Беллман Р. Динамическое программирование.- М., 1960.

3. Федоренко Р.П. Приближенное решение задач оптимального управления.- М., 1978.

4. Полак Э. Численные методы оптимизации. Единый подход.- М., 1974.

5. Габасов Р., Кириллова Ф.М. Качественная теория оптимальных процессов.- М., 1971.

6. Габасов Р., Кириллова Ф.М. Особые оптимальные управления.- М., 1973.

7. Габасов Р., Кириллова Ф.М. и др. Конструктивные методы оптимизации. В пяти частях. Ч. 1.-Минск, 1983, Ч. 2.- Минск, 1984, Ч. 3 - Минск, 1986, Ч. 4 - Минск, 1987, Ч. 5 - Минск, 1998.

8. Гайшун И.В., Горячкин В.В. Интервальная и робастная устойчивость двухпараметрических дискретных систем с интервальными коэффициентами // Дифференциальные уравнения. 2015. Т. 51, № 10. С. 1277-1283.

9. Астровский А.И., Гайшун И.В. Линейные системы с квазидифференцируемыми коэффициентами: управляемость и наблюдаемость движений.- Минск, 2013.

10. Гайшун И.В. Дифференциальные уравнения над кольцом функций на множестве гомоморфизмов дифференциального кольца в кольцо констант // Доклады НАН Беларуси. 2014. Т. 58, № 1. С. 31-33.

Полный список литературы размещен на сайте innosfera.by

27

i Надоели баннеры? Вы всегда можете отключить рекламу.