Научная статья на тему 'Эволюция и перспективы приближенных методов оптимального управления'

Эволюция и перспективы приближенных методов оптимального управления Текст научной статьи по специальности «Математика»

CC BY
292
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМИЗАЦИЯ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / УЛУЧШЕНИЕ / ПРИБЛИЖЕННЫЕ МЕТОДЫ / OPTIMIZATION / OPTIMAL CONTROL / IMPROVEMENT / APPROXIMATE METHODS

Аннотация научной статьи по математике, автор научной работы — Гурман Владимир Иосифович, Расина Ирина Викторовна, Блинов Александр Олегович

В статье дан краткий обзор приближенных методов оптимального управления и идей, лежащих в их основе. Изложение ведется в терминах постановок задач оптимизации и улучшения управления в стандартной форме для дискретных и непрерывных управляемых систем. Рассмотрены методы первого и второго порядков, улучшение сложных процессов. Освещены алгоритмы, основанные на исследовании множеств достижимости и на многомерных аппроксимациях. Приведен обширный список литературы, содержащий основные полученные теоретические и прикладные результаты, что дает возможность разработчикам новых методов оценить состояние дел в рассматриваемой области. Обозначены возможные направления дальнейшего развития приближенных методов оптимального управления в соответствии с прогрессом в сфере высокопроизводительной вычислительной техники.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Evolution and prospects of approximate methods of optimal control

The article gives a brief overview of approximate methods of optimal control and the ideas underlying them. Material is presented in terms of optimization and improvement control problems in the standard form for discrete and continuous control systems. The first and second orders methods and the improvement of complex processes are considered. The algorithms based on a study of reachable sets and multidimensional approximations are described. An extensive bibliography containing the main obtains theoretical and applied results, that enables developers of new methods to assess the state of arts in this area. Possible directions of further development of approximate methods of optimal control in accordance with progress in the field of highperformance computing are indicated.

Текст научной работы на тему «Эволюция и перспективы приближенных методов оптимального управления»

ШБН 2079-3316 ПРОГРАММНЫЕ СИСТЕМЫ: ТЕОРИЯ И ПРИЛОЖЕНИЯ № 2(6), 2011, с. 11-29

УДК 517.977

В. И. Гурман, И. В. Расина, А. О. Блинов

Эволюция и перспективы приближенных методов оптимального управления

Аннотация. В статье дан краткий обзор приближенных методов оптимального управления и идей, лежащих в их основе. Изложение ведется в терминах постановок задач оптимизации и улучшения управления в стандартной форме для дискретных и непрерывных управляемых систем. Рассмотрены методы первого и второго порядков, улучшение сложных процессов. Освещены алгоритмы, основанные на исследовании множеств достижимости и на многомерных аппроксимациях. Приведен обширный список литературы, содержащий основные полученные теоретические и прикладные результаты, что дает возможность разработчикам новых методов оценить состояние дел в рассматриваемой области. Обозначены возможные направления дальнейшего развития приближенных методов оптимального управления в соответствии с прогрессом в сфере высокопроизводительной вычислительной техники.

Ключевые слова и фразы: оптимизация, оптимальное управление, улучшение, прибли-

женные методы.

Введение

В конце 50-х и начале 60-х годов 20 века в связи с бурным развитием техники и появлением первых космических программ возникла настоятельная необходимость решения задач оптимизации процессов управления. В это время были сформулированы такие основополагающие результаты, обобщающие известные положения вариационного исчисления, как принцип максимума Понтрягина и метод динамического программирования Беллмана [1,2], принцип оптимальности Кротова [3-6], общая теория экстремума Милютина-Дубовицкого [7].

Несмотря на то, что эти новые теории учитывали особенности современных задач управления, главным образом, наличие разнообразных ограничений в дополнение к основным—дифференциаль-ным -- связям в вариационном исчислении, их прямое практическое

© В. И. Гурман, И. В. Расина, А. О. Блинов, 2011 © Программные системы: теория и приложения, 2011

использование оказалось весьма ограниченным сложностями реализации теоретических соотношений, описывающих искомое решение получаемых уравнений. Как правило, аналитическое решение можно было найти лишь в редких случаях, если не считать специально подобранных примеров. Это послужило причиной для разработки приближенных методов, позволяющих решать сложные практические задачи.

За прошедший с момента их появления полувековой период было предложено множество разнообразных приближенных, численных методов, позволяющих искать оптимальное решение напрямую, минуя условия оптимальности, посредством операций улучшения управления, повторяемых в итерационной процедуре. При этом косвенно использовались как сами основополагающие результаты, так и принципы, лежащие в их основе.

Цель данной статьи — дать краткий обзор этих и родственных им приближенных методов и лежащих в их основе идей, который позволил бы оценить состояние дел в этой области разработчикам новых методов в связи с перспективой эффективной реализации их в параллельных вычислениях на суперкомпьютерах.

Изложение ведется в терминах следующих постановок задач оптимизации и улучшения управления в стандартной форме, для непрерывной и дискретной систем:

(1) X = / (Ь, х, и), Ь € Т = [Ь/ , Ьр],

(2) х (Ь + 1) = / (Ь, х (Ь) ,и (Ь)), Ь € Т = {+ 1,...,ЬР},

(3) х € М", и € и (Ь,х) С Мр.

Предполагается, что Ь/, х (Ь/) = х/, Ьр фиксированы. Задан функционал как функция конечного состояния: I = Г (х (Ьр)).

Задача оптимизации I({шя}) ^ М состоит в поиске минимизирующей функционал I последовательности {тя} С О, где О— множество процессов т = (х(Ь),и(Ь)), удовлетворяющих (1) или (2) и (3).

Построение минимизирующей последовательности может вестись через решение задачи улучшения, в которой задан некоторый элемент т1 € О. Требуется найти элемент т11 € О, на котором I меньше: I(т11) < I(т1). Решая эту задачу итерационно, можно получить улучшающую, в частности, минимизирующую последовательность {тя}.

Непрерывная задача рассматривается в естественных для практики предположениях: непрерывность функций / (Ь, х, и), Г (х) и многозначного отображения И (Ь, х), кусочная непрерывность и(Ь), кусочная гладкость х(Ь). В дискретной задаче никаких теоретико-функциональных ограничений априори не накладывается.

1. Методы первого порядка

Исторически развитие методов улучшения началось с методов первого порядка, известных как градиентные методы, одновременно с созданием современной теории оптимального управления. В числе основоположников отметим Р. Куранта [8], Д.Е. Охоцимского и Т.М. Энеева [ - ], Л.В. Канторовича [ ], Л.И. Шатровского [ ], Дж. Келли [14].

Улучшающее изменение управления строится по схеме £ии(Ь) = —£1,^, где еи > 0, Ри — градиент минимизируемого функционала. Выбором Еи обеспечивается выполнение неравенства Л < 0, где — первая вариация функционала. При вычислении производной функционала обычно используют уравнение в вариациях и тождество Лагранжа, что приводит к необходимости решения системы дифференциальных уравнений для сопряженной переменной с соответствующими начальными условиями.

В зависимости от способа выбора величины еи получаются различные формы градиентных методов. Для задачи с закрепленным левым концом, свободным правым и при отсутствии ограничений вариация управления выбирается в виде ^ии(Ь) = еи • НИ(Ь, хи(Ь), ии(Ь), ф(Ь)), где Н = ф/ — /0, сопряженная система ф = — НХ(Ь, хи(Ь), ии(Ь), ф(Ь)) дополняется условием на правом конце ф(Ьр) = — Гх(Ьр,хи(Ьр)). Подробный вывод уравнений градиентного метода в терминах конструкций достаточных условий оптимальности можно найти в книге [15]. Более сложные схемы требуются при наличии ограничений на переменные управления и состояния. Здесь можно отметить, например, работы Р.П. Федоренко и В.Г. Гюрджиева [16,17]. Описание некоторых из градиентных методов можно найти в [10,18]. Наряду с этим реализовались и другие методы, родственные градиентным, основанные на принципе максимума Понтрягина [19-21]. Ряд интересных схем предложен в книге Н.Н. Моисеева [22]. Для линейных систем весьма эффективным оказался метод моментов [23,24].

2. Методы второго порядка

Методы первого порядка демонстрируют, как правило, высокую эффективность на первых итерациях и ее резкое снижение в окрестности оптимума. Это заставило обратиться к более сложным схемам построения алгоритмов и разработке методов второго порядка [25-27]. Они связаны с тейлоровской аппроксимацией функции Кротова-Беллмана и условий Беллма-на в окрестности текущего приближения с точностью до малых второго порядка, что приводит к дифференциальным уравнениям для первых и вторых производных функции Кротова-Беллмана. Если при этом также аппроксимируются правые части систем (1), (2) по переменным состояния и управления, то получается метод слабого улучшения, а результирующий синтез управления оказывается линейным. Ряд таких методов для непрерывных и дискретных систем приведен в [28-30]. Иначе получаются методы сильного улучшения. Такого типа методы представлены в [26,31,32].

Приведем соотношения в методе сильного улучшения:

(4) ф = —HX — a(Hp — Hp )j ф(^) = —aFx(xI(tF)) — (1 — a)E,

(5) 7 = —(HXx + aHpx + HX p7 + 7HPp7)) 7(tF ) = —«Fxx(xI(tF ^

(6) u(t, x) = u(t, x, (ф(£) + <г(х — XI(t)))),

u(t, x,p) = arg max H(t, x,p, u),

«eu(t,x)

H(t,x, ф) = max H(t,x, ф, u).

u£U(t,x)

Здесь ф и 7 соответственно градиент и матрица вторых производных функции Кротова по компонентам x на опорной траектории. Уравнение для матрицы 7 представляет собой матричное уравнение Риккати, которое может и не иметь решения в одной из точек заданного отрезка (особая точка). В этом случае предложена специальная процедура сдвига особой точки в начало отрезка и модификация алгоритма [28].

Новые методы повлекли за собой новую проблему. Если близость соседних приближений в методах градиентного типа первого порядка регулировалась величиной шага по градиенту, то методы второго порядка потребовали иных подходов. Один

из возможных подходов был сформулирован в [32] и получил название принципа локализации. Он использовался в [28-31]. Остановимся на этом подробнее.

Вместо исходного функционала рассматриваются функционалы следующего вида:

11

Ia = «I + ^(1 — а) / |Дх|2йЬ + ^|Дх(Ьр)|2,

4/

Ьр

1 Г 1

Iа = а! + ^(1 — а) I [в|Дх|2 + (1 — в)|Ди|2 ^|Дх(Ьр)|2,

0 < а < 1, 0 < в < 1, Дх = х — х1(Ь), Ди = и — и1(Ь).

В первой конструкции второе слагаемое является «штрафом» за отклонение от опоры по состоянию. Второй функционал содержит еще одно слагаемое как «штраф» за отклонение и по управлению. В каждом из функционалов коэффициенты а и в являются весовыми коэффициентами. Специальный подбор весовых коэффициентов позволяет регулировать близость соседних приближений.

Это позволяет решать по единой схеме задачи поиска оптимального процесса путем итерационного улучшения и реализации найденного решения в форме синтеза оптимального управления в окрестности его траектории. При этом получаются матричные уравнения Риккати относительно коэффициентов функции Кротова и их дискретные аналоги. В общем случае они отличны от уравнений Риккати классической теории АКОР [33,34], и соответствующий им приближенно-оптимальный синтез управления, в общем случае, в отличие от синтеза в АКОР --нелинейный.

Если положить а = 0 в уравнениях 4,5, то получается метод первого порядка, отличный от градиентного. Методы улучшения как первого, так и второго порядков использовались для решения широкого круга прикладных задач [35-37].

3. Методы улучшения сложных процессов

Эпоха освоения космоса привела к необходимости расчета траекторий перелета с одной планеты Солнечной системы на

другую (Земля-Марс) и разработки алгоритмов передвижения шагающих аппаратов по поверхностям других планет. Особенность указанных задач состоит в том, что на заданном отрезке времени управляемый процесс разбивается на отдельные этапы, каждый из которых имеет свое описание либо в терминах дифференциальных, либо дискретных уравнений. Все эти этапы связаны общим функционалом. Такие процессы получили название сложных или многоэтапных. В настоящее время их часто называют гибридными. Для них сформулированы общие достаточные условия оптимальности типа Кротова [32,38], и на этой основе разработана серия приближенных численных методов, которыми только и возможно практическое исследование столь сложных объектов [39-43].

В работе В.И. Гурмана [38] впервые была приведена математическая модель сложного процесса и сформулированы достаточные условия оптимальности. Модель сложного процесса содержит два уровня. Нижний уровень представляет собой непосредственное описание управляемого процесса. На этом уровне действует непрерывная модель. Верхний уровень создается искусственно в виде дискретного процесса, связывающего моменты изменения описания исходной системы управления. Позднее обнаружилось, что существуют процессы подобного вида, описываемые дискретными уравнениями. Поэтому в работе [40] модель и достаточные условия оптимальности были распространены на класс дискретных задач. В этом случае модели верхнего и нижнего уровней дискретные.

В работе К.Н. Габелко [39] приведен первый алгоритм решения задачи оптимального управления для сложных процессов градиентного типа. С помощью аналогичного метода решена задача оптимизации химического процесса [44]. Позднее в работах В.И. Гурмана и А.Г Орлова [41,42] были приведены более общая модель и достаточные условия оптимальности, и решена задача управления шагающим аппаратом. Затем в работе [43] впервые построен для сложных процессов метод улучшения второго порядка.

В статье [45] приведены достаточные условия оптимальности как в форме Кротова, так и в форме Беллмана. Сочетание этих условий и специальное преобразование части приращения функционала позволило построить алгоритм второго порядка,

содержащий меньшее число сопряженных переменных на каждом этапе по сравнению с более ранними вариантами метода. В [46,47] рассматривались достаточные условия оптимальности для сложных процессов с параметрами и процессов с запаздыванием по состоянию. Для последних получен алгоритм градиентного типа.

Иные подходы к оптимизации сложных процессов как процессов в логико-динамических системах развиваются в [48] и в [49].

4. Другие постановки задач и приближенные методы

Наряду с созданием методов второго порядка для классической задачи ОУ стали появляться, во-первых, новые подходы и методики построения приближенных методов, а во-вторых, новые постановки задач. Круг приложений расширялся. Появились исследования множеств достижимости и началось их использование для разработки алгоритмов улучшения. К работам такого типа можно отнести [50-52].

В классической задаче оптимального управления, как правило, предполагается, что каждому допустимому управлению и начальному состоянию соответствует единственная траектория управляемой системы. Вместе с тем распространенной является ситуация, когда невозможно установить однозначное соответствие между управлением и траекторией. В частности, такая ситуация возникает, когда априорные данные о каких-либо параметрах системы исчерпываются заданием лишь областей их изменения, оставляя сами эти параметры неопределенными. Каждое управление порождает множество траекторий системы, которое для решения задач управления удобно представлять объединением — ансамблем траекторий [53]. Методы решения нелинейных задач улучшения ансамблем предложены в [54-56].

В конце 1980-х, в 1990-ые годы и в первые годы 21-го века, с одной стороны шла шлифовка разработанных методов, а с другой продолжался процесс создания новых алгоритмов по ранее рассмотренным направлениям. В монографии [57] наряду с методами решения экстремальных задач подробно освещаются итерационные процессы, основанные на принципе максимума. Большое внимание уделено градиентным методам

и задаче с дополнительными функциональными ограничениями. Широкий спектр методов и их приложения для решения практических задач представлены в [58,59]. В монографии [59], помимо изложения методов улучшения и исследования вопросов их настройки, рассматриваются вопросы сходимости методов.

Своеобразным итогом и обобщением многолетних исследований достаточных условий оптимальности и методов улучшения, построенных на базе достаточных условий оптимальности, служит монография В.Ф. Кротова [60], где в частности описан общий метод глобального улучшения управления и его конкретная реализация с линейной разрешающей функцией, оказавшаяся особенно эффективной в приложении к управления квантовыми системами. Родственные методы улучшения, называемые нелокальными, описаны в книге В.А. Срочко [61]. Эти методы развиваются в работах А.С. Булдаева [62-64].

К нелокальным следует также отнести процедуры улучшения в вырожденных задачах ОУ, которые характеризуются наличием пассивных дифференциальных связей. Их исключение не меняет искомого решения задачи, но приводит к задаче меньшего порядка (производной задаче). При этом известные локальные улучшения в производной задаче автоматически ведут к нелокальным в исходной [30,65-69].

Работы [50,70] содержат развитие методов улучшения на основе аппроксимации множеств достижимости.

Иные подходы к решению задач улучшения, использующие схемы динамического программирования, представлены в [71-74].

В работах [75-77] получены достаточные условия оптимальности типа Кротова и в форме Беллмана для дискретных процессов с запаздыванием, на основе которых строятся методы улучшения второго порядка и рассматривается их модификация. Особенность таких алгоритмов состоит в том, что число слагаемых в сопряженной системе для первой и второй производных функции Кротова плавающее и зависит от величины запаздывания.

Большое количество разработанных методов, их модификаций и решенных практических задач привело к появлению обзоров и созданию первых монографий по приближенным методам оптимального управления, досконально освещающим

проведенные исследования и новые, возникающие по ходу исследований проблемы. Среди них [24,78-80].

5. Методы, основанные на многомерных аппроксимациях, и параллельные вычисления

Развитие вычислительной техники, появление суперкомпьютеров создало предпосылки для активного использования в задачах улучшения и приближенно-оптимального синтеза схем многомерной аппроксимации уравнения Беллмана, непосредственное использование которого связано с катастрофическим ростом объемов вычислений и памяти с увеличением размерности решаемой задачи. В.Ф. Кротовым впервые предложена схема приближенного синтеза с оценкой на основе достаточных условий оптимальности [81]. Она может реализоваться с помощью различных аппроксимирующих конструкций.

Одна из них, композиция одномерных полиномов, предложенная и реализованная в свое время в [82-84], позволяет проводить интерполяцию на прямоугольной сетке. Другие варианты интерполяции функции Кротова-Беллмана в [30]. В совместных работах В.И. Гурмана и В.А. Батурина [85,86] используется интерполяция функции Кротова-Беллмана либо кусочно-постоянной функцией, либо кусочно-линейной. Родственный подход для дискретных систем рассматривался в [87]. Вторая конструкция, регулярный тейлоровский полином, обеспечивает интерполяцию на специальной сетке.

Наиболее широкие возможности для применения разнообразных конструкций предоставляет аппроксимация по методу наименьших квадратов. Сами аппроксимирующие конструкции при этом тоже могут улучшаться. Разные аспекты такого подхода рассматривались в [88-90]. Теми же методами возможно приближенное аналитическое представление моделей объектов управления, необходимое для применения методов теории управления как точных, так и приближенных, в то время как в реальности эти модели зачастую представлены сложными зависимостями, в том числе эмпирическими, табличными, и компьютерными программами. Наглядным примером может служить модель вертолета при оптимизации режимов нештатной посадки [91-93].

Отметим, что в связи с этим повысился интерес к дискретизации непрерывных систем — переходу от непрерывной модели к дискретной на ранних стадиях исследования задачи, а не в конце, при численном интегрировании конечных дифференциальных соотношений оптимального процесса. Такое преобразование модели управляемой системы позволяет обойти обременительные теоретико-функциональные требования в применяемых схемах аппроксимации и оценках приближенных решений. Кроме того, в терминах постановки дискретной задачи ОУ и соответствующих достаточных условий возможна интерпретация самых разнообразных задач. Эти вопросы затрагивались в работах [32,38,59]. Дискретные модели естественно используются для применения развитых методов нелинейного программирования к решению задач оптимального управления [94-96].

Как известно, выбор начального приближения, достаточно близкого к оптимуму, играет важную роль при проведении расчетов любым итерационным методом. Общих методик и рекомендаций на этот счет не существует. Однако для вырожденных задач, широко распространенных на практике, предлагается в качестве начальных приближений находить магистральные решения таких задач специальными методами [97-99].

В связи с появлением суперкомпьютеров появилась уникальная возможность параллельных вычислений для решения оптимизационных задач, что позволяет существенно увеличить их допустимую размерность. Вопросы распараллеливания алгоритмов при решении задач ОУ и некоторые результаты этого направления рассматриваются в [100,101]. В указанных статьях представлен опыт применения параллельных вычислений для приближенного решения задач улучшения и оптимизации законов управления динамическими системами. Для этих целей в ИПС им. А.К. Айламазяна РАН разрабатывается программный комплекс ISCON (Improvement and Synthesis of Control), предназначенный для моделирования и оптимизации управляемых систем (рис. 1).

В комплексе предусмотрена возможность обмена данными с пакетом символьных вычислений Maple. Модули и подпрограммы ПК ISCON в совокупности представляют собой гетерогенную вычислительную среду с распределением функций между

Рис. 1. Схема ПК ISCON

ее компонентами. Так массовые однотипные расчеты по отработанным и реализованным алгоритмам выполняются на кластере СКИФ. С помощью пакета Maple можно анализировать и обрабатывать полученные данные, а также подготавливать начальные данные для нового запуска программ на суперЭВМ, что делает его в этой роли своеобразным интеллектуальным интерфейсом между пользователем и программами.

6. Перспективы: многометодные процедуры

Одним из перспективных направлений решения задач оптимизации является применение многометодного подхода, заключающегося в комбинировании различных методов в процессе решения задачи. Описание подобных технологий есть в работах А.И. Тятюшкина, А.Ю. Горнова [102,103].

Авторы предлагают в качестве средства для создания многометодных процедур использовать механизм параллельных вычислений, при котором выполняется одновременный запуск нескольких алгоритмов, а на основе сравнения полученных промежуточных результатов выбирается наилучший. Описанный

метод достаточно прост в реализации, но при этом не используются знания о свойствах решаемой задачи и применяемых алгоритмах улучшения, которые бы позволили снизить объем вычислений.

В [104, 105] предложен и получил определенное развитие принцип построения многометодных процедур оптимального управления, использующий интеллектуальный анализ соответствия задач и алгоритмов их решения.

Такой подход ориентирован не только на повышение эффективности поиска оптимальных управлений, но, что может быть важнее, -- на решение проблемы отдаления потенциальных пользователей из предметных областей от ценных достижений теории управления, заключенных в большом разнообразии предлагаемых приближенных схем и алгоритмов, иными словами -на автоматизацию процесса поиска решения по тому запросу, который способен сформулировать пользователь.

Хотя этот подход еще далек от полного воплощения, но проведенный анализ обзорного характера и собственный опыт убеждают в том, что в сочетании со стремительным прогрессом в области технических средств он представляет главное направление развития приближенных методов оптимального управления.

Список литературы

[1] Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко

Е. Ф. Математическая теория оптимальных процессов. М. : Наука,

1961. ТП

[2] Беллман Р. Динамическое программирование. М. : ИЛ, 1960. Т[]

[3] Кротов В. Ф. Методы решения вариационных задач на основе

достаточных условий абсолютного минимума, 1 // Автоматика и

телемеханика, 1962, № 12. Т[]

[4] Кротов В. Ф. Методы решения вариационных задач на основе

достаточных условий абсолютного минимума, 2 // Автоматика и

телемеханика, 1963, № 5. Т

[5] Кротов В. Ф. Методы решения вариационных задач на основе

достаточных условий абсолютного минимума, 3 // Автоматика и

телемеханика, 1963, № 7. Т

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[6] Кротов В. Ф. Методы решения вариационных задач на основе

достаточных условий абсолютного минимума, 4 // Автоматика и

телемеханика, 1965, № 11. Т[]

Дубовицкий А. Я., Милютина А. А. Задачи на экстремум при наличии ограничений // Журнал вычислительной математики и математической физики, 1965. 5, № 3. Т[]

Courant R. Variational Methods for Solutions of Problems of Equlibrium and Vibrations // Bull. Amer. Math. Soc., 1943. 49, no. 1. |1 Охоцимский Д. Е. К теории движения ракет // Прикладная математика и механика, 1946. 10, № 2. |1

Охоцимский Д. Е., Энеев Т. М. Некоторые вариационные задачи, связанные с запуском искусственного спутника Земли // Успехи физических наук, 1957. 15, № 1a. |1

Энеев Т. М. О применении градиентного метода в задачах теории оптимального управления // Космические исследования, 1968. 4,

№4. |1

Канторович Л. В. Функциональный анализ и прикладная математика // УМН, 1948. 3, №6, с. 89-185. |1

Шатровский Л. И. Об одном численном методе решения задач оптимального управления // Журнал вычислительной математики и математической физики, 1962, № 2. |1

Келли Г. Д. Метод градиентов // Методы оптимизации с приложениями к механике космического полета / ред. Лейтман Д.. — М. : Наука, 1965. Т1

Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. М. : Наука, 1973. |1

Федоренко Р. П. Метод проекции градиента в задачах оптимального управления. М., Препринт ИПМ АН СССР, 1975, №45. |1 Гюрджиев В. Г. Метод возможных направлений для решения задачи оптимального управления с фазовыми ограничениями, Рукопись депонирована в ВИНИТИ, 18.09.1980, № 4099-80 Деп. |1 Miele A. Recent Advances in Gradient Algorithms for Optimal Control Problems // J. Optimiz. Theory and Applications, 1975. 17, no. 516. |1 Крылов И. А., Черноусь^ Ф. Л. О методе последовательных приближений для задач оптимального управления // Журнал вычислительной математики и математической физики, 1962. 2, № 6.

Т1

Крылов И. А., Черноусь^ Ф. Л. Решение задач оптимального управления методом локальных вариаций // Журнал вычислительной математики и математической физики, 1966. 6, № 2. Т Васильев О. В., Тятюшкин А. И. Об одном методе решения задач оптимального управления, основанном на принципе максимума // Журнал вычислительной математики и математической физики, 1981. 21, № 6. Т1

Моисеев Н. Н. Численные методы в теории оптимальных систем. М. : Наука, 1971. Т1

Красовский Н. Н. Теория управления движением. М. : Наука, 1968.

Т1

[24] Габасов Р., Кириллова Ф. М. Современное состояние теории

оптимальных процессов // Автоматика и телемеханика, 1972, № 9.

Т1, 4

[25] Jacobson D. H. New second-order and first-order algorithms for determinining optimal control. A differential programming approach // J. Optimiz. Theory and Applications, 1968. 2, no. 4. Т2

[26] Кротов В. Ф., Фельдман И. Н. Итерационные методы решения экс-

тремальных задач // Моделирование технико-экономических процессов. -- М. : Изд-во Московского экономико-статистического института,

1978. Т2

[27] Анрион Р. Теория второй вариации и ее приложения в оптимальном управлении. М. : Наука, 1979. Т2

[28] Гурман В. И., Батурин В. А., Расина И. В. Приближенные методы оптимального управления. Иркутск : Изд-во Иркут. Ун-та, 1983. Т2, 2

[29] Гурман В. И., Расина И. В., Батурин В. А., Данилина Е. В. Достаточные условия относительного минимума в задачах улучшения и синтеза управления // Методы оптимизации и их приложения. -Новосибирск : Наука. Сиб. Отд-ие, 1982. Т

и др.

[30] Гурман В. И., Батурин В. А., Данилина Е. В., и др. Новые

методы улучшения управляемых процессов. Новосибирск : Наука,

1987. Т2, 4, 5

[31] Гурман В. И., Расина И. В. О практических приложениях достаточных условий сильного относительного минимума // Автоматика и телемеханика, 1979, № 10, c. 12-18. Т2, 2

[32] Гурман В. И. Принцип расширения в задачах управления. М. : Наука, 1997. Т2, 2, 3, 5

[33] Летов А. М. Аналитическое конструирование регуляторов, II // Автоматика и телемеханика, 1960. 21, № 5, c. 561-568. Т2

[34] Kalman R. Contributions to the theory of optimal control // Bul. Soc. Mech. Mat., 1960, p. 102-119. Т2

[35] Модели управления природными ресурсами / ред.Гурман В. И.. М. : Наука, 1981. Т2

и др.

[36] Викулов В. Е., Гурман В. И., Данилина Е. В., и др. Экологоэкономическая стратегия развития региона. Новосибирск : Наука,

1990. Т

и др.

[37] Данилина Е. В., Румянцев А. К., Панарин А. В., и др. Модели и методы оценки антропогенных изменений геосистем. Новосибирск : Наука, 1986. Т2

[38] Гурман В. И. К теории оптимальных дискретных процессов // Автоматика и телемеханика, 1973, № 6. Т3, 5

[39] Габелко К. Н. Последовательное улучшение многоэтапных процессов // Автоматика и телемеханика, 1974, № 12. Т3

[40] Гурман В. И., Расина И. В. Достаточные условия оптимальности сложных дискретных процессов // Сб. Численные методы. — Иркутск, 1978. Т3

[41] Гурман В. И., Орлов А. Г. Достаточные условия оптимальности сложных процессов // Автоматика и телемеханика, 1978, №4. Т3

[42] Гурман В. И., Орлов А. Г. Сложные процессы двуногой ходьбы, Препринт ИПМ им. М. В. Келдыша, 1979, №95. Т3

[43] Гурман В. И., Расина И. В. Метод улучшения второго порядка сложных процессов. Новосибирск, 1977. Т3

[44] Агафонова И. А., Гулин Л. Л., Расин И. И. Математическое

моделирование и оптимизация процесса метилирования динатриевой соли сульфамина антипирина, Деп. в ВИНИТИ, 10.11.78, № 3457—98 ДЕП.. Т3

[45] Расина И. В. Две формы достаточных условий оптимальности и метод улучшения второго порядка для сложных процессов // Юбилейный сборник научных трудов к 10 летию СИПЭУ. — Иркутск : изд-во «Макаров», 2004, с. 180—192. Т3

[46] Расина И. В. Сложные процессы с параметрами // Актуальные

проблемы права, экономики и управления в Сибирском регионе.

Сборник статей международной научно-практической конференции (18—19 апреля 2005 г.). — Иркутск : СИПЭУ, 2005. Т. 2, с.42—44. Т3

[47] Расина И. В. Сложные дискретные процессы с запаздыванием по

состоянию // Актуальные проблемы права, экономики и управления в Сибирском регионе. Сборник статей международной научнопрактической конференции (3—4 мая 2007 г.). — Иркутск : СИПЭУ,

2007. Т. 1, с.348-351. Т3

[48] Васильев С. Н., Жерлов А. К., Федосов Е. А., Федунов Б. Е.

Интеллектное управление динамическими системами. М. : Наука.

Физматлит, 1999. Т 3

[49] Бортаковский А. С., Пантелеев А. В. Достаточные условия оптимальности управления непрерывно-дискретными системами // Автоматика и телемеханика, 1987, № 7, с. 57-66. Т3

[50] Гурман В. И., Батурин В. А. Алгоритм улучшения управления, основанный на оценках областей достижимости, Деп. в ВИНИТИ, 1985, № 651-85. Т4

[51] Константинов Г. Н., Сидоренко Г. В. Внешние оценки множеств достижимости управляемых систем // Известия АН СССР. Техническая Кибернетика, 1986, № 3. Т

[52] Гурман В. И., Константинов Г. Н. Описание и оценка множеств достижимости управляемых систем // Дифференциальные уравнения, 1987, № 3. Т4

[53] Куржанский А. Б. Управление и наблюдение в условиях неопределенности. М. : Наука, 1977. Т4

[54] Константинов Г. Н. Задача управления ансамблем и достаточные условия оптимальности // Новые методы улучшения управляемых процессов. --Новосибирск : Наука, 1987. Т4

[бб] Константинов Г. Н. Метод последовательного улучшения в задаче управления ансамблем // Новые методы улучшения управляемых процессов. — Новосибирск і Наука, 1987. T

[66] Константинов Г. Н. Достаточные условия оптимальности для минимаксной задачи управления ансамблем траекторий // Автоматика и телемеханика, 1987, № 8. T4

[67] Васильев О. В., Аргучинцев А. В. Методы оптимизации в задачах и упражнениях. М. і Физматлит, 1999. T4

[68] Батурин В. А., Гурман В. И., Дыхта В. А. И Д. Методы ре-

шения задач теории управления на основе принципа расширения. Новосибирск і Наука, 1990. T4

[69] Батурин В. А., Урбанович Д. Е. Приближенные методы оптимального управления, основанные на принципе расширения. Новосибирск і

Наука, 1997. T4, б

[60] Krotov V. F. Global methods in optimal control theory. New York і Marcel Dekker, 1996. T4

[61] Срочко В. А. Итерационные методы решения задач оптимального

управления. М. і Физматлит, 2000. T4

[62] Булдаев А. С. Методы возмущений в задачах улучшения и

оптимизации управляемых систем. Улан-Удэ і Изд-во Бурятск. гос. ун-та, 2008. T4

[63] Булдаев А. С. Проекционные процедуры нелокального улучшения

линейно управляемых процессов // Известия вузов. Математика, 2004, №1, c. 18-24. T

[64] Булдаев А. С., Моржин О. В. Улучшение управлений в нелиней-

ных системах на основе краевых задач // Известия Иркутского государственного университета. Математика, 2009. 2, № 1, c. 94-107.

T4

[6б] Гурман В. И. Вырожденные задачи оптимального управления. М. і Наука, 1997. T4

[66] Гурман В. И., Батурин В. А. Улучшение и локальный синтез управления. Вырожденные задачи, Деп. в ВИНИТИ, № 618А-ДЕП.81. T

[67] Гурман В. И., Батурин В. А., Данилина Е. В. Нелокальное улучшение и приближенно оптимальный синтез управления в задачах оптимального управления с неограниченным множеством скоростей, Деп. в ВИНИТИ, № 339б-84 ДЕП.. T

[68] Дыхта В. А., Колокольникова Г. А., Никифорова И. А. Нелокальные преобразования задач оптимального управления и условия минимума на множестве последовательностей в задачах с особыми режимами // Теоретические и прикладные вопросы оптимального управления. — Новосибирск і Наука, Сиб. Отд-ние, 198б. T

[69] Гурман В. И., Батурин В. А., Москаленко и др. А. И. Mетоды улучшения в вычислительном эксперименте. Новосибирск і Наука,

1988. T4

[70] Батурин В. А., Гончарова Е. В. Метод улучшения, основанный на приближенном представлении множества достижимости. Теорема о релаксации // Автоматика и телемеханика, 1999, № 11. Т4

[71] Моисеев Н. Н. Численные методы теории оптимального управления, использующие вариации в пространстве состояний // Кибернетика, 1966. 5, № 3. Т4

[72] Хрусталев М. М. Необходимые и достаточные условия оптимальности в форме уравнения Беллмана // Докл. АН СССР, 1975. 242, № 5. Т

[73] Моисеев Н. Н. Методы динамического программирования в теории оптимальных управлений, I // Журнал вычислительной математики и математической физики, 1964. 4, № 3. Т

[74] Моисеев Н. Н. Методы динамического программирования в теории оптимальных управлений, II // Журнал вычислительной математики и математической физики, 1965. 5, № 1. Т4

[75] Расина И. В. Метод улучшения второго порядка для дискретных процессов с запаздыванием, 18.06.96, № 1, 1997-В96. Т4

[76] Расина И. В. Два метода улучшения второго порядка для дискрет-

ных управляемых процессов с запаздыванием // Труды конференции, Секция 2: Оптимальное управление // 11-я Байкальская междуна-

родная школа-семинар «Методы оптимизации и их приложения», 5-12 июля 1998 г.. --Иркутск, 1998, с. 97-100. Т

[77] Расина И. В. Одна модификация метода улучшения для дискретных процессов с запаздыванием // Труды международной конференции «Математика, управление, интеллект». --Иркутск, 2000, с. 139-142. Т4

[78] Черноусько Ф. Л., Колмановский В. Б. Вычислительные и приближенные методы оптимального управления // Итоги науки и техники. Сер. Мат. анализ, 1977. Т. 14, с. 101-166. Т4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[79] Мерриэм К. У. Теория оптимизации и расчет систем управления с обратной связью. М. : Мир, 1967. Т

[80] Кирин Н. Е. Вычислительные методы теории оптимального управления. Л. : Изд-во ЛГУ, 1968. Т4

[81] Кротов В. Ф. Приближенный синтез оптимального управления // Автоматика и телемеханика, 1964. 25, № 11. Т5

[82] Букреев В. З. Об одном методе приближенного синтеза Оптимального управления // Автоматика и телемеханика, 1968, № 11.

Т5

[83] Букреев В. З. Синтез оптимального управления летательным аппаратом на активном участке // Космические исследования, 1970. 8, № 6. Т

[84] Гурман В. И. Приближенный синтез оптимального управления // Автоматика и телемеханика, 1976, № 5. Т5

[85] Гурман В. И., Батурин В. А. Построение и оценка приближенного синтеза оптимального управления // Изв. АН СССР. Техническая кибернетика, 1978, № 4. Т5

[86] Гурман В. И., Батурин В. А. Приближенный синтез оптимального управления с помощью дискретной оценки // Проблемы устойчивости движения і Наука, 1979. T5

[87] Гурман В. И., Константинов Г. Н., Расина И. В. Приближенный синтез оптимального управления для дискретных систем // Методы оптимизации и исследование операций, прикладная математика. Сб. статей. -- Иркутск і Сибирский энергетический институт СО АН СССР, 1976. T5

[88] Гурман В. И., Ухин М. Ю. Метод улучшения дискретного управления, основанный на аппроксимации множества достижимости // Сборник научных трудов, посвященный 20-летию ИПС РАН. — М. і Физматлит, 2004. T5

[89] Gurman V. I., Ukhin M. Y. The extension principle in control problems. Constructive methods and applied problems. M. і Fizmatlit, 200б. T

[90] Ухин М. Ю. Приближенный синтез оптимального управления. М. і Физматлит, 2006. T б

[91] Гурман В. И., Квоков В. Н., Ухин М. Ю. Приближенные методы оптимизации управления летательным апаратом // Автоматика и телемеханика, 2008, № 4, c. 191-201. T5

[92] Квоков В. Н., Трушкова Е. А., Ухин М. Ю. Метод улучшения управления на имитационной модели объекта и его применение к задаче оптимизации маневров нештатной посадки вертолета // Вестник СГАУ, 2009, № 1, c. 161-170. T

[93] Гурман В. И., Блинов А. О., Фраленко В. П. Аналитическая аппроксимация модели динамики летательного аппарата в задачах приближенно-оптимального синтеза управления // Вестник СГАУ, 2009, № 4, c. 16-2б. T5

[94] Евтушенко Ю. Г. Методы решения экстремальных задач и их применение в системах оптимизации. М. і Наука. T5

[9б] Габасов Р., Кириллова Ф. М., Тятюшкин А. И. Конструктивные методы оптимизации. Ч.1і Линейные задачи. Минск і Университетское, 1984. T

[96] Горнов А. Ю. Вычислительные технологии решения задач оптимального управления. Новосибирск і Наука, 2009. TS

[97] Гурман В. И. Магистральные решения в процедурах поиска оптимальных управлений // Автоматика и телемеханика, 2003, № 3.

T5

[98] Гурман В. И., Ухин М. Ю. Приближенный синтез оптимального управления в задачах с магистральными решениями // Труды второй международной конференции по проблемам управления (МКПУ II) 16-20 июня 2003 г.. --М. і ИПУ РАН, 2003. T

[99] Гурман В. И., Ухин М. Ю. Магистральные решения в задачах оптимизации развития регионов // Автоматика и телемеханика, 2004, № 4. T5

[100] Гурман В. И., Трушкова Е. А. Приближенные методы оптимизации управляемых процессов // Программные системы: теория и

приложения, 2010. 1, №4, http://psta.psiras.ru/read/psta2010_4_ 85-104.pdf. Т5

[101] Гурман В. И., Трушкова Е. А., Блинов А. О. Приближенная оптимизация управления в параллельных вычислениях // Вестник БГУ, 2010, № 9. Т5

[102] Тятюшкин А. И. Численные методы и программные средства оптимизации управляемых систем. Новосибирск : Наука, 1992. Т6

[103] Горнов А. Ю., Тятюшкин А. И. Программная реализация мульти-методной технологии для задач оптимального управления // Труды III Междунар. конф. «Проблемы управления и моделирования в сложных системах». — Самара : ИПУСС РАН, 2001, c. 301—307. Т6

[104] Белышев Д. В., Гурман В. И. Программный комплекс многоме-тодных интеллектуальных процедур оптимального управления // Автоматика и телемеханика, 2003, №6, c. 60—67. Т6

[105] Белышев Д. В., Гурман В. И. Многометодный подход к оптимизации управления // Математика, информатика: теория и практика. Сборник трудов, посвященный 10-летию Университета города Пере-славля.— Под редакцией А.К. Айламазяна. — Переславль-Залесский : Издательство «Университет города Переславля», 2003, c. 130—135. Т6

V. I. Gurman, I. V. Rasina, A. O. Blinov. Evolution and prospects of approximate methods of optimal control.

Abstract. The article gives a brief overview of approximate methods of optimal control and the ideas underlying them. Material is presented in terms of optimization and improvement control problems in the standard form for discrete and continuous control systems. The first and second orders methods and the improvement of complex processes are considered. The algorithms based on a study of reachable sets and multidimensional approximations are described. An extensive bibliography containing the main obtains theoretical and applied results, that enables developers of new methods to assess the state of arts in this area. Possible directions of further development of approximate methods of optimal control in accordance with progress in the field of high-performance computing are indicated.

Key Words and Phrases: optimization, optimal control, improvement, approximate methods.

Образец ссылки на статью:

В. И. Гурман, И. В. Расина, А. О. Блинов. Эволюция и перспективы приближенных методов оптимального управления // Программные системы: теория и приложения : электрон. научн.

журн. 2011. №2(6), с. 11-29. URL: http://psta.psiras.ru/read/

psta2011_2_11-29.pdf

i Надоели баннеры? Вы всегда можете отключить рекламу.