Научная статья на тему 'О решении задач оптимального управления вариационным методом'

О решении задач оптимального управления вариационным методом Текст научной статьи по специальности «Математика»

CC BY
129
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / НЕКОРРЕКТНЫЕ ЗАДАЧИ / НЕЛИНЕЙНЫЙ МАЯТНИК С ТРЕНИЕМ / OPTIMAL CONTROL / ILL-POSED PROBLEMS / SINGULAR REGIMES

Аннотация научной статьи по математике, автор научной работы — Терновский В. В., Хапаев М. М.

В работе обсуждается алгоритм численного решения задач оптимального управления методами, применяемыми при рассмотрении некорректных задач. Развитые академиком А. Н. Тихоновым в XX в. устойчивые алгоритмы решения таких задач на компакте могут быть использованы в задачах оптимального управления. Особенностью задач оптимального управления является разрывность функции управления. Указанная трудность преодолевается введением подвижной расчетной сетки. Величина шага сетки находится в процессе решения задачи быстродействия.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О решении задач оптимального управления вариационным методом»

В качестве примера рассмотрим еще наборы вида (а\, ai,ai,ai). В случае f(a\, ai,ai,ai) = 1 необходимо обратиться к конъюнкциям х\х^у\у\ и Х2Хау\у\ из ДНФ функции д, а в случае f(a\, ai,ai,ai) = = 0 — заметить, что каждая конъюнкция из ДНФ функции д' либо содержит хотя бы одну из переменных уд, либо хотя бы один из конъюнктивных сомножителей Х\Х2, Х1Х4, Х2Х3, Х3Х4. Теорема 3 доказана.

Отметим, что для равномерного id-разложения соответствующая степень deg(P2/SM) равна 5 (см. [2]).

СПИСОК ЛИТЕРАТУРЫ

1. Марченков С.С. Однородные алгебры // Проблемы кибернетики. Вып. 39. М.: Наука, 1982. С. 85-106.

2. Марченков С. С. О равномерном id-разложении булевых функций // Дискретная математика. 1990. 2. Вып. 3. С. 29-41.

3. Марченков С. С. О степени равномерного id-разложения замкнутых классов в Ри / / Дискретная математика. 1991. 3. Вып. 4. С. 128-142.

4. Марченков С. С. Об id-разложениях класса Ри над предполными классами // Дискретная математика. 1993. 5. Вып. 2. С. 98-110.

5. Марченков С.С. Замкнутые классы булевых функций. М.: Физматлит, 2000.

6. Marczewski Е. Homogeneous operations and homogeneous algebras // Fund. Math. 1964. 56. N 1. P. 81-103.

Поступила в редакцию 10.11.09

УДК 517.977

В.В. Терновский1, М.М. Хапаев2

О РЕШЕНИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ВАРИАЦИОННЫМ МЕТОДОМ

В работе обсуждается алгоритм численного решения задач оптимального управления методами, применяемыми при рассмотрении некорректных задач. Развитые академиком А. Н. Тихоновым в XX в. устойчивые алгоритмы решения таких задач на компакте могут быть использованы в задачах оптимального управления. Особенностью задач оптимального управления является разрывность функции управления. Указанная трудность преодолевается введением подвижной расчетной сетки. Величина шага сетки находится в процессе решения задачи быстродействия.

Ключевые слова: оптимальное управление, некорректные задачи, нелинейный маятник с трением.

1. Введение. Во второй половине XX в. интенсивно развивались два научных направления: оптимальное управление (ОУ) и некорректные задачи. Академик А. Н. Тихонов показал, что эти области прикладной математики пересекаются. Действительно, задачи ОУ являются некорректно поставленными [1]. Но можно и не учитывать некорректность, и изучать задачу ОУ в рамках принципа максимума Л. С. Понтрягина (ПМ). С другой стороны, ПМ ничего не говорит о режимах особого управления, которые возникают в реальных задачах, например, при наличии фазовых ограничений [2]. Кроме того, входные данные задач ОУ в реальных приложениях заданы неточно, что также не укладывается в рамки ПМ. Таким образом, ПМ имеет ограниченное применение. Необходимо создать универсальный алгоритм, который позволил бы решать прикладные задачи ОУ, учитывая некорректность, с приближенными данными и режимами особого управления. По нашему мнению, этим запросам отвечает вариационный подход в задачах ОУ.

1 Факультет ВМК МГУ, доц., к.ф.-м.н., e-mail: Vladimirl961Qhotmail.com

2 Факультет ВМК МГУ, проф., д.ф.-м.н.

Однако имеется принципиальное противоречие в регуляризирующих методах решения задач ОУ. Так как задача некорректная, необходимо применять специальные алгоритмы решения таких задач, которые с успехом используются для поиска гладких решений, в то время как в задаче ОУ ищется разрывное решение (например, в релейных устройствах). Применение стабилизатора и построение сглаживающего функционала для минимизации в классе разрывных решений является допустимым, но малопродуктивным, так как регуляризирующий множитель имеет порядок ошибки округления. Необходимо "угадывать" разрывные решения в сглаженных кривых. Говорить о сходимости минимизирующей последовательности разрывных управлений в какой-либо разумной метрике также не приходится, хотя задача ОУ имеет решение.

Ключом к разрешению трудностей оказалось использование подвижной (по времени) сетки. Если некорректная задача исследуется стандартными вариационными методами без регуляризации, такое решение обычно состоит из гладкой кривой и выбросов большой амплитуды высокой частоты. Если ввести дополнительные переменные, означающие длину временных сегментов, и продолжить процесс минимизации, может оказаться, что суммарная длина сегментов с выбросами будет в пределах ошибки округлений. Эта гипотеза подтверждена и реализована на примере задачи о наискорейшем успокоении нелинейного маятника с вязким трением.

2. Задача наибыстрейшего успокоения нелинейного маятника. В системах управления кораблями, самолетами, ракетами стремятся минимизировать время, по истечении которого объект выходит в заданную точку или на заданную траекторию при ограничении угла отклонения рулей, количества расходуемого топлива и т. п. Так как уравнение маятника является часто встречающимся в механике таких систем, решение задачи наибыстрейшего успокоения при наличии трения, пропорционального скорости перемещения объекта, представляется актуальным и современным. Характерный пример такой системы — твердое тело, движущееся в газовой или жидкой среде. Тогда дифференциальное уравнение маятника записывается в виде

v + ф + ш2 sin(u) = 0. (1)

В отличие от случая сухого трения, колебания никогда полностью не кончаются. Сформулируем задачу управления по быстродействию нелинейным маятником с вязким трением (1): перевести маятник из произвольного положения в нижнее устойчивое за кратчайшее время. Нам неизвестно аналитическое решение уравнения (1), что приводит к неразрешимости функции координаты от управления в явном виде и усложняет численный алгоритм. Авторами работы [3] подобная задача исследовалась геометрическими методами.

Запишем задачу быстродействия в безразмерной форме

v + fiv + sin(v) = ku(t). (2)

На управление наложено стандартное ограничение |«(i)| ^ 1, начальные состояния произвольны: г>(0) = г>о, ¿(0) = vq, а финальные состояния отвечают нижнему устойчивому положению равновесия: v(T) = 2жп, v(T) = 0, {¿¿, к} = const, где п — неизвестное целое число. Коэффициент трения /i и коэффициент управления к предполагаются произвольными.

Удобно перейти к новой функции (р = uexp(/i/2i), чтобы избавиться от первой производной в численных расчетах. Тогда уравнение (2) для новой функции (р записывается в виде

а2

(р + — <р + exp(/i/2i) sin(exp(^/i/2i)9?) = kexp(fj,/2t)u(t). (3)

Сформулируем задачу быстродействия в вариационной постановке: найти минимальное время Т > О успокоения маятника и целое число п (количество оборотов маятника) на решении уравнения (3) при выполнении локальных и интегральных ограничений:

1) |u(i)| < 1,

Управление (а) и фазовая траектория (б) нелинейного маятника при входных параметрах: ¡л = 0.1, у о = 1.5, у о = 1.5, к = 0.7, общее время процесса гашения колебаний Т = 4.788

2 Т Т

2) - ^о - ¿о + 2ттп^ ехр0*/2*) " ^ / ^ ^ + / ехР(^) 8т(ехр(-/х/2£М0) ^ =

о о

т

= к! ехр(М/2 о

г г

3, - * + ы^/Ч (1 ■-Ti) + £ / WO« - / £ИФ(,/ад ...*=Ф(-,/2£М£)) « =

о о

г

= -к J £exp(/i/2£)«(£) о

4) Ai + А2 + ... + Ajv = Т,

где Aj — частичный сегмент интегрирования, подлежащий определению, N — заданное число узлов. На каждом сегменте управление не зависит от времени (используется кусочно-постоянная аппроксимация).

Замечание. Ограничения 2 и 3 следуют из уравнения (3) после одно- и двукратного интегрирования. Интересно исследовать также несколько эквивалентных формулировок ограничений типа 2 и 3, интегрируя уравнение (3) с различными весами, образующими полную систему.

Для решения поставленной задачи ОУ воспользуемся стандартными градиентными методами поиска минимума функционала Т при ограничениях 1-4, встроенными в систему компьютерной математики фирмы Wolfram. Заметим, что расчеты без ограничения 4 не приводят к результату высокой точности из-за неустойчивости задачи даже при использовании стабилизатора. Рассчитаем траекторию (p(t) с помощью встроенной программы NDSolve. Вычислим интегралы из ограничений 2 и 3 использовав процедуру NIntegrate. Интегралы в правых частях ограничений 2 и 3 найдем аналитически, предварительно приближая управление кусочно-постоянной функцией с неизвестными значениями на сегментах (использовалось 50-200 сегментов). И, наконец, воспользуемся программой NMinimize для расчета управления.

На сетке из 200 узлов был получен график управления колебаниями нелинейного маятника (рисунок). Параметры задачи выбирались так, чтобы подчеркнуть нелинейный характер движения маятника под действием большой силы управления и трения, как это бывает в реальных механизмах. Моделирование движения при малых значениях коэффициента управления и пренебрежимо малом трении подробно исследовано в работе [4].

3. Заключение. Численное решение задач ОУ трудоемко из-за некорректности. Построение негладких функций управления требует введения подвижной неравномерной сетки, расположение узлов которой определяется в результате решения задачи быстродействия. Это добавляет еще одну размерность в задаче и увеличивает время вычислений. С другой стороны, предложенный подход позволяет добиться более высокой (машинной) точности попадания в финальное условие, чем при использовании только тихоновского стабилизатора. Дальнейшее развитие метода видится в решении многомерных задач ОУ с использованием нерегулярной треугольной и тетраэдральной сетки.

СПИСОК ЛИТЕРАТУРЫ

1. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1986.

2. Терновский В.В.,Хапаев М. М. Прямой численный метод решения задач оптимального управления // Докл. РАН. 2008. 420. № 4. С. 463-466.

3. Ли Э.Б., Маркус J1. Основы теории оптимального управления. М.: Наука, 1972.

4. Решмин С. А., Черноусько Ф. J1. Оптимальный по быстродействию синтез управления нелинейным маятником // Изв. РАН. ТиСУ. № 1. 2007. С. 13-22.

Поступила в редакцию 14.12.09

i Надоели баннеры? Вы всегда можете отключить рекламу.