Механика
УДК 531.36
МЕТОД ОХОЦИМСКОГО-ПОНТРЯГИНА В ТЕОРИИ УПРАВЛЕНИЯ
И АНАЛИТИЧЕСКОЙ МЕХАНИКЕ. ЧАСТЬ 2: МЕТОД ОХОЦИМСКОГО-ПОНТРЯГИНА В АНАЛИТИЧЕСКОЙ МЕХАНИКЕ
Ю. Ф. Голубев
1.4. Изопериметрические ограничения. Предположим, что требуется найти экстремаль функционала Ф(7) среди всех вектор-функций, для которых выполнено ограничение
Ф(7) = J G(x, u,t) dt = c.
Функционалу Ф(7) отвечает функция Гамильтона [1]
т
Н = С(х, и,Ь)+^ грг/г(х, и,Ь),
г=1
где функции 1рг, г = 1,...,ш, удовлетворяют системе дифференциальных уравнений
диХг дн й'фг дН . ^
йЬ дф^ йЬ дхг' '"'' '
и условиям трансверсальности
т
Н(х(Ьо), и(Ьо),ф(Ьо)) йЬо - ^ Фг(Ьо) йхг(Ьо) = 0,
г=1
т
Н(х(Ь 1), и(Ь1 ),ф(Ь1)) йЬ1 - ^ Фг(Ь1) йХг(Ь1) = 0.
i=1
Определение. Градиентом функционала $(7) называется вектор-функция
дФ / дН дн\
д7 \ ди1 дик I Пусть на отрезке Ьо ^ Ь ^ ¿1 заданы две вектор-функции
71 = {у е як : у(Ь) = (У1 (Ь),..., у к (*))} , 72 = е Ек : z(Ь) = (¿1 (Ь), ...,гк Определим для них скалярное произведение
(71Л2) = (1Ь, 'Ы'2 = (71,71), \\ъ\? = (72,72).
/с 1 =1
Для вычисления градиентов функционалов $(7) и Ф(7) применяются различные сопряженные переменные ф и ф.
Теорема 2. В задаче о поиске экстремума найдется постоянная X, для которой дифференциал функционала Ф при условии, что функционал Ф сохраняет постоянное значение, совпадает с безусловным дифференциалом функционала Ф + ХФ.
Доказательство. Дифференциалы функционалов можем представить в виде
'дФ
д1
Пусть задана произвольная вариация 5. Тогда вариация 5', обращающая в нуль значение йФ, может быть получена по формуле
5' = 5-
дФ
д7
-2
Л
д^у' )
По смыслу 5' представляет собой вариацию в плоскости, перпендикулярной к градиенту функционала Ф в пространстве функций. Дифференциал функционала Ф на 5' можно выразить в виде
5
дФ
д7
2
9Ф \ 9Ф
с?7' ) с?7
Э[Ф + ЛФ]
д7
для любого 5. Для того чтобы получить градиент в правой части, достаточно взять вектор-функцию ф = ф + Лф. Скаляр Л выражается формулой
Л = -
дФ
д7
2
/9Ф 0Ф\
\ с?7 ' с?7 ) '
Пример 3 (максимальная высота подъема ракеты). Уравнение движения имеет вид
д = —д + и — /(д)д, V = и, 0 ^ и ^ и*,
где д — вертикальная координата, д — ускорение силы тяжести, и — удельная тяга, V — характеристика расхода топлива, и* — максимальное значение удельной тяги, /(д) — коэффициент аэродинамического сопротивления, зависящий от высоты: /(д) = к[1 — а(д — К)}, Н — высота однородной атмосферы. Здесь через а(д — К) обозначена сингулярная ст-функция, обладающая свойствами
\ 0, х < 0; йа ~ ~ Г+го, х = 0;
°{х)= 1, ш= • О, ^0,
5(х) йх = 1.
Расход топлива ограничен: V(Ь) ^ С. Необходимо найти такое управление, которое обеспечивает максимум величины д(Т), где Т — время окончания движения, определенное условием д(Т) = 0. Переформулируем задачу в переменных д = х\, д = Х2:
т
т
хх = х2, х2 = —д + и — /(х\)х2, Ф = J х2 йЬ, V(Т) = J ийЬ = С.
о о
Требуется найти максимум функционала Ф при условии, что функционал V сохраняет постоянное значе-
ние.
В соответствии с теоремами 1 [1] и 2 составим гамильтониан задачи
Н = х2 + Ли + фх + Ф2 —д + и — / (х\)х2)
и систему уравнений для сопряженных переменных
фх = —К^2х2 5(х1 — К), Ф2 = Ф2/х) — фх — 1. Начальная точка фиксирована:
йхх(0) = йх2(0) = йЬ0 = 0. Следовательно, условия трансверсальности будут выполнены, если принять
{[Л + ф2(Т)}и(Т) — ф2(Т)д} йТ — фх(Т) йхх(Т) — ф2(Т) йх2(Т) = 0.
Величина Х\(Т) не фиксирована. Поэтому ф\(Т) = 0. Тогда с учетом первого уравнения (1) получим
( 0, Х1(£) <Ь, 0 < Ь < Т;
Ф1(Ь) = <
{хф2^1)[1 - а(х1 - Ь)], Х1(Т) > Ь, Х1 (¿1) = Ь. Поскольку Т тоже не фиксировано, то следует принять
[Л + Ф2(Т)]п(Т) - ф2(Т)д = 0. Дифференциал функционала Ф представится в виде
т
(Ф = ! [Л + Ф2(Ь)]5и(Ь) (Ь.
Если Ф достигает максимума, то значение (Ф должно быть отрицательным для любого допустимого §и(Ь). Следовательно, оптимальным будет управление
и = — [1 + sign(A + ф2)] .
Рассмотрим сначала случай, когда Х1(Ь) ^ Ь, 0 ^ Ь ^ Т. Напишем решение второго уравнения (1):
ехр(к[Ь - Т]).
М*) = - +
к
ЫТ) - -
к
В зависимости от величины Ф2(Т) функция ф2(Ь) либо монотонно убывает, либо монотонно возрастает. Функция [Л+ф2(Ь)] может иметь лишь одну перемену знака в некоторый момент времени т. Экстремалями служат функции
(и*, 0 < Ь<т; ¡0, 0 < Ь<п;
и = 0, п =п*, П1(Ь) = ( и2(Ь) = ^ *
[0, т ^ Ь ^ Т, \^и*, т1 ^ Ь ^ Т.
Вариант и = 0 следует отбросить как отвечающий минимальному значению предельной высоты полета. Вариант и = и* можно рассматривать как предельный, например, для варианта и = П1 (Ь) при Т ^ т либо для варианта и = щ(Ь) при т1 ^ 0. Непосредственный подсчет показывает, что высота, достигаемая при и = и^Ь), оказывается больше, чем при и = щ (Ь). Следовательно, оптимальным будет только управление и = щ(Ь).
Пусть теперь Х1(Т) > Ь. Имеем
• [ к[ф2 - Ф2 (Ь1)] - 1, 0 < Ь < Ь1;
Ф 2 = <
[-1, Ь1 <Ь < Т.
Отсюда видим, что при 0 ^ Ь ^ Т функция ф2(Ь) монотонно убывает, а потому оптимальным остается вариант и = и^Ь).
Данная задача решена в предположении, что сопротивление воздуха линейно по скорости, а плотность кусочно-постоянна. В работе [2] показано, что если сопротивление квадратично зависит от скорости, а плотность воздуха зависит от высоты экспоненциально, то при достаточно больших скоростях будут возникать режимы управления, содержащегося внутри допустимой области.
2. Стандартная задача вариационного исчисления. Найти необходимое и достаточное условие, определяющее экстремали функционала
Ф = У Ш(д1,...,дп,д1,...,ди,Ь) (Ь, (2)
ь0
где q(Ь) = (д1(Ь),..., дп(Ь)) — дифференцируемая вектор-функция параметра Ь, Ш — дважды дифференцируемая функция своих аргументов на заданном множестве вектор-функций q(Ь).
Для решения этой задачи воспользуемся методом Охоцимского-Понтрягина. Определим вектор-функцию q(t) с помощью следующей системы дифференциальных уравнений:
Ч=^=и' (3)
где и = (и\,..., ип) — вектор-функция управлений, выбираемых произвольно. Функционал (2) перепишем в виде
¿1
Ф = ! №(дх,...,дп,их,...,ип,Ь) йЬ. (4)
ь0
Согласно теореме 1 [1], функционалу (4) и системе уравнений (3) отвечает гамильтониан
, йфг дН
йфг дН дН
йЬ ддС йЬ дфг'
г=Х
а дифференциал функционала (4) выражается формулой
¿1 П дН йФ = о— &
.) . , диг
Ьо г=Х
при выполнении условий трансверсальности
п
Н^(Ьо), и(Ьо), Ф(Ьо)) йЬо — фг (Ьо) йдг (Ьо) = 0,
г=х
п
Й^(Ьх), и(Ьх ), ф(Ьх)) йЬх — фг (Ьх) йдг (Ьх) = 0.
г=х
2.1. Задача с фиксированными концами. В этой задаче к сравнению допускаются вектор-функции q(t), имеющие в фиксированные начальный и конечный моменты времени фиксированные значения начальных и конечных координат. Тогда условия трансверсальности автоматически удовлетворяются. Поскольку управление принадлежит открытой области, то необходимыми и достаточными условиями экстремума функционала будут равенства
дН дШ , дШ дШ . л
— = ^—+фг = 0 -»■ фi = -—— = - — , 1 = 1,...,П. (5)
диг диг диг ддг
Подставив найденные выражения в дифференциальные уравнения для сопряженных переменных и выразив переменные иг через дг, заметим, что для экстремальности функционала (2) в задаче с фиксированными концами необходимо и достаточно, чтобы выполнялись уравнения Эйлера
й ( дШ \ дШ
= 0, г = 1,..., п. (6)
йЬ\ ддг ) дд.
2.2. Случай дШ/дЬ = 0. Экстремаль функционала определена уравнениями (6), для которых будет справедлив первый интеграл
■А дШ и ддг
где Н — постоянная интегрирования. Предполагая, что функция Еq) не тождественный нуль, и не учитывая условия ее сохранения, вычислим дифференциал функционала
¿1 п ¿1 п дШ
г ^ дШ г
■] = = у р(ч> ч)гМ + ф
¿0 г х ¿0
на экстремали функционала Ф. С учетом равенств (5) найдем
¿1
<и = у 5Е <И
ь0
при выполнении условий трансверсальности
™ дш
(Е + Я) йЬ+У^ — (1дг
г0 дп,
7=1 п
д<Пг
¿0
^ дШ ,
7=1 дпг
¿0
дш
(Р + Н) + £ —<1®
Н .= 1 дпг
дШ ,
дпг
¿1 г=1
= 0, = 0,
¿1
поскольку на экстремали имеем Е + Н = 0. Если теперь к сравнению допустить только кривые, для которых сохраняется Е(4, 4) = Л, но которые проходят через фиксированные начальную и конечную точки (время не фиксировано), то получим аналог принципа Мопертюи-Лагранжа-Якоби [3]. А именно при дШ/дЬ = 0 вектор-функции 7, удовлетворяющие уравнениям Эйлера, будут экстремалями функционала .] среди всех кривых с одинаковым значением константы Л, проходящих через фиксированные начальную и конечную точки в координатном пространстве.
Пример 4 (задача о брахистохроне). Материальная точка соскальзывает без начальной скорости в поле параллельных сил тяжести в вертикальной плоскости по кривой 7, соединяющей заданные начальную точку А и конечную точку В. Среди всех дифференцируемых кривых 7, проходящих через фиксированные точки А и В, найти такую, для которой время движения точки из А в В минимально.
Вариант 1. Брахистохрона образует идеальную связь. Поместим начало координат в точку А. Ось Ау направим вертикально вниз. Горизонтальную ось Ах выберем так, чтобы плоскость Аху содержала
точку В. Время Т движения по кривой 7 можно выразить с помощью криволинейного интеграла первого Г
рода [4]: Т = / —, где йв — элемент длины дуги, а г> — скорость материальной точки, которую в данном
случае можно найти из интеграла энергии: и = у/2ду. Функционал Т можно представить в виде
У1
Т = Ш<у, Ш =
х
./ 2
+ 1
у/5ду
(7)
У0
Решением задачи будет циклоида (см., например, [3, 4]).
Вариант 2. Брахистохрона с вязким трением. В классической задаче о брахистохроне функционал (7) записан в предположении, что существует интеграл энергии. При добавлении в систему трения, например вязкого, формулой (7) воспользоваться невозможно и задача стандартными методами вариационного исчисления не решается. Представим систему уравнений движения в виде
X1 = х2, X 2 = -кх2 — их4, X з = х4, Х4 = —д — кх4 + их2,
где члены, содержащие управление и, выражают составляющую реакции брахистохроны, перпендикулярную скорости. Далее
т
Ф = J 1 <Ь, Н = 1 + ф1х2 — ф2(кх2 + их4) + ф3х4 + ф4 (—д — кх4 + их2). о
При условии, что сопряженные переменные удовлетворяют дифференциальным уравнениям
Ф1 =0, Ф2 = —ф1 + кф2 — ф^и, фз =0, ф)4 = —фз + кф4 + ф2 и и условиям трансверсальности
ф1 (Т )= а, ф2 (Т) = 0, фз(Т )= в, ф4 (Т) = 0, 1 + ах2(Т) + /Зх4 (Т) = 0,
дифференциал функционала выражается формулой
т
йФ = !(ф4х2 — ф2х4) 5и йЬ.
Имеем условие экстремальности ф^х2 — ф2Х4 = 0. После дифференцирования его по времени в силу уравнений Гамильтона получим ах^ — (3x2 + ф29 = 0. Повторное дифференцирование приводит к искомому условию оптимальности
и(ах2 + /Зх4 — ф4 д) = 2д(а — кф2). (8)
Чтобы воспользоваться этим условием, зададим значения х2(Т), (Т). Тогда значения постоянных а, в можно найти из уравнений
1 + ах2(Т) + вхА (Т) = 0, ах А (Т) — вх2(Т) = 0.
Далее система уравнений движения и уравнений для сопряженных переменных интегрируется с учетом условий трансверсальности и условия (8) в обратном времени до тех пор, пока скорость не окажется равной нулю. Траектория, которая при этом получится, и будет брахистохроной с вязким трением. На рис. 1, 2 показаны брахистохроны с вязким трением. Для сравнения на тех же графиках приведены брахистохроны без трения, отмеченные точками. Радиус окружности, порождающей идеальную брахистохрону, обозначен через К. Видно, что с увеличением коэффициента трения к происходит уменьшение кривизны соответствующей брахистохроны.
Рис. 1. Брахистохрона с вязким трением, к = 0,05, К = 19,5 м
Рис. 2. Брахистохрона с вязким трением, к = 0,1, К =30 м
3. Интегральные вариационные принципы механики. Пусть Ш = Ь(дх,..., дп, дх,..., дп, Ь) есть лагранжиан механической системы, Ь — время, а дг, г = 1,...,п, суть производные от обобщенных координат по времени. Другими словами, Ь = Ь2 + Ьх + Ьо, где Ь2 — положительно определенная квадратичная форма скоростей, Ьх — линейная форма скоростей, Ьо от скоростей не зависит.
Уравнения (6) совпадают с уравнениями Лагранжа второго рода. Отсюда и следует принцип Гамильтона, состоящий в том, что решения уравнений Лагранжа составляют экстремаль функционала (2) в задаче с фиксированными концами.
Из полученного решения также следует, что если из уравнений
* = * = .........
г ддг
выразить дг = Яг(дх,..., дп, фх,..., фп, Ь) и подставить их в выражение для Н:
Нф = Н(дх,...,дп,дх(q, Ф,Ь),..., Яп(ц^, Ф, ь),ь),
то с учетом (5) получим
дНф _дЬ | А дЬ дд3 | А дд3 _ дЬ _ дН % % дд3 % 3 % % %'
дН^ п дЬ дд* А , дд*
= Т7" ^ГТ + 'ФзТГ + & =
дфг ~х дЯз дфг ^ дфг
Поэтому сопряженные переменные и лагранжевы координаты удовлетворяют следующей системе уравнений Гамильтона:
г!грг _ дН'ф
М дпг ' М дфг ' >•••>•
Связь между полученными уравнениями и каноническими уравнениями Гамильтона определяется каноническим преобразованием вида
(4; ^) = (я; —р), Н* = —Н,
имеющим валентность —1. Здесь Н — стандартный гамильтониан системы и р. = дЬ/дпг, % = 1,...,п.
Заключение. Формулы дифференциалов, предложенные Д. Е. Охоцимским, можно использовать для исследования функционалов, в том числе и в теории дифференциальных игр, так же, как дифференциалы функций.
Методы теории управления обогащают стандартные методы классического вариационного исчисления, их можно применять для решения вариационных задач в неконсервативных постановках.
Методы оптимального управления и гамильтонова механика, представленные единой теорией, образуют эффективный инструмент для решения современных проблем науки.
Работа выполнена при поддержке РФФИ (грант № 07-01-00134).
СПИСОК ЛИТЕРАТУРЫ
1. Голубев Ю.Ф. Метод Охоцимского-Понтрягина в теории управления и аналитической механике. Часть 1: Метод Охоцимского-Понтрягина в теории управления // Вестн. Моск. ун-та. Матем. Механ. 2008. № 6. 50-56.
2. Охоцимский Д.Е. К теории движения ракет // Прикл. матем. и механ. 1946. X, вып. 2. 251-272.
3. Голубев Ю.Ф. Основы теоретической механики: Учебник. 2-е изд., перераб. и доп. М.: Изд-во МГУ, 2000.
4. Вариационные принципы механики: Сб. статей / Под ред. Л. С. Полака. М.: Физматлит, 1959.
Поступила в редакцию 26.03.2008
УДК 531.3.01
МОБИЛЬНЫЕ РОБОТЫ С ДВУМЯ НЕЗАВИСИМЫМИ СООСНЫМИ ВЕДУЩИМИ КОЛЕСАМИ: ДИНАМИКА И СХЕМЫ УПРАВЛЕНИЯ
В. Е. Павловский, В. В. Евграфов, В. В. Павловский, Н. В. Петровская
1. Введение. В работе исследуются задачи синтеза гладких траекторий и задачи планирования и корректной реализации движения мобильных роботов с двумя независимо управляемыми активными колесами — роботов с дифференциальным приводом. Актуальность изучаемых задач обусловлена эффективностью рассматриваемой кинематической схемы. Одно из возможных применений задачи — построение динамически корректного управления роботами-футболистами.
2. Динамика колесного робота и управление им. Рассмотрим робот с двумя независимыми активными колесами, оси которых лежат на одной прямой. Движение такого колесного робота изучалось в статье [1], затем авторами в [2, 3]. Исследование движения цепочки подобных объектов приведено в [4-6].
Модель. Пусть система представляет собой два абсолютно твердых диска, расположенные на осях, лежащих на одной прямой; в местах крепления колес к осям находятся точечные цилиндрические шарниры; колеса управляются идеальными электродвигателями. К осям жестко прикреплен корпус — абсолютно твердое тело, которое может перемещаться плоскопараллельно. Эта "тележка" движется по абсолютно шероховатой плоскости, колеса в точках касания с плоскостью не проскальзывают. Модель рассматриваемого робота приведена на рис. 1. При условии плоскопараллельного движения корпуса положение системы описывается пятью координатами (х, у, в, ф1,ф2), углы (^1 представляют собой углы поворота ведущих колес робота относительно оси. Центр масс корпуса объекта находится в точке С (рис. 1). Положение центра масс корпуса С в связанной системе координат задается вектором Ь = (Ь1,Ь2). Середина расстояния между колесами обозначена 0(х,у). Влияние пассивных колес на движение системы считаем незначительным.