Метод улучшения управления на имитационной модели объекта и его приложение к задаче оптимизации маневров нештатной посадки вертолёта

Квоков В. Н.; Трушкова Е. А.; Ухин М. Ю.

УДК 629.735.4 + 517.977

МЕТОД УЛУЧШЕНИЯ УПРАВЛЕНИЯ НА ИМИТАЦИОННОЙ МОДЕЛИ ОБЪЕКТА И ЕГО ПРИЛОЖЕНИЕ К ЗАДАЧЕ ОПТИМИЗАЦИИ МАНЕВРОВ НЕШТАТНОЙ ПОСАДКИ ВЕРТОЛЁТА *

'ОАО «Камов», г. Москва 2Институт программных систем РАН, г. Переславль-Залесский

Предлагается итерационный алгоритм улучшения управления для динамических систем на основе аппроксимации в среднем модели объекта на каждой итерации в окрестности улучшаемой траектории линейноквадратическими конструкциями. Алгоритм применим непосредственно к имитационным моделям динамических систем, не имеющих полного аналитического описания, и является составной частью методики оптимизации управления на таких моделях. Эффективность методики продемонстрирована на примере посадки вертолёта в нештатной ситуации.

Динамическая управляемая система, улучшение управления, имитационная модель объекта, оптимизация маневров нештатной посадки вертолета

Введение. К настоящему времени математическое моделирование динамики летательных аппаратов, как и многих других управляемых объектов, с использованием новейших вычислительных средств широко применяется в проектных, исследовательских организациях и учебных центрах. Наиболее впечатляющие успехи достигнуты в области имитационных моделей, которые позволяют особенно полно и точно воспроизвести свойства реального объекта и условия его функционирования. Однако такие модели ориентированы на решение так называемых прямых задач динамики и управления - проигрывание различных сценариев и законов управления. Они разрабатываются в форме компьютерных программ, включающих различные эмпирические зависимости, и не имеют, как правило, полного аналитического описания, необходимого для эффективного решения обратных задач - синтеза законов управления - с помощью сложных методов, разрабатываемых в математической теории управления.

В [1] предпринята попытка преодолеть это противоречие путём аналитической аппроксимации поля скоростей исследуемой динамической системы по таблицам, генериру-

емым на имитационной модели конструкциями различной сложности и точности. При этом более простые аппроксимации используются для качественного анализа с целью получения сравнительно “грубого” приближённого решения, а более сложные - для итерационного уточнения полученного “грубого” приближения как начального. Процедура аппроксимации достаточно подробно описана в [2]. На этапе качественного анализа применяются хорошо зарекомендовавшие себя высокоэффективные методы, учитывающие специфические особенности прикладных задач (такие, как вырожденность и магистральная природа их решений) [3-6].

Цель данной работы - предложить достаточно универсальный алгоритм итерационного улучшения начального приближения управления, ориентированный на параллельные вычисления, который в отличие от известных процедур такого рода может оперировать не только с аналитическими аппроксимациями любой сложности, но и непосредственно с исходной имитационной моделью. Последнее необходимо для практической реализации полученного решения.

Применение алгоритма демонстрируется в вычислительных экспериментах на при-

*Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований, проект № 06-01-00330.

мере исследования манёвров безопасной не штатной посадки вертолёта с определением такой, что границы безопасной зоны [1 ].

Алгоритм улучшения управления. Предполагается, что модель динамической управляемой системы представлена как дискретная во времени (что, как правило, выполняется при практической численной реализации). Рассматривается задача оптимального управления в стандартной форме:

(х11 (I),и11 (I)) И е Du, ^ е Dx(пн), что

F(X1(I,), (I, ))< F(х1(I,),г!(I,)).

Общие конструкции метода улучшения управления приведены в [7], где на основе принципа оптимальности Кротова элемент

m ищется путем аппроксимации решения следующей задачи:

x(t +1) = f (t, x(t),u(t)), t є T = {0,1,* ,tF }, x(G) = xg, x_f < x(tF ) < x+f , u(t) є Du = {u(t)| u_ < u(t) < w+} (1)

x_ < x(t) < x+, t є T \ {tF},

Fo (x(tF))® min.

Ограничения фазовых переменных сни-

y(t +1) = g(ЛУ(t),v(t)), tє T = {G,1,K ,tF}

s(t +1) = gs (t, У, s ) =

= s(t) + tF 8(y(t) + x1 (t)) _ tF 8(x1 (t))

У0(t +1) = go (y ^ v) = У0 (t) + °.5vT (t )v(t),

y(0) = 0, s(G) = 0, y0(G) = 0, v(t) + u1 (t) є Du,

(З)

маются с помощью замены задачи (1) Ga (y(tF), s(tF X У 0 (tF )) = ay 0(tF) + (1 _ a) x

оштрафованной задачей следующего вида:

X F(y(tF ) + x1 (tF ), S(tF ) + z1 (tF ))

(2)

x(t +1) = f (t, x(t), u(t)), t є T = {0,1,* , tF }, z (t + 1) = z(t) + tF 8 (x(t) ),

x(G) = xo, z(G) = G, u(t) є Du ,

F(x(tF ), z(tF )) = b0F0 (x(tF )) + PIz(tF ) +

+ p 2 8f (x(tF))® min,

где

8'(x) = -min{0, x' - x-} + max{0,x1 - x+ },

8F(x) = -min{0,x' - x-F}+ max{0,x' - x+F}, i = 1,* , n, Д, e R, bi, b2e Rn •

Связанная с полученной системой задача улучшения ставится следующим образом: имеется начальное приближенное решение задачи (2) - элемент m1 = (xJ (t), u1 (t))

U e Du , x e Dx (U X

где у = х - X1 , 5 = z - zI, V = и - и1,

g(t,у,V) = /(|,у + X1, V + и1)-/(|, X,и1), а -некоторое действительное число из полуинтервала (0,1] (регулятор метода).

Будем искать функцию Кротова в виде

Ф (|, у0, у, 5) = w(t) + у 0 (I) у0 + у Т (I) у + X т (IК

где значения ), у0(!), у(I), X(I) находятся из следующих приближённых соотношений (Кротова-Беллмана) для задачи (3):

P (tF, УG, У, s)» Ga (У, S У0 } P(^ У0, y, s)»

: max

v+u1 єD.

{P(t +1 go (y0, v), g(t, У, v),l (t, У, s))}

(4)

t = tF _ 1,* ,0.

Dx (u1 (t) ) = J x (t)

x(0) = xo, j

x(t + 1) = f (t, x( t), u1 (t) )J

и требуется найти элемент

При этом управление v(t, у) (в форме синтеза) для задачи (3) есть управление, на котором достигается максимум в соотношениях (4).

Таким образом, управление (в форме синтеза) для задачи (2) записывается следующим образом:

и(1, х) = v(t, х - х1 (I))+и1 (I), I е Т \ {I,},

а искомым элемент

ш11 = {хп (і), и11 (і) )

получается с помощью уравнении исходной системы

х11 (0) = х0, и111 (і) = и(і, х11), х11 (і) = / (і, х11, и11).

Алгоритм нахождения коэффициентов

функции Кротова - ^(і), у0(і), у (і), X (і) -

для задач без фазовых ограничений подробно описан в [7]. Он основан на линеаризации правых частей соотношений (4) в ряд до членов первого (второго) порядка в окрестности нуля и последующей замене производных их разностными аналогами. Шаги разностных схем выступают дополнительными регуляторами алгоритма.

Одна итерация алгоритма улучшения

начального приближения ш1 = (х1 (і), и1 (і)) состоит из следующих шагов.

1. Задаются значения параметров метода.

2. Выбираются весовые коэффициенты оштрафованного функционала в виде

Р0 = 1, Р = (А1,- ,Рп,Р2,- ,РП)т = 0,

если х1 (і) удовлетворяет фазовым ограничениям, иначе в виде

к

р0 = 1, рі = 0, і є 10, рг = Р/(Як), і є І,

(гг(ір)),і = 0,- п, к = £р(х1 (ір))і = п +1,- ,2п, 10 ={іє {1,- ,2п}к < є} 1 = {1,- ,2п}\ 10,

Р = П к, Я = £ Р/к,

іє1

где е - требуемая точность «попадания» траектории в фазовые ограничения.

3. Находится управление в форме синтеза в виде и(^ х) = )х + В(I), I е Т \{,},

где Л(!), В(I) - матрицы размера р х и и р х1, соответственно, при каждом фиксированном значении I.

4. С помощью уравнений исходной системы получается элемент

ш

и и.и

{х11 (і), иИ (і)).

5. Если улучшение произошло, то повторяются шаги 2-5, иначе повторяются шаги 1 -4 (с другими значениями параметров метода), либо итерации прекращаются (по достижении необходимой точности).

Большим преимуществом описанного алгоритма метода улучшения управления является его естественный параллелизм, поскольку алгоритм содержит крупные гранулы параллелизма (шаги алгоритма 2-5), вычисляемые независимо для каждого набора параметров метода. При этом для каждого набора параметров число итераций, проделанных до достижения указанной точности, заранее неизвестно. Следовательно, при дальнейшей программной реализации алгоритма заранее неизвестно, как будут загружены отдельные узлы вычислительной установки. Поэтому динамические программы предпочтительнее любых других типов.

Описанный метод представляет собой аналог методов улучшения первого (второго) порядка [4, 6, 8], в частности, градиентных, основанных на локальной линейной (линейно-квадратической) аппроксимации модели и функции Кротова-Беллмана в окрестности улучшаемой траектории, и имеет аналогичные свойства сходимости, поскольку практически совпадает с локальными в достаточно малой окрестности (при достаточно большом а).

Приложение к задаче об аварийной посадке вертолёта. Рассматривается движение вертолёта в вертикальной плоскости, описываемое уравнениями:

іЄ1

х1 = ш 1 {- ХВР СОБ в - Т БІЙ и1 ), х2 = ш -1 {- ХВР БІЙ в + Т СОБ и1 - G )

х3 = р (х, х2, х3,и\и2,К) + Р

.4 ^4/ 2>

(5)

14( х2) = х2

где х1 , х 2 - горизонтальная и вертикальная составляющие вектора скорости; х3 - угло-

4

вая скорость вращения несущего винта; х -

высота; и1 - угол отклонения вектора тяги от

вертикали; и2 - общий шаг несущего винта; К - располагаемая мощность двигателей (рассматривается как внешнее воздействие в

нештатной ситуации); Р, Q, Я, N - константы, ш , G - масса и вес вертолёта, соответственно; ХВР = Q{(х1)2 + (х2)2); Т = р(х3Я)2; в = ат^ {х2 / х1).

Зависимости РТ {х1, х2, х3, и1, и2) и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/3 {х1, х2, х3, и \ и2, N) рассчитываются с помощью компьютерной фортран-программы для конкретных наборов переменных. Модель движения вертолёта (5) используется в задачах предварительной оценки лётных характеристик вертолёта [9, 10]. Она позволяет существенно повысить точность расчёта взлетно-посадочных характеристик на переходных режимах (в частности, при определении границ опасных зон в координатах к - V ) по сравнению с известным энергетическим методом благодаря учету динамики несущего винта.

Заданы начальные значения фазовых переменных, ограничения на фазовые переменные во время и в конце манёвра, ограничения на управления:

х(0) = (0,0,29.6,0)Т,

и- = (-0.348,0.08)Т, и + = (0.348,0.348)Т, х- = (0,-3.2,24.6,-¥)т , х+ = (+¥,0,30.8,+¥)т , х-р = (0,-3.2,24.6,-¥)т , х+р = (7.5,0,30.8,+¥)т .

Требуется минимизировать конечную высоту р (х^р )) = х 4(tF ), что равносильно максимизации нижней границы опасной зоны аварийной посадки.

Был проведён расчет таблиц правых частей (5) в допустимой области, и затем построено семейство их аппроксимаций [2]. В дальнейшем основные исследования и расчёты проводились на одной из нелинейных аппроксимаций рассматриваемой динамической системы вида

х =-4.41 • 10-4д/( х1)2 + (х2)2 х1 - 9.8и\

2

: 4.41-10-4^(х1)2 + (х2)2х2 +

+ 0.122( х3)2 РТ {х1, х2, х3, и1, и2)-9.792,

3 х3/_1 ,„2 ,31,2

х3 = /5(х,X,х,и,и ,357) + + 0.192( х3)-1 {К - 357),

х4 = х2,

где

РТ {х1, х2, х3, и1, и2) = -0.045 + 0.003х + 0.005х' + х2 {0.006 - 0.001х3) +

+

и1 {0.071 - 0.003х3) и2{0.443 - 0.007х3)

/3(х1,х2,х3,и1,и2)= 2.526 + 0.125х3 -

- 0.005( х3)2 + х1 (0.528 - 0.035х3 +

+ 0.001(х3)2) + х2(-1.228 + 0.08х3 -

- 0.001(х3)2) + и'(8.463 - 0.523х3 +

+ 0.01( х3)2) + и2 (75.614 - 5.458х3 +

+ 0.081( х3)2).

После проведения качественного анализа сформировался начальный приближённый

элемент т1 = (х1 (I), и1 (I)) (при фиксированных значениях N, I, ) [1] («итерация 0» на рис. 1).

Написана программная реализация на языке программирования С++ алгоритма

Рис. 1. Вариант улучшения управления на нелинейной аппроксимации

Рис. 2. Вариант улучшения управления на исходной модели

улучшения управления. На рис. 1 представлены результаты работы программы для нелинейной системы, полученной при аппроксимации модели движения вертолета в нештатной ситуации.

Далее была проведена серия расчётов по улучшению программы управления на исходной имитационной модели с использованием сетевого программного комплекса КСОК [2], обеспечивающего взаимодействие между исходной компьютерной фортран-программой и программами качественного анализа и улучшения управления в линейном

варианте (на языке С++) и параллельном варианте (на языке Т++ - расширении языка С++ для Т- системы, реализующей принцип автоматического динамического распараллеливания программ). На рис. 2 представлено улучшение начального управления с ограничением времени переключения с одного значения управления на другое. Видно, что траектория, соответствующая начальной программе управления, не удовлетворяла граничному условию х2(ір) >-3.2. Это связано с

неизменными погрешностями при переходе от аппроксимации к исходной модели движе-

I I I 1 II I' II

Рис. 3. Анализ эффективности параллельной реализации метода улучшения

ния. Выбранные две итерации (19, 105) позволяют судить о хорошей работе программы, так как на всех этих итерациях управления и траектории удовлетворяют всем требуемым ограничениям, а значение целевого

функционала х 4(!р) на итерации 105 оказывается почти равным первоначальному (достигнуто попадание в допустимое множество, и при этом не ухудшилось значение целевого функционала). Сравнительно большое число итераций объясняется необходимостью тонкой настройки штрафных коэффициентов для выполнения жёстких ограничений на состояние как в ходе выполнения манёвра, так и в его конце.

С целью уменьшения расчётного времени написан параллельный вариант программы улучшения управления для дискретных динамических систем. Проведены вычислительные эксперименты с параллельными расчетами на кластере семейства «СКИФ» в ИПС РАН для приведённой выше нелинейной аппроксимации исходной модели. Вычисления проводились на 256 различных комбинациях параметров метода улучшения при существенном нарушении требуемых ограничений траекторией начального приближения. В результате удалось уменьшить значение целевого функционала, удовлетворив при этом всем ограничениям. Время расчётов при переходе на параллельный вариант значительно сократилось.

Для более конкретной оценки эффективности распараллеливания программы проведён запуск программы на различном числе узлов и замер времени работы в каждом случае. Результаты представлены на рис. 3. На нём хорошо виден почти идеальный (линейный) эффект распараллеливания, что и ожидалось с самого начала при формировании алгоритма.

Выводы. Предложенный итерационный метод улучшения начального управления может быть непосредственно применён к задачам улучшения управления для дискретных динамических систем и для непрерывных

динамических систем (после их предварительной дискретизации с достаточно малым шагом) независимо от способа представления исходной модели - явного (в аналитической форме) или неявного (в форме компьютерной программы).

Метод естественным образом ориентирован на параллельную программно-алгоритмическую реализацию.

Библиографический список

1. Гурман В.И., Квоков В. Н., Ухин М. Ю. Приближенные методы оптимизации управления летательным аппаратом // Автоматика и телемеханика. - 2008. - № 3.

2. Блинов А. О., Гурман В. И., Фрален-ко В. П. // СГАУ.

3. Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. - М.: Наука, 1973.

4. Гурман В. И. Принцип расширения в задачах управления. - М.: Наука: Физматлит, 1985.

5. Гурман В. И. Магистральные решения в процедурах поиска оптимальных управлений // Автоматика и телемеханика. - 2003.

- № 3. - С. 61-71.

6. Батурин В. А., Урбанович Д. Е. Приближенные методы оптимального управления, основанные на принципе расширения. -Новосибирск: Наука, 1997.

7. Гурман В.И., Трушкова Е.А., Ухин М.Ю. Улучшение управления, реализующего скользящий режим // Автоматика и телемеханика.

- 2008. - № 3.

8. Ухин М. Ю. Приближенный синтез оптимального управления. - М.: Физматлит, 2006.

9. Летников В. Б., Рогов Ю. Н. Исследование траекторий прерванного и продолженного полета вертолета при отказе одного двигателя. Труды научных чтений, посвященных памяти академика Б. Н. Юрьева. - М.: Изд-во ИИЕТ АН СССР, 1990. - С. 146-156.

10. Суриков Н. Ф., Иоффе Г. И., Дмитриев Ф. Ф., Пак Е. Г. «Вертолет Ка-26». - М.: Транспорт, 1982.

References

1. Gurman VI., Kvokov V N., Ukhin M. Yu. Approximate methods of aircraft control optimization // Automatics and telemetry. 2008 No. 3.

2. Blinov A.O., Gurman V.I., Fralenko V.P. // SSAU.

3. Krotov V. F., Gurman V. I. Methods and problems of optimal control. - Moscow: Nauka, 1973.

4. Gurman V. I. Extension principle in control problems. - Moscow: Nauka: Phizmatlit, 1985.

5. Gurman V. I Main solutions in the procedures of optimal control search // Automatics and telemetry - 2003 No. 3 pp. 6171.

6. Baturin V. A., Urbanovitch D. Ye. Approximate methods of optimal control based

on the extension principle. Novosibirsk: Nauka, 1997.

7. Gurman V. I., Trushkova Ye. A., Ukhin M. Yu. Improvement of control implementing zero-overshoot response // Automatics and telemetry - 2008. No. 3.

8. Ukhin M. Yu. Approximate synthesis of optimal control. - Moscow: Phizmatlit, 2006.

9. Letnikov V. B., Rogov Yu. N. Analysis of interrupted and continued helicopter flight path with the failure of one engine. Transactions of the scientific conference devoted to the memory of Academician B. N. Yuriev. Moscow Institute of Natural Science and Technology History. Russian Academy of Science, 1990, pp. 146-156.

10. Surikov N. F., Ioffe G. I., Dmitri-yev F. F., Pak Ye. G. « Ka-26 helicopter». Moscow: Transport, 1982.

METHOD OF IMPROVING CONTROL USING A SIMULATION OBJECT MODEL AND ITS APPLICATION TO THE PROBLEM OF HELICOPTER EMERGENCY LANDING MANOEUVRE OPTIMIZATION

'Foint Stock Company “Kamov”, Moscow 2Institute of Program System, Russian Academy of Science, Pereslavl-Zalessky

The paper presents an iterative algorithm of improving control for dynamic systems based on obj ect approximation on average at each iteration in the vicinity of the path being improved by linear-quadratic structures. The algorithm can be applied directly to simulation models of dynamic systems that have no complete analytical description, and it form a part of the method of optimizing control using such models. The efficiency of the method is illustrated by the example of helicopter emergency landing.

Dynamic controllable system, improvement of control, simulation object model, emergency helicopter landing manoeuvres, parallel algorithm.

Информация об авторах Квоков Вадим Николаевич, главный специалист, кандидат технических наук, ОАО «КАМОВ», Москва, e-mail: [email protected]. Область научных интересов: имитационные модели объектов, оптимизация маневров нештатной посадки вертолета.

Трушкова Екатерина Александровна, старший научный сотрудник, кандидат физико-математических наук, Институт программных систем РАН, Переславль-Залесский, e-mail: [email protected]. Область научных интересов: теория оптимального управления, методы улучшения управления, параллельные алгоритмы, параллельное программирование.

Ухин Михаил Юрьевич, старший научный сотрудник, кандидат технических наук, Институт программных систем РАН, Переславль-Залесский, e-mail: [email protected]. Область

научных интересов: теория оптимального управления, методы улучшения управления, имитационные модели в технике, экономике и экологии.

Kvokov Vadim Nickolayevitch, senior expert, candidate of technical science, joint-stock company “Kamov” Moscow, e-mail: [email protected]. Area of research: simulation objects models, helicopter emergency landing manoeuvre optimization.

Trushkova Yekaterina Alexandrovna, senior research fellow, candidate of physical and mathematical science, Institute of program systems, Russian Academy of Science, Pereslavl-Zalessky, e-mail: [email protected]. Area of research: optimal control theory, methods of control improvement, parallel algorithms, parallel programming.

Ukhin Mikhail Yurievitch, senior research fellow, candidate of technical science, Institute of program systems, Russian Academy of Science, Pereslavl-Zalessky, e-mail: [email protected]. Area of research: optimal control theory, methods of control improvement, simulation models in engineering, economy and ecology.

Аннотация научной статьи по математике, автор научной работы — Квоков В. Н., Трушкова Е. А., Ухин М. Ю.

Похожие темы научных работ по математике , автор научной работы — Квоков В. Н., Трушкова Е. А., Ухин М. Ю.

METHOD OF IMPROVING CONTROL USING A SIMULATION OBJECT MODEL AND ITS APPLICATION TO THE PROBLEM OF HELICOPTER EMERGENCY LANDING MANOEUVRE OPTIMIZATION