Научная статья на тему 'Цифровые алгоритмы оптимального управления движением корабля'

Цифровые алгоритмы оптимального управления движением корабля Текст научной статьи по специальности «Математика»

CC BY
82
9
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Васильев Александр Николаевич

Рассматриваются модели оптимального управления движением морского объекта в непрерывном и в дискретном времени. Приведена структурная схема системы оптимального управления движением, а также графики, демонстрирующие её работу

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Васильев Александр Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Цифровые алгоритмы оптимального управления движением корабля»

УДК 621.391 А. Н. ВАСИЛЬЕВ

ЦИФРОВЫЕ АЛГОРИТМЫ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДВИЖЕНИЕМ КОРАБЛЯ

Рассматриваются модели оптимального управления движением морского объекта в непрерывном и в дискретном времени. Приведена структурная схема системы оптимального управления двилсением, а также графики, демонстрирующие её работу.

ВВЕДЕНИЕ

Предположим, что некоторый объект управления необходимо перевести из исходного состояния х(10) в заданное состояние х(1$) с помощью какого-

либо управления и(1;) [1]. Обычно существует множество управлений ЩЧ),

обеспечивающих выполнение задачи. В нашем случае выбрано управление, обеспечивающее минимум взвешенной суммы средних квадратов ошибки и сигналов управления [2,3].

НЕПРЕРЫВНОЕ ВРЕМЯ

Рассмотрим решение задачи оптимального управления для непрерывного времени.

Движение материальной точки массой т (элементарного объекта управления) под воздействием силы и(1) вдоль оси Ох (рис. 1) описывается

следующим уравнением:

гг/ч с*ух <12х /1Ч

и(0 = ш-а = ш—- = т—(1)

А с11

О

т, Щ) -►—

х

Рис. 1. Движение объекта вдоль оси координат под воздействием силы

Тогда, учитывая связь между изменением координаты и скоростью, запишем систему дифференциальных уравнений, характеризующих состояние объекта во времени:

dx

= vx

dt

dv* =-U(t)

. dt m Представив вектор состояния как

X = (iJ, (3)

можем записать модель изменения состояния объекта управления в следующем виде:

^ = A(l)X(t) + B(t)U(t), (4)

dt

• ( где для данного случая A(t) = ( q q J, B(t) =

1

Vmy

В самом общем случае X представляет собой n-мерный вектор фазовых

координат, U(î) - r-мерный вектор управления, A(t) - nxn-матрица, B(t) -

• •

nxr-матрица.

Для обеспечения оптимального управления в соответствии с вышеназванным критерием необходимо минимизировать функционал

J = 0,5X1 (tk )S X(t k ) 4- 0,5 J(XT (t) Q(t) X(t) 4- UT (t) R(t) U(t)) dt, (5)

to

где весовые nxn-матрицы S и Q(t) будем полагать симметричными и неотрицательно определенными; R(t) - положительно определенная гхг-матрица; ts - фиксированный интервал времени. Цель управления

заключается в удержании фазовых координат около нуля. Тогда оптимальное управление может быть сформировано на основе следующих вычислений:

U(t) = -R (t) • вr (t) • K(t) • X (t), (6)

где матрица K(t) удовлетворяет дифференциальному уравнению Риккати: dK

— = -K(t) • A(t) - Ат (t) • K(t) + K(t) • B(t) • R-1 (t) - BT (t) • K(t) - Q(t) ; dt

K(tk ) = S, t e (t0,ts). При бесконечном времени наблюдения (t0 =0,ts-»oo) граничное условие К(оо) = 0. Для стационарных систем (т.е. когда матрицы

А, В, Q, R не зависят от времени t) существует предел lim K(t)|t6(o,ts) = К, где

• «

К является решением алгебраического уравнения

-К-А-Ат - К + К- В- R"1 - В1 • К - Q = 0, а оптимальное управление имеет вид

U(t) = -R"1 • Вт • К • X(t).

В случае, когда на объект действуют внешние возмущения модель движения объекта перепишется в виде

^ = A(t)X(t) + B(t)U(t) + ?, (7)

at

где ç - векторный белый шум с ковариационной матрицей

• } = N^ (t) • ô(t - т); A(t) - nxn-матрица коэффициентов,

определяемых линеаризованными характеристиками объекта управления в соответствующем режиме управления; B(t)~ пхг-матрица линеаризованных

коэффициентов для исполнительных органов объекта. Вектор наблюдений

Z(t) = C(t) • X(t) H- ê(t) _ (8)

отличается по размерности от вектора состояния X(t) тем, что учитывается nixn- матрицей C(t). Это отличие размерностей вызвано двумя причинами. С одной стороны, не все компоненты вектора X(t) могут быть измерены.

С другой — некоторые составляющие X(t) могут быть получены с помощью

различных систем получения фазовых координат. В этом случае имеет место комплексирование измерений. Погрешности измерений учитываются с

помощью векторного белого шума 0(1) с ковариационной матрицей

M{0(t) • 6Т (t - т)} = N0 (t) • S(t - т).

В соответствии с теоремой разделения [3, 4J можно показать, что при гауссовских процессах наилучшее (в смысле минимума дисперсии ошибки)

оценивание X(t) состояния X(t) объекта управления определяется ! следующими калмановскими соотношениями:

= A(t)X(t) + B(t)U(t) + K(t)(z(t) - C(t)î(t)), (9)

где

K(t) = P(t).CT(t).N0-!(t),

dP

— = A(t) • P(t) + P • AT (t) - P(t) • CT (t) • Nq1 (t) • C(t)P(t) + NÉ (t) dt

с начальным условием P(t0) = P0. Заметим, что ковариационная матрица

вектора ошибок оценивания P(t) не зависит от наблюдений Z(t) и принятого

закона управления U(t) и может быть вычислена и записана в память ЭВМ

до начала работы системы управления движением для каждого из возможных балансировочных режимов.

Рис. 2. Система оптимального управления движением

m

Оптимальное допустимое управление, минимизирующее функционал

J = M 0,5XT(ts)SX(ts) + 0,5*|(хт(t)Q(t)X(t)-fUT(t)R(t)U(t))dt ,(10)

l0 J

может быть сформировано на основе следующих вычислений:

Û(t) = -L(t)X(t), (11)

L(t) = R"1 (t) • BT (t) • M(t),

— = -M(t) • A(t) - AT • M(t) + M(t) • B(t) • R4 (t) • BT(t) • P(t) - Q, dt

где M(ts) = S. Структурная схема вычислений, реализующих оптимальное управление, представлена на рис. 2.

ДИСКРЕТНОЕ ВРЕМЯ

Весьма важно, что точно такие же по структуре вычислительные процедуры оптимального оценивания-управления получены и для систем с дискретным временем. Разностные уравнения, которыми описываются такие системы, непосредственно пригодны для реализации на бортовых цифровых вычислительных устройствах систем управления движением.

Такие уравнения получаются следующим образом. Производную от функции по времени представляют в виде разности значений функции между соседними отсчётами за промежуток времени, равный интервалу дискретизации:

dt

AT

g(tk-.)

f(tk) = f(tk_1) + ATfl-g(tk_1).(l2)

д

Тогда система дифференциальных уравнений (2) с учётом внешних воздействий перепишется в виде системы разностных уравнений (принимая

ДТд=1):

Хк ~ Хк-1 + Vxk-I

1 тт t • (13)

Модель движения объекта (7) примет вид

*к =АЫ -Хы+Вм -ÜM к = к0,кр + l,...,ks, (14)

где Хк п-мерный вектор состояния на k-м отсчёте; Uk — r-мерный вектор управления; m-мерный вектор наблюдений (8) перепишется в виде

zk=ck-xk+ök. . (15)

Найдем управление, обеспечивающее минимум функционала

J = м\0.5 • XI ■ S • Хк + 0.5 • f{x; • Qk ■ X, + t// • Д, • С/, )| I *=*о J

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(16)

ш

Это управление определяется по формуле

ик=-Ьк.Хк, (17)

где . \

Ч=в[-мк+гА.(кк + в- -м^-вг'.

Матрица Мк находится путём решения матричного уравнения Риккати:

Мк = А?; -Мк+1 • Ак +(}к -Ц .(як + в£ -Мк+1 -Вк)-Ьк

с граничным условием Мк^ = Б.

Для оптимальной оценки вектора состояния получено уравнение Калмана:

хк = Акч 'Хк-1 +Вк-1 -им +КЫ -СкХы).

Коэффициент усиления фильтра Калмана для дискретного времени запишется в виде

Кк=Рк.Кё,к-Ст,

а уравнение ковариационной матрицы ошибок

Р^РэкСс-СЕ + Ыё^-Ск-Рзкск-С^)-1,

где Е - единичная матрица, а экстраполированные ковариационные матрицы находятся как

Р«к=Ак.Рм.А1+Ывк

с начальным условием РЭКСко = М{Хко • Хк^}.

Следует заметить, что представленное решение содержит матрицы Ак и Вк, существенным образом зависящие от кинематических параметров движения [5]. При этом возникает необходимость корректировать элементы этих матриц в зависимости, например, от параметров поступательного движения объекта. Кроме того, изменяющийся уровень внешних воздействий

•'г*

(Чл

М* /

ртйЬВДа Г110 '«оц оу'й пТу а

те

. -«- . ..

• «и " " ' £ К^.Цр^Са

РШШ

- Зо£»оуйп'!с: х

''у.''<•:■

и погрешностей оценивания состояния также требует корректировки соответствующих матриц С2к и Як. Процедура корректировки элемеиго»

матриц может быть выполнена с помощью введения дополнительных блоком адаптации параметров системы управления движения (СУД).

В качестве примера было рассмотрено перемещение центра масс объекта управления на расстояние 50 м вдоль оси Ох за 100 шагов. Графики изменения компонент вектора наблюдения г1к = хк + 91к, %2к = + 02к,

вектора оценок хк, 9хк координат, диагональные элементы Рхк, Р^ матрицы

ошибок оценивания, элементы М^к матрицы управления, а также

результирующие компоненты хь и уХк вектора состояния и значения силы ичК

представлены на рис. 3.

Рис. 3. Работа цифрового алгоритма оптимального управления

ЗАКЛЮЧЕНИЕ

Разностные уравнения алгоритмов оптимального управления движением, полученные для дискретного времени, непосредственно пригодны для

бортовых цифровых вычислительных устройствах систем управления движением корабля. Основные соотношения полученных алгоритмов остаются неизменными в условиях внешних воздействий, при появлении новых систем получения информации или новых органов управления. Однако варианты

реализации на

автоматических

математические

комплексирования систем определения координат и параметров движения, динамические свойства корабля, условия плавания, а также инерционность органов управления требуют уточнения полученных результатов для конкретного проекта.

СПИСОК ЛИТЕРАТУРЫ

Г. /« ш\

1. Васильев К.К. Теория автоматического управления (следящие системы). Ульяновск: УлГТУ, 1999. 96 с.

2. Красовский H.H. Теория управления движением. Линейные системы. М.: Наука, 1968. 475 с.

3. Сэйдж Э.П., Уайт Ч.С. Оптимальное управление системами. М.: Радио и связь, 1982. 392 с.

4. Цыпкин ЯЗ. Адаптация, обучение и самообучение в автоматических системах. М.: Наука, 1968. 232 с.

5. Васильев К.К. Оптимальное стохастическое управления движением корабля // Вестник УлГТУ, 2000. №3. С. 27-37.

Васильев Александр Николаевичу магистр техники и технологий по направлению «Радиотехника», окончил радиотехнический факультет Ульяновского государственного технического университета, инженер кафедры «Телекоммуникации». Имеет работы в области анализа тепловых процессов в твердотельных структурах, а также в области моделирования систем управления подвиэ/сными объектами.

УДК 621.391

В. Р. КРАШЕНИННИКОВ

АВТОРЕГРЕССИОННАЯ МОДЕЛЬ ВЕТРОВОГО ВОЛНЕНИЯ ВОДНОЙ ПОВЕРХНОСТИ

Предлагается модель, позволяющая имитировать ветровое волнение водной поверхности, что может быть использовано при статистическом моделировании систем управления надводными судами.

При проектировании систем управления морскими подвижными объектами необходимо исследование их поведения в условиях волнения. Выполнить такое исследование аналитически не всегда удается из-за случайного характера волнения. Поэтому целесообразно применить статистическое моделирование, для чего нужно иметь модель, позволяющую достаточно адекватно имитировать реальное волнение водной поверхности. В этой статье предлагается пространственно-временная авторегрессионная

модель, имитирующая динамическое трёхмерное волнение с заданными параметрами.

Картина волнения определяется волновой ординатой (ВО) z = f(x,y,t),

равной отклонению кромки воды в точке у) в момент времени t от её среднего уровня. Случайный характер волнения обусловливает представление ВО в виде случайного поля. Это поле трёхмерно (зависит от трех переменных X, >',/), но может рассматриваться и как изменяющееся со временем двумерное поле. Среднее значение поля равно нулю по смыслу ВО. 11а ограниченных пространственно-временных участках можно предположить, что поле однородно и стационарно. Если еще предположить гауссовость, то поле будет полностью характеризоваться своей корреляционной функцией (КФ)

V(x,y,t) = М[/(0Д0)/(| х\у \,\t |)]. (1)

Путем обработки многочисленных натурных экспериментов был найден ряд аппроксимаций временной КФ морского волнения [1]. В частности, используется экспоненциально-гармоническая аппроксимация

V(0 ДО = а2 ехр(-а 111) cos cot 5 (2)

где С2 - дисперсия; ОС - параметр затухания; (О = 2я ! Т - угловая частота; 'Г - период волнения.

Вид КФ (2) обусловлен двумя факторами - движением волн и изменением их формы со временем. Пусть направление оси координат ОХ совпадает с направлением движения волн. Если бы форма волн не менялась, то по оси движения КФ имела бы вид (2):

У(хД0 = V(0909xtc-t) = ехр(-а, \x/c-t \)cos(aK/c-6Jt), (З)

где с - скорость движения волн и параметр затухания КФ для волн с неменяющейся по времени формой. Форма реальных волн меняется со временем. Учтём это изменение введением в (3) временного затухания:

V(x,09t) = а2 ехр(-а? |f j)exp(-a, \ x(c-t\)cos(pox/c-<at)9 (4)

где #2 - параметр этого дополнительного затухания КФ.

При X = О КФ (4) должна быть равна КФ (2), следовательно, параметры

должны удовлетворять условию СХ\ + = ^ .

Общее направление движения волн совпадает с направлением ветра (по оси ОХ), но линии гребней волн лишь приблизительно прямые, параллельные оси OY. Поэтому зависимость КФ по оси OY, видимо, также имеет вид (2), но со значительно меньшими значениями затухания и частоты. Примем для простоты чисто экспоненциальную зависимость, т.е. добавим к

(4) множитель ехр(-а31 у |). Учитывая также, что для ветровых

i Надоели баннеры? Вы всегда можете отключить рекламу.