Эредитарная модель инерционного запаздывания в задаче оптимального управления

Музыка Дмитрий Александрович; Пещеров Руслан Олегович; Тертычный-Даури Владимир Юрьевич

УДК 62.50

Д. А. Музыка, Р. О. Пещеров, В. Ю. Тертычный-Даури

ЭРЕДИТАРНАЯ МОДЕЛЬ ИНЕРЦИОННОГО ЗАПАЗДЫВАНИЯ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ*

С использованием уравнений Вольтерра с переменными пределами интегрирования (интегральной эредитарной процедуры запаздывания) рассмотрена организация процесса запаздывания по времени в канале управления динамическим объектом. Представлена интегральная формула, позволяющая задавать закон управления с запаздыванием по времени, ее вывод обеспечивается с помощью итерационного приближения в схеме интегрального уравнения Вольтерра второго рода.

Ключевые слова: эредитарность, запаздывание по времени в управлении, уравнения Вольтерра, итерационная аппроксимация, интегральные преобразования.

Введение. Формирование блока запаздывания (БЗ), т.е. некоторого устройства, призванного имитировать подачу на вход объекта управления управляющих воздействий с запаздыванием по времени и ( - И), И > 0, ^ е [¿0, ^ ], основано на реальных, а не абстрактных технических возможностях моделируемых управляемых динамических систем. Инерционное запаздывание по времени (в зависимости от типа системы управления) является внутренней характеристикой этой системы.

Отметим, что БЗ может функционировать исходя из различных принципов и условий (см., например, работы [1—3]). При этом требуется наиболее эффективно математическими средствами реализовать (или смоделировать) задержку по времени в канале обратной связи.

Термином „эредитарность" В. Вольтерра [4, 5] обозначал такие явления в динамических процессах, которым в той или иной мере свойственны наследственность, наличие „памяти" от прошлого состояния системы (гистерезис, запаздывание). В работах [4, 5] была предложена теория интегральных и интегродифференциальных уравнений с переменным пределом интегрирования.

Согласно работе академика Н.Н. Лузина [6] „...«Феномен запаздывания» ... являет собою удержание следов прошлого состояния, ... это означает, что здесь применим не аппарат дифференциальных уравнений, каковы бы они не были, но интегродифференциальные уравнения Вольтерра".

Рассмотрим решение задачи эредитарного моделирования по времени в канале управления движением динамического объекта, обосновав возможность применения итерационных процедур приближенного решения интегральных уравнений Вольтерра к задачам управления с запаздыванием.

Рис. 1

В соответствии с рис. 1 (У — управление, ОУ — объект управления, И > 0 — запаздывание по времени) осуществляется вывод формулы для выбора закона управления и (^) при

Исследование выполнено при поддержке Министерства образования и науки Российской Федерации (соглашение № 14.В37.21.1928).

помощи блока запаздывания, с учетом того, что формула для закона управления с запаздыванием по времени u (t — h) в функции вектора состояния х (t) уже получена.

Постановка задачи. Основные допущения. На основе уравнений Вольтерра сформируем БЗ в управлении по времени, на вход которого подается сигнал управления u (t), а на

выходе образуется u (t — h), h > 0, t e [t0, t1 ].

Будем считать далее, что ядро интегрального уравнения для БЗ, описывающее эффект эредитарности, представляет собой функцию разности t — s, где s — переменная интегрирования по времени. Положим это ядро равным exp [—а(t — s)J, где а > 0 — некоторая заданная постоянная. Наличие такого ядра обеспечивает затухание эредитарности с ростом запаздывания по времени.

Важной особенностью формируемого БЗ с эредитарными свойствами служит его прямая

зависимость от задачи минимизации исходного функционала качества: J ^ min (u (t — h) —

ueU

управление с запаздыванием по времени, U — допустимое множество управлений).

Выбор оптимального закона управления u0 (t — h) как решения соответствующего оптимизационного уравнения Беллмана означает о том, что u0 (t — h) представляет собой некоторую известную (найденную) вектор-функцию с текущего состояния х (t) системы и времени t [7, 8]:

u0 (t — h) = ю[х(t),t] . (1)

Будем считать u (t — h) известной вектор-функцией х (t) и t, определяемой по формуле (1), а u (t) — неизвестной вектор-функцией х (t) и t, а также величины запаздывания h.

Схема решения. Уравнения Вольтерра. Основное уравнение, описывающее работу БЗ, зададим в виде интегрального уравнения Вольтерра второго рода относительно уравнения u (t) с переменными пределами интегрирования

t

Q(t) = u(t)+ J e~a(t—sS)u(s)ds, а,h > 0, (2)

t—h

где заданные величины a, h > 0 считаются постоянными, а вектор-функции Q и u — непрерывно дифференцируемыми по t.

Продифференцируем уравнение (2), пользуясь формулой дифференцирования интеграла с переменными пределами интегрирования:

± f f (s)ds = d

dt V w ds

t - h

t-h

ff (s)ds + f f (s)ds

t - h

=f (*)-dt j f (s )ds=f (t)-f (t -h)'

c

Vc = const e (t - h, t) . Для уравнения (2) после дифференцирования по t имеем

t

й(t) = U (t) + e~at J easu (s)ds + e~at eatu (t)- ea(t-h)и (t - h)

t-h

откуда следует

ii (t ) = и (t ) + и (t )-a J e"a(t-s S)u (s )ds - e~ahu (t - h ). (3)

t-h

По сравнению с уравнением (2) преимущество интегродифференциального уравнения Вольтерра первого порядка (3) относительно неизвестной вектор-функции управления и (t)

заключается в том, что в него явно входит управление с запаздыванием по времени и (t - h) .

Путем интегрирования уравнение (3) сводится к (2). Отметим, что и (t) = Q(t) при h = 0,

следовательно

и0 (t - h o = u0 (t) = c[x (t), t].

В этом случае приходим к известному решению (в виде управления) без запаздывания (1). Таким образом, надо положить

Q( t ) = ю[ х ( t ), t J = ш ( t ), тогда уравнения (2), (3) запишутся в соответствующем виде при Q( t ) = ш (t ).

С учетом закона оптимального управления (1) уравнение (3) можно представить следующим образом:

t

со (t) + e"ahQ (t) = и (t) + и (t) - a J e"a(t-s\ (s) ds. (4)

t-h

При h = 0 имеем линейно-дифференциальное уравнение

сс ( t ) + œ( t ) = il ( t ) + и ( t )

с решением

и(t)-©(t) = Ce"(i-i°), t e[t0,t1 ]. Чтобы и (t ) = œ(t ), как и в уравнении (2) при h = 0, следует положить и(t0)-c(t0) = C = 0 .

Итерационная аппроксимация. Очевидно, что интегральное уравнение (2) имеет более простую структуру, чем интегродифференциальные (3) или (4), рассмотрим его при i(t ) = c(t ). Разрешим (2) относительно и (t ), пользуясь итерационным подходом. Будем

считать, что оно порождено системой п линейных алгебраических уравнений с п неизвестными

i-1 _

и +Е Кгиг =с, i = 1, n, (5)

r=i-2

при и-1 + и0 = 0 (i = 1,2). Здесь дискретный индекс i заменим на t, а r — на s ;

К (t, s) = e-a(r-s)= Kts .

Обозначим через A определитель из коэффициентов системы (5):

и1 =Ш1, и2 = К21и1

и3 + К31и1 + К32и2 = ^ и4 + К42и2 + К43и3 = ш4 ,

ип + Кп(п-2)ип-2 + Кп(п-1)ип-1 =Cn,

тогда получим

1 0 0 0 0 ... 0

К21 1 0 0 0 ... 0

К31 К32 1 0 0 ... 0

А = 0 К42 К43 1 0 ... 0 = 1,

0 0 К53 К54 1 ... 0 •

0 0 0 0 • ... Кп(п-2 )Кп(п -1)1

0 — алгебраическое дополнение для элемента К,г , то

А-г = 0 (, > г), Агг = 1.

Пользуясь правилом Крамера, можем написать для неизвестных ur :

г-1

^ = Ог + Е А-гО = Ог + Е £г,О , г = 1, И , ,=г-2

г -1

Е

,=г -2

(6)

где о-1 = о0 = 0 (г = 1,2); Sri = А,г.

Данный итерационный прием можно применить для исходного интегрального уравнения (2). Тогда его решение и (г) при переходе от конечного числа переменных к бесконечному получим из соотношения (6) в виде интегрального равенства

и(г) = о(г)+ | £(г,8)ю(5)ds.

(7)

г-И

= о,- .

(8)

где £ (г, ^) — разрешающее ядро уравнения (2).

Интегральные преобразования. Требуется с помощью итерационного приближения найти решение (7), для обоснования которого подставим выражение (6) в уравнение (5):

,-1 ,-1 ( ,-1 О + Е £-кОк + Е К,к + Е Кгг£гк

к=,-2 к=,-2 V г=к+1 )

После сокращения на о, придем к равенствам

,-1

£,к + К,к + Е К,г£гк = 0 ,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г=к+1

откуда при переходе от конечного числа переменных к бесконечному с учетом изменения индекса к получим:

8-И 8-И

I К (г, 5)£ (5, з)<ь = | £ (г, 5)К (5, з)5 = £ (г, s)+К (г, з). (9)

Заменив г на 5 , умножим уравнение (2)

и(£)+ I К(5,з)и= О(5)

5-И

(к (5,8) = е~а(5~8, а> 0) на £ (г, 5) и проинтегрируем результат по 5 от г - И до г:

г г 5 г

| £ (г, 5)и (5)5+ I £ (г, 5Щ | К (5, з)и ()ж = | £ (г, 5)о(5)5. (10)

г-И г-И 5-И г-И

В предположении, что S (t, s), K (t, s) — это скалярные функции, домножим на u (s) соотношение (9) и проинтегрируем по s от t - h до t:

t s t

J u(s)ds J K(t,£)S(£,s)d£ = - J [S(t,s) + K(t,s)]u(s)ds . (11)

t-h s-h t-h

Обобщим формулу Дирихле на двойные интегралы с переменными верхними и нижними пределами интегрирования:

b s b b

J ds J f (s, ^ = J d^J f (s, ^)ds, (12)

a a a E,

где a, b — фиксированные числа.

В этой связи для всякой непрерывной по своим аргументам функции f (s, £) можно доказать следующее равенство (ср. с равенством (12)):

b s b \

J ds J f (s, ^ = J d^ J f ($, s)ds, (13)

a s-h a \-h

где h = const > 0 .

В отличие от формулы изменения порядка интегрирования (12), когда области интегрирования слева (Л1) и справа (Л2) одинаковы, в (13) области Д1 и Д2 различны, но симметричны относительно оси £ = s и имеют одинаковые площади, что обеспечивает равенство повторных интегралов слева и справа (рис. 2).

Рис. 2

Для обоснования равенства (13) можно использовать и такой аргумент: поменяв в левой части местами переменные я и %, получим его правую часть.

Воспользуемся далее равенством (13) в соотношении (10), которое можно переписать в

виде

г г я г

| 5 (г, %)и \ и (я)ёя | К (г, ф я)^= \ 5 (г, ,

г—И г—И я-И г—И

или, принимая во внимание выражение (11):

г г г г

| 5 (г, %)и (У^- \ К (г, я )и (я) Ж - \ 5 (г, я) и (я )Ж = \ 5 (г, . (14)

t-h

t - h

Сократив слева первое и третье слагаемые в (14), получим интегральную формулу

г г

- I К (г, 8 )и (8 )ds = I £ (г, 5)ю(5У5

г-И г-И

с взаимным ядром £ (г, 8), разрешающую уравнение (2).

Процедура вычисления ядерных функций. Опишем процедуру для вычисления определителей £,к = 5 к, а тем самым и ядерных функций £ (г, 8), в соотношении (7). Для этого вернемся к равенствам (8). Будем считать, что

= К (1) + К (2)+ + К С) £,к = К,к + К,к +... + К,к ,

где К-к ^ — слагаемое порядка I; I — некоторое заданное натуральное число. Запишем соотношения (8) в виде

К(Р+ 4г>+...+К«+ Кк + Е Кг(К«+ *«+...+ К^и0 (15)

г=к+1 У '

и положим в выражении (15):

К(1)=-К, К(2)= Е К(1)К(1) К(3)= Е К(1)К(2) ... КК )= Е К(1)КК1 -1)

К1к = Аг'к, К,к = Е Л,к Кгк , К,к = Е Кгк , , Л,к = Е К,г Кгк .

г=к +1 г=к +1 г=к +1

Чтобы отсюда найти £ (г, 8), перейдем от конечного числа переменных к бесконечному на промежутке 5 е [8, г]:

К (1)(г, 8) = -К (г, 8),

К (2)(г, 8 ) = ! К (1)(г, 5)К %8 )d 5,

8

К(3) (г, 8 ) = ^ К(1) (г, 5)К (2)(5,8 )5,

К К )(г, 8 ) = | К (1)(г, 5) КК-1)(5,8 )5

С-1),

где 8 е [г - И, г]

и

£ (г, 8) = Е КК)(г, 8), КК)(г, 8) = 0.

I=1

I ^<х>

Вследствие ограниченности функции К (г, 8) : К(1) (г, 8) текающих при интегрировании неравенств

< М = const У г, 8, а также вы-

К (1)(г, 8 )< М, К (2)(г, 8)

'(2)

М2 |г - 8|

1!

5 5

К К )(г, 8)

<

м'\1 - -1 ((-1)!

приведенный ряд для £ (г, 8) равномерно сходится.

Заключение. В настоящей статье предложена схема формирования блока запаздывания по времени в канале управляющего воздействия, основанная на использовании интегральных и интегродифференциальных уравнений Вольтерра с переменными пределами интегрирова-

ния. Для соответствующего интегрального уравнения Вольтерра приведена итерационная процедура решения и получена формула для формирования управления в зависимости от величины запаздывания. По мнению авторов, эредитарная модель построения БЗ представляется наиболее естественной и эффективной при синтезе закона управления с запаздыванием по времени, основанного на беллмановской процедуре оптимизации. Эта процедура предполагает формирование в БЗ сначала и0 (г - И) (1), а затем и0 (г) по формуле (7), а не наоборот, как это обычно имеет место при неоптимизационном синтезе: и (г) -— и (г - И). Для исходного

интегрального уравнения Вольтерра второго рода с двумя переменными пределами интегрирования применительно к задаче управления с запаздыванием по времени введена интегральная формула решения с помощью итеративной приближенной процедуры решения, которая обобщается на случай перехода от конечного числа переменных к бесконечному.

СПИСОК ЛИТЕРАТУРЫ

1. Колмановский В. Б., Носов В. Р. Устойчивость и периодические режимы регулируемых систем с последействием. М.: Наука, 1981. 448 с.

2. Бобцов А. А. Адаптивное и робастное управление неопределенными системами по выходу. СПб: Наука, 2011. 174 с.

3. Пыркин А. А. Управление в условиях запаздывания // Науч.-техн. вестн. СПбГУ ИТМО. 2007. Вып. 38. С. 287—292.

4. Вольтерра В. Теория функционалов, интегральных и интегродифференциальных уравнений. М.: Наука, 1982. 304 с.

5. Вольтерра В. Математическая теория борьбы за существование. М.: Наука, 1976. 286 с.

6. Лузин Н. Н. К изучению матричной теории дифференциальных уравнений // АиТ. 1940. № 5. С. 4—66.

7. Тертычный-Даури В. Ю. Галамех. Т. 4. Оптимальная механика. М.: Изд-во физ.-мат. лит., 2008. 608 с.

8. Тертычный-Даури В. Ю. Условная задача оптимального управления: адаптивный метод решения // АиТ. 2006. № 3. С. 54—67.

Дмитрий Александрович Музыка

Руслан Олегович Пещеров

Владимир Юрьевич Тертычный-Даури

Сведения об авторах

— студент; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра систем управления и информатики;

E-mail: [email protected]

— студент; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра систем управления и информатики;

E-mail: [email protected]

— д-р физ.-мат. наук, профессор; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра высшей математики, кафедра систем управления и информатики;

E-mail: [email protected]

Рекомендована кафедрой систем управления и информатики

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Поступила в редакцию 13.12.12 г.

Эредитарная модель инерционного запаздывания в задаче оптимального управления Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Музыка Дмитрий Александрович, Пещеров Руслан Олегович, Тертычный-даури Владимир Юрьевич

Похожие темы научных работ по математике , автор научной работы — Музыка Дмитрий Александрович, Пещеров Руслан Олегович, Тертычный-даури Владимир Юрьевич

HEREDITARY MODEL OF INERTIAL TIME DELAY IN OPTIMAL CONTROL PROBLEMS

Текст научной работы на тему «Эредитарная модель инерционного запаздывания в задаче оптимального управления»