М. М. Хрусталев, К. А. Царьков 81
ДОСТАТОЧНЫЕ УСЛОВИЯ ТЕРМИНАЛЬНОЙ ИНВАРИАНТНОСТИ СКАЧКООБРАЗНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ
М. М. Хрусталев, К. А. Царьков
Институт проблем управления им. В. А. Трапезникова РАН
117997, Москва
УДК 517.977
Б01: 10.24411/9999-018А-2019-100011
В работе предлагаются условия терминальной инвариантности динамических стохастических кусочно-непрерывных управляемых процессов. Рассматриваемые процессы описываются системами нелинейных дифференциальных уравнений, содержащих в правой части наряду с детерминированным непрерывным слагаемым стохастическую скачкообразную компоненту в виде интеграла по случайной мере Пуассона. Предполагается, что параметры меры (интенсивность и распределение величин скачков) могут меняться со временем. Начальное условие фиксировано. Под терминальной инвариантностью понимается постоянство значения заданного функционала (терминального критерия), выполненное с вероятностью 1. Формулируются достаточные условия терминальной инвариантности, позволяющие вычислить указанное значение явно. Схема применения условий демонстрируются на модельном примере. В рамках данного примера показаны ключевые свойства терминально инвариантной стратегии управления, которые обеспечивают парирование произвольных реализаций случайного скачкообразного процесса.
Ключевые слова: терминальная инвариантность; скачкообразные случайные процессы; стохастические управляемые системы.
Введение
Проблема построения терминально инвариантных динамических систем весьма актуальна на практике, и в то же время изучена в настоящее время не достаточно хорошо. Особенно это касается математических моделей реальных процессов, учитывающих случайные внешние возмущения. Одной из первых работ в этой области явлется статья [1]. В ней не только сформулированы и строго обоснованы достаточные условия терминальной инвариантности стохастических систем, но и введены сами понятия терминальной инвариантности по возмущениям и абсолютной терминальной инвариантности.
Настоящая работа является продолжением исследований статьи [1]. В отличие от [1], где были рассмотрены системы диффузионного типа, здесь в аналогичном аспекте исследуется класс скачкообразных стохастических систем. Предлагаемые достаточные условия терминальной инвариантности в терминологии работы [1] обеспечивают инвариантность системы по возмущениям при произвольном начальном условии. Это означает, что в случае фиксированного начального условия терминальный критерий почти наверное принимает постоянное значение.
1. Постановка задачи
Предположим, что управляемая динамическая система описывается стохастическим дифференциальным уравнением [2, 3]
82 "Проблемы оптимизации сложных систем - 2019"
dx(t ) = f (t, x(t ), u (t, x(t ), v(t )), v(t ))dt + J h(t, x(t- ), u(t, x(t- ), v), v)|(dt, dv),
Mr (1)
x(t0 ) = xo,
где t е T :=[t0; tj œ M - время; начальное условие (t0, x0) е T х M" фиксировано; x(t) - и -мерный вектор, характеризующий состояние системы в момент времени t ; t ^ v(t) - r -мерный случайный процесс с заданным распределением (вероятностной мерой) v(t, •) ; iи(-) - неоднородная случайная пуассоновская мера на T х Mr с интенсивностью t ^ n(t, •) , в каждый момент времени t значение П(t, •) - заданная неслучайная ненормированная мера на Mr с условием 0<n(t, Mr )<+œ такая, что выполнено равенство П (t, •) = П(t, Mr )v(t, •) ; (t, x, v) ^ u (t, x, v) - m -мерная неслучайная измеримая стратегия управления (заранее не задана, но может быть выбрана произвольно в целях, формулируемых далее); f (•), h(•) - заданные измеримые " -мерные вектор-функции; здесь
и далее в работе используется обозначение x(t- ) := lim x(s) . Предполагается, что процесс
х ^t-0
v(t ) и мера i(-) независимы.
Введем в рассмотрение множество V допустимых процессов управления (x(), u(•)), удовлетворяющих условию: при заданной стратегии управления (t, x, v) ^ u (t, x, v) случайный процесс x(t) является сильным решением [2, стр. 519] уравнения (1) на T . На множестве V определим функционал (терминальный критерий)
J(x(-),u(0) = F(x(tj)), F(•) е С2(M"). (2)
Систему (1) при фиксированной стратегии (t, x, v) ^ u (t, x, v) будем называть терминально инвариантной, если критерий (2) принимает постоянное значение Jc с вероятностью 1.
Требуется определить стратегию управления, обеспечивающую терминальную инвариантность динамической системы (1) в смысле определения 2.
2. Достаточные условия терминальной инвариантности
Введем в рассмотрение множество Ф функций (г, х) ^ ((г, х): Т х Мп ^ М , имеющих непрерывные производные (, (рх, ( . Для краткости обозначим
К (г, х, и, V) = (, х) + ( (г, х) / (г, х, и, V), (3)
Г (г, х, и, V) = ((/, х + к(г, х, и, V)) - ((/, х), (4)
Л (г, х, и, V) = Г (г, х, и, V) - (1 (г, х)Н(г, х, и, V), (5)
Щ, х, и, V) = К (г, х, и, V) + |Л(г, х, и, v)П(г, dv). (6)
®1
Если при фиксированной стратегии (г, х, V) ^ и(г, х, V) существуют измеримая ограниченная функция г ^ ц(г): Т ^ М и функция ((•) еФ такие, что для всех х е Мп, V е Мг выполнены условия 1 ((1,х) = Г (х) ,
2. Ь(г, х, и (г, х, V), v) = п(г) п.в. на Т,
3. Г( г, х, и (г, х, V), v) = 0 всюду на Т ,
то система (1) терминально инвариантна, а значение критерия
М. М. Хрусталев, К. А. Царьков 83
J = хс) + \n(t )dt. (7)
t0
3. Модельный пример
Рассмотрим систему
\dx1 (t) = x2 (t )dt + x2 (t- ) n(dt, M), [dx2 (t) = - x (t )dt + u(t, x(t- )) ¡Li(dt, M),
где t e T = [—1; 0]; x(-1) = (-1,1)T; интенсивность пуассоновской меры П(t, M) = 5; размерности векторов n = 2, m = l = 1; отсутствуют возмущения, связанные со случайным процессом v(t), и можно считать, что r = 1.
Требуется обеспечить терминальную инвариантность системы относительно величины J = Х2(0).
Функции р(-) и п(') построим в форме
(p(t, x) = у (t) Х1 + у/2(t) Х2, n(t) = 0, тогда условия теоремы 3 с учетом обозначений (3)-(6) примут вид L у(0)Х1 +У2(0)Х2 = Х2 ,
2. y(t)х1 + y2(t)Х2 + y(t)Х2 — y2(t)Х1 = 0 п.в. на T ,
3. y1(t)x2 +y2(t)u (t, x) = 0 всюду на T .
Из условия (iii) получаем структуру инвариантного управления
u (t ,x) = —^^ x2, У2 (t)
а коэффициенты y(t), y2(t) найдем из условий (i), (ii). В силу произвольности значений x1, x2 имеем задачу Коши
^'ЧлО), у(0) = 0,
dt
)
= —y(t), У2 (0) = 1,
dW2(t )_
dt
которая имеет решение ц/х(1) = sin(t), у/2^) = cos(t) . Таким образом,
и ^, х) = -tg(t) Х2.
На рисунках 1-2 представлены результаты простейшего численного моделирования методом Эйлера для нескольких реализаций траекторий компонент вектора состояния х^) и управления и (^ х^)) .
Значения величины J = х2 (0) отличаются друг от друга в пределах погрешности и равны 1.386, 1.382, 1.387 соответственно для полученных реализаций. Точное терминальное значение критерия по формуле (7) Jc = sin(1) + cos(1) «1.381.
Рисунок 1: Три реализации (черный, зеленый и красный цвета) состояния x(t)
-1 -0.8 -Об -0.4 -02 0,
Рисунок 2: Три реализации (цвета те же) управления u (t, x(t))
Результаты моделирования свидетельствуют о том, что величина x2(0) не меняется в зависимости от реализации случайной меры v(-). Таким образом, найденная стратегия управления действительно обеспечивает терминальную инвариантность заданной динамической системы.
Список литературы
1. Хрусталев М.М. Терминальная инвариантность стохастических систем диффузионного типа // АиТ. 2018. 8. С. 81-100.
2. Королюк В.С., Портенко Н.И., Скороход А.В., Турбин А.Ф. Справочник по теории вероятностей и математической статистике. - М.: Наука, 1985. - 640 с.
3. 0ksendal B., Sulem A. Applied Stochastic Control of Jump Diffusions. - Berlin Heidelberg, Germany: Springer, 2005. - 266 p.
Хрусталев Михаил Михайлович - д-р. физ.-мат. наук, гл. науч. сотр. Института проблем управления им. В. А. Трапезникова РАН; email: mmkhrustalev@mail.ru; Царьков Кирилл Александрович - канд. физ.-мат. наук, ст. науч. сотр. Института проблем управления им. В. А. Трапезникова РАН; email: k6472@mail.ru