УДК 551.435.627:517.977 БОТ 10.24147/2222-8772.2024.3.74-83
УПРАВЛЕНИЕ ОПОЛЗНЕВЫМИ ПРОЦЕССАМИ В РАМКАХ ТЕОРИИ ДИФФЕРЕНЦИАЛЬНЫХ ИГР
А.К. Гуц
д.ф.-м.н., профессор, е-шаЛ: [email protected]
Сочинский государственный университет, Сочи, Россия
Аннотация. В статье теория дифференциальных игр применяется для управления процессом сползания оползней по горным склонам. Найдено оптимальное управление Нэша, гарантирующее остановку оползневого процесса. Обсуждается форма практического использования предложенной модели управления сползанием оползней. Предложен путь противостояния оползням за счёт выбора стратегии Штакельберга, при которой стратегия игрока «Природа» обозначена как подбор соответствующей функции, адекватно отражающей ситуацию с ливневым дождём.
Ключевые слова: оползень, модель оползня, дифференциальные игры, управление оползневым процессом, оптимальное управление Нэша, оптимальное управление Штакельберга.
Введение
Схождение оползней с горных склонов является самым грозным опасным природным явлением в г. Сочи.
Оползень - это смещение масс горных пород по склону под воздействием собственного веса или в случае дополнительной нагрузки вследствие переувлажнения, подмыва склона, сейсмических толчков и прочих процессов. На территории Большого Сочи насчитывается более 228 крупных оползней [1]. Оползневые процессы угрожают большой части территории города. Поражённость территории оползнями составляет здесь 50-80 %, а иногда достигает 80-90 % [2].
Основными причинами схода оползней следует считать ливневые дожди, а также строительные работы, которые плохо контролируются. Теоретические изыскания и модели оползневых процессов ограничиваются традиционными методами теории грунтов и инженерной геологии. Имеется потребность в пополнении способов борьбы с оползнями современными математическими методами. Имеются определённые успехи использования теории катастроф в моделировании оползневых процессов. В данной статье предлагается использование методов теории дифференциальных игр.
1. Математическая модель оползня и теория катастроф
Китайские специалисты предложили следующую математико-механическую модель оползня [3], включающую два типа грунта, сползающего по скользящей основе по плоскому склону:
2Gslsu1e 2
3h
iu—uA 3/Gelee2 Л iu—uA ( V иг ) Gsls Д щ ) + \
и — Gelee2 mgh sin ft"
GJS
Gs lsui
= 0, (1)
где С3 - начальный модуль сдвига; Се - модуль сдвига; и - ползучее смещение оползня; щ - величина смещения при максимальном напряжении, и\ = 2и0; 13 и 1е - длины поверхности скольжения для деформационно-упрочняющего грунта и упруго-хрупкого грунта соответственно; Н, к, ¡3 и тд (д - ускорение свободного падения) - вертикальная высота горного массива, мощность скользящего слоя, угол наклона поверхности скольжения и масса горного массива соответственно. Полагая
х
и — иг 3(к — 1) 3(1 + к — кOi, Geleu1e2
~ , о ^ , к ^
щ 2
можно (1) переписать в виде
2
ж3 + ах + b = 0.
GJX
С =
mgh sin ft
Geleui
Уравнение (2) определяет стационарные равновесия системы
dx ~dt
dW
dx '
(2)
(3)
W(x, a, b) = ix4 + iax2 + bx, подверженной катастрофе типа сборка [4]. Её бифуркационное множество
{(а,Ъ) е R2 : 2а3 + 27Ь2 = 0}
задаёт кривую на плоскости ab, пересечение которой влечёт скачкообразные изменения смещения х.
В статьях [3,5] демонстрируется, каким образом знание бифуркационного множества при изучении сходов оползней способствует их предупреждению. Смысл в том, чтобы уточнить возможные дополнительные коэффициенты а, которые могут входить в выражение для W(х,а,Ь):
W(a,x,^)(x) = 4 ах4 + 2 (Л + а)х2 + (у + Ъ)^х (4)
- так, чтобы эволюция состояния х, описываемая уравнением
dx = _ dW(a,x,^) dt dx '
отвечала накопленным по годам данным. Затем определить бифуркационное множество и далее следить за тем, чтобы управляющие параметры его не пересекали (см. подробности в [5]).
Авторы статьи [5] связывают управляющий параметр а с деятельностью человека, т. е. а = Н(= human), которая направлена на борьбу с оползнями. Деятельность
человека определяет, будет ли иметь место оползень внезапно или постепенно, в зависимости от изменения геологических условий окружающей среды.
Второй управляющий параметр Ь связан с ливневыми дождями, т. е. Ь = г (=гаш). Последнее оправдано для Сочи, поскольку среди основных причин, вызывающих оползни, на первом месте1 стоят длительные ливневые дожди, переувлажняющие грунт и провоцирующие его сползание со склонов.
Иначе говоря, вместо (3) изучаем систему
¿X дШ
(5)
& дх
Ш(х, Н, г) = -х4 +— Нх2 + гх.
\ ) 4 2
Главная трудность в использовании описанного подхода состоит в том, чтобы прояснить то, как измеряется величина х. Действительно, поскольку большинство оползней в горной местности происходит внезапно на неустойчивых склонах с очень сложными геологическими условиями, и их сотни, то смещение каждого оползня невозможно точно измерить [5]. Поэтому нужно как-то избежать этого, т. е. заменить х на иную величину, так или иначе связанную со смещением х. Это вполне разумно, если учесть, что для города пространственные и временные рамки - десятки километров и годы. Иначе говоря, естественно пренебречь смещением каждого отдельного оползня и понимать под х некоторую интегральную характеристику совокупности оползней, зарегистрированных городскими службами.
Другими словами, вместо смещения х необходимо ввести некий пропорциональный ему индекс смещения оползней Р. В работе [5] Р - это число оползней за год. (В Сочи соответствующие службы говорят о кубометрах убранного сползшего грунта.) Вместо дифференциального уравнения (5) рассматривается разностное
Р(I + 1) = -АаР3(I) - [ВгН - (Во - 1)]Р(г) - [С\г + Со], (6)
где + 1,Ь + 2,...,Ь + п - годы, по которым есть архивные данные {Р (Ь + к)} по оползням. Коэффициенты А0,Вг,В0,С1, С0 находим методом наименьших квадратов с соответствующим статистическим обоснованием.
Надо сказать, что такая подмена смещения х дала неплохой результат для провинции Юньнань в Китае [5]. Однако в случае Сочи использование данного подхода затруднено отсутствием информации о нахождении многолетних архивных данных по оползням, накопленных различными организациями, занимавшимися с 1948 г. в Сочи оползнями, а возможно, и их безвозвратной потерей [6].
Но поскольку можно, в какой-то мере, говорить, опираясь на опыт китайских учёных, о средней величине смещения оползней, которая оценивается, скажем, по объёму убранного сползшего грунта, то можно на первом этапе считать,что х - это финансовые затраты по предупреждению оползней в сумме с затратами на ликвидацию послеоползневых последствий.
1 Другие причины: нарушения при строительстве зданий, подрезание склонов, вырубка деревьев на склонах, землетрясения.
Для нас важно, чтобы предложенная нами в рамках теории дифференциальных игр оптимальная стратегия, или оптимальное управление, гарантировала стремление величины х к нулю с ростом времени, т. е. критерием успешности найденного решения будем считать выполнение условия
lim х = 0. (7)
Управление будем искать, рассматривая уравнение (3) как дифференциальную игру двух игроков [7] - «Природы» в лице ливневых дождей г и «Человека» Н в форме работ по предотвращению сползанию оползней.
2. Оптимальное управление Нэша
Естественно рассматривать игру с ненулевой суммой [7], поскольку выигрыши «Природы» и «Человека» трудно увязать в нечто единое. Ведь говорить о выигрыше можно скорее только в том случае, если имеем дело с существом, наделённым сознанием, имеющим тот или иной интерес и т. д.
Возможны два подхода для выбора стратегии, или управления в теории дифференциальных игр.
При первом подходе игрок может выбирать своё управление (стратегию) в зависимости от того, в каком положении х в момент времени Ь находится система. В таком случае игрок конструирует управляющее воздействие в виде функции ,х), зависящей от позиции {Ъ, х}. При этом для uj.it, х) используется термин позиционное управление игрока [8]. Часто пишут просто и(х).
При втором подходе игрок формирует «своё» управляющее воздействие в виде только функции времени и({) на всю продолжительность игры. В таком случае говорят, что и(Ь) - это программное управление игрока, или просто используется термин «управление».
Здесь мы будем искать позиционное управление, или, точнее, позиционное равновесие Нэша, а в § 3 - программное оптимальное управление Штакельберга.
Для дифференциальной игры N игроков
^ = Нх) + ¿и(х)и, № = 0,
3 = 1
х е К, щ е К,
где каждое щ - это ]-й игрок, его управляющий параметр, с выигрышными функциями
N
Зг(х,Щ,...,ии)= Ю^ + ^Щ (щ)2](И, (г=1,...,Ю, 0 3=1
Юг > 0, Кгг > 0, Кгз > 0, существование равновесий Нэша
31(и\,и*2,и*, ...,и*м) ^ 31(и[,и*2, ...,и*-1,иг,и*+1...,и*м), Ущ, i е N, (8)
сводится к крайне сложной задаче отыскания положительно определённого решения Уг(х) > 0 нелинейного уравнения Гамильтона-Якоби
1 м
№'хш(х) + дг(х) - 2м)'х )-1 (V,)'х+
3 = 1 1 м
Яц [д3 (х)]2№п )-1]2 № )'х]2 = 0, (9)
4
3 = 1
по которому строится равновесие Нэша:
и*(х) = щ(Ц(х)) = -1 Пггдг(х)(Уг)'х, г е М, (10)
в соответствии с теоремой 10.4-2 из [7].
2.1. Оптимальное управление Нэша для игры (5)
В нашем случае N = 2, дифференциальная игра описывается уравнением
¿х дШ 3
dt дх
= -х6 - Нх - г, (11)
где Н (human) - игрок 1, «Человек» (параметр и1) - это человеческий фактор, т. е. усилия организаций по предотвращению оползней; г (rain) - игрок 2, «Природа» (параметр и2) - это дождевые осадки, и
f(х) = -х3, gi(x) = -х, g2(x) = -1.
Берём Rn = R22 = 1,R12 = R2i = 0. Тогда уравнения Гамильтона-Якоби принимают вид:
Qi + (Vi)'xí(x) -\[д1(х)]2№)>х]2 - 1-[92(x)]2(v1yx(V2)'x = o,
Q2 + (V2)'xf (X) - -^(X^m)^2 - \[gi(x)]2(Vi)'x(V2)'x = 0.
(12)
Следовательно, если взять
= х2т+2 + 1 х4т + 1 х4т-2, ^ = х2т+2 + 1 х4т-2 + 1 х4т, (13) то уравнения Гамильтона-Якоби (10) имеют решения
УЛх) = У2(х) = — х2т, т ^ 1. 2т
При этом функции Я^х), Я2(х) являются положительно определёнными. Поэтому по теореме 10.4-2 из [7] имеем равновесие Нэша
Н * = 1 х2т, г* = 1 х2т-1, (14)
найденное по формулам (10). Отметим, что усилия людей, борющихся с оползнями, т. е. величина Н* = Н* (х), определяются, как мы видим, через величину х, характеризующую смещение оползня. Поэтому фактически мы имеем формулу, позволяющую оценивать затраты по факту сползшего оползня. И это следствие того, что мы пошли по пути использования позиционного управления.
Уравнение дифференциальной игры принимает вид
^ = -х3 - 1х2т+1 - 1х2т-1 < 0, сИ 2 2
решение которого
X
2 [ ^ (15)
I 2хъ + х^т+1 + х^т-1'
хо
х(0) = хо, о,
есть строго убывающая функция х(Ь). Это говорит о том, что усилия Н*(х) = (1/2)х2т людей, ответственных за противодействие оползням, приводят к уменьшению величины смещения оползня (или, при иной интерпретации величины х, к уменьшению объёма грунта, который сползёт на улицы города и который необходимо будет убрать с учётом различных финансовых затрат на ликвидацию последствий оползневой катастрофы).
Выигрышные функции, соответственно, имеют вид
Л(х,Н, г)= !\Я1(х) + (Н*)2](И, ^(х,Н, г)= 1\Я2(х) + (г*)2](И. оо
Равновесие Нэша в данном случае означает, что если каждый игрок пытается в одностороннем порядке изменить свою стратегию управления, в то время как политика второго игрока остаётся неизменной, то он имеет худший результат (больший проигрыш). Можно уйти в философию, рассуждая о том, что бы это известное специалистам по теории игр утверждение значило в случае не одушевлённых, но крайне опасных оползней, «не прощающих» людям ошибки или их преступные деяния, и в случае людей, продумывающих мероприятия по защите города от оползней. Но лучше говорить об используемом игровом методе с целью пополнения достаточно скудного математико-теоретического задела по борьбе с оползнями и надеяться на то, что он окажется столь же полезным, как и использование математической теории катастроф.
2.2. Управление Нэша при т = 1
Рассмотрим частный случай найденного оптимального управления Нэша:
ТТ* 1 2 * 1
Н = —х , г = -х.
22
Для него решение (13) имеет вид
, ,__ (* d/хх (* d/хх 1 , х
-t + lnC = —-—— = ---—— = —- In
х3 + (1/3)х J х(х2 + (1/3)) (2/3) (1/3)+х2' или
х
Х =С- e-t.
(1/3) +х2
Переходя к пределу по t ^ получим, что lim х2 = 0, т. е. выполнено равенство (7), которое мы охарактеризовали как критерий успешности принимаемого управления.
2.3. Управление Нэша при т =2
Рассмотрим другой частный случай найденного оптимального управления Нэша
Н * = -х4, г* = -х3. 2 ' 2
Для него решение (13) имеет вид
1 , ^ С dх С dх 1 1 х2
--t + lnC = I 0 , с = Q/„ , = - — - — ln-
2 J 3х3 + х5 J х3(3 + х2) 6х2 18 3 + х2
или
( 3 + х2 \
3 + х \ з _9t
0 }е =Се 9
х
Переходя к пределу по t ^ получим
lim (3е■ lim (3 + х2) = С ■ lim е~9t = 0 ух2 )
Одно из слагаемых слева должно обратиться в нуль, и это возможно лишь при lim х2 = 0, т. е. равенство (7) выполнено.
3. Оптимальное управление Штакельберга
Очевидно, что «Природа» в наше время сама определяет, какие осадки и когда польются или полетят сверху на город. Ливневые дожди явно не зависят от желаний людей и являются лидером в рассматриваемой нами игре «Природа - Человек».
Обратимся поэтому к классу иерархических дифференциальных игр [9, р. 114], в которых один из игроков имеет приоритет ходов над другими игроками и изучим стратегии Штакельберга для нашей модели оползней (5).
В этих играх у нас есть лидер и ведомый. Лидер объявляет свою стратегию, и мы ищем лучшую стратегию для ведомого в ответ на любую заявленную стратегию лидера. Его стратегия выводится из решения задачи оптимизации ведомого с учётом стратегии лидера.
Рассмотрим дифференциальную игру «Природа - Человек» (5) с выигрышной функцией игрока «Человек» [9, р. 115]:
т
Г Н2 х2 Зн[хо,Н, г}= Ун(х,Н, г)сИ, Ун(х,Н, г) = -Н - —---—.
4. Управление Штакельберга для игры (5)
В игре, основанной на стратегии Штакельберга, один игрок является лидером, он диктует свои условия другим игрокам. Поищем оптимальную стратегию Шта-кельберга для нашей дифференциальной игры:
х
— = /(х, Н, г) = -х3 - Нх - г, х(0) = хо, ге [0,Т].
Предполагаем, что нам известна стратегия игрока «Природа», т. е. нам известен прогноз осадков, в том числе и прогноз ливневых дождей г = г* (1) на момент Ь = 0. Отметим, что сочинский Гидромет имеет такие прогнозы, поступающие из Москвы, как минимум за сутки, а уточнённые - за шесть часов.
Игрок «Человек», зная эту стратегию, выбирает свою стратегию, своё программное управление Н*(1) так, чтобы максимизировать свою выигрышную функцию, т. е. ищем функцию Н* (1) так, что
Н= агд тах Зн [х0, Н(I), г*(1)].
Для данной стратегии г*(Ь) условия оптимальности имеют вид [9, р. 114, 115]:
9ун ^^др ¿А дун ^..др __
дН + тдН = 0 Л = -дх дТх' (16)
или
в А
-1 -Н -Ах = 0, — = х -А[-3х2 -Н]. Следовательно, оптимальная стратегия Штакельберга игрока «Человек» равна
Н*(г) = -1 -А(г)х(г), (17)
где А( ) есть решение системы дифференциальных уравнений:
Г = х + А • [3х2 - 1 -А •х],
< ^ = -х3 + х • (1 + А •х) - г*(г), (18)
х(0) = х0, А(т) = 0.
Приведённые выше условия (16) достаточны для оптимальности Н*(£), если гамильтониан игрока «Человек»
Пн(х, Н, г*,Х) = ун(х, Н, г*(1)) + Л(1)/(х, Н, г*(1)) =
Н2 х
= -Н - — - — -Л ■ [х3 + Нх + г*(1)]
является функцией в совокупности вогнутой (выпуклой вверх) по переменным х и Н [9, р. 114], что сводится к выполнению неравенств
0 ^ 1 + 6Л -х ^Л2. (19)
Таким образом, теоретически задача поиска оптимальной стратегии борьбы с оползнями сводится к решению системы (18) и к проверке условия (19). Очевидно, это предполагает подбор функций *( ), адекватно отражающих ситуацию с ливневыми дождями и к последующее численное решение системы (18) с проведением серии вычислительных экспериментов.
Численное моделирование проводится в Ма1;ЬаЬ благодаря наличию в нём решателя bvp4c, т. е. программы, позволяющей находить решение краевых задач для систем дифференциальных уравнений2, в том числе и для задач типа (18). Но эту часть работы планируется опубликовать в следующей статье.
5. Заключение
Мы получили оптимальное управление смещением оползня в виде чисто математических выражений (14) или (17). Важно понять, как они могут быть проинтерпретированы городскими инженерами, занимающимися практическими вопросами противостояния оползневым процессам.
Речь идёт о плане противооползневых мероприятий - установке подпорных стенок, дренажных систем, посадке деревьев на склонах и пр. Очевидно, что по смещению х или по количеству оползней за год устанавливается объём работ как по уборке оползневого грунта, так и по сумме денежных затрат. Предложенное в статье управление оползневым процессом, сопоставленное с традиционными инженерными расчётами, позволит определить, какое оптимальное управление (стратегия) Нэ-ша (при каком значении т) из множества управлений (стратегий), данных формулой (13), наиболее эффективно, и, следовательно, использовать именно его в практической работе. Именно такой путь был предложен в работе китайских исследователей [5] и относительно успешно реализован касательно практического использования математической теории катастроф.
Одновременно предложен путь борьбы с оползнями за счёт использования оптимальной стратегии Штакельберга, в котором выбор стратегии игроком «Природа» сводится к выбору функции, адекватно отражающей ситуацию с ливневым дождём.
2Решатель bvp4c отсутствует в системе 8с1ЬаЬ.
Благодарности
Работа выполнена в рамках государственного задания «Эволюция окружающей
среды и климата вследствие естественных причин и антропогенного воздействия»
(FGRW-2021-0015, № госрегистрации 122032300363-3).
Литература
1. Борисенко М.О. Проблемы оползневых деформаций (на примере района Сочи) // Наука, образование и экспериментальное проектирование. 2022. № 1. C. 281-284.
2. Крестин Б.М., Мальнева И.В. Активность оползневого и селевого процессов на территории Большого Сочи и её изменения в начале XXI века // Сергеевские чтения: материалы годич. сес. Науч. совета РАН по проблемам геоэкологии, инженерной геологии и гидрогеологии. М.: Изд-во РУДН, 2014. Вып. 16. С. 295-299.
3. Qin S.Q., Jiao J.J., Wang S.J. A cusp catastrophe model of instability of slip buckling slope // Rock Mechanics and Rock Engineering. 2001. Vol. 34. P. 119-134.
4. Постон Т., Стюарт И. Теория катастроф и её приложения. М.: Мир, 1982.
5. Tao Y., Cao J., Hu J., Dai Z. A cusp catastrophe model of mid-long-term landslide evolution over low latitude highlands of China // Geomorphology. 2013. Vol. 187. P. 80-85.
6. Шебзухова О. Оползневые процессы, подтопление территорий и возрождение УБПР // SCAPP. 2022. № 5. С. 58-64.
7. Lewis F.L., Vrabie D.L., Syrmos V.L. Optimal Control. John Wiley & Sons, Inc., 2012.
8. Тынянский Н.Т., Жуковский В.И. Дифференциальные игры с ненулевой суммой (кооперативный вариант) // Итоги науки и техники. Серия Математический анализ. 1979. Т. 17. C. 3-112.
9. Dockner E.J., Jergensen S., Ngo Van Long, Sorger G. Differential Games in Economics and Management Science. Cambridge: Cambridge University Press, 2000.
CONTROL OF LANDSLIDE PROCESSES WITHIN THE FRAMEWORK OF THE THEORY OF DIFFERENTIAL GAMES
A.K. Guts
Dr.Sc. (Phys.-Math.), Professor, e-mail: [email protected] Sochi State University, Sochi, Russia
Abstract. In the article, the theory of differential games is applied to control of the process of sliding of landslides on mountain slopes. The optimal Nash control which guarantees the stop of the landslide process is found. The form of practical use of proposed model of landslide sliding control is discussed. A path of resistance to landslides is suggested in which the choice of the Stakelberg strategy in the frame in which the "nature" player's strategy is indicated as selection of the appropriate functions that adequately reflect the situation with heavy rain.
Keywords: landslide, landslide model, differential games, landslide process control, optimal Nash control, optimal Stakelberg control.
Дата поступления в редакцию: 30.10.2023