Научная статья на тему 'Информационные множества в дифференциальной игре поиска с дискретными моментами наблюдения'

Информационные множества в дифференциальной игре поиска с дискретными моментами наблюдения Текст научной статьи по специальности «Математика»

CC BY
47
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — С. В. Меетников

Рассматривается дифференциальная игра поиска с дискретными моментами наблюдения. Исследуются свойства гарантирующих стратегий поиска и уклонения, вводятся информационные множества, где может находится прячущийся игрок, если он не обнаружен до заданного момента времени.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Информационные множества в дифференциальной игре поиска с дискретными моментами наблюдения»

УДК 518.9

ИНФОРМАЦИОННЫЕ МНОЖЕСТВА В ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ ПОИСКА С ДИСКРЕТНЫМИ МОМЕНТАМИ НАБЛЮДЕНИЯ

С, В, Меетников

Рассматривается дифференциальная игра поиска, описываемая системой векторных дифференциальных уравнений:

для Р: x =/(t, x,u), и G U, x G R3, (1)

для E : y = g(t, y, v), v G V, y G R3, (2)

где U (V) — непустое компактное множество в евклидовом пространстве Rp (Rq), t > to- Вектор-функция / (g) в правой части уравнения (1) ((2)) удовлетворяет условиям единственности, продолжимости решений для каждой измеримой вектор-функции и = u(t) G U (v = v(t) G V). Кроме того, предполагается, что множество

F(t, x) = (С | С = /(t, x, u), u G U} (G(t, y) = {n | n = g(t, y, v), v G V})

(3)

выпукло и замкнуто при любых (t, x) G [to, ^xR^(t, y) G [to, ^xK3) [1-3].

Пусть задано разбиение a = {to < ti < ... < tY < ...} интервала [t0, те) такое, что tY < i^i y < k гДе Y k — порядковые числа [4], причем supt7 = tk G a Предположим, что игрок Р может обна-

Y <k

ружнвать игрока E только в моменты t G a. Введем в рассмотрение функцию

1, если y(t) G 5(x(t)), t G a;

x(t),y(t)) = , n

и в противном случае

© 2008 Меетников С. В.

(здесь Б(х) — область обнаружения игрока Р) и функционал X 0 •)) = т х^),уф).

4е [¿о,то)

Рассмотрим антагонистическую игру Гст = (А, В, Ка} [1-3] с дискретными моментами наблюдения из разбиения а интереса времени [¿о, го) с выигрышем игрока Р гада Е£(X0, у(•)) и функцией выигрыша

КХ0,и{•); у0,ю{•)) = X•,г0,х0,и),у(•,г0,у0,у)),

где •)) е А (уоМ•)) е В.

Пусть N(¿,¿0, N0) — область достижимости игрока Е из множества N в момент ¿, т. е.

Щ¿, ¿о, {у е М" | у = у(¿, ¿о, V), уо е N0, V е пЕ}.

Определение. Областью неопределенности ¿) местоположения игрока Е в момент времени ¿ е [¿о, го) для игры поиска с дискретными моментами наблюдения из разбиения а при фиксированной стратегии а = (щ, и( ^игрока Р назовем множество

ПЛМо,(хо,^),и) = {у = у^) | (3уф е Щ^о,уо),№) е N0)

<ут е а, у{т) е ^х(т))},

где Х^) = Хт, ¿о, хо, и), N(¿, ¿о, уо) — множество достижимости игрока Е в момент ¿ е [¿о, го).

Заметим, что область неопределенности Пст(¿) — это такое подмножество М", где может находиться игрок Е, если он не обнаружен до момента ^ ^^^ ^^^^^^тении игроком Р стратегии а. Из определений области неопределенности Пст(¿) и гарантирующей стратегии игрока Р вытекает следующее свойство множества Пст(¿).

Свойство. Если для стратегии а= (х0, и(•)) множество

пусто, то стратегия а игрока Р является гарантирующей обнаружение с продолжительностью поиска Т; если стратегия а игрока Р является гарантирующей обнаружение с продолжительностью поиска Т, то тогда множество Пст(Т,¿о, (х>, N0), и) является пустым.

Приступим к исследованию свойств, гарантирующих обнаружение Р

рока Е для игры поиска с дискретными моментами наблюдения из разбиения <г. Для фиксированной чистой стратегии а = (жо,м(•)) игрока Р с помощью множеств ¿о,^о) и 5(ж(£)), ж(£) = ж(£, ¿о, жо, и), построим множество ¿,¿0, (жо, Со), и) (Со = N\^(жо))-

Множество ¿,¿0, (жо, Со), и) строится следующим образом.

1. Положим

2. Пусть ¿) определено до момента ¿7 >^и^ = 7+1. Тогда

\Ntfc №(*к)), ¿ = *к •

Если к — предельное порядковое число, т. е. вир£7 = ¿к, то Оа(¿)

7 <к

определим по формуле

7< к

По принципу трансфинитной индукции [4] получаем, что множество ¿) определено для любого 4 € [¿о, те).

Замечание. Определение множества ¿к), где к — предельное порядковое число, с помощью операции пересечения корректно, поскольку

N(¿^7+1 ) С ^(¿к,¿7

для любого ¿к, ¿7 € <г.

Действительно, из определения области достижимости получаем

Na(tk ,tj, Ge(tj)) = N(tk, i7+l, N(t.y+1 ,t7, G Л t7)) D N(tk, N(tj+1 ,Gj(t7))\S(x(t7+i))) = N(tk,G«{t1+1)).

Основные свойства множества Ga(t, to, (xo, Go),u) следующие.

1. Gff(t) с N(t,t0,N0),t > t0.

2. Если существует момент времени t ^ to, для которого GCT(t) = 0, то G^т) = 0 для всех т ^ t.

3. G^t2,t1,^(t1),G^^)),u) = G,j(t2,to,(xo,Go),u) для всех t G [to, го) (полугрупповое свойство).

4. Если разбиение о\ содержит все точки разбиения a 2 интервала [t0, го), то Gj (t) с Gj2 (t), t G ^0, го).

Лемма. Для того чтобы стратегия a = {xQ,u(■ )) игрока P была гарантирующей с продолжительностью поиска tj = тст(щ,и(■ )), необходимо н достаточно, чтобы в момент времени Tj = tg + tj множество G(TJ,to, (xo, Go), u) было пусто.

Доказательство. Необходимость. Допустим, что стратегия a = (щ,и(■ )) игрока P является гарантирующей с продолжительностью поиска tj = тст(xq,u(■ )). Покажем, что GCT(t^) = 0. Предположим противное, т. е. в момент Ta = to + тст множество Ga(ta) непусто. Пусть k — порядковое число такое, что tk G a,tk ^ TŒ и не существует другого момента tY G a такого, что tk <tY ^ Ta. Ясно, что Ga(tk) ф 0. Возьмем любую точку yk G Ga(tk). Возможны два случая: k — изолированное порядковое число (к = 7 + 1)ик — предельное порядковое число (k = sup{7 | y < к}). Рассмотрим первый случай. Из свойства 2 следует, что GCT(t7) ф 0, т. е. существуют состояпие yY G Ga(t7) = 0 и управление v7(t), для которых yk = y(tk,tY,yY,vY). Кроме того, поскольку k = y + 1, то

y = y(tk ,y7 ,vj) G {tk) и y(tk,tj ,y7 ,vj) G N(tk ,Ga(tj)).

k

Из свойства 2 следует, что GCT(t7) ф 0 для всex y < k, поскольку по

определению

С Л ¿к) = Р) {^(¿к, ¿7 ,СЛ ¿Л)}•

7< к

Возьмем 7 < к и обозначим через У*(•, [¿7, ¿к], ук) множество всех траекторий игрока Е, начинающихся из множества С Л ¿7) и заканчивающихся в точке ук € С Л ¿к)- Другими словами,

У*(-,[*7,*к],Ук) "{ЛО I РУ7 € СЛ^))(Э*7 € Ре)

((Л •) = Л ¿7,У7,иу)) & (Л^к, ¿7,У7= Ук)}.

Обозначим через У*+1 (•, ,¿к, Ук) сужение всех траекторий Л0 € У*(•, [¿7, ¿к],Ук) та интервал времени [¿7+1 ,^к]. Из построения множества С(£ст) следует, что

У *( •, ,^к] ,Ук) с ^к] ,ук).

Пусть У7+1 (•, [¿7,£к],ук) — подмножество множества У*(•, [¿7,£к],ук) такое, что

(>[¿7 ,УЛ = У *( ,Ук) •

Аналогично построим множество

У •,^7 ,*к] ,Ук) , г = 1,2,....

Ясно, что

У^(.[¿7,ук) с У7+1(•,^7^к],Ук)• Из построения множества С Л следует, что

У= р| У,*к],Ук)^ 0.

¿^0

Действительно, если У = 0 то существует такое число ] ^ 0, что •, [¿7, ¿к], Ук) = 0 для всех г ^ Это означает, что не существует траектории, начинающейся в множестве С Л ¿7+1) и заканчивающейся в точке ук, т. е. Ук € ^(¿к, СЛ^м)) и тем более Ук € СЛ^к)- Тогда существуют такое состояние У7 € С Л ¿7) и управле ние «7 € РЕ)

что у(• ) = у(• ^-у,у1 ^.у) е У. Из построения множества У следует, что у^^-у,у1 ^.у) е ^(¿) для всех ¿ е \Ь1 ^к], ¿ е а, поскольку в противном случае существует такой момент т е а, ¿^ ^ ¿ ^ ¿к, что у^^-у,у1 ^.у) е и поэтому у^) е ¿)- Это противоречит условию Ук = У^к,¿7,У1 ^^ е ,0а^к) = Оа^к,¿,0^1), а) (см. свой-

ство 3).

Таким образом, в обоих случаях нашлись такие состояние у1 е 0а( ¿-у) и у правде ние v7 е ВЕ, что

) е ^(¿), ¿ е а, ¿1 < ¿ < ¿к.

Предположим, что найдены такие состояние уг е 0а(¿г) и управление V: е Бе, V:: = Vz( ¿), ЧТО У^^г ,Уг ^г) £ ^^ ¿ е а ¿2 < ¿ < ¿к-Тогда, следуя аналогичным рассуждениям, можно найти управление V™ е Ве, т < г, и такую точку ут е что у^, ¿т, ут, vm) е

¿ е а ¿™ ^ ¿ ^ ¿к- Из принципа трансфинитной индукции [4] следует, что существуют состояние уо е О и управление ^ е ВЕ, для которых У^о,Уо^о) е ¿ е а. Отсюда

(х( • • ^Уо^о)) = о

а Х, и Р

щей с продолжительностью поиска та , т. е. паше допущение неверно и

О Л Та ,¿o,(xo,0o),u)) = 0.

Достаточность. Пусть для стратегии а = (хо,и(• )) имеем множество 0а(Та) = 0а(Та, ¿о, (хо, О), и)). Покажем, что стратегия а игрока Р является гарантирующей с продолжительностью поиска та = Та - ¿0-

Предположим противное, что существуют такие состояние уо е N и управление V е Ве, что у(т) = у(т, ¿0, у0, V) е т е а, т е [¿о, Тст]. Тогда для любого момента ¿ е [¿о, Т^] выполнено 0а(¿) = 0. Действительно, у0 е N0, у^) е N(¿1,¿o,0o)\stti). Пусть ^¿^ е ост^7) и к = 7 + 1. Тогда у^к) е N(¿k,¿7, Оа^))\£(х^к)), а если к — предельное порядковое число, то у^к) е 0а(¿к) (из определения множества

Gff(tfc))- Таким образом, для любого t £ [to, Тст] множество СЛ^ непусто, в том числе и для момента Тст, что противоречит нашему предположению.

Лемма доказана.

Заметим, что если в игре Гст продолжительность предписана и разбиение а содержит конечное число точек ({to = t\ < ^ < ... < tn = T}, t £ [t0, T]), то для любой стратегии a = (ж0, Л■)) игрока P, которая не является гарантирующей обнаружение, можно за конечное число шагов построить управление v £ DE и найти состояние yo £ N игрока E, для которых он избежит обнаружения на интервале [to, T].

Продолжим изучение гарантирующих стратегий.

Теорема. Для того чтобы стратегия a = (ж0, Л■)) игрока P была гарантирующей в игре необходимо существование для любого момента t ^ toтакого t* > t, что

CAU) Cint[С Лt)]. (4)

Если при этом выполняется неравенство

м[СЛt*)] <м[СЛ*)] - е, (5)

где е — некоторое фиксированное положительное число, int[A] — внутренность множества A, ^[A] — мера Лебега, то условие (4) является и достаточным.

Доказательство. Необходимость. Предположим противное, т. е. существует такой момент времени t ^ to, что для всех t ^ t не выполняется включение (4). Из определения гарантирующей стратегии и леммы следует, что существует момент времени т = т(жо,м(■)), для которого СЛт) = 0 и СЛt) = 0 для всex t ^ т. Поэтому если t ^ т, то го свойства 2 вытекает СЛ^ = 0, что противоречит нашему предположению. Если же t < т, то из полугруппового свойства 3 имеем

СЛT,t0, (ж0, С0),м) = СЛT,t, (Л?), СЛ= 0.

Поэтому для t нашелся такой момент т, что 0 = GCT(Л С int[GCT(¿)], и необходимость доказана.

Достаточность. Пусть для стратегии a = (ж0, и(•)) и любого момента t ^ to существует такой момент t*, что выполнены соотношения (4) и (5). Покажем, что стратегия a = (ж0,и(•)) является гарантиру-

tt

t

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Gff(t1) Cint[Gff(t0),Gff(t0)] = G0,

причем t1)] < m[Gct(to)] — e, где e > 0, Go ограничено и имеет

положительную меру, т. е. ^[Go] < те. С другой стороны, для момента tt

Gff(t2) Cint[Gff(t1)],

причем ^[GCT(t2)] < MlG^t1)] — e Отсюда ^[Gff(t2)] < ^[Gff(to)] — 2e и существует такой момент времени т < го, чт о (т)] = 0. Поскольку по построению GCT(т) = int[GCT(т)], то GCT(т) = 0, т. е. мы показали, что стратегия a = (жо,и(•)) игрока P является гарантирующей с продолжительностью поиска т = т(жо, и(•)). Теорема доказана.

ЛИТЕРАТУРА

1. Петросян Л. А., Зенкевич Н. А. Оптимальный поиск в условиях конфликта. Л.: Изд-во Ленингр. ун-та, 1986.

2. Зенкевич Н. А., Местников С. В. Динамический поиск подвижного объекта в условиях конфликта // Вопросы механики и процессов управления. 1991. Т. 14. С. 68-76.

3. Mestnikov S. V. Approximation of the information sets in differential search game with a detail of pursuer // Proc. Tenth Intern. Sympos. on Dynamic Games and Applications. St. Peterburg, Russia, 2002. C. 630-631.

4. Куратовский К., Мостовский А. Теория множеств. М.: Мир, 1970.

г. Якутск

29 июня 2005 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.