Модель управления действиями наблюдателя при вторичном поиске

Прокаев Александр Сергеевич

у%Щ ОБРАБОТКА ИНФОРМАЦИИ И УПРАВЛЕНИЕ

УДК 681.1

МОДЕЛЬ УПРАВЛЕНИЯ ДЕЙСТВИЯМИ НАБЛЮДАТЕЛЯ ПРИ ВТОРИЧНОМ ПОИСКЕ

А. Н. Прокаев,

адъюнкт

Военно-Морская академия им. Н. Г. Кузнецова

Рассмотрено решение задачи нахождения оптимального алгоритма вторичного поиска (поиска подвижного объекта после потери контакта с ним) на основе теоретико-игрового подхода при различном характере распределения положения объекта в области неопределенности.

This article is devoted to solution secondary search (the mobile object search after losing) optimal algorithm problem on the search games basis with the different law of object position distribution in the uncertainty area.

Введение

Актуальность развития методов и моделей поиска подвижных объектов вытекает из наличия и объективного роста ситуаций, определяемых необходимостью обнаружения объектов, характеризующихся неопределенностью текущих координат в пространстве (аварийный самолет в спасательной операции, косяк рыбы при координируемом лове рыбы, подводная лодка противника в территориальных водах и пр.). При этом координация и распределение усилий сил поиска есть целенаправленный процесс, требующий эффективного управления. В современных условиях управление поиском осуществляется на базе широкого класса информаци-онно-управляющих систем, позволяющих в реальном масштабе времени получать и обосновывать решения руководства поисковыми действиями на применение сил поиска. Предлагаемая модель управления действиями наблюдателя (поисковой системой) является дальнейшим развитием соответствующего класса задач теории поиска, используемых при разработке математического и программного обеспечения указанных информационно- управляющих систем.

Влияние основных ограничений теории поиска на эффективность поисковых действий в современных условиях

Как известно, основные положения теории поиска подвижных объектов были разработаны в период Второй мировой войны учеными группы оценки операций под руководством Б. О. Купмана [6-8] в 1956-1957 гг. Идеи, сформулированные в отчетах Б. О. Купмана, получили дальнейшее развитие как за рубежом, так и в трудах отечественных ученых. Однако развитие технических средств поиска и их носителей привело к появлению ограничений, затрудняющих или вовсе исключающих использование теории поиска подвижных объектов (ТППО) в ее классической редакции для решения ряда практических задач поиска. Приведем здесь ряд наиболее очевидных ограничений:

1) объект поиска оказывает активное противодействие наблюдателю;

2) зона обнаружения наблюдателя и (или) объекта поиска соизмерима с размерами района поиска;

3) форма и (или) размеры района поиска в процессе поиска изменяются;

4) объект поиска имеет возможность выйти из района поиска в течение времени поиска.

Традиционный подход исследования операций предполагает учет указанных ограничений путем наращивания математических моделей поиска неподвижного объекта элементами, играющими роль факторов, ограничивающих поисковые усилия [2]. В конечном счете это приводит к тому, что тактика поиска цели, активно уклоняющейся от обнаружения, не имеет принципиальных отличий от тактики поиска неподвижной цели, что непосредственно следует из анализа используемых показателей эффективности.

В качестве показателя эффективности поиска в большинстве случаев принято использовать вероятность обнаружения цели. Вероятность обнаружения одиночной цели при самостоятельном поиске в районе группой наблюдателей определяется выражением

P(f) = 1-exp(-Yzf), (1)

где t - время поиска;

уЕ - суммарная интенсивность поиска группы

из п наблюдателей.

Модель равновероятного распределения координат цели предполагает равномерное распределение поисковых усилий по району поиска, что достигается выделением каждому наблюдателю участка поиска в пределах района, площадь которого пропорциональна поисковой производительности данного наблюдателя. В результате этого интенсивность поиска цели на всех участках поиска становится одинаковой.

Для определения вероятности обнаружения цели, уклоняющейся от обнаружения, в качестве интенсивности поиска принимается величина

_ 2<*Ц/УН sinq.

где dцj - эффективная дальность обнаружения целью / -го наблюдателя;

г1 V

ин/ ■ Ц-V

q,= arcsin-^-arcsin-^-, (3)

dm Цн

где 1/ц.у - скоростыдели при уклонении от обнаружения.

Анализ выражений (1) -(3) позволяет сделать следующие выводы.

1. Распределение наблюдателей по участкам поиска, площадь которых пропорциональна их поисковой производительности, приводит к тому, что каждый наблюдатель осуществляет поиск не в составе единой поисковой системы, а самостоятельно, независимо от остальных наблюдателей, вследствие чего преимущество группового поиска в значительной степени утрачивается. Взаимодействие при поиске осуществляется только в пределах участка (если наблюдатель групповой). Взаимодействие между наблюдателями, ведущими поиск на смежных участках, заключается, как правило, только в организации смены участков.

2. Если

°ц/> н/ I/ , (4)

vнi

что чаще всего и имеет место в современных условиях, особенно в ситуации, когда цель получает информацию о поисковых силах от внешних источников, интенсивность поиска для случая идеально уклоняющейся цели, определяемая выражением (2), равна нулю. Если условие (4) выполняется для всех наблюдателей группы, общая вероятность обнаружения цели в районе будет равна нулю независимо от количества наблюдателей в группе, так как все наблюдатели осуществляют поиск независимо друг от друга. Очевидно, что решить задачу оптимального поиска или хотя бы оценить его эффективность в этом случае можно только опосредованно.

Оптимизация поиска объектов на основе теории дифференциальных игр

Разрешение указанного противоречия возможно как за счет расширения собственных положений ТППО, так и путем привлечения элементов других теорий к решению вновь возникающих задач. Вышеуказанные ограничения ТППО переводят ситуацию поиска в разряд конфликтных, т. е. таких, где участвующие стороны имеют несовпадающие интересы. Математической теорией конфликтных ситуаций является теория игр. Привлечение аппарата теории игр к решению задач поиска привело к появлению целого класса задач на стыке теории игр и теории поиска - игр поиска. Значительная часть поисковых ситуаций в условиях противодействия цели может быть представлена в виде непрерывной бесконечной антагонистической игры (иначе - дифференциальной игры) с неполной информацией.

Метод оптимизации поиска подвижных объектов на основе теории дифференциальных игр базируется на следующих основных положениях.

1. Оптимальная смешанная стратегия объекта поиска определяется целью его действий в конкретной поисковой ситуации. Цель действий объекта поиска всегда противоположна цели действий наблюдателя. В любой момент времени поиска объект поиска действует наименее выгодным для наблюдателя образом.

2. Игра поиска подвижного объекта Г может быть сведена к эквивалентной ей игре поиска неподвижного объекта Г.

3. Игра Г является эквивалентной игре Г, если:

- значения игры равны, т. е. val Г = val Г ;

- множества оптимальных стратегий игроков совпадают, т. е. u[t) = и (t) и v = v , где u(t), v - оптимальные стратегии наблюдателя и цели в игре поиска подвижного обьекта; u*(t), v - соответствующие им оптимальные стратегии в эквивалентной игре поиска неподвижного обьекта.

4. Оптимальной стратегией цели в игре поиска неподвижного объекта является размещение в области G по равновероятному закону. В игре поиска подвижного объекта оптимальная стратегия цели будет определяться условиями конкретной задачи.

5. Система фазовых координат при решении задачи поиска должна строиться таким образом, чтобы пространство поиска G' в данной системе координат при условии применения наблюдателем оптимальной смешанной стратегии и* включало в себя все пространства параметров цели G¡, / = 1...оо .соответствующие всем возможным стратегиям цели, иначе, чтобы выполнялось условие G¡ с G'.

Основная идея метода заключается в нахождении решений игр поиска подвижных объектов путем сведения последних к эквивалентным играм поиска неподвижных объектов, имеющим более простое решение. Таким образом, решение задачи оптимального поиска подвижной цели на плоскости сводится к решению задачи оптимального поиска неподвижного «образа» цели в пространстве параметров.

Последовательность применения метода для решения задач оптимизации поиска подвижных объектов такова:

1 этап. Постановка задачи поиска. Включает в себя:

а) определение цели действий объекта поиска;

б) определение закона распределения вероятности нахождения цели в районе поиска (на рубеже, в полосе);

в) определение характеристик движения наблюдателя и цели и возможности по их взаимному обнаружению;

г) определение дополнительных условий задачи (возможность выхода цели из района поиска и др.).

2 этап. Представление задачи оптимизации поиска в виде дифференциальной игры (формальное определение дифференциальной игры поиска подвижного объекта). Включает в себя:

а) определение множеств стратегий (оптимальных смешанных стратегий) наблюдателя и цели, соответствующих поисковой ситуации;

б) выбор системы фазовых координат, позволяющей преобразовать игру поиска подвижного объекта в эквивалентную игру поиска неподвижного объекта;

в) определение динамики игроков и области поиска в выбранной системе фазовых координат.

3 этап. Решение дифференциальной игры поиска неподвижного объекта в фазовых координатах. Включает в себя:

а) определение значения игры, т. е. значения функции выигрыша в ситуации равновесия;

б) определение условия оптимальности стратегии наблюдателя;

в) определение аналитических зависимостей, характеризующих траектории наблюдателя и цели в фазовых координатах.

4 этап. Преобразование полученных аналитических зависимостей из системы фазовых координат в систему декартовых (полярных) координат на плоскости; нахождение числовых характеристик траектории наблюдателя на основе полученных выражений.

В качестве критерия оптимальности поиска принимается цена игры - минимальное время обследования области возможного положения цели при заданной вероятности ее обнаружения или максимум обследуемой площади за определенное время. Решением дифференциальной игры поиска является оптимальная траектория наблюдателя.

Рассмотрим некоторые решения задачи вторичного поиска на основе теоретико-игрового подхода.

Вторичный поиск («поиск по вызову»)

В работах по теории поиска [1,4,6] широко освещен так называемый вторичный поиск, когда установлен факт присутствия цели в районе, но ее место определено с ошибкой. При этом предполагается, что скорость цели известна достоверно, а направление движения распределяется равновероятно по всему горизонту. Плотность вероятности места цели относительно исходной точки обнаружения через время ¿после потери контакта с ней, соответствующее указанной выше гипотезе о характере движения, цели имеет вид:

2+2

w(r,t) =

1

Г +1/ц f

2а2

- rV t

;о( р”)’

(5)

2ко^ w

где a - среднеквадратическая погрешность места

цели;

'о(

'ХА

функция Бесселя нулевого порядка от

мнимого аргумента.

Оптимальной стратегией наблюдателя, позволяющей ему осуществлять поиск, постоянно находясь в области максимума плотности вероятности места цели w(r, t), как показано в вышеуказанных работах, является расходящаяся логарифмическая спираль, описываемая уравнением

R(t) = 1/ц?3е

Л-1

(6)

где R{t) - расстояние от исходной точки до точки максимума величины w{r, t)]

f3 - время от момента обнаружения до момента начала поиска;

ц - координата наблюдателя в полярной системе при его движении по логарифмической спирали.

Способу обследования водного пространства по расходящейся логарифмической спирали присущи следующие существенные недостатки [5]:

- эффективный поиск возможен только лишь при соблюдении гипотезы о постоянстве курса и скорости уклоняющегося объекта в течение всего времени поиска, а также соответствии фактических параметров движения объекта, принятым в гипотезе;

- учитывает только случайный характер курса цели, но не учитывает случайное распределение места цели в зависимости от средства и способа ее первичного обнаружения;

- невозможен поиск объектов, скорость которых при уклонении больше скорости наблюдателя.

С целью преодоления указанных противоречий сформулируем задачу вторичного поиска следующим образом: в области неопределенности, имеющей форму круга радиусом Я0 - находится цель, максимальная скорость цели 1/ц . Характер задач, выполняемых целью в районе поиска, позволяет ей покинуть его в любой момент времени поиска. Наблюдатель осуществляет поиск цели на скорости VH > 1/ц , имея при этом дальность действия средств обнаружения цели, равную dH <с/ц , где с/ц - дальность, на которой цель обнаруживает наблюдателя. Задача наблюдателя состоит в том, чтобы обнаружить цель в кратчайшее время.

Применение метода оптимизации на основе теории дифференциальных игр к решению задачи вторичного поиска позволяет сделать следующие выводы.

1. Если место цели в момент начала поиска распределено в области неопределенности по равновероятному закону, оптимальная траектория наблюдателя, являющаяся результатом решения данной задачи на основе теоретико-игрового подхода, представляет собой сходящуюся спираль, результаты компьютерного моделирования которой представлены на рис. 1, а, б. Вектор скорости цели в каждой точке спирали направлен под углом ц(£) к радиусу спирали. Значение Lt(f) определяется выражением:

¡40 = arccos

«а)>(о2+1 -m2 -m

k(t)2+^

(7)

а)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

б)

Ф1;

ф1, ф2^3|

I Рис. 1. Поиск по сходящейся спирали одиночным наблюдателем (а) и группой из трех наблюдателей (б)

а)

1,0

0,8

0,6

0,4

0,2

0'

■■

■■ р( ¿¡у-

VJ — — - Рой 1

б)

1.0

0.8

0.6

0.4

0.2

Р( ¿As PJ ]

~А

О

8 10

2 4^6 8 10

в Рис. 2. Сравнение эффективности поиска по расходящейся логарифмической (Р0(у)) и по сходящейся (Р05и)) спирали

0.864

0.8

0.6

0.4

0.2

0

■■

■■ У^Р OS k)

" / "К Ї)"

fort s) 1

12

3 6 9

и<, 1П3

I Рис. 4. Сравнение эффективности вторичного поиска

по сходящейся (Р05) и расходящейся (Рог) спирали при равновероятном распределении цели

где

т=

ndH .

nR(t)'

(8)

R(t)~ текущий радиус спирали; m - соотношение

скоростей цели и наблюдателя, m

_л

vu

Способ поиска, реализующий траекторию поиска по сходящейся спирали, будем именовать способом (стратегией) ПСС. Условие оптимальности стратегии ПСС определяется выражением:

О <

''max -

ndH

mn

(9)

где Ятах - предельное значение радиуса; п - число наблюдателей.

Число наблюдателей, необходимое для реализации стратегии ПСС, определяется выражением:

^необх

mnRn

(Ю)

где Я0 ~ радиус района поиска. Сравнительная оценка эффективности поиска традиционным способом (по расходящейся логарифмической спирали) и поиска по сходящейся спирали приведена на рис.2, а, б.

Анализ результатов математического моделирования данной поисковой ситуации позволяет сделать вывод о том, что эффективность ПСС тем выше эффективности поиска по расходящейся логарифмической спирали, чем большее упреждение в обнаружении имеет цель над наблюдателем (на рис.

2, б изображен случай, когда цель практически не

/

/ pjn

% (s) /

У PJD

3 6 9

ts(i),tr(j).t,

0.024 3 1.276x10’4

6 9 12 15

ts(i), tr(j), ts 11-412

Рис. 3. Сравнение эффективности вторичного поиска по сходящейся (Рпз) и расходящейся (Рпг) спирали при нормальном распределении цели при а0 = 10 миль (а) и сг0 = 50 миль (б)

имеет такого упреждения), т. е. чем меньшее значение имеет интенсивность поиска уклоняющейся цели, определяемая выражениями (2) - (3).

2. Если место цели в момент начала поиска распределено в области неопределенности по нормальному закону, оптимальной траекторией наблюдателя является рассмотренная выше сходящаяся спираль или расходящаяся спираль, характеристики которой также определяются выражениями (7) -(8). Способ поиска по расходящейся спирали будем называть способом (стратегией) ПРС. Его отличие от ПСС заключается только в направлении движения наблюдателя - не от периферии области неопределенности к ее центру, а наоборот. Предельный радиус области неопределенности, которая может быть обследована с использованием стратегии ПРС, определяется выражением

О <

''max -

nd Hj

где

пц

2m

■m

(11)

(12)

3. Эффективность вторичного поиска при нормальном законе распределения координат цели определяется рядом факторов. Кроме величин, от которых эффективность поиска зависит в любой поисковой ситуации (скорость цели и наблюдателя, дальность обнаружения наблюдателя и др.), при вторичном поиске большую роль играет точность знания места цели в момент начала поиска, определяемая величиной СКО а0 . Если значение а0 мало, то более эффективным можно считать способ ПРС (рис. 3, а). Уменьшение вероятности обнаружения цели с течением времени объясняется расширением ОВПЦ, сопровождающимся уменьшением плотности вероятности нахождения цели в необследованной области. Если значение cf0 велико (рис. 3, б), способ ПСС имеет преимущество над ПРС.

4. При равновероятном характере распределения цели в районе поиска ПСС имеет бесспорное преимущество над ПРС (рис. 4). Линия излома графика функции Por(t) (вероятность обнаружения цели при ПРС) соответствует моменту достижения наблюдателем расстояния Rmax от центра района поиска. На графике видно, что даже в том случае, когда цель находится поблизости от центра района по-

■ Рис. 5. Траектория наблюдателя при поиске неподвижной (малоподвижной) цели

Рис. 6. Сравнение эффективности поиска неподвижной цели по сходящейся (РП5) и расходящейся (Рпг) спирали при нормальном распределении

50.01

/' PnrÜ) i

/ / /

7 /

1

0 2 4 6 8

ts(¡), tr(j)

б)

рд ,У \

/ У р„,м

и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

о 0.03 2 4 6 6 6858

ts(i), tr(j)

иска, динамика роста вероятности обнаружения практически одинакова.

5. Если цель неподвижна (т = 0) или малоподвижна (т<< 1 )> траектория наблюдателя будет иметь вид спирали Архимеда (рис. 5).

Если распределение места цели в районе характеризуется равновероятным законом, способы ПСС и ПРС имеют одинаковую эффективность. Если цель распределена по нормальному закону, оптимальным способом поиска будет ПРС независимо от значения ст0 (рис. 6).

Заключение

Представленный в статье подход позволяет решать задачу оптимизации поиска для случаев, не имеющих прямых аналитических решений в рамках ТППО. При этом полученное решение позволяет решить задачу не только для однородных наблюдателей, но и для разнородных сил поиска.

Литература

1. Абчук В. А., Суздаль В. Г. Поиск объектов. - М.: Сов. радио, 19/7. - 333 с.

2. Динер И. Я. Исследование,операций. - Л.: ВМА, (969. 604 с.

■ 3 ХеллманО. Введение в теорию оптимального поиска. Пер. с англ. / Под ред. Моисеева Н. П. - М.: Наука, 1985. -284 с.

4. Попович В. В, Моделирование, оценка эффективности и оптимизация систем наблюдений ВМФ (теория поиска подвижных объектов). - СПб.: ВМА, 2000, -424 с.

5. ЧаусовФ. С., Михайлов В. А. Способ поиска объектов по сходящейся архимедовой спирали (Материалы изобретения). - СПб.: ВМА. 2002. - 33 с.

6 Koopman В. О. The theory of search. !.. Opera!,Res. ~ 1956.

- 4. -P. 324-346,

7. Koopman B. O. The theory of search, 2./ Operat Res. -1956.

- 4. - Р. 503-531.

8. Koopman B. O. The theory of search. 3./Operat. Res. - 1956.

-5.-Р. 613-626.

ИЗ ДАТ ЕЛ ЬСТВ <* « П 0Л ИТЕХН И КА» П Р ЕД СТА ВЛ Я Е1

ЛяликовА. П.

Трактат об искусстве изобретать. — СПб.: Политехника, 2002. — 416 с.: ил.

В книге изложены основные аспекты — философский, исторический, психологический, системный и эвристический — важнейшей отрасли общечеловеческой культуры, которая является источником и основой бытия, личного и социального, — технического творчества.

Книга предназначена для широкого круга читателей: от учащихся и студентов до умудренных жизнью и размышлениями о ее сущности специалистов, собирающихся изобретать, уже изобретающих и даже совсем никогда и ничего не изобретавших.

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Прокаев Александр Сергеевич

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Прокаев Александр Сергеевич

Текст научной работы на тему «Модель управления действиями наблюдателя при вторичном поиске»