Наука к Образование
МГТУ им. Н.Э. Баумана
Сетевое научное издание
Наука и Образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2015. № 08. С. 116-139.
ISSN 1994-0408
Б01: 10.7463/0815.0789709
Представлена в редакцию: Исправлена:
© МГТУ им. Н.Э. Баумана
УДК 004.9
Инженерный синтез системы нелинейной пространственной селекции с элементами искусственного интеллекта для подавления критичных помех фона в оптико-электронных приборах авиационного и космического базирования
Левшин В. Л.1'2, Муратов К. В.
1,*
12.06.2015 01.07.2015
'К190@уади1ехд|
1МГТУ им. Н.Э. Баумана, Москва, Россия 2ОАО «НПП «Геофизика-Космос», Москва, Россия
В статье описывается инженерный синтез системы обнаружения теплопеленгационной аппаратурой точечных источников излучения с радикальным подавлением особо пространственно-неоднородного фона, основанным на нелинейной топологической селекции с элементами искусственного зрительного интеллекта. Представлены методики формирования апертуры нелинейного фильтра-дискриминатора, выработки признаков и алгоритмов селекции объектов по их геометрической форме при параметрически-стохастическом подходе, а также изложены способы построения областей селекции. Разработанные алгоритмы опробованы на математических моделях цели и помехи, описываемой моделью «ступени», а также при полунатурном моделировании на тестовом образчике сложного фона. Полученные результаты свидетельствуют о реальных предпосылках достижения достаточно низких значений вероятностей пропусков цели и ложных тревог при работе оптико-электронного прибора в критичных фоновых условиях.
Ключевые слова: оптико-электронный прибор, критичные помехи фона, нелинейная пространственная селекция, искусственный зрительный интеллект, фильтр-дискриминатор, топологические признаки, параметрически-стохастический подход, вероятностные характеристики распознавания
Введение
В условиях применения оптико-электронных приборов (ОЭП) авиационного и космического базирования естественный интеллект пилота или космонавта применительно к автоматическим системам повсеместно заменяется элементами искусственного интеллекта. Последнее, безусловно, относится к системам, осуществляющим обнаружение объектов на пространственно-неоднородном фоне.
Объекты в виде малоразмерных (по отношению к размеру элемента разрешения ОЭП - пикселю) подвижных целей должны быть при этом распознаны и пропущены на выход по их наиболее явным топологическим и кинематическим отличиям от критичных видов неоднородностей фона (КВНФ), которые создают самые интенсивные мешающие сигналы и подлежат подавлению. В качестве КВНФ здесь выступают одномерно-вытянутые границы макроструктурных фрагментов: облаков, пространственно-однородных массивов воды, суши, древесной растительности, полей, заснеженных областей и т.д. Давно доказано практикой, что именно от подобных элементов исходят самые интенсивные мешающие сигналы, которые могут в десятки и сотни раз превосходить полезные сигналы от целей. Другие мешающие сигналы, в частности, от однородного фона и шумов фотоприёмного устройства рассматриваются в данном случае как второстепенные по сравнению с интенсивными помехами от КВНФ.
В простых фоновых условиях (при распределении вероятностей поля яркости фона в виде закона Гаусса) задачи выделения целей на фоне помех решаются с помощью оптимальных линейных фильтров. Они при нормальном законе распределения являются (при дополнительном ограничении гипотезами стационарности и независимости излучений искомого объекта и фона) «абсолютно оптимальными» даже в более общем классе нелинейных фильтров [1]. В иных условиях оптимальные линейные фильтры, будучи связанными подчинением принципу суперпозиции, могут осуществлять только частичное подавление помех. Сложная фоновая обстановка характеризуется же явным отличием закона распределения вероятностей поля яркости фона от нормального закона [2].
В задачах обнаружения и распознавания объектов на сложном фоне преобладают вариации пороговых обработок с сопутствующими пространственными трансформациями. Пороги при этом строятся на тех или иных свойствах изображения.
Авторами показано [2], что система квазиоптимальной линейной пространственной фильтрации, в силу ограниченных возможностей этого узкого класса фильтров, не может обеспечить эффективного подавления КВНФ в условиях применения ОЭП авиационного и космического базирования по воздушным целям в сложной фоновой обстановке. В такой ситуации выделение цели из-за недостаточной эффективности действия даже наилучшего линейного фильтра при всей корректности выбора порога может оказаться невозможным. Следовательно, необходимо переходить от линейных алгоритмов к нелинейным, не обладающим таким «минусом». При таком подходе неоднородности фона, достоверно распознанные нелинейными операторами, могут быть подавлены целиком и полностью, независимо от их интенсивности.
Однако синтез оптимальных нелинейных фильтров (как в пространственной, так и во временной области) представляет собой достаточно сложную, пока ещё не решённую в общем случае проблему. Это обусловлено тем, что для данного класса фильтров, в отличие от винеровской теории для линейных фильтров [3], не существует простых алгоритмов оптимизации при свойственных этим условиям довольно «экзотичных»
законах распределения вероятностей (например, бимодального распределения или распределения Коши).
Вопросы использования логических нелинейных фильтров с 8-ми связной апертурой рассматривались в работе Дж. Сильвермана, Дж. М. Муни и Ш. Е. Сайфер [4]. Их связь с задачей распознавания неоднородностей фона была отмечена в работе М. Штерна и В. Дрисколла [5]. Дальнейшее развитие теории можно проследить в работе [6], где подробно рассмотрен класс ранговых нелинейных фильтров и возможности придания им с одной стороны свойств морфологической избирательности, а с другой стороны -одновременно робастности к вариативности помех, что созвучно с предлагаемыми в данной статье алгоритмами. Однако в указанных работах полноценного развития подхода по использованию топологической нелинейной селекции для разделения целей и помех не проводилось.
В предлагаемом подходе распознавание КВНФ в общем случае должно производиться по полному набору эффективных отличительных признаков. К их числу относятся топологические признаки (геометрическая форма), а также не менее важный кинематический признак, заключающийся в отличии искомых подвижных объектов от неподвижного (или почти неподвижного) фона. Эта операция, по аналогии с её применением в радиолокации (на базе эффекта Доплера [7]), называется селекцией по движению цели.
Рассмотрение в данной статье посвящено исследованиям топологических признаков. Монография [1], в которой изложена теория оптимальной нелинейной фильтрации специфического назначения для пуассоновских процессов на базе математического аппарата диффузионных интегралов, послужила некоторым ориентиром по формированию структуры нелинейного фильтра. Также стоит отметить два важных методических момента. Первый из них относится к выбору способа аналитического описания входных сигналов и алгоритмов. В силу принятого нелинейного характера обработки, пространственно-частотный способ в данном случае оказывается неуместным. Поэтому используется преимущественно чисто пространственное описание. Второй момент связан с использованием одновременно регулярного и стохастического подхода к описанию сигналов - параметрически-стохастического, при котором форма математических моделей цели и помехи принимается регулярной, а их параметры рассматриваются как случайные. Это позволяет наиболее адекватно представить процесс обработки и достаточно просто и «прозрачно» применить к нему вероятностные соотношения, соблюдая умеренную вычислительную сложность алгоритмов.
Научная новизна проведённых исследований заключается в изучении возможности использования нелинейной топологической селекции объектов для разделения их на классы и подтверждается патентом на изобретение [8].
Предлагаемая система нелинейной пространственной селекции может быть использована при разработке алгоритмов для ОЭП авиационного и космического базирования, решающих задачи обнаружения и сопровождения точечных подвижных
объектов на кадрах видеопоследовательностей в сложных фоновых условиях с требуемой эффективностью при относительно невысоких вычислительных затратах.
1. Постановка задачи
Задача в данной работе ставится следующим образом. На базе выбираемых критериев оптимума формируется апертура фильтра-дискриминатора селектируемых объектов, осуществляется синтез алгоритмов дискриминации КВНФ, производится расчётная оценка вероятности правильной дискриминации и сопоставление результатов с данными по квазиоптимальным линейным фильтрам. В итоге делается вывод о степени эффективности помехозащиты предложенным методом.
Критерии оценки оптимальности алгоритмов селекции обычно рассматриваются в разных аспектах: учёт стоимости и реализуемости, связь алгоритмов с информационными параметрами ОЭП, выбор подхода к осреднению по различным условиям применения ОЭП. В отношении последнего имеются две альтернативы: среднестатистическая (относительно равномерное осреднение по совокупности всевозможных фоно-целевых ситуаций) и экстремальная (минимаксный подход, требующий максимизировать эффективность решения в самых сложных условиях) [9].
Дополнительным аспектом являются соотношения вероятностей двух видов ошибочных решений по обнаружению цели: пропуска полезного сигнала и ложного обнаружения. Эти виды ошибок взаимно противоречивы в отношении выбора уровня порога, поэтому их оптимальный баланс зависит от значимости каждой из них. В более простых фоновых условиях обычно принимается приоритет ложных тревог. В комбинированных ситуациях (например, при чередовании простой и сложной фоно-целевых обстановок) разумно придерживаться комплексного критерия, объединяющего вероятность пропуска цели и вероятность ложной тревоги с некоторыми весами их значимости, соответствующими степени ущерба от того или иного вида ошибочных решений - так называемый «критерий взвешенного среднего риска» [9]. В данном случае он и является наиболее оправданным, в связи с чем, ориентир будет взят на него, имея при этом в виду приоритетный вес ложных тревог (2.1) [10].
где Япр - средний риск, К12 и К21 - весовые коэффициенты, и Б2 - решения об отсутствии или обнаружении цели, Р(у2|Б1) - вероятность ложной тревоги, Р(у1|Б2) -вероятность пропуска цели. При этом в связи с решением задачи дихотомии пропуск цели равносилен принятию цели за помеху, а ложная тревога - принятию помехи за цель.
2. Методы исследований
2.1. Критерии оценки эффективности алгоритмов
= *12 ДЗ, у2) + ^1^2, Уд = К^ЖУ21 3) + К21Р(Б2)Р(У11 ад
(2.1)
Стоит отметить ещё один важный момент. Так как в данном случае воздействия сигнала и помехи в каждом пикселе не аддитивны, а альтернативны, и «замешивания» их друг с другом не происходит, то случай присутствия и сигнала и помехи в одном пикселе исключен из рассмотрения как маловероятный.
2.2. Структура системы селекции
В соответствии с теорией оптимальной линейной фильтрации алгоритмы, выделяющие цель безотносительно к фону в пределах апертуры фильтра называются обычно «согласованными» (подразумевается - с конфигурацией полезного сигнала). Они представляют собой лишь первое необходимое, но вовсе ещё не достаточное, звено оптимального фильтра. Это положение сохраняется по смыслу и для оптимизации структуры нелинейных фильтров.
Вторым звеном оптимального линейного фильтра является помехоподавляющее звено с пространственно-частотной характеристикой, обратной спектру дисперсий помехи, сводящее при этом неоднородный фон к некоррелированному (однородному) полю яркости (пространственному белому шуму). В принятом параметрически-стохастическом подходе (при котором неоднородности фона типа кромок принимаются, как обычно это делается для равноправной с ними цели, в виде сигналов, имеющих вполне определённую неслучайную форму, но с параметрически-случайными параметрами) спектр дисперсий может быть корректно заменён квадратом модуля комплексного спектра амплитуд поля яркости фона. При этой операции исключаются фазовые параметры, и звено становится координатно-независимым.
Кроме того, оптимизированная структура фильтра должна содержать ещё третье звено, согласующее центрировку фильтра с положением объекта в поле зрения, которое может быть достаточным при соответствующей центрировке фильтра по отношению к цели. Положение центров объектов в пределах апертуры фильтра произвольно и неизвестно заранее. Однако, введение этого третьего, входящего в оптимальный фильтр, фазосдвигающего звена, не столь необходимо. Функции подобного звена выполняются площадкой фотоприёмного устройства, усредняющей сигнал в пределах пикселя, осуществляющего одновременно функции согласующего звена. Поэтому выходные сигналы, зависящие от центрировки, подвергаются тем самым осреднению по этому параметру, что приводит к некоторым неизбежным потерям, то есть к квазиоптимальности.
Возвращаясь к наиболее важному в данном случае помехоподавляющему звену, стоит отметить, что помехоподавляющие звенья, противодействующие КВНФ и однородному фону, должны быть разными. КВНФ характеризуются высоким значением градиента - первой, направленной поперёк перепада, дискретной производной. Полезный сигнал от цели характерен второй, но ненаправленной (или иначе всенаправленной) производной. Необходимость специализировать оптимизированные алгоритмы селекции по видам помех «выводит» на систему дискриминации и полного подавления КВНФ. В
ней указанные задачи различения искомых объектов от мешающих с подавлением последних чётко разделяются.
Суть алгоритмов топологической (морфологической) селекции заключается, таким образом, в сравнении разнонаправленных градиентов яркостного рельефа фона для определения ориентации максимальных градиентов для выделения КВНФ и в выявлении точек перегиба (крутизны поверхности рельефа) для локализации точечных целей. Это делается по всем доступным для используемой апертуры фильтра направлениям при компарации дискретных направленных производных друг с другом путём выстраивания их в ранговый ряд и нахождения наибольших и наименьших значений. Ранговые алгоритмы, как говорит теория [6], являются одним из самых типичных и эффективных видов широкого класса нелинейных фильтров.
Далее, для ослабления влияния шумов, возрастающих при операции дифференцирования, а также для снижения чувствительности алгоритмов к разбросу других сопутствующих мешающих факторов (то есть повышению робастности) выгодно от оценок абсолютных величин перейти к относительным путём деления наименьших значений конечных разностей рангового ряда на наибольшие их значения. Робастность по той же теории [6] является важнейшим свойством оптимизированных нелинейных алгоритмов.
При синтезе согласующего звена наличие аппаратной функции оптико-механического блока ОЭП, «размывающей» точечный характер цели в её изображении, учитывается в величине дискретов конечных разностей, непосредственно связанных с размером пикселя.
Далее встаёт обычный в теории автоматического распознавания изображений вопрос о методе классификации: сравнение с эталоном класса, с проведением границ раздела по многим классам, на базе так называемых «формальных решающих правил» или использование сравнительных по каждой паре классов (задача дихотомии) методов - так называемых «методов относительной дискриминации» [10]. Последний метод является более надёжным, как это свойственно всем относительным методам. В этом случае граница между данной парой классов в задаче автоматического распознавания лишь двух классов (так называемый «порог дихотомии») определяется нахождением глобального минимума совместного закона распределения обоих классов, что значительно проще построения формальных решающих правил в пространстве многих переменных.
Поскольку подлинные законы распределения случайных параметров сигналов помехи и цели известны, в основном по предельным их значениям, то эти законы распределения могут быть обоснованно приняты равномерными с центрировкой на средних по всему диапазону значениях соответственно перепадов и крутизн яркостного рельефа.
Что касается координатных параметров децентрировки и углов поворота вытянутых неоднородностей фона по отношению к осям пространственного фильтра, то здесь также имеются все основания принять их законы распределения равномерными, так как
факторы, которые могли бы внести неравномерность при указанной постановке вопроса, отсутствуют. Тогда при анализе результатов относительное число превышений выбранного порога дискриминации соответствует вероятности ложной тревоги по помехам, а число непревышений - вероятности пропуска по цели.
Помимо этих вероятностей, которые, являются условными (то есть полученными при условии наличия объектов данного вида в данной точке поля зрения ОЭП), желательно иметь данные по априорным вероятностям присутствия цели, КВНФ и однородного фона в поле зрения. Тогда, умножая их на полученные условные вероятности, отнесённые к каждому пикселю, можно, суммируя соответствующие их произведения по всем пикселям кадра в соответствии с теорией вероятности (по известной формуле Байеса [11]), получить безусловные конечные апостериорные вероятности по данному кадру, важные для потребителя.
В части расположения в кадре, интервалы корреляции дают представление о пространственной плотности кромок на участках разрывной облачности. А доля этих участков на небосводе физически определяется бальностью облачности (в десятках процентов).
3. Полученные результаты
3.1. Формирование апертуры фильтра-дискриминатора
Апертуру фильтра-дискриминатора можно определить несколькими путями. Во-первых, можно, опираясь на исходную общность нелинейной и линейной фильтрации, синтезировать сначала структуру оптимального линейного фильтра, как ориентир для синтеза аналогичного нелинейного. Пространственно-частотную характеристику оптимального линейного фильтра Винера [12], трансформированной к эквивалентным пространственным преобразованиям поля яркости, можно определить из следующей формулы, вытекающей из рассмотренной выше структуры оптимального линейного фильтра:
, ч Я [т ,тА , ч
Н [т т )=Г („ г \ Н фс [т т ), (31)
[тх ,ту )
где Нц(юх,юу) - пространственно-частотная характеристика согласующего (с полезным сигналом) звена. В свою очередь функцию Оф(юх,юу), именуемую пространственным спектром дисперсий, можно представить следующей формулой, использующей сепарабельные переменные:
сф [т ,у ) = С [т р [ту ), (32)
\ 2аф Хк
где С[Юх) = —-, Юх и юу - пространственные частоты по ортогональным осям
тх Х2 +1
координат, хк - интервал корреляции по соответствующей оси координат, Оф -среднеквадратическое отклонение фоновой помехи. Выражение по другой ортогональной
оси аналогично. При параметрическом подходе к фильтрации, как уже отмечалось, здесь может фигурировать квадрат модуля спектра комплексных амплитуд регулярного поля яркости фона, в данном случае тоже в сепарабельном по ортогональным осям координат виде.
Помехоподавляющее звено пространственного фильтра Винера должно иметь пространственно-частотную характеристику, которая соответствует двумерному пространственному дифференциатору второго порядка. В дискретном виде при пространственном описании ему эквивалентна всенаправленная (с учётом попиксельной дискретизации) и нормированная по квадрату дискрета конечная разность того же порядка. Она образуется вычитанием из конечной разности первого порядка аналогичных операторов, сдвинутых на пиксель по всем четырем направлениям. В результате формируется 4-х связная апертура дискретного Лапласиана. Если пойти дальше и расширить окрестность дискретного пространственного дифференцирования, то получается более широкая апертуру. Указанные операции иллюстрируются рис. 3.1. В результате получается 13-ти ячеечная апертура дискретного пространственного фильтра.
Рис. 3.1. Процесс формирования расширенной апертуры фильтра
И, наконец, наиболее строгий способ синтеза вытекает из развитой в [6] теории оптимальной нелинейной фильтрации, построенной при Пуассоновском законе распределения на базе использования математического аппарата диффузных уравнений и так называемых «стохастических интегралов». Полученное в указанной работе весьма сложным путём решение даёт примерно такую же форму апертуры. Её коррективы под КВНФ в текущей задаче, не изменив общую форму окна фильтра, касаются попиксельных его весов. Некоторые модификации 16-ти связного типа могут быть получены при дополнительном использовании так называемых «косых операторов». Они позволяют отразить градиенты и крутизны не только в диагональных (биссектрисных), а также в
промежуточных (с дискретом примерно в 26,56° по углу поворота) направлениях, что выливается в 17-ти ячеечную апертуру. Она лучше всего подходит для селекции вытянутых в самых различных направлениях КВНФ, обеспечивая достаточно малый дискрет угла их ориентации при оценке анизотропии (отступлений от центральной симметрии), но вычислительно более затратна.
С учётом вышесказанного, для осуществления операций дискриминации формы объекта предусматривается три вида апертур (рис. 3.2).
\ М /
\ /
/ \ / \
4-х связная 8-ми связная 16-ти связная
Рис. 3.2. Используемые виды апертур фильтра-дискриминатора
Стоит отметить, что 8-ми связная и 16-ти связная апертуры значительно предпочтительней по сравнению с более употребительной 4-х связной апертурой по своим различительным возможностям из-за наличия дополнительных радиальных направлений, которые при необходимости расширения апертуры фильтра уменьшают дискрет фазового угла векторов градиентов введением отсчетов с пикселей 1 = 9...16. При этом шаг отсчётов также соответственно вырастает. Вырастают и вычислительные затраты (примерно в 2 раза).
Дальнейшие оценки будут производиться с 8-ми связной апертурой, как со средним по балансу эффективности и сложности вариантом.
3.2. Выработка признаков селекции объектов по размеру и форме
При построении модели изображения цели принимается, что линейная и стационарная оптико-электронная система состоит из двух последовательных звеньев
[13]:
1) Оптическая система (объектив) с функцией рассеяния, учитывающей дифракцию и геометрические аберрации, аппроксимируемой центрально-симметричной гауссоидой и играющей роль её нормированной весовой функции.
2) Площадка матричного фотоприёмного устройства, размещаемая в фокальной плоскости объектива, с нормированной весовой функцией в виде параллелепипеда.
Аппаратная (результирующая) весовая функция оптико-механического блока ОЭП определяется из выражения операции двумерной свёртки:
Кп (*, y) = К (*, y) ® К (*, у) =
х х
= | | К (u, v)K (x - u, y - v)dudv.
—х —х
На рис. 3.3 приведён вид функции han(x,y) при значениях ап = 1, го = 0,5.
у
Рис. 3.3. Вид функции Ьап(х,у)
Основным объектом селекции по форме (топологии), как уже указывалось ранее, являются кромки - резкие двумерные перепады яркости (математическая модель -«ступень»). Указанная неоднородность фона описывается функцией Гст(х,у). Функция £;т(х,у) представляет собой «ступень» высотой Д^т со спадом по гауссоиде. В физическом смысле значение свёртки весовой функции системы с функцией-«ступенью» представляет собой энергию излучения от данного источника, попадающую на элемент матрицы приёмника. Иначе говоря, функция свёртки характеризует зависимость сигнала с данного пикселя от сдвига «ступени» относительно центра этого пикселя. Пример трансформации функции-«ступени» на выходе оптико-механического блока ОЭП представлен на рис. 3.4.
У
Рис. 3.4. Пример трансформации функции-«ступени»
Как уже указывалось, при равномерном распределении параметров помехи и цели выбор порогов дискриминации и оценка вероятностей пропусков цели и ложных тревог особенно просты и сводятся к подсчёту вариантов, превышающих и не превышающих порог. При этом, так как варианты образуются путём независимого изменения каждого параметра, то есть сочетанием каждого значения одного из параметров с каждым значением другого, то общее число вариантов оказывается довольно значительным. И те, и другие нормируются по общему количеству вариантов в задаче дихотомии.
Пороги дискриминации выбираются, как упоминалось, методом ранжирования и поиска экстремально низких значений (минимума-миниморума) по паре классов «цель -ступень». Сложность задачи выявления КВНФ обусловлена тем, что «ступень» значительно более близка к точечному источнику, которому она должна быть альтернативна, чем к заурядной помехе в виде однородного фона (постоянной составляющей поля яркости). Отличия от точечного источника могут заключаться только в разнице градиентов по различным направлениям, которые для точки изотропны (центрально симметричны), а для протяжённых источников (помех) явно анизотропны, то есть малы вдоль и велики поперёк контуров неоднородностей.
Для выявления неоднородностей необходимо использовать конечные разности первого и второго порядка по различным направлениям. Этих направлений в минимальном количестве может быть, как следует из предыдущего, 4, 8 или 16.
Указанные выше конечные разности вычисляются по следующим формулам:
где и - значение яркости 1-го пикселя апертуры фильтра-дискриминатора.
Из того факта, что «ступень» может быть расположена под разными углами по отношению к контуру апертуры (например, вдоль, поперёк или под некоторым углом), вытекает логика выбора экстремальных направлений (наименьших и наибольших градиентов) с последующим определением коэффициентов анизотропии первого и второго порядка, позволяющих оценить ориентацию «ступени» относительно апертуры фильтра-дискриминатора:
А = Р - и\/(^), г = 1...4;
(3.4)
А? = Ро -и\/(ап45), г = 9...16;
А = |2Ро - Р - Р1+2\/(а\), г = 1,2; А1! = |2Ро - р - Р1+2\/(2а]), г = 5,6;
(3.5)
А? = |2Ро - р - Р1+А\/(5аП), г = 9...12,
(3.6)
(А1) = шах(Л;};
\ ' шах г
шах
(А77) . = шin{Af};
V ' шт г
(А11) = шах{А;7};
\ ' шах г
шт
шах
(3.7)
(3.8)
шах
Для корректного определения границ классов с последующим построением областей селекции необходимо провести обозначенную выше обработку на математических моделях цели и помехи («ступени»). При моделировании необходимо проварьировать как можно больше параметров математических моделей, «покрывая» тем самым наибольшее количество возможных вариантов формы помехового сигнала в реальных фоновых условиях.
Для модели помехи («ступени») достаточно варьировать следующие параметры: угол ориентации относительно апертуры фильтра (в пределах неповторяющихся значений от 0° до 45° с шагом в 3°), ширина спада (от 0 до 2-х пикселей с шагом 0,5 пикселя) и смещение центра объекта по обеим осям координат относительно центра пикселя (от 0 до 0,5 пикселя с шагом 0,1 пикселя). Для модели цели варьируется только смещение центра объекта по обеим осям координат относительно центра пикселя (от 0 до 0,5 пикселя с шагом 0,1 пикселя).
По результатам обработки, образованных таким образом 2880 вариантов модели «ступени», были получены следующие значения операций обработки изображений:
- (А1)ш,п: 0...0,2091;
- (А!)шах: 0,3152...0,7455;
- К 0...0,4398;
- (Ап)шт: 0...0,3321;
- (Ап)шах: 0,048...0,7858;
- Кп: 0...0,9621.
Аналогичным образом были получены следующие результаты по 36 вариантам модели цели:
- (А!)ш,п: 0...0,3781;
- (А!)шах: 0,1767...0,5026;
- К 0...0,7609;
- (Ап)шт: 0,0888...0,5346;
- (Ап)шах: 0,1767...0,9936;
- Кп: 0,5026...0,5892.
Стоит отметить, что смещение центра модели цели относительно центра пикселя более чем на 0,3 пикселя приводит к тому, что значительная часть энергии пятна перетекает на соседние пиксели, и идентификация цели по топологическим признакам на периферии пикселя оказывается более затруднительной.
По полученным по обеим моделям результатам можно отметить, что кардинальные отличия цели от КВНФ воплощаются, в основном, в параметре асимметрии. При этом коэффициент асимметрии первого порядка характеризует градиенты помехи в поперечном, продольном и промежуточных направлениях. Коэффициент асимметрии второго порядка характеризует крутизну яркостного рельефа цели, то есть показывает, насколько модель изображения цели центрально симметрична по крутизне относительно текущего пикселя. Разделение по коэффициенту анизотропии отражается на графиках областей селекции наклонными линиями, исходящими из начала координат (см. ниже рис. 3.7). Они-то при соответствующем выборе наклона и являются порогом в решении задачи дихотомии. Этот порог, в свою очередь, является параметром совместного закона распределения соответствующих объектов, определяемым как глобальный минимум плотности их совместного распределения.
Другой параметр отличия - максимальное значение первой производной -разграничивает в равной мере, как цели, так и КВНФ от однородных участков фона с низкими значениями перепадов и крутизн яркостного рельефа.
Совместный закон распределения при решении задачи дихотомии «цель - ступень» в данном случае на одном графике изобразить проблематично ввиду огромной разницы в количестве вариантов модификаций моделей (36 у цели против 2880 у «ступени»). В связи с этим разместим оба распределения для соответствующих порядков анизотропии рядом для определения глобальных минимумов, служащих в дальнейшем порогами (рис. 3.5).
Значения коэффициента анизотропии первого порядка Значения коэффициента анизотропии первого порядка
а) б)
Значения коэффициента анизотропии второго порядка Значения коэффициента анизотропии второго порядка
в) г)
Рис. 3.5. Гистограммы плотности распределений значений коэффициентов анизотропии первого и второго порядков: а), в) - по модели «ступени»; б), г) - по модели цели
Проведённые исследования показали, что во всех случаях практически можно ограничиться лишь двумя параметрами анизотропии, которые с достаточно высокой степенью достоверности характеризуют разделение альтернативных видов целеподобных и помеховых объектов.
Таким образом, на первом этапе проводится отсеивание «ступеней» и целей от однородного фона по максимальному значению первой производной. Это значение, на основе полученных на моделях данных, принимается равным 0,2, то есть (А1)Шах = 0,2.
На втором этапе по степени анизотропии первого порядка разделяются «ступени» и «потенциальные» цели. Исходя из совместной плотности распределения, устанавливается порог: К1 = 0,4. При этом цель позиционируется пока как «потенциальная» из-за того, что она может отвечать критерию величины градиента, но не быть симметричной по всем угловым направлениям.
Для уточнения правильной идентификации цели вводится третий этап в виде дополнительного разделения целей и «ступеней» по анизотропии второго порядка. Высокие значения коэффициентов анизотропии второго порядка в распределении «ступеней» можно объяснить тем, что модель «ступени» в худшем конкретном варианте трансформируется в однородный фон. В это же время высокие значения (по отношению к «1») коэффициентов анизотропии второго порядка в распределении целей, наоборот, указывают на достаточную «идеализированность» модели (её почти строгую осевую симметрию, несмотря на квадратную форму чувствительной площадки фотоприёмного устройства). Подобным же образом устанавливается по этому параметру порог: Кц = 0,5. При попадании значения коэффициента анизотропии второго порядка рассматриваемого пикселя на подпороговый уровень, объект считается «ступенью».
Если условие дискриминации выполняется, то с выходов дискриминаторов выдается решение о распознанном виде объектов, и алгоритм переходит к рассмотрению
следующего пикселя. Если же условие не выполняется, то дискриминатор выдает альтернативный ответ.
Соответствующая схема селекции поясняется на рис. 3.6, а порождаемые ею области селекции - на рис. 3.7.
Рис. 3.6. Схема внутрикадровой селекции объектов
Рис. 3.7. Области селекции
Стоит отметить, что пороговое значение второй максимальной производной, указанное на графиках областей селекции, в алгоритме селекции в силу её избыточности не задействуется.
3.3. Оценка результатов селекции на полунатурном кадре и сопоставление их с результатами, полученными на математических моделях
Неотъемлемой составляющей проводимых исследований является сопоставление результатов, полученных при полунатурном моделировании и математических моделях. Ранее были проведены исследования математических моделей цели и КВНФ и получены зависимости порогов селекции от наборов параметров моделей. При данном полунатурном моделировании проводятся схожие исследования применительно к полунатурным ложным «целям», «ступеням» и однородному фону с использованием выработанных ранее данных по порогам.
Итоги работы алгоритма селекции на полунатурном кадре, изображённые на рис. 3.8, показывают объективно положительные результаты. Во-первых, выделенные «ступени» чётко повторяют на исходном видеокадре границы кромок облаков, границы раздела «земля - вода» и другие границы компонент макроструктуры земного покрова. Во-вторых, выделенные «точки» практически идеально соответствуют заложенным требованиям, не завися при этом от интенсивностей их сигнала.
а) Видеокадр со сложным фоном
б) Результат селекции «ступеней» на однородном фоне (фон выделен черным цветом) Рис. 3.8. Оценка результатов селекции на видеокадре со сложным фоном (полунатурное моделирование)
Кроме того, была также произведена ручная контрольная выборка приблизительно равномерно расположенных по кадру 100 пикселей отдельно по однородному фону, «ступеням» и «точкам», которые могут быть восприняты как псевдоцели.
Зная количество идентифицированных пикселей каждого класса, можно определить все вероятности (правильного обнаружения, правильного необнаружения, пропуска цели, ложной тревоги), выраженные в относительных количествах пикселей.
Условная вероятность правильного обнаружения:
^апост
Р. = —-, (3.9)
обн лтапр ' 4 '
ц
где Кцапост - апостериорная вероятность обнаружения цели, получаемая в ходе обработки соответствующим алгоритмом; Кцапр - априорная вероятность обнаружения цели, которая определяется количеством выставленных вручную контрольных пикселей.
Условная вероятность пропуска цели:
Р = 1 - Рл . (310)
пр обн 4 '
Условная вероятность правильного необнаружения:
лт апост
р = -ст--(3 ,,)
нобн лгапр ' \ ■ )
ст
где Кстапост - апостериорная вероятность обнаружения «ступени», получаемая в ходе обработки соответствующим алгоритмом; Кстапр - априорная вероятность обнаружения «ступени», которая определяется количеством выставленных вручную контрольных пикселей.
Условная вероятность ложной тревоги:
лт нобн'
(3.12)
Полученные с учётом вышеизложенного указанные условные вероятности отвечают вполне приемлемым значениям: Робн = 0,98, Рпр = 0,02, Рнобн = 0,97, Рлт = 0,03.
Следовательно, эффективность работы нелинейных алгоритмов при внутрикадровой обработке показывает достаточно высокую их устойчивость от помех при селекции целей, и тем самым, высокую помехозащищённость системы в критических фоновых условиях.
3.4. Сравнение эффективности квазиоптимальной линейной фильтрации и
нелинейной селекции
Для определения эффективности работы квазиоптимального линейного фильтра проводилась обработка на математических моделях цели и помехи, аналогичная той, что была проведена с использованием нелинейной селекции. Главным критерием является повышение отношения «сигнал/помеха».
Результаты моделирования показывают, что в 99,9% случаев степень подавления помехового сигнала не превышает одного порядка, а в 0,1% случаев - двух порядков. Среднее значение подавления по всем реализациям - 2,5. Исходя из этого, в среднем с помощью квазиоптимальной линейной фильтрации можно повысить отношение «сигнал/помеха» примерно в 8 раз.
Для подтверждения результатов математического моделирования было также проведено аналогичное полунатурное моделирование на видеокадре со сложным фоном (см. выше рис. 3.8). При этом степень подавления «ступеней» рассчитывалась как отношение интенсивностей соответствующих сигналов до и после обработки линейным квазиоптимальным фильтром.
Полученные результаты говорят о том, что в 99,82% случаев степень подавления помехового сигнала не превышает одного порядка, а в 0,18% случаев - двух порядков. Среднее же значение степени подавления сигнала «ступени» по кадру равно 2,95. При этом в среднем по кадру отношение «сигнал/помеха» повышается примерно в 12 раз. Стоит отметить, что после обработки линейным квазиоптимальным фильтром неоднородные участки фона остаются крайне «пёстрыми» (рис. 3.9).
Рис. 3.9. Видеокадр со сложным фоном, обработанный квазиоптимальным линейным фильтром
Таким образом, используя квазиоптимальную линейную фильтрацию можно подавить КВНФ в очень ограниченное число раз (степень подавления во всех случаях не превышает одного порядка). Использование же нелинейной обработки позволяет селектировать и подавлять КВНФ полностью, независимо от интенсивности.
Заключение
По полученным результатам можно сделать ряд принципиальных выводов и обобщений:
1. Заложенные принципы нелинейной топологической селекции получили определённое подтверждение по выявлению КВНФ - кромок (описываемых моделью «ступени»), участков однородной структуры, а также точечных целей проведением аналитических оценок по математическим моделям и при полунатурном моделировании по тестовому образчику фона с явно выраженными пространственными неоднородностями.
2. Дискриминация однородного фона легко производится по первой максимальной дискретной производной. Дискриминация КВНФ может производиться на основе решения задачи дихотомии по паре противопоставляемых друг другу объектов «ступень - точка» с выбором порога по глобальному минимуму их совместного закона распределения и классификацией по методу «ближайшего соседа», наиболее надёжным способом сравнения.
3. Сопоставление оценок работоспособности дискриминаторов КВНФ по математическим моделям с результатами полунатурного моделирования показало, что оценки по моделям не противоречат более натуральному представлению сложного по
яркостному рельефу фона. Поскольку модели отличаются простотой и наглядностью, их использование в предварительном анализе вполне оправдано.
4. Произведённая оценка возможностей получения данных по вероятностям правильной дискриминации однородного фона, «ступеней» и «точек» по всему кадру с использованием выбранных величин порогов также свидетельствует о реальных предпосылках достижения относительно низких значений вероятностей пропусков цели и ложных тревог на сложном фоне: Рпр = 0,02, Рлт = 0,03.
5. Проведённое исследование характеризует эффект использования элементов искусственного зрительного интеллекта при распознавании целей и КВНФ по морфологическому признаку с последующим полным нелинейным подавлением мешающих сигналов, независимо от их интенсивности, что позволяет обеспечить требуемую высокую помехозащищённость ОЭП. Подобный эффект никоим образом не достигается при использовании традиционных методов квазиоптимальной пространственной фильтрации.
Список литературы
1. Федосеев В.И. Приём пространственно-временных сигналов в оптико-электронных системах (Пуассоновская модель). М.: Университетская книга, 2011. 232 с.
2. Климова А.В., Крыжановский В.В., Лёвшин В.Л., Муратов К.В. О предельных возможностях линейной пространственной фильтрации при подавлении помех пространственно-неоднородного фона в теплопеленгаторах различных классов // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2013. № 11. С. 159174. DOI: 10.7463/1113.0656657
3. Ким Д.П. Теория автоматического управления. В 2 т. Т. 2. Многомерные, нелинейные, оптимальные и адаптивные системы: учеб. пособие. М.: ФИЗМАТЛИТ, 2004. 464 с.
4. Silverman J., Mooney J.M., Caefer C.E. Tracking point targets in cloud clutter // Proc. of SPIE. 1997. Vol. 3061. P. 496-507. DOI: http://dx.doi.org/10.1117/12.280369
5. Stern M., Driscoll W. New algorithm for detection and classification of targets // Proc. of SPIE. 1981. Vol. 0292. P. 249-255. DOI: http://dx.doi.org/10.1117/12.932838
6. Волосюк В.К., Кравченко В.Ф., Пономарёв В.И. Математические методы моделирования физических процессов в задачах дистанционного зондирования Земли // Зарубежная радиоэлектроника. Успехи современной радиоэлектроники. 2000. № 12. С.3-74.
7. Гришин Ю.П., Ипатов В.П., Казаринов Ю.М., Коломенский Ю.А., Ульяницкий Ю.Д. Радиотехнические системы: учеб. для вузов по спец. «Радиотехника» / под ред. Ю.М. Казаринова. М.: Высшая школа, 1990. 496 с.
8. Крыжановский В.В., Климова А.В., Лёвшин В.Л., Муратов К.В. Способ поиска и обнаружения малоразмерных слабоизлучающих подвижных источников излучения на
пространственно-неоднородном фоне оптико-электронными приборами: пат. 2536082 Российская Федерация. 2014. Бюл. № 35. 20 с. 9. Вентцель Е.С. Исследование операций. М.: Высшая школа, 2007. 208 с.
10. Мерков А.Б. Распознавание образов. Введение в методы статистического обучения. М.: Едиториал УРСС, 2011. 256 с.
11. Гмурман В.Е. Теория вероятностей и математическая статистика: учеб. пособие для вузов. 9-е изд., стер. М.: Высшая школа, 2003. 479 с.
12. Левин Б.Р. Теоретические основы статистической радиотехники. 3-е изд., перераб. и доп. М.: Радио и связь, 1989. 656 с.
13. Гайденков А.В., Крыжановский В.В. Алгоритмы обнаружения движущихся малоразмерных целей в сложной фоновой обстановке // Радиотехника. 2012. № 10. С. 137-146.
Science and Education of the Bauman MSTU, 2015, no. 08, pp. 116-139.
DOI: 10.7463/0815.0789709
Received: Revised:
12.06.2015 01.07.2015
Science^Education
of the Bauman MSTU
I SS N 1994-0408 © Bauman Moscow State Technical Unversity
Engineering Synthesis of Nonlinear Spatial Selection with Artificial Intelligence Elements to Suppress Critical Interference of Background in Aviation and Space-Based Opto-Electronic Devices
V.L. Levshin12, K.V. Muratov1
bauman Moscow State Technical University, Moscow, Russia 2JSC Scientific Production Enterprise "Geophysics-Space",
Moscow, Russia
Keywords: opto-electronic device, critical interference of background, nonlinear spatial selection, artificial visual intelligence, filter-discriminator, topological characteristics, parametrically-stochastic approach, probabilistic recognition characteristics
The previous authors' works have shown that the system of quasi-optimal linear spatial filtering, due to the restriction of this class of filters, related to the superposition principle, has very limited capacity to suppress the most critical interference spatially inhomogeneous background. Such partial suppression does not meet extreme approach requirements for providing high probability characteristics to detect small targets in the most difficult background conditions.
In this regard, there is a conclusion that it is necessary to find a different approach, in which the result of the system operation in complex background does not depend on the level of the background noise at the input. This article performs an engineering synthesis of the system with the artificial visual intelligence elements, which recognizes a class of the small-sized radiating objects with the suppression of the most critical interference through nonlinear topological selection.
Consideration of this problem begins with the formation of the filter-discriminator aperture, which is a basis for this theory, «echoing» with the theory of optimal nonlinear filtering spatial Poisson processes. Thus, formation of the optimized nonlinear filter structure is based on the optimal linear filter (Wiener filter) structure. As a result, there are three versions of filter apertures (4-, 8- and 16-connected ones), with one of which later providing operations of the object shape discrimination. The focus of the article is, mainly, on the 8-connected aperture, as the average in balance of efficiency and complexity option.
The article pays considerable attention to development of signs and algorithms to select the objects by size and shape. It shows that selection on a uniform background is possible by the maximum value of the first derivative and to separate the most critical form of Markov's field
inhomogeneities and background brightness, as the fragments of component boundaries of macrostructure background - edges («steps») and targets, you must use the anisotropy coefficients of the first and second order. The result of using the system, most effectively separating of signs, was the formation of the so-called «areas of selection».
Mathematical models of the target and interference of parametrically-stochastic approach, as well as simulation on a semi-natural test frame with a fairly complex background «scene», proved the fundamental capability of the synthesized circuits to suppress radically the sources of interference signals, which are tens and even hundreds times greater than the signals from targets at the input. Thus, unlike the method based on optimal linear filtering, this approach allows the nonlinear «blockers» to suppress completely interference previously recognized by topological discriminators.
Control sampling of points of the semi-natural frame enabled us to estimate conditional probabilities of a true solution of the target detection problem. The estimate has shown that the obtained probability of missing the target and false alarm are quite acceptable the values that make up a few percent.
Obtained results show the incomparable advantages in complex background situation of presented non-linear method as compared to its traditional linear analogues.
References
1. Fedoseev V.I. Priem prostranstvenno-vremennykh signalov v optiko-elektronnykh sistemakh
(Puassonovskaya model') [Receiving spatial-temporal signal in the optical-electronic systems
(Poisson model)]. Moscow, Universitetskaya kniga Publ., 2011. 232 p. (in Russian).
2. Klimova A.V., Kryjanovskii V.V., Levshin V.L., Muratov K.V. Frontier of linear spatial filtration during interference elimination of a spatially-heterogeneous background in various classes of thermal direction finders. Nauka i obrazovanie MGTU im. N.E. Baumana = Science and Education of the Bauman MSTU, 2013, no. 11, pp. 159-174. DOI: 10.7463/1113.0656657 (in Russian).
3. Kim D.P. Teoriya avtomaticheskogo upravleniya. V 2 t. T. 2. Mnogomernye, nelineinye, optimal'nye i adaptivnye sistemy [The theory of automatic control. In 2 vols. Vol. 2. Multidimensional, nonlinear, optimal and adaptive systems]. Moscow, Fizmatlit Publ., 2004. 464 p. (in Russian).
4. Silverman J., Mooney J.M., Caefer C.E. Tracking point targets in cloud clutter. Proc. of SPIE, 1997, vol. 3061, pp. 496-507. DOI: http://dx.doi.org/10.1117/12.280369
5. Stern M., Driscoll W. New algorithm for detection and classification of targets. Proc. of SPIE, 1981, vol. 0292, pp. 249-255. DOI: http://dx.doi.org/10.1117/12.932838
6. Volosyuk V.K., Kravchenko V.F., Ponomarev V.I. Mathematical methods of modeling physical processes in problems of remote sensing of the Earth. Zarubezhnaya radioelektronika. Uspekhi sovremennoi radioelektroniki = Achievements of Modern Radioelectronics, 2000, no. 12, pp. 3-74. (in Russian).
7. Grishin Yu.P., Ipatov V.P., Kazarinov Yu.M., Kolomenskii Yu.A., Ul'yanitskii Yu.D. Radiotekhnicheskie sistemy [Radio systems]. Moscow, Vysshaya shkola Publ., 1990. 496 p. (in Russian).
8. Kryzhanovskii V.V., Klimova A.V., Levshin V.L., Muratov K.V. Sposob poiska i obnaruzheniya malorazmernykh slaboizluchayushchikh podvizhnykh istochnikov izlucheniya na prostranstvenno-neodnorodnom fone optiko-elektronnymi priborami [Method of search and discovery small low-radiating moving sources in spatially inhomogeneous background by optoelectronic devices]. Patent RF, no. 2536082, 2014. (in Russian).
9. Venttsel' E.S. Issledovanie operatsii [Operations research]. Moscow, Vysshaya shkola Publ., 2007. 208 p. (in Russian).
10. Merkov A.B. Raspoznavanie obrazov. Vvedenie v metody statisticheskogo obucheniya [Pattern recognition. Introduction to methods of statistical learning]. Moscow, Editorial URSS Publ., 2011. 256 p. (in Russian).
11. Gmurman V.E. Teoriya veroyatnostei i matematicheskaya statistika [Probability theory and mathematical statistics]. Moscow, Vysshaya shkola Publ., 2003. 479 p. (in Russian).
12. Levin B.R. Teoreticheskie osnovy statisticheskoi radiotekhniki [Theoretical foundations of statistical radio engineering]. Moscow, Radio i svyaz' Publ., 1989. 656 p. (in Russian).
13. Gaidenkov A.V., Kryzhanovskii V.V. Algorithm of tracking down of moving small-sized objectives in complex background conditions. Radiotekhnika = Radioengineering, 2012, no. 10, pp. 137-146. (in Russian).