ДИФРАКЦИОННАЯ ОПТИКА, ОПТИЧЕСКИЕ ТЕХНОЛОГИИ
Проблемы формирования систем, обеспечивающих автоматическое распознавание объектов по дальностным портретам
Ф.Б. Баулин1, Е.В. Бурый1
1 Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет), Москва, Россия
Аннотация
В статье рассмотрены проблемы, которые возникают у разработчиков распознающих оптико-электронных систем, и апробированные методы их решения. Отмечены основные достижения в этой предметной области. На основании обобщения опыта синтеза лазерных локационных систем, обеспечивающих автоматическое распознавание объектов, сделан вывод о принципиальной возможности создания таких систем и общих правилах их синтеза.
Ключевые слова: дальностный портрет, обратное рассеяние, распознавание, лазер, фотоприёмник, локационная система.
Цитирование: Баулин, Ф.Б. Проблемы формирования систем, обеспечивающих автоматическое распознавание объектов по дальностным портретам / Ф.Б. Баулин, Е.В. Бурый // Компьютерная оптика. - 2019. - Т. 43, № 1. - С. 5-13. - DOI: 10.18287/2412-6179-2019-43-1-5-13.
Введение
Теоретические основы распознавания объектов по форме рассеянного ими импульса лазерного излучения начали активно исследоваться в 70-е годы прошедшего столетия. В связи с развитием в 90-е годы аппаратных средств регистрации широкополосных оптических сигналов и средств вычислительной техники начали исследоваться возможности аппаратной реализации таких систем [1 - 3]. Кроме того, значительные успехи были достигнуты в области создания новых для того времени классификаторов, основанных на использовании многослойных искусственных нейронных сетей
[4]. Стало очевидно, что для автоматического распознавания объекта получение его изображения в привычном понимании не является необходимым - распознавание объекта может быть осуществлено лазерной локационной системой (ЛЛС) на основе выделенной из зарегистрированного локационного сигнала совокупности информативных признаков.
Проявляемый к таким системам интерес объясняется как простотой технической реализации приёмного тракта, так и тем, что их энергетическая эффективность оказывается заметно выше, чем у активных систем, позволяющих получать изображения при отсутствии внешних источников излучения, когда распознавание объекта осуществляется по его изображению.
Результаты поиска методов и средств распознавания подвижных антропогенных объектов с помощью ЛЛС, в том числе экспериментальные, к настоящему времени представлены исследователями из следующих организаций:
- TNO Defence Security & Safety (Нидерланды) [5 - 7];
- Swedish Defence Research Agency (Швеция) [8, 9];
- MIT Lincoln Laboratory (США) [1, 10, 11];
- лаборатория лазерных информационных систем
(РФ) [2, 12, 13].
Первые образцы таких систем обеспечивали приемлемое качество распознавания объектов с линейными размерами, превышающими 80 м [1].
Отметим, что само понятие «качество распознавания» является обобщающим и требует отдельного обсуждения. Интуитивно понятно, что речь идёт не только о величине средней вероятности правильного распознавания объекта, но и о вероятности промахов при распознавании и реализуемой минимальной вероятности распознавания ракурсов каждого объекта.
По мере развития средств формирования лазерных импульсов малой длительности (единицы наносекунд и менее) и расширения эквивалентной полосы пропускания средств регистрации лазерного излучения появилась возможность создания ЛЛС, обеспечивающих автоматическое распознавание объектов меньших размеров - морских судов и летательных аппаратов (ЛА) с линейными размерами, не превышающими 10 м [5, 14, 15].
Обобщение опыта построения ЛЛС, обеспечивающих распознавание объектов по форме огибающих регистрируемых сигналов, с одной стороны, свидетельствует о принципиальной возможности их создания и эффективности функционирования. С другой стороны, этот анализ позволил выявить часто встречающиеся при формировании систем характерные проблемы и определить направления их решения.
1. Распознавание объектов в импульсной локации по дальностным портретам При облучении объекта лазерным импульсом интенсивность рассеянного излучения представляет собой функцию времени и зависит от формы поверхности объекта и характера рассеяния излучения этой поверхностью. Если импульс излучения представлен 5-функцией, то эту зависимость называют импульсной характеристикой рассеяния (ИХР) объекта.
ИХР зависит от наблюдаемого ракурса объекта. Ракурс удобно определять, задавая угол азимута а и угол места р для вектора v, коллинеарного линии визирования объекта в системе координат, в которой описана его поверхность (рис. 1). Этот вектор в дальнейшем
будем называть вектором наблюдения. Заметим, что ИХР инвариантна к повороту объекта вокруг вектора наблюдения, если распределение интенсивности излучения в сечении луча передатчика ЛЛС осесимметрично [2]. ИХР инвариантна по отношению к расстоянию до объекта, если распределение интенсивности в пределах поверхности объекта остается равномерным.
Принцип распознавания объектов по форме импульса рассеянного излучения основан на том, что объекты, которые имеют различные формы поверхностей, имеют различные ИХР [16].
Возможны два варианта постановки задачи распознавания объекта:
1. Распознавание объекта выполняется на основании анализа полученной ИХР при отсутствии априорной информации о его ракурсе. Хотя возможны совпадения ИХР, соответствующих каким-либо ракурсам двух различных объектов, такие ситуации маловероятны - как правило, регистрируемые ИХР различаются. 2
2. Распознавание объекта выполняется после того, как определён его ракурс. Наличие информации о ракурсе объекта позволяет учесть возможные совпадения ИХР разных объектов и существенно облегчить решение задачи их автоматического распознавания.
Распознавание объекта обычно выполняется по результатам анализа не ИХР, а сигнала на выходе фотоприёмного устройства локационной системы, традиционно называемого дальностным портретом (ДП) [2, 16, 17]. ДП представляет собой последовательную систему временных свёрток [2]:
U (t, а, В) =
(1)
= P (t) * G (t) * g (t, а, в) * G(t) * h (t),
где t - время; P (t) - огибающая зондирующего импульса (ЗИ) излучения; G (t) - функция импульсного отклика трассы распространения излучения (атмосферного канала); g(t, а, в) - ИХР объекта; h(t) - импульсная характеристика фотоприёмного устройства. Символом «*» обозначена операция временной свёртки.
Таким образом, при локации объекта форма ДП будет определяться ИХР объекта, формой огибающей ЗИ излучения [16], состоянием атмосферного канала
[18] и импульсной характеристикой фотоприёмного устройства [2].
Величина средней вероятности правильного распознавания объекта может снижаться в силу того, что его ИХР могут изменяться из-за возможных вариаций альбедо и индикатрис рассеяния излучения участков его поверхности [2, 17]. Кроме того, существенные флуктуации ДП возникают из-за формирования развитой спекл-структуры рассеянного излучения [1, 15]. Вместе с тем флуктуации ДП, вызываемые небольшими изменениями наблюдаемого ракурса объекта, при регистрации сигналов в оптическом диапазоне длин волн оказываются менее значимыми, чем флуктуации сигналов в радиодиапазоне [2, 5, 15].
При изменении наблюдаемого ракурса объекта его протяжённость в направлении линии визирования изменяется, что может приводить к изменению качества распознавания [1, 5]. В [1] предложено бороться со снижением качества распознавания комплексиро-ванием активной ЛЛС с системами автоматического распознавания ИК-изображений объектов, однако, как уже отмечалось, этот путь энергетически неэффективен. Альтернативой следует считать адаптацию алгоритма функционирования классификатора к изменениям условий наблюдения объекта (вариациям функций P(t) и G(t), параметры которых могут быть независимо оценены), также снижающим качество распознавания.
Устоявшаяся структурная схема ЛЛС, обеспечивающей распознавание объектов по ДП, обсуждаемая многими из перечисленных исследователей, представлена на рис. 2.
Рис. 2. Функциональная схема ЛЛС, обеспечивающей распознавание объектов
Импульсный лазер и оптическая система (ОС) передающего канала обеспечивают формирование ЗИ лазерного излучения с требуемыми характеристиками. ЗИ частично рассеивается поверхностью объекта в направлении приёмного канала ЛЛС. Фотоприёмное устройство (ФПУ) преобразует регистрируемое излучение в электрический сигнал, который преобразуется в двоичный код аналого-цифровым преобразователем. Обработка сигнала, представленного в цифровой форме,
выполняется функциональными блоками, реализованными в едином вычислительном модуле.
Заметим, что для корректного сравнения энергетических потенциалов ЛЛС двух различных типов -ЛЛС, осуществляющей распознавание объектов по результатам анализа ДП, и ЛЛС, в которой распознавание объектов проводится по их изображениям, необходимо получить оценки энергии импульсов излучения их передающих каналов, когда при одинаковых расстояниях до объекта обе системы позволяют обеспечить одинаковое качество его распознавания.
Сложность такого анализа, включающего определение свойств различных типов классификаторов, очевидна. Тем не менее, получение приближённой оценки в этом случае возможно. Для этого определим отношение сигнал/шум на выходах фотоприёмников обоих типов ЛЛС при максимальном удалении объекта от ЛЛС.
Будем считать, что регистрация ДП проводится одноэлементным фотоприёмником, имеющим квантовую эффективность п, для которого поток шумовых фотоэлектронов характеризуется средней плотностью XN. Тогда отношение сигнальных и шумовых фотоэлектронов на его выходе в отсутствие фонового излучения составит
>Rp
(П WS) / hv
ATRp ■ XN
где WS - интегральная интенсивность регистрируемого излучения; ATRp - интервал наблюдения, который должен соответствовать выбранной для регистрируемых сигналов полосе пропускания.
С другой стороны, в соответствии с критерием Джонсона [19] для успешного распознавания объекта по его изображению оно должно содержать не менее K = 7 ч 8 информационных пикселей. Предположив, что всё это изображение вписывается в область размером L2 = 4*4 пикселей, поле зрения оптической системы ЛЛС из-за возможных ошибок наведения составляет не менее N2 = 6*6 пикселей, будем считать, что установленный в соответствии с уровнем собственного шума одного фоточувствительного элемента матрицы порог обнаружения сигнала обеспечивает требуемую вероятность обнаружения сигнала в одном элементе разрешения. Предположим также, что один такой элемент имеет характеристики, близкие к характеристикам ранее рассмотренного точечного фотоприёмника, и для сравнения энергетической эффективности двух систем объединим сигналы всех ячеек фоточувствительного элемента матричного типа. В результате, считая потоки шумовых фотоэлектронов независимыми, получим
S|. _( K n-Ws/h'V'\hN -■(AT. -Х N )),
где ATIm - интервал наблюдения выбранного матричного фотоприёмника. Тогда
Sl. _ ATRp ■ ХN _ ATRp
~p ~ N2 -(AT. -Хn) _ AT. ■ N2 '
Обычно ATRp << ATIm, но для рассматриваемого примера можно положить, что ATRp = ATIm, соблюдая корректность сравнения. Тогда получаем, что SIm /SRp = 2,7Т0-2. Конечно, данный расчёт является весьма приближённым (величины XN реальных фотоприёмников - матричного и точечного - могут заметно отличаться), однако он подтверждает тезис о большей энергетической эффективности системы, регистрирующей ДП объекта, и подтверждает целесообразность реализации в активных ЛЛС с приёмником матричного типа минимально возможного числа элементов разрешения, обеспечивающих реализацию функции распознавания изображения объекта.
2. Средства формирования зондирующих импульсов
Для формирования высокоэнергетических ЗИ в системах, предназначенных для распознавания крупных объектов, например, судов, применяются мощные лазеры на основе CO2, формирующие излучение в длинноволновой части ИК-диапазона. Такой лазер и ОС передающего канала позволили реализовать ЛЛС, обеспечивающую локацию объекта на расстояниях в несколько десятков километров (автоматическое распознавание судов типа «фрегат» ЛЛС с С02-лазером было осуществлено на расстояниях до 100 км [1]). Импульсы, формируемые такими лазерами, имеют длительность около 30 нс, что затрудняет распознавание объектов небольших размеров, например, ЛА.
При решении задач распознавания небольших морских объектов нашли применение иттербий-эрбиевые лазеры [15], генерирующие импульсы на длине волны 1,55 мкм, и лазеры на алюмоиттриевом гранате, активированном ионами Nd3+ [5, 14], формирующие импульсы на длине волны 1,06 мкм. Энергия импульсов излучения лазеров, применённых для построения ЛЛС, находилась в пределах от десятка до сотни мДж (в стенде, описанном в [14], - 60 мДж, 5 нс, в аппаратуре
[15] - 15 мДж, 6 нс). Такие параметры импульсов лазерного излучения позволили обеспечить разрешение по дальности от 0,6 [14] до 0,7 м [15].
Таким образом, при построении ЛЛС с функцией распознавания объектов по ДП требует решения проблема обоснованного выбора длительности ЗИ и соответствующей ей полосы пропускания ФПУ. При этом следует учитывать, что тип лазера во многих случаях определяет длительность ЗИ, что обусловлено физикой происходящих в активной среде лазера генерационных процессов, а также длину волны излучения, которая должна соответствовать максимуму спектральной чувствительности ФПУ. Большинство авторов сходятся во мнении, что уменьшение длительности ЗИ позволяет добиваться более высокого разрешения по дальности [5, 14, 15] и должно улучшать качество распознавания, т.к. более высокое разрешение по дальности позволяет различать особенности ДП, формируемые при рассеивании ЗИ мелкими деталями поверхности объекта. Однако при уменьшении длительности ЗИ нужно увеличивать полосу пропускания ФПУ, что приводит к увеличению мощности регистрируемого шума. Кроме того, при посто-
янной энергии ЗИ лазерного излучения лучевая прочность оптических элементов обратно пропорциональна длительности ЗИ [20]. В связи с этим объяснимо стремление реализовать распознавание множества объектов, используя ЗИ с максимальной длительностью, одновременно реализуя специальные методы обработки локационных сигналов. Экспериментальные исследования показывают [2], что при длительности ЗИ 5...10 нс, а в ряде случаев - более 20 нс, удаётся обеспечить требуемое качество распознавания объектов протяжённостью несколько метров.
Очевидно, что допустимая максимальная длительность ЗИ зависит как от состава множества распознаваемых объектов, так и от предъявляемых требований к качеству распознавания этих объектов.
3. Средства регистрации рассеянного излучения
Опыт применения в ЛЛС с функцией распознавания объектов по ДП различных типов ФПУ показал, что главной проблемой их выбора является выполнение противоречивых требований - большого размера фоточувствительной площадки фотодетектора ФПУ (как правило, требуемый диаметр составляет 2 мм и даже более для обеспечения требуемого поля зрения приёмного канала ЛЛС при малом расстоянии до объекта) и малой длительности переходной характеристики фотодетектора. Один из путей решения этой проблемы - согласование поля зрения ОС приёмного канала и параметров пучка лазерного излучения, формируемого ОС передающего канала, что позволяет обеспечить лучшие энергетические характеристики системы при сохранении временного разрешения [1, 15]. В этом отношении перспективно применение в составе ЛЛС комплектов ОС, обеспечивающих формирование лазерных пучков с различной расходимостью. Комплект, обеспечивающий большую расходимость, следует использовать для обнаружения объекта и точного наведения на него оптической оси ЛЛС, а другой комплект - для регистрации ДП лоци-руемого объекта.
Нередко к фоточувствительному элементу предъявляются требования реализации функции слежения за пространственным положением лоцируемого объекта - так, в [1] регистрация излучения, рассеянного в дальнем ИК-диапазоне поверхностями крупного судна, осуществлялась матрицей фотодетекторов, содержащей 2*2 чувствительных элемента. Поле зрения каждого элемента составляло около 150 мкрад при апертуре ОС приёмного канала 0,15 м.
Значительное влияние на результаты распознавания объектов оказывает ширина полосы пропускания ФПУ. Так, в [5, 14, 15] для регистрации ДП объектов с линейными размерами от 5 до 15 м использовались ФПУ с шириной полосы пропускания от 200 до 300 МГц. В [15] для распознавания таких объектов использован ФПУ на основе ИК-фотодетектора с квантовыми ямами, имеющий полосу пропускания 300 МГц. Для распознавания объектов с меньшими линейными размерами ЛЛС должна обеспечивать раз-
решение по дальности не хуже, чем десятки сантиметров [15]. Полоса пропускания ФПУ, используемого в такой ЛЛС, должна составлять не менее 1 ГГц, что сложно выполнить при указанных требованиях к размерам фоточувствительной площадки фотодетектора.
Важно отметить, что в [15] предложено для решения задачи обнаружения объекта использовать ФПУ с уменьшенной до 10 МГц полосой пропускания его электронного тракта, что, по-видимому, приблизило полосу пропускания приёмного тракта к оптимальной и привело к увеличению отношения сигнал/шум на входе порогового устройства обнаружения сигнала. Полученный в [15] результат подтверждает ранее сделанный вывод о том, что при создании ЛЛС с функцией распознавания объектов по ДП нецелесообразно существенно уменьшать длительность ЗИ -её величина должна быть не менее 1... 5 нс и даже может достигать 10 нс. Полученные в [2] результаты, подтверждённые как авторами [14], так и авторами
[15], позволяют сделать вывод о том, что успешное распознавание по ДП удаётся осуществить, если ДП представлен не менее чем 10 отсчётами, причём существенное увеличение числа регистрируемых отсчётов ДП во многих случаях не приводит к заметному улучшению качества распознавания объектов.
Отдельного обсуждения требуют возможные флуктуации ДП. Они, как правило, обусловлены формированием спекл-структуры, возникающей в результате рассеяния когерентного лазерного излучения поверхностью объекта. В [1, 15] отмечено, что вызванные этим явлением флуктуации ДП существенно превышают флуктуации, вызванные фоновой засветкой объекта и тепловыми шумами в приёмном тракте ЛЛС. Для элиминирования таких флуктуаций эффективно некогерентное сложение реализаций сигналов, полученных несколькими фотодетекторами, расположенными в различных точках пространства, причём расстояния между ними должны превышать величину радиуса когерентности поля регистрируемого излучения.
Заметим, что в настоящее время отсутствуют апробированные простые модели флуктуаций, возникающих в результате формирования спекл-структуры поля рассеянного излучения. Во многих случаях достаточным можно считать применение модели аддитивного белого нормального шума с наперёд задаваемой величиной дисперсии, однако достижение предельных характеристик ЛЛС с функцией распознавания объектов по ДП требует применения более точных моделей -например основанных на принципах [21].
4. Предварительная обработка ДП
Предварительная обработка ДП основана на использовании априорной информации о лоцируемых объектах и параметрах ЗИ. Она позволяет обеспечить максимальное отношение сигнал/шум и сократить количество информации, передаваемой на вход классификатора. Функциональная схема блока предварительной обработки сигнала, реализованного в [1, 2, 15], представлена на рис. 3.
Рис. 3. Функциональная схема блока предварительной обработки сигнала
Для уменьшения влияния флуктуаций ДП, вызванных спекл-структурой поля рассеянного излучения и дифракцией ЗИ на неоднородностях среды распространения излучения, целесообразно выполнять усреднение нескольких реализаций сигнала.
Очевидно, что уменьшение дисперсии флуктуаций ДП при усреднении N независимых реализаций регистрируемого сигнала приведёт к увеличению отношения сигнал/шум в VN раз. При испытаниях ЛЛС, в которой усреднение реализаций сигнала не проводилось, вероятность правильного распознавания оказалась ниже [14], чем при испытаниях системы, обладающей схожими энергетическими характеристиками, в которой была реализована процедура усреднения реализаций [15]. Для обеспечения статистической независимости реализаций ДП при их усреднении минимальную величину периода следования ЗИ следует задавать так, чтобы он превышал интервал корреляции функции импульсного отклика трассы распространения излучения. В [15] отмечено, что корректное усреднение реализаций осложняется изменениями наблюдаемого ракурса и расстояния до объекта. Это обстоятельство приводит к формированию дополнительного требования, предъявляемого к минимальной величине периода формирования ЗИ: в течение этого интервала времени изменения ракурса объекта, обусловленные его маневрированием, должны быть малы.
При распознавании объекта по ДП нередко требуется обеспечить инвариант положения ДП относительно начала интервала наблюдения. Для этого нужно определять временной сдвиг зарегистрированной реализации ДП относительно начала интервала наблюдения. Поскольку априорная информация о типе регистрируемого сигнала отсутствует, необходимо установить общий для всех сигналов метод измерения временного сдвига, который должен обеспечить минимум ошибки измерения в изменяющихся условиях регистрации ДП.
Такой метод может быть основан на принципе построения временного дискриминатора, состоящего в определении интервала времени At, начало которого совпадает с началом интервала наблюдения, а окончание - с первым локальным (или главным - при малом отношении сигнал/шум) максимумом ДП [1].
В качестве точки окончания интервала времени At может быть использован вычисляемый центр масс зарегистрированного ДП или точка достижения максимума взаимной корреляционной функции между ре-
гистрируемым сигналом и всеми предварительно загруженными в базу образов ДП [5]. Если метод вычисления центра масс ДП оказывается эффективен при малом отношении сигнал/шум, то использование метода, основанного на вычислении корреляционной функции, требует значительных вычислительных затрат [22] и характеризуется слабой выраженностью максимума.
Следует отметить, что большинство экспериментальных исследований выполнено для ЛЛС, обеспечивающих распознавание морских судов [1, 5, 6, 8, 14, 24]. В них подробно описаны проблемы, возникающие при работе таких распознающих ЛЛС, которые в основном касаются условий наблюдения объектов и должны учитываться при формировании перспективных ЛЛС:
- при умеренном ветре и угле места Р менее 60° поверхность воды не регистрируется ЛЛС и не вызывает повышения вероятности ложных тревог [6, 8];
- ДП объектов будут флуктуировать из-за отражения излучения от взволнованной водной поверхности, которое наблюдается как до, так и после рассеяния излучения поверхностью объекта [24];
- при скоростях ветра более 10 м/с образование морской пены приводит к существенному изменению характера рассеяния ЗИ водной поверхностью и повышению вероятности ложных тревог [8];
- ДП объектов будут флуктуировать из-за изменений ракурса, связанных с качкой [8].
Очевидно, что такие проблемы отсутствуют при
эксплуатации ЛЛС, обеспечивающих локацию объектов, находящихся на значительном расстоянии от подстилающей поверхности - например, ЛА.
Попытки синтеза ЛЛС для распознавания наземных объектов [10, 23] свидетельствуют об актуальности решения проблемы элиминирования влияния излучения, отражённого от подстилающей поверхности, на решения, формируемые классификатором. Очевидным решением является формирование множества обучающих выборок, соответствующих ситуациям, когда объекты располагаются на подстилающих поверхностях различного типа. Его недостаток - существенное увеличение размеров формируемой обучающей выборки. Возможной альтернативой является применение специальных алгоритмов зондирования, по результатам применения которых устанавливается факт распознавания одного и того же типа объекта в окрестности некоторой выбранной точки подстилающей поверхности.
Исследователями [1, 2, 5, 8] установлено, что при решении задач распознавания в реальных условиях наблюдения объекта количество обрабатываемой информации может существенно превышать количество информации, обрабатываемой в тестовом режиме. Это связано, прежде всего, с увеличением числа ДП во множестве образов, необходимом для повышения вероятности правильного распознавания объекта [5] и обеспечения возможности распознавания объектов с различными схемами нанесённых на их поверхность покрытий [17].
Для сокращения количества информации, передаваемой в классификатор, требуется выполнить редукцию пространства признаков, отобрав те признаки сигнала, совокупность которых может обеспечить решение задачи распознавания с требуемым качеством. Решению этой задачи препятствует то обстоятельство, что критерий информативности признаков ДП до настоящего времени остаётся нечётко сформулированным [2, 17, 23, 25]. Кроме того, до настоящего времени окончательно не решена проблема выбора такого метода преобразования сигнала, применение которого, с одной стороны, обеспечивало бы формирование множества признаков, инвариантного к сдвигу ДП по временной оси, но, с другой стороны, обеспечивало бы сохранение информации о взаимном положении на временной оси компонент ДП.
Для формирования множества признаков ДП, подлежащих редукции, могут быть использованы различные интегральные преобразования [2, 25]. Так, в [2] предложено представлять ДП совокупностью отсчётов амплитудного спектра сигнала. Такое представление позволяет сформировать вектор признаков, инвариантный к временному положению ДП относительно момента времени излучения ЗИ. Этот способ формирования вектора признаков может приводить к потере части полезной для решения задачи распознавания информации. Заметим, что в [2] обосновано использование в качестве признаков низкочастотных отсчётов амплитудного спектра.
Избежать потерь информации об относительных положениях максимумов можно, использовав вейвлет-преобразование [25]. Его отличием от преобразования Фурье является то, что
- базисные функции, используемые при расчёте коэффициентов вейвлет-преобразования, являются конечными;
- некоторые из существующих базисных функций схожи по своим свойствам с функциями, описывающими процесс формирования ДП при рассеянии импульса лазерного излучения поверхностью объекта.
В [3, 15, 27] отмечено, что ДП может быть представлен сигнатурами. В [15] в качестве признаков используются расстояния между ближайшими экстремумами ДП, а также величины отношений их значений. Такое решение позволяет существенно сократить количество информации, передаваемой в классификатор. Однако чем меньше экстремумов будет содержаться в ДП, подлежащих распознаванию, тем больше информации окажется утрачено при формировании сигнатур.
Другой способ формирования сигнатур предложен в [3, 27]. Считается, что регистрируемый сигнал может быть представлен суперпозицией Гауссовых функций, различающихся амплитудой и временным сдвигом. Такое представление регистрируемого сигнала справедливо, если ЗИ хорошо аппроксимируется Гауссовой функцией, а зондируемая поверхность представима системой точечных отражателей. Поэто-
му такой способ часто используется при сканировании поверхности Земли с находящимся на ней растительным покровом. Такое представление ДП обладает теми же недостатками, что и сигнатуры, рассчитанные на основании выделения экстремумов.
Таким образом, несмотря на то, что к настоящему времени разработан целый ряд методов отбора информативных признаков [2, 3, 25 -28], выбор метода, дающего наилучший результат в условиях поставленной задачи, должен выполняться на основании свойств множества векторов признаков, которые могут быть установлены либо в результате выполнения прямых измерений ДП, либо в результате их численного моделирования.
5. Типы эффективных классификаторов и особенности их функционирования
В радиолокационных системах решение о наблюдении объекта традиционно принимается на основании критерия Байеса. Такой принцип принятия решения находит применение и при моделировании ЛЛС, обеспечивающих автоматическое распознавание объектов по их ДП [5]. На основании значений корреляционных максимумов и параметров шумовых реализаций рассчитываются апостериорные вероятности наблюдения распознаваемых объектов. Хотя в ряде случаев применение такого метода оказывается успешным, большинство исследователей старались избегать его применения [2, 10, 14, 15], что объясняется его низкой устойчивостью к шумам [15] и значительной вычислительной сложностью [22].
Авторы [14] применили метрический классификатор и выполнили сравнение качества распознавания, обеспечиваемого при использовании различных методов оценки сходства между ДП. Несмотря на невысокие значения достигнутых вероятностей правильного распознавания - не более 0,7 для множества из трёх объектов - они считают эти методы классификации перспективными для применения в разрабатываемых системах распознавания ДП.
Метрический классификатор был применён авторами [10, 23] для распознавания объектов по трёхмерным множествам точек, полученных при лазерном сканировании сцен. По сравнению с результатами [14], им удалось достичь более высоких вероятностей правильного распознавания объектов с малыми отличиями поверхностей, однако время, требуемое для обработки отсчётов сигналов, оказалось значительным и не соответствовало целевой задаче распознавания.
Общим недостатком ЛЛС, использующих вычисление значения КФ и метрические классификаторы, является необходимость использования всей совокупности обучающих образов в процессе функционирования системы.
В [15] для распознавания объектов предложено оценивать принадлежность сигнатуры, формируемой для полученной реализации ДП, определённому объекту. Эта оценка формируется классификатором, построенным на основе дерева принятий решений [29].
Также при вынесении решения учитывается значение экстремума взаимной корреляционной функции, вычисляемой по реализации сигнала и ДП каждого объекта. Авторы [15] сообщают, что описанный классификатор обеспечил наибольшую вероятность правильного распознавания множества, состоящего из трёх объектов.
Широкое распространение в задачах распознавания образов получили классификаторы на основе алгоритмов многослойных нейронных сетей прямого распространения [1, 2, 17], дающие наилучшие результаты. Преимуществом нейросетевых классификаторов является отсутствие необходимости хранения реализаций ДП в процессе функционирования системы: в процессе обучения нейросетевого классификатора происходит обобщение информации, содержащейся в совокупности обучающих образов, и сохранение её в виде весовых коэффициентов нейросетевого классификатора.
Основными сложностями, возникающими в процессе обучении нейросетевого классификатора, являются попадание фазовой точки в локальные минимумы функции ошибки и паралич сети [4]. Установлено, что чем большую размерность имеют векторы на входе нейросетевого классификатора, тем больше вероятность возникновения таких событий. Для преодоления этих проблем эффективным решением оказалась адаптация коэффициента скорости обучения классификатора п к скорости уменьшения ошибки обучения Ve: если величина Ve при выполнении итераций обучения уменьшается, п также уменьшают.
С другой стороны, очевидно, что для ускорения обучения такого классификатора следует предварительно выполнять операцию редукции пространства признаков, в целом сохраняющую их информативность, но уменьшающую размерность векторов признаков. Основной проблемой при осуществлении этой операции является зависимость получаемых результатов от используемого метода редукции, его параметров, состава множества распознаваемых объектов и типа классификатора. К сожалению, в настоящее время известны только общие рекомендации в отношении этих преобразований [25]. Для сравнения различных методов редукции применительно к решаемой задаче распознавания необходимо получить оценки качества решений, формируемых классификатором при использовании различных методов редукции.
Заключение
Обобщение опыта синтеза ЛЛС, обеспечивающих автоматическое распознавание объектов по ДП, свидетельствует как о принципиальной возможности создания таких систем, так и об однотипных проблемах, возникающих при их формировании.
Выбор длительности ЗИ должен выполняться особенно тщательно, поскольку его величина определяет информационные возможности ЛЛС и также фактически определяет тип используемого источника лазерного излучения и требования к ФПУ. Для распо-
знавания объектов с линейными размерами, превышающими несколько метров, длительность ЗИ может составлять единицы и даже десятки наносекунд. Можно считать, что распознавание объектов по ДП оказывается возможным, когда протяжённость объектов в направлении линии визирования такова, что обеспечивается формирование не менее 10 амплитудных отсчётов ДП.
Для оценивания качества функционирования системы распознавания следует проводить совместный анализ величин средней вероятности правильного распознавания всех объектов, минимальной вероятности правильного распознавания какого-либо из этих объектов и вероятности промахов, возникающих вследствие изменения каких-либо локационных параметров.
Критерий информативности признаков ДП до настоящего времени остаётся нечётко сформулированным, что препятствует полноценному анализу проблемы редукции пространства признаков. Как следствие, представляется целесообразным выполнять сравнительный анализ результатов распознавания тестовых ДП, на основании которого принимать решение о параметрах пространства признаков.
Литература
1. Baum, J. Non-cooperative identification of ships with electrooptical data / J. Baum, E. Tung, S. Rak // The Lincoln Laboratory Journal. - 1994. - Vol. 1, Issue 7. - P. 3-30.
2. Бурый, Е.В. Синтез системы распознавания объектов по форме огибающей лазерного импульса при импульсно-периодической локации // Квантовая электроника. -1998. - Т. 25, № 5. - C. 471-475.
3. Hofton, M.A. Decomposition of laser altimeter waveforms / M.A. Hofton, J.B. Minster, J.B. Blair // IEEE Transactions on Geoscience and Remote Sensing. - 2000. - Vol. 38, Issue 4. - P. 1989-1996. - DOI: 10.1109/36.851780.
4. Уоссермен, Ф. Нейрокомпьютерная техника: Теория и практика / Ф. Уоссермен; пер. с англ. - Москва: Мир, 1992. - 237 c. - ISBN 5-03-002115-9.
5. van den Heuvel, J.C. Identification of air and sea-surface
targets with a laser range profiler / J.C. van den Heuvel, R.M. Schoemaker, R.H.M.A. Schleijpen; ed. by M.D. Turner, G.W. Kamerman // Proceedings of SPIE. -2009. - Vol. 7323. - 73230Y (12 p.). - DOI:
10.1117/12.818426.
6. Kunz, G.J. Detection of small targets in a marine environment using laser radar / G.J. Kunz, H.H.P.Th. Bekman, K.W. Benoist, L.H. Cohen, J.C. van den Heuvel, F.J.M. van Putten // Proceedings of SPIE. - 2005. - Vol. 5885. -58850F. - DOI: 10.1117/12.614914.
7. TNO - Innovation for life [Electronical Resource]. URL: https://www.tno.nl/en/ (request date 03.10.2017).
8. Steinvall, O. Measurement and modeling of laser range profiling of small maritime targets / O. Steinvall, M. Elmqvist, T. Chevalier, C. Brannlund // Proceedings of SPIE. - 2012. -Vol. 8542. - 85420I. - DOI: 10.1117/12.970271.
9. Swedish defence research agency - Totalforsvarets forskningsinstitut [Electronical Resource]. URL: https://www.foi.se/en/foi.html (request date 03.10.2017).
10. Marino, R.M. Jigsaw: a foliage-penetrating 3D imaging laser radar system / R.M. Marino, W.R. Davis // Lincoln Laboratory Journal. - 2005. - Vol. 1, Number 15. - P. 23-36.
11. MIT Lincoln Laboratory. Massachusetts Institute of Technology [Electronical Resource]. URL: https://www.ll.mit.edu/ (request date 03.10.2017).
12. Buryi, E. Surface shape reconstruction of located small object / E. Buryi. - In: European Optical Society: EOS annual meeting. - 2012. - TOM 7. Optical Systems for the Energy & Production Industries. - TOM7_5832_001. - 2 p.
13. Лаборатория лазерных информационных систем [Электронный ресурс]. URL: http://llis.bmstu.ru (дата обращения: 03.10.2017).
14. Schoemaker, R.M. Characterisation of small targets in a maritime environment by means of laser range profiling / R.M. Schoemaker, K.W. Benoist // Proceedings of SPIE. -2011. - Vol. 8037. - 803705. - DOI: 10.1117/12.884575.
15. Steinvall, O. Laser range profiling for small target recognition / O. Steinvall, M. Tulldahl // Optical Engineering. - 2017. -Vol. 3, Issue 56. - 031206. - DOI: 10.1117/1.OE.56.3.031206.
16. Завада, В.С. К расчёту импульсных характеристик отражения тел в оптическом диапазоне / В.С. Завада, А.В. Захаров, И.А. Непогодин // Импульсная фотометрия. - 1978. - № 5. - C. 31-34.
17. Бурый, Е.В. Формирование репрезентативного множества векторов признаков для обучения системы распознавания типов летательных аппаратов методом моделирования распределений коэффициентов рассеяния их поверхностей / Е.В. Бурый, Ю.Л. Смирнова // Математическое моделирование. - 2004. - Т. 16, № 4. - C. 80-88.
18. Ishimaru, A. Wave propagation and scattering in random media. Volume 2: Multiple scattering, turbulence, rough surfaces, and remote-sensing / A. Ishimaru. - San Diego: Academic Press, 1978. - 339 p. - ISBN: 978-0-12-374702-0.
19. Johnson, J. Analysis of image forming systems /
J. Johnson. - In: Image intensifier symposium: Part III. -Fort Belvoir, 1958. - P. 249-273.
20. Бабаянц, Г.И. Разработка и исследование диэлектрических покрытий с высокой лучевой прочностью / Г.И. Бабаянц, С.Г. Гаранин, В.Г. Жупанов, Е.В. Клюев,
А.В. Савкин, С.А. Сухарев, О.А. Шаров // Квантовая электроника. - 2005. - Т. 35, № 7. - C. 663-666.
21. Ragheb, H. Testing new variants of the Beckmann-Kirchhoff model against radiance data / H. Ragheb, E.R. Hancock // Computer Vision and Image Understanding. - 2006. - Vol. 102, Issue 2. - P. 145-168. - DOI: 10.1016/j.cviu.2005.11.004.
22. Растригин, Л.А. Адаптация сложных систем / Л.А. Растригин. - Рига: Зинатне, 1981. - 375 c.
23. Vasile, A.N. Pose-independent automatic target detection and recognition using 3D laser radar imagery / A.N. Vasile,
R. M. Marino // Lincoln Laboratory Journal. - 2005. -Vol. 15, Number 1. - P. 61-78.
24. Armbruster, W. Maritime target identification in flash-ladar imagery / W. Armbruster, M. Hammer // Proceedings of SPIE. - 2012. - Vol. 8391. - 83910C. - DOI: 10.1117/12.920264.
25. Baulin, F. Efficiency analysis of feature extraction methods for pulse laser ranging systems / F. Baulin, E. Buryi, D. Semerenko // 2017 Progress In Electromagnetics Research Symposium - Spring (PIERS). - 2017. - P. 37903794. - DOI: 10.1109/PIERS.2017.8262418.
26. Fukunaga, K. Introduction to statistical pattern recognition / K. Fukunaga. - 2nd ed. - Boston: Academic Press, 1990. -592 p. - ISBN: 978-0-12-269851-4.
27. Hancock, S. Measurement of fine-spatial-resolution 3D vegetation structure with airborne waveform lidar: Calibration and validation with voxelised terrestrial lidar /
S. Hancock, K. Anderson, M. Disney, K.J. Gaston // Remote Sensing of Environment. - 2017. - Vol. 188. - P. 3750. - DOI: 10.1016/j.rse.2016.10.041.
28. Haykin, S.O. Neural networks and learning machines / S.O. Haykin. - 3rd ed. - New York: Pearson, 2008. - 936 p. - ISBN: 978-0-13-147139-9.
29. Quinlan, J.R. Induction of decision trees / J.R. Quinlan // Machine Learning. - 1986. - Vol. 1, Issue 1. - P. 81-106. -DOI: 10.1007/BF00116251.
Сведения об авторах
Баулин Федор Борисович, в 2016 году окончил Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет) с дипломом по специальности «Радиоэлектронные системы и устройства», аспирант МГТУ им. Н.Э. Баумана. Область научных интересов: системы распознавания, нейронные сети, цифровая обработка сигналов. E-mail: [email protected] .
Бурый Евгений Владленович, доктор технических наук, профессор, в 1986 году окончил Московское высшее техническое училище имени Н.Э. Баумана. Радиоинженер. Руководитель Лаборатории лазерных информационных систем МГТУ им. Н.Э. Баумана. Область научных интересов: системы распознавания, лазерная локация, нейронные сети. E-mail: [email protected] .
ГРНТИ: 28.23.15
Поступила в редакцию 4 июня 2018 г. Окончательный вариант - 18 декабря 2018 г.
Issues of recognition system synthesis based on laser range profiles
F.B. Baulin1, E.V. Buryi1
1.Bauman Moscow State Technical University (National Research University), Moscow, Russia
Abstract
In this article we described common problems encountered by various researchers when synthesizing recognition systems based on laser range profile, developed for non-cooperative vehicle recognition. Proven approaches to tackling the problems are also considered. The contemporary level of the technology and guidelines for developing the recognition systems are discussed. Based on the research results combined, it is concluded that such systems are not only feasible, but also in demand.
Keywords: backscattering, range profile, laser, laser sensor, recognition, lidar.
Citation: Baulin FB, Buryi EV. Issues of recognition system synthesis based on laser range profiles. Computer Optics 2019; 43(1): 5-13. DOI: 10.18287/2412-6179-2019-43-1-5-13.
References
[1] Baum J, Tung E, Rak S. Non-cooperative identification of ships with electrooptical data. The Lincoln Laboratory Journal 1994; 1(7): 3-30.
[2] Buryi EV. Synthesis of an object recognition system based on the profile of the envelope of a laser pulse in pulsed li-dars. Quantum Electronics 1998; 28(5): 458-462. DOI: 10.1070/QE1998v028n05ABEH001248.
[3] Hofton MA, Minster JB, Blair JB. Decomposition of laser altimeter waveforms. IEEE Transactions on Geoscience and Remote Sensing 2000; 38(4): 1989-1996. DOI: 10.1109/36.851780.
[4] Wasserman PhD. Neural computing: Theory and practice. New York: Coriolis Group; 1989. ISBN: 978-0-44220743-4.
[5] van den Heuvel JC, Schoemaker RM, Schleijpen RHMA. Identification of air and sea-surface targets with a laser range profiler. Proc SPIE 2009; 7323: 73230Y. DOI: 10.1117/12.818426.
[6] Kunz GJ, Bekman HHPTh, Benoist KW, Cohen LH, van den Heuvel JC, van Putten FJM. Detection of small targets in a marine environment using laser radar. Proc SPIE 2005; 5885: 58850F. DOI: 10.1117/12.614914.
[7] TNO - innovation for life. Source: (https://www.tno.nl/en/).
[8] Steinvall O, Elmqvist M, Chevalier T, Brannlund C. Measurement and modeling of laser range profiling of small maritime targets. Proc SPIE 2012; 8542: 85420I. DOI: 10.1117/12.970271
[9] Swedish defence research agency - Totalforsvarets forskningsinstitut. Source: (https://www.foi.se/en/foi.html).
[10] Marino RM, Davis WR. Jigsaw: a foliage-penetrating 3D imaging laser radar system. Lincoln Laboratory Journal 2005; 1(15): 23-36.
[11] MIT Lincoln Laboratory. Massachusetts Institute of Technology. Source: (https://www.ll.mit.edu/).
[12] Buryi E. Surface shape reconstruction of located small object. In: European Optical Society: EOS annual meeting 2012; TOM 7: TOM7_5832_001.
[13] Laser informational system laboratory. Source: (http://llis.bmstu.ru).
[14] Schoemaker RM, Benoist KW. Characterisation of small
targets in a maritime environment by means of laser range profiling. Proc SPIE 2011; 8037: 803705. DOI:
10.1117/12.884575.
[15] Steinvall O, Tulldahl M. Laser range profiling for small target recognition. Opt Eng 2017; 3(56): 031206. DOI: 10.1117/1.OE.56.3.031206.
[16] Zavada VS, Zakharov AV, Nepogodin IA. Matters concerning calculation of impulse response in optical band [In Russian]. Impul'snaya Fotometriya 1978; 5: 31-34.
[17] Buryi, EV, Smirnova YL. Forming of representative set of attribute vectors for training recognition system of aircrafts types by method for simulating of distributions of scattering coefficients of their surfaces [In Russian]. Mate-maticheskoye modelirovaniye 2004; 16(4): 80-88.
[18] Ishimaru A. Wave propagation and scattering in random media. Vol 2: Multiple scattering, turbulence, rough surfaces, and remote-sensing. San Diego: Academic Press; 1978. ISBN: 978-0-12-374702-0.
[19] Johnson J. Analysis of image forming systems. In Book: Image intensifier symposium: Part III. Fort Belvoir; 1958: 249-273.
[20] Babayants GI, Garanin SG, Zhupanov VG, Klyuev EV, Savkin AV, Sukharev SA, Sharov OA. Development and study of dielectric coatings with a high radiation resistance [In Russian]. Quantum Electronics 2005; 35(7): 663-666. DOI: 10.1070/QE2005v035n07ABEH008958.
[21] Ragheb H, Hancock ER. Testing new variants of the Beckmann-Kirchhoff model against radiance data. Computer Vision and Image Understanding 2006; 102(2): 145168. DOI: 10.1016/j.cviu.2005.11.004.
[22] Rastrigin LA. Adaptation of complex system [In Russian]. Riga: Zhynatne; 1981.
[23] Vasile AN, Marino RM. Pose-independent automatic target detection and recognition using 3D laser radar imagery. Lincoln Laboratory Journal 2005; 15(1): 61-78.
[24] Armbruster W, Hammer M. Maritime target identification in flash-ladar imagery. Proc SPIE 2012; 8391: 83910C. DOI: 10.1117/12.920264.
[25] Baulin F, Buryi E, Semerenko D. Efficiency analysis of
feature extraction methods for pulse laser ranging systems. Progress In Electromagnetics Research Symposium -Spring (PIERS) 2017: 3790-3794. DOI:
10.1109/PIERS.2017.8262418.
[26] Fukunaga K. Introduction to statistical pattern recognition, second edition. 2nd ed. Boston: Academic Press; 1990. ISBN: 978-0-12-269851-4.
[27] Hancock S, Anderson K, Disney M, Gaston KJ. Measurement of fine-spatial-resolution 3D vegetation structure with airborne waveform lidar: Calibration and validation with voxelised terrestrial lidar. Remote Sensing of Environment 2017; 188: 37-50. DOI: 10.1016/j.rse.2016.10.041.
[28] Haykin SO. Neural networks and learning machines. 3rd ed. New York: Pearson; 2008. ISBN: 978-0-13-147139-9.
[29] Quinlan JR. Induction of decision trees. Mach Learn 1986; 1(1): 81-106. DOI: 10.1007/BF00116251.
Authors’ information
Baulin Fedor Borisovich, born 1989, in 2016 graduated from Bauman Moscow State Technical University with an engineer diploma in Radioelectronics. Currently he is a postgraduate at BMSTU. Fields of study: automatic recognition, artificial neural networks, digital signal processing. E-mail: [email protected] .
Buryi Evgeni Vladlenovich, born 1963, in 1986 graduated from Moscow Higher Technical School n.a. Bauman with an engineer diploma in Radioelectronics. Received his Sc.D. degree at BМSTU in 2003. He is currently the head of Laser Information Systems laboratory and a professor at BMSTU. Fields of study: automatic recognition, artificial neural networks, lidars. E-mail: [email protected] .
Received June 4, 2018. The final version - December 18, 2018.