ЛАЗЕРНЫЕ И ОПТИКО-ЭЛЕКТРОННЫЕ СИСТЕМЫ
УДК 621.397.2
Ю. С. Гулина, В. Я. Колючкин
МЕТОДИКА РАСЧЕТА ВЕРОЯТНОСТИ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ЧЕЛОВЕКОМ-ОПЕРАТОРОМ
Изложена методика расчета вероятности распознавания образов объектов, наблюдаемых человеком-оператором на выходе оптико-электронных приборов наблюдения, основанная на многоканальной модели зрительной системы человека. Приведены результаты экспериментальных исследований, подтверждающих правильность предложенной методики, которая может быть использована при проектировании оптико-электронных приборов наблюдения.
E-mail: [email protected]
Ключевые слова: оптико-электронные приборы наблюдения, вероятность распознавания, зрительная система, человек-оператор.
Основными показателями качества оптико-электронных приборов (ОЭП) наблюдения являются условные вероятности обнаружения образов наблюдаемых объектов, а также условные вероятности распознавания этих образов человеком-оператором. Предлагаемая методика позволяет учесть не только характеристики излучения объектов и ОЭП наблюдения, но также свойства зрительного восприятия зашумленных изображений человеком-оператором.
Методика основана на многоканальной модели зрительной системы человека-оператора [1]. Согласно этой модели в зрительной системе осуществляется оптимальный прием и последующий анализ финитных пространственно-частотных гармонических составляющих образа объекта, на основе которого в соответствии с критерием максимума апостериорной вероятности (критерием идеального наблюдателя [2]) принимается решение об обнаружении или распознавании образов объектов.
Решение об обнаружении объекта принимается на основе одной или нескольких пространственно-частотных гармоник. Вероятность правильного обнаружения объекта в предположении о независимости каналов, в которых происходит анализ гармоник, описывается выражением [1]
(1)
здесь РобНтп — вероятность правильного обнаружения тп-й гармоники, которая в свою очередь определяется формулой
^ 2 г> \Стп дтп) \ /Г)\
= 72П / ехЧ--2-; ^ (2)
Стп
где £тп — порог принятия решения об обнаружении тп-й гармоники, выраженный в нормированных на среднеквадратическое отклонение (СКО) шума значениях реализаций сигнала на выходе тп-го фильтра и равный
1п Лп д
Цтп I ^ ; (3)
дтп 2
дтп — воспринимаемое отношение сигнала к шуму (ОСШ) на тп-й гармонике; Лп — пороговое отношение правдоподобия.
Как указано в работе [1], воспринимаемое ОСШ определяется формулами:
|00 — |п
LН(0,0)
2vk тзр А,
Аш
o
;
= 2 2 Vk Тзр Ao
l^rnn 2|П \1 А
Атп
Т f ,mn
L ■< ¡x %
Т m n
Hk{ L 'L
(4)
(5)
где дп — пиковое ОСШ; ик — частота кадров в ОЭП наблюдения; тзр — постоянная времени, описывающая инерционность зрительного восприятия; А0 — габаритная площадь изображения объекта; Аш —
площадь корреляции аддитивного шума; ЬН(-г~— фурье-образ
\ Ьх Ьу /
нормированной функции, описывающей изображение объекта с учетом линейных искажений, которые вносит тракт ОЭП наблюдения;
~ /т п\
Н к [у ) — функция контрастной чувствительности [2].
Отметим, что модель зрительной системы человека-оператора [1] хорошо согласуется с экспериментальными данными при решении задачи обнаружения образов объектов. Однако в этом модельном описании проводится обнаружение отдельных гармонических составляющих образов объектов путем сравнения с соответствующими пороговыми значениями. Но для решения задачи распознавания необходимо проводить анализ значений гармоник, рассматриваемых как признаки распознавания, в многомерном признаковом пространстве. Поэтому модель, предложенную в работе [1], нельзя использовать для оценки вероятности распознавания образов объектов.
Предлагаемая методика оценки процесса распознавания изображений человеком-оператором основана на гипотезе о том, что в зрительной системе проводится анализ признаков, которыми являются модули
финитных гармонических составляющих образа объекта, а решение о принадлежности образов объектов к тому или иному классу принимается в соответствии с критерием идеального наблюдателя [2].
Чтобы отнести объект к тому или иному классу, нужно, во-первых, выбрать эффективный словарь признаков распознавания — набор гармоник, достаточных для принятия решения о распознавании, и описать каждый класс объектов, подлежащих распознаванию, в признаковом пространстве. В рамках статистической теории распознавания образов такое описание задается функциями правдоподобия. Во-вторых, требуется определить в пространстве признаков границы между классами, т.е. найти правило, согласно которому будет приниматься решение о принадлежности объекта к тому или иному классу.
С учетом сказанного были внесены коррективы в многоканальную модель зрительной системы человека-оператора [1] для адаптации ее к решению задачи распознавания образов объектов. В частности, блоки пороговых устройств из каждого канала исключены. Вместо них в модифицированную структурную схему модели многоканальной зрительной системы введен блок определения решающих границ (рис. 1). В предпроцессоре отдельные финитные гармонические составляющие образов объектов первично обрабатываются и анализируются, а в логическом блоке строятся решающие границы в признаковом пространстве, образованном совокупностью гармоник, для принятия решения о распознавании.
Рассмотрим задачу распознавания на примере двух классов объектов, изображения которых наблюдаются на экране видеоконтрольного устройства при наличии аддитивного шума с нормальной статистикой. Значения реализаций сигналов на выходе каждого тп-го канала представляют собой нормально распределенные случайные величины,
Рис. 1. Структурная схема многоканальной модели зрительной системы человека-оператора при распознавании:
1 — оптический фильтр; 2 — временной фильтр; 3 — пространственный фильтр; 4 — параллельные фильтры; 5 — блок определения решающих границ; 6 — процессор; 7 — блок памяти
которые характеризуются математическим ожиданием и дисперсиеи. При принятии решения о распознавании двух классов объектов, у которых признаки распознавания являются нормально распределенными случайными величинами, в соответствии с критерием идеального наблюдателя решающее правило можно представить в виде квадратичной формы относительно вектора наблюдения Х следующим образом [3]:
2 (X - М0т Е-1 (X - МО - 1 (X - М2)т Е-1 (X - М2) +
+11пЕ1 £ 1п РМ ^ X е ( Ш1 , (6) 2 Е2 Р М ^
где X = [х1 х2 ... хп]т — случайный вектор, характеризующий реализации сигнала в п-мерном признаковом пространстве; Му =
= [т1у т2у ... тпу]т — вектор математического ожидания случайного
22 а11 ... °1и
ковариационная матрица аддитив-
вектора X; Е =
2 2 ^n 1 ••• °nn
ной помехи, элементами которой являются числа ст- = М|(х^ - т^) х х (ху - ту)}; Р (шу) — априорные вероятности появления объектов, принадлежащих к классу шу.
При искажении изображений объектов белым шумом ковариационная матрица преобразуется к диагональному виду, ее элементы одинаковы и равны значениям дисперсии помехи на выходе каждого тп-го канала. Компоненты вектора Х при этом не коррелированы, а байесовское решающее правило принимает вид линейной функции относительно Х [3]:
(М2 - М1)т X + 1 (М1М1 - МТ2М2) £ 1п ^ X е ( Ш1 (7)
2 Р (ш2) [ Ш2.
Предположим, что появление объектов различных классов равновероятно. Тогда априорные вероятности, характеризующие принадлежность объектов к тому или иному классу, будут равны, т.е. Р (ш1) = Р (ш2) = 0,5, и решающее правило имеет вид
(М2 - М1)т X + 1 (М1М1 - М2М2) £ 0 ^ X е { Ш1 (8) 2 [ ш2.
Границы между классами можно определить как решение системы уравнений
(М2 - М1)т X +2 (М1М1 - М2М2) = 0. (9)
2 1 2
Решение системы (9) представляет собой многомерную функцию, описывающую гиперплоскость, разделяющую области двух классов объектов в признаковом пространстве.
Если значения реализаций сигналов на выходе каждого тп-го канала пронормировать на СКО отп аддитивного шума, то математическими ожиданиями для случайных векторов, описывающих образы объектов, будут являться значения воспринимаемых ОСШ на тп-х гармониках спектров изображений объектов. С учетом этого замечания можно ввести следующие обозначения нормированного вектора реализаций и нормированного вектора математического ожидания:
Я = — [хЪ Х2,...,Хп]Т = [Сь С2,---,Сп]Т ,
а,п
Muj =
1
_ [моо, '
О-
Систему уравнений для нахождения границ между классами в признаковом пространстве нормированных гармонических составляющих можно представить в виде
(Ми2 - Ми1)т Я + 1 (МитМи1 - МиТМи2) = 0. (10) 2
Вероятность правильного распознавания ^'-го класса
р =
1 npj
2
(Соо - й0о) + ''' + (Сю - ßlnr)
(2п)2
ехр | -^---—-• """" ) ^Соо ...йС-ппп-,
(11)
где И ] — область ]-го класса в пространстве признаков.
Безусловная вероятность правильного распознавания любого из двух классов объектов
Рпр = Р (^1) РПрх + Р (Ш2) Рпр2 . (12)
Для проверки адекватности предложенной модели были проведены экспериментальные исследования. В экспериментах принимали участие 11 специально обученных операторов. В процессе обучения на мониторе видеоконтрольного устройства операторам предъявлялись полутоновые изображения объектов различного масштаба на равномерном фоне. Типовые изображения объектов приведены на рис. 2.
При проведении экспериментов операторам предъявлялись зашум-ленные изображения объектов (рис. 3) и ставилась задача определить принадлежность к одному из двух классов. Значение СКО шума постепенно увеличивалось до такой степени, когда ни один из операторов
2
ir 1
§ 1 Ш
Рис. 2. Типовые изображения объектов
уже не мог распознать объект. Условия наблюдения, а именно среднюю яркость экрана и расстояние наблюдения, каждый оператор мог выбирать по своему усмотрению.
По результатам, полученным в ходе экспериментов, были определены значения вероятности распознавания изображений объектов различных размеров и при разных значениях пикового ОСШ. На рис. 4 приведены результаты экспериментов, полученные при распознавании изображений объектов, имеющих габаритные размеры 38x68 пикселей и наблюдаемые при различных значениях пикового ОСШ, а также расчетные графики зависимости вероятности распознавания таких изображений от пикового ОСШ. Как следует из приведенных на рис. 4 результатов, экспериментальная и расчетные зависимости различаются, причем при увеличении числа признаков в области значений пикового ОСШ, меньших 0,15, различие возрастает до 11%, при больших ОСШ — уменьшается до 2%. При четырех признаках расчетная вероятность распознавания и экспериментальная различаются не более чем на 5 % во всем диапазоне значений пикового ОСШ.
Экспериментальные и расчетные результаты исследований влияния размеров изображений на вероятность распознавания приведены на рис.5. При расчетах в качестве признаков использовались амплитуды гармоник, в том числе амплитуда Ь00 нулевой гармоники и амплитуды Ь01, Ью, Ь11 первых гармонических составляющих образов объектов. Анализируя полученные результаты, выявили, что различие
Рис.3. Изображение объекта, искаженное белым шумом
Рис. 4. Зависимость вероятности распознавания объекта размером 38x68 пикселей от пикового ОСШ для различного числа признаков:
1 — расчетная зависимость при 6 признаках (амплитуды гармоник
Loo> L01 , Lio, Ьц, L20, L21); 2 — то же при 5 признаках (амплитуды гармоник Lqq, L01 ,L 10, L11, L20); 3
— то же при 4 признаках (амплитуды гармоник L00, L01, L10, L11); 4
— то же при 3 признаках (амплитуды гармоник L00, L01, L10); 5- то же при 2 признаках (амплитуды гармоник L00, L10); о — экспериментально полученные значения
Рис. 5. Зависимость вероятности распознавания от пикового ОСШ при вариациях размеров изображений объектов:
--теоретически рассчитанная зависимость; о — экспериментально полученные
значения 38x68 пикселей (а); 19x34 пикселей (б); 10x17 пикселей (в); 5x9 пикселей (г)
экспериментальных и расчетных значений вероятности не превышает 8% при размерах изображений объектов от 38x68 пикселей до 10x17 пикселей, но при размерах изображений 5x9 пикселей отличие экспериментальных от расчетных значений достигает 15%. Это свидетельствует о том, что при расчетах использовалось недостаточное число признаков распознавания. Кроме этого не учтено влияние помех пространственной дискретизации, возникающих при формировании изображений.
В заключение отметим, что полученные в ходе исследований результаты свидетельствуют о правильности предложенного подхода к описанию свойств зрительной системы, а изложенная методика может быть использована для приближенной оценки вероятности распознавания зашумленных изображений, наблюдаемых человеком-оператором на экране видеоконтрольного устройства ОЭП наблюдения.
СПИСОК ЛИТЕРАТУРЫ
1. Бенуни А. А., К о л ю ч к и н В. Я. Модель зрительной системы человека-оператора // Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. - 2002. -№ 4. - С. 43-52.
2. Красильников Н. Н. Теория передачи и воспроизведения изображений. Теория передачи изображений и ее приложения. - М.: Радио и связь, 1986. -248 с.
3. Фукунага К. Введение в статистическую теорию распознавания образов: Пер. с англ. - М.: Наука, 1979. - 368 с.
Статья поступила в редакцию 18.05.2011
Юлия Сергеевна Гулина родилась в 1986 г., окончила МГТУ им. Н.Э. Баумана в 2009 г. Аспирантка кафедры "Лазерные и оптико-электронные системы" МГТУ им. Н.Э. Баумана. Специализируется в области проектирования оптико-электронных приборов наблюдения.
Yu.S. Gulina (b. 1986) graduated from the Bauman Moscow State Technical University in 2009, Post-graduate of "Laser and Optical-Electronic Systems" department of the Bauman Moscow State Technical University. Specializes in the field of design of optical-electronic observation instruments.
Василий Яковлевич Колючкин родился в 1948г., окончил в 1972 г. МВТУ им. Н.Э. Баумана и в 1986 г. МИФИ. Д-р техн. наук, профессор кафедры "Лазерные и оптико-электронные системы" МГТУ им. Н.Э. Баумана. Автор более 100 научных работ в области системного проектирования оптико-электронных приборов.
V.Ya. Kolyuchkin (b. 1948) graduated from the Bauman Moscow Higher Technical School in 1972. D. Sc. (Eng.), professor of "Laser and Optical-Electronic Systems" department of the Bauman Moscow State Technical University. Author of 125 publications in the field of system design of optical-electronic instruments.