Научная статья на тему 'Метод селекции световозвращающих объектов от диффузных с помощью цифровой адаптивной обработки'

Метод селекции световозвращающих объектов от диффузных с помощью цифровой адаптивной обработки Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
88
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОРОГОВАЯ ОБРАБОТКА / БИНАРНОЕ ИЗОБРАЖЕНИЕ / СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЯ / СКРЫТЫЕ ВИДЕОКАМЕРЫ / PINHOLE-ОБЪЕКТИВЫ / "ЗАМЫКАНИЕ" ИЗОБРАЖЕНИЯ / ФИЛЬТРАЦИЯ ОБЪЕКТОВ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бокшанский Василий Болеславович, Е Тэвун, Вязовых Максим Вячеславович, Литвинов Илья Сергеевич

Рассмотрен метод селекции световозвращающих объектов от диффузных с помощью адаптивной пороговой обработки разностного кадра. На основе приведенного метода представлен алгоритм фильтрации диффузных объектов на бинарных изображениях.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бокшанский Василий Болеславович, Е Тэвун, Вязовых Максим Вячеславович, Литвинов Илья Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The method of selection of the retroreflective objects from the diffuse same with the digital adaptive processing

The methods of selection of retroreflective objects from diffuse objects with the adaptive thresholding of frames difference are considered. An algorithm is presented for filtering the diffuse objects on the binary images.

Текст научной работы на тему «Метод селекции световозвращающих объектов от диффузных с помощью цифровой адаптивной обработки»

УДК 621.396.067.7

Метод селекции световозвращающих объектов от диффузных с помощью цифровой адаптивной обработки

© В.Б. Бокшанский, Е Тэвун, М.В. Вязовых, И.С. Литвинов МГТУ им. Н.Э. Баумана, Москва, 105005, Россия

Рассмотрен метод селекции световозвращающих объектов от диффузных с помощью адаптивной пороговой обработки разностного кадра. На основе приведенного метода представлен алгоритм фильтрации диффузных объектов на бинарных изображениях.

Ключевые слова: скрытые видеокамеры, pinhole-объективы, пороговая обработка, бинарное изображение, «замыкание» изображения, сегментация изображения, фильтрация объектов.

В настоящее время благодаря современным достижениям в области микроэлектроники интенсивно развиваются интегральные технологии. На основе таких технологий производят миниатюрные видеокамеры с высокочувствительными ПЗС- или КМОП-сенсорами, у которых диаметр входного зрачка объектива менее 1 мм. Подобные видеокамеры открывают широкие возможности для ведения скрытого видеонаблюдения, поскольку их можно встраивать в стены и интерьеры помещений, переносные приборы и аксессуары, скрывать под одеждой.

Несанкционированное получение видеоинформации может привести к серьезным проблемам, связанным как с утечкой конфиденциальных данных, так и с возможностью шантажа или давления на основе полученных «компрометирующих» материалов. Ежегодно производители фильмов теряют часть прибыли от проката картин из-за распространения «пиратских» фильмов в сети Интернет, нелегально снятых в кинотеатрах. Для борьбы с «пиратством» требуются системы, осуществляющие незаметное автоматическое обнаружение видеокамер в рядах зрителей без причинения неудобств последним во время просмотра фильма. Такие системы должны с высокой вероятностью обнаруживать как видеокамеры, встроенные в современные смартфоны и планшеты, так и видеокамеры с объективами типа pinhole в диапазоне дальностей 1.. .40 м.

Самым эффективным методом обнаружения является метод лазерной локации. При облучении видеокамер лазерным излучением возни-

кает ретроотраженное излучение, направление которого совпадает с начальным направлением лазерного пучка. В оптике это явление называют световозвращением, при этом любой световозвращающий объект описывается показателем световозвращения (ПСВ), индикатрисой отражения и пеленгационной характеристикой. ПСВ определяется оптическими и конструктивными параметрами обнаруживаемого устройства и зависит от длины волны лазерного излучения.

Видеокамеры с объективами типа pinhole вследствие небольшого диаметра входного зрачка обладают очень низким ПСВ (10... 100 см2/ср). При их обнаружении на малых дальностях, например в комнатах или офисных помещениях, содержащих большое количество зеркальных и диффузно отражающих поверхностей, возникает множество «ложных» бликов, интенсивность которых чаще всего превышает интенсивность «полезных» световозвращенных бликов. Эту особенность следует учитывать при построении алгоритма обнаружения.

К самым распространенным объектам с диффузно отражающими поверхностями, имеющим высокий коэффициент отражения, относятся полированные металлические детали, полиэтиленовые пленки, оптические детали.

Целью настоящей работы является описание метода и построения на его основе алгоритма, осуществляющего селекцию световозвра-щающих бликов от диффузно отраженных бликов с применением современных методов цифровой обработки изображений. На входе алгоритма исходное необработанное изображение содержит полутоновые объекты, соответствующие световозвращенным и диффузно отраженным бликам. На изображении блик от видеокамеры с объективом типа pinhole занимает от одного до нескольких десятков пикселов в зависимости от расстояния между системой обнаружения и видеокамерой. При отсутствии дефокусировки приемного объектива системы обнаружения форма такого блика чаще всего обладает октальной симметрией. В то же время размеры и форма бликов от диффузных поверхностей на изображении являются произвольными и будут определяться только мощностью лазерного излучения и положением системы обнаружения относительно этих поверхностей.

Классические алгоритмы обнаружения основаны на вычитании двух соседних — «активного» и «пассивного» — видеокадров с дальнейшей пороговой обработкой разностного кадра [1]. В ситуациях, когда интенсивность «полезного» излучения не превышает интенсивности «ложного» излучения, представленный алгоритм не обеспечит правильную работу системы. Необходимо провести усовершенствование алгоритма, добавив автоматическую селекцию целей по морфологическим признакам, например по размеру и форме.

Пороговая обработка изображения позволяет получить бинарное изображение. При этом форма и размеры объектов на бинарном изображении зависят от порогового значения. Следует отметить важную особенность: форма и размеры световозвращенных бликов незначительно изменяются в зависимости от порогового значения. Напротив, форма и размеры диффузных объектов на бинарном изображении сильно зависят от порогового значения. При использовании большого порогового значения, не превышающего значения интенсивности све-товозвращающих бликов, на бинарном изображении присутствуют как протяженные объекты, так и объекты, занимающие всего один пиксел. При уменьшении порогового значения объекты на бинарном изображении, сформированные отраженным излучением от диффузных поверхностей, существенно изменяют размеры, объединяются с соседними объектами, при этом также в изображение добавляются новые объекты. Таким образом, используя несколько пороговых значений и формируя несколько бинарных матриц, можно отфильтровать «ложные» объекты на основе значительного изменения пространственных признаков этих объектов на бинарных изображениях.

Ниже приведены основные этапы алгоритма обнаружения скрытых видеокамер с автоматической селекцией объектов.

1. Вычисление разности «активного» и «пассивного» кадров

«Пассивный» кадр хп(да, n) — это кадр, содержащий информацию об объектах в зоне обнаружения, облучаемых только фоновым («по-меховым») излучением.

«Активный» кадр ха(да, n) — это кадр, содержащий информацию об объектах в зоне обнаружения, облучаемых как фоновым, так и лазерным излучением.

Вычисление разностного кадра осуществляется по формуле

Ах(т, n) = ха (т, n) - хп (т, n). (1)

На рис. 1 представлено разностное изображение, содержащее световозвращенный блик от видеокамеры с объективом типа pinhole, а также диффузно отраженное излучение от металлической конструкции. Данный этап алгоритма позволяет исключить из дальнейшей обработки отраженное фоновое излучение от объектов, находящихся в зоне подсвета лазера. Источниками фонового излучения могут быть солнце, люминесцентные лампы, лампы накаливания, светодиоды и другие активные источники излучения. Рис. 1. Разностное изображение

2. Вычисление адаптивных пороговых значений

Практическая апробация разрабатываемого алгоритма показала, что вычисление базового То и дополнительных Т и Т2 пороговых значений следует проводить не для всего разностного кадра, а для непересекающихся соседних областей размером 5*5 пикселов. Разбиение изображения на области связано с тем, что интенсивность пикселов, соответствующих «подсвеченным» объектам, расположенным на различном расстоянии от системы обнаружения, будет разной. Размер области разбиения обусловлен максимальным характерным размером блика от инспектируемых световозвращателей в заданном диапазоне дальностей.

Для к-й области изображения базовое пороговое значение определяется следующим выражением:

где функция mod вычисляет остаток от деления; N — число пикселей в строке изображения; о — среднеквадратическое отклонение (СКО) значения шума изображения, отн. ед.

Таким образом, пороговые значения будут адаптивно изменяться в зависимости от интенсивности пикселов, лежащих внутри областей, и значения СКО шума изображения. Первое дополнительное пороговое значение выбирается всегда большим, чем базовое пороговое значение, и не может превышать максимального значения интенсивности полутонового изображения. Второе дополнительное пороговое значение всегда должно быть меньше базового. Нижний предел для этого порога ограничивается величиной 3о.

СКО значения шума изображения вычисляется по одному пикселу для последовательности NF разностных кадров. Как правило, этот пиксел соответствует краю поля зрения матрицы, куда не попадает отраженное лазерное излучение.

СКО вычисляется по формуле

где Дхг (т, п) — значение интенсивности пиксела в г-м разностном кадре; Дх( т, п)— скользящее среднее значение интенсивности пиксела для последовательности ЫГ разностных кадров.

На основании серии проведенных экспериментов с использованием макетного образца прибора обнаружения скрытых видеокамер «АНТИСВИС» в реальной фоноцелевой обстановке были установле-

^=1 *i5 (N-')+5 [mod GN)- ')+3°' (2)

1 NF _

———X kxt(m,n)-Ax(m,n) 2; NF -1 i=1L J

(3)

ны следующие соотношения для дополнительных пороговых значений:

[1,2570к, 1,25Ток < хШах;

Т1к = 1 , 257 > . (4) [xmax, 1 25Т0к > хтах;

[0,757ок, 0,757ок > 3а;

7 = I , , ок ,5)

2к [3а, 0,75% < 3а,

где хтах — максимальное значение интенсивности для полутонового изображения.

Алгоритм обнаружения инспектируемых объектов, основанный на адаптивных пороговых значениях, вычисляемых по формулам (4) и (5), обеспечивает максимальную вероятность обнаружения (99 %) при минимальной вероятности ложного обнаружения (менее 0,1 %), что подтверждается на практике и моделированием в среде МАТЬАБ. Оптимальное число дополнительных пороговых значений равно 2. Увеличение числа дополнительных пороговых значений незначительно улучшает качество селекции, при этом существенно возрастают требования к программно-аппаратной части системы обнаружения, что может привести к нарушению принципа обработки в реальном масштабе времени.

3. Формирование бинарных изображений

Бинарные изображения формируются с помощью базового Т0к и дополнительных Т1к и Т2к пороговых значений путем сравнения текущего значения пиксела разностного кадра с тремя пороговыми значениями. В результате на бинарных изображениях (рис. 2) единичными (истинными) будут пикселы, интенсивность которых превышает пороговое значение, все остальные пикселы будут нулевыми:

Г1, Ахк (т, п) > Тк;

Ъг (тп) = . , . т 1 = 0Л2, (6)

[0, Дхк (да, п) < Т&,

где Дхк (да, п) — к-я область разностного изображения.

4. Предварительная морфологическая обработка

Данная обработка заключается в операции «замыкание» на каждом бинарном изображении отдельно квадратным примитивом SQ:

Ъе1 (да, п) = ( (да, п) Ф SQ) © SQ, г = 0,1, 2. (7)

Морфологическая операция «замыкание» используется для объединения диффузных объектов на бинарных изображениях [2]. Ее смысл заключается в следующем: близкорасположенные на изображении объекты объединяются в одно целое путем заполнения про-

в нием Т2, То и Т соответственно

странства между ними единичными пикселами. Таким образом, площадь диффузных объектов увеличивается, что позволяет эффективно отфильтровать такие объекты на следующем этапе алгоритма.

Размер квадратного примитива выбирается исходя из предположения о возможном среднем расстоянии между двумя соседними диффузными объектами на бинарном изображении. При этом необходимо учитывать, что световозвращенные объекты могут располагаться вблизи диффузных объектов, и при объединении с последними выделить их будет невозможно. Квадратный примитив размером 3*3 пиксела наиболее предпочтителен при цифровой обработке.

5. Сегментация объектов на бинарных изображениях

После проведения морфологической операции «замыкание» над бинарными изображениями необходимо провести их сегментацию — выделить все связанные единичные области на изображениях [2]. Результатом сегментации будет получение набора объектов, для которых вычисляется ряд морфологических признаков: площадь £об объекта; отношение квадрата полупериметра р описанного вокруг объекта прямоугольника к площади объекта; соотношение длин сторон Ш/И этого прямоугольника и др.

6. Морфологическая обработка

На основании вычисленных на предыдущем этапе признаков проводится фильтрация объектов (рис. 3). Решение о принадлежности текущего объекта к классу инспектируемых принимается исходя из выполнения следующих условий:

• площадь £об объекта не превышает максимально допустимое значение £тах (определяется режимом работы системы обнаружения, а именно типом видеокамеры и расстоянием между системой обнаружения и видеокамерой);

• отношение квадрата полупериметра описанного вокруг объекта прямоугольника к площади объекта находится в диапазоне значений 4 < р V£об < 8;

• отношение сторон прямоугольника 0,5 < Ш/И < 2.

а б

7. Логическое умножение бинарных матриц

Операция логического умножения трех бинарных матриц, соответствующих одному разностному кадру, осуществляется по следующей формуле:

br (m, n) = bc0 (m, n) & bc1 (m, n) & bc2 (m, n). (8)

Морфологическая обработка приведет к удалению объектов на изображениях, не удовлетворяющих условиям на этапе 6. Таким образом, после логического перемножения трех бинарных изображений в итоговой матрице останутся только те объекты, которые присутствовали во всех трех исходных обработанных матрицах: bei (m, n), i = 0,1, 2 (рис. 4). Разработанный алгоритм на основе адаптивной пороговой обработки позволяет осуществить селекцию световозвра-

щенных бликов от диффузных с высокой вероятностью обнаружения (99 %) при незначительном числе ложных срабатываний (вероятность ложного обнаружения менее 0,1 %) в реальном масштабе времени.

Рис. 4. Результаты работы алгоритма обнаружения с графическим выделением обнаруженной видеокамеры с объективом типа pinhole: а — исходное разностное изображение; б — итоговое бинарное изображение

Таким образом, универсальность программно-аппаратной реализации алгоритма в макетном образце прибора обнаружения скрытых видеокамер позволяет совершенствовать его путем дальнейших экспериментальных исследований. Использованная платформа предоставляет широкие возможности по перестройке параметров алгоритма с минимальными временными затратами.

ЛИТЕРАТУРА

[1] Бокшанский В.Б., Карасик В.Е., Таранов М.А. Автоматическое обнаружение световозвращателей с помощью лазерных локационных систем. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение, 2011, № 2, с. 25-35.

[2] Гонсалес Р., Вудс Р. Цифровая обработка изображений. Москва, Техносфера, 2005, 1072 с.

Статья поступила в редакцию 03.07.2013

Ссылку на эту статью просим оформлять следующим образом: Бокшанский В.Б., Тэвун Е, Вязовых М.В., Литвинов И.С. Метод селекции све-товозвращающих объектов от диффузных с помощью цифровой адаптивной обработки. Инженерный журнал: наука и инновации, 2013, вып. 9. URL: http://engjournal.ru/catalog/pribor/optica/910.html

Бокшанский Василий Болеславович родился в 1969 г., окончил МГТУ им. Н.Э. Баумана в 1993 г. Канд. техн. наук, начальник сектора, доцент кафедры «Лазерные и оптико-электронные системы» МГТУ им. Н.Э. Баумана. Автор более 40 научных работ в области лазерной локации и оптико-электронных приборов и систем. e-mail: vassily@bmstu.ru

Е Тэвун родился в 1978 г., окончил МГТУ им. Н.Э. Баумана в 2008 г. Аспирант кафедры «Лазерные и оптико-электронные системы» МГТУ им. Н.Э. Баумана. Автор ряда научных работ в области лазерной локации и лазерных систем видения.

Вязовых Максим Вячеславович родился в 1976 г., окончил МГТУ им. Н.Э. Баумана в 2000 г. Канд. техн. наук, доцент кафедры «Лазерные и оптико-электронные системы» МГТУ им. Н.Э. Баумана. Автор более 20 научных работ в области лазерной локации и лазерных систем видения.

Литвинов Илья Сергеевич родился в 1987 г., окончил МГТУ им. Н.Э. Баумана в 2011 г. Аспирант кафедры «Лазерные и оптико-электронные системы» МГТУ им. Н. Э. Баумана. Автор ряда научных работ в области цифровой обработки изображений. e-mail: nightcreak@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.