Научная статья на тему 'Сегментация изображений и селекция объектов на основе многопороговой обработки'

Сегментация изображений и селекция объектов на основе многопороговой обработки Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
577
77
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОПОРОГОВАЯ ОБРАБОТКА / СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ / СЕЛЕКЦИЯ ОБЪЕКТОВ / МЕТОД БИНАРНОГО ИНТЕГРИРОВАНИЯ / ВЕРОЯТНОСТНЫЕ МОДЕЛИ / MULTI-THRESHOLD PROCESSING / IMAGE SEGMENTATION / OBJECT SELECTION / BINARY INTEGRATION METHOD / STATISTICAL MODELLING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Волков В.Ю., Маркелов О.А., Богачев М.И.

Введение. Задачи обнаружения, выделения, селекции и локализации объектов различной формы на изображениях возникают в различных областях исследований. Ярким примером этого могут служить системы дистанционного радиовидения, использующие телевизионные и инфракрасные камеры, обзорные радиолокаторы с синтезированной апертурой, лазерные и акустические локаторы. При этом круг решаемых задач включает идентификацию объектов, слежение за ними, сопоставление и совмещение изображений от разнородных датчиков, индексацию и восстановление изображений. Цель работы. Разработка методики сегментации изображений и селекции объектов на них на основе многопороговой обработки. Материалы и методы. Методы сегментации классифицируют в соответствии с ключевыми элементами на изображении (пикселами, границами, областями и др.): методы пороговой оценки и кластеризации на уровне пикселов, методы обнаружения границ объектов, выделение областей и другие классификаторы, использующие непараметрические методы, машинное обучение, нейронные сети, нечеткие множества и т. д. Особенность предложенного подхода заключается в том, что выбор оптимального порога для селекции каждого объекта осуществляется с использованием апостериорной информации о результатах такой селекции. Результаты. Результаты работы предложенного метода селекции объектов по площади сравниваются с результатами, полученными с применением известного метода бинарного интегрирования. Сравнение проводилось как на модельных объектах заранее известной формы в условиях добавления синтезированного шума, так и на реальных изображениях, полученных при дистанционном зондировании поверхности Земли. Заключение. В статье обсуждаются достоинства и недостатки предложенного подхода для селекции объектов на изображениях, а также приводятся рекомендации по его применению.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Волков В.Ю., Маркелов О.А., Богачев М.И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IMAGE SEGMENTATION AND OBJECT SELECTION BASED ON MULTI-THRESHOLD PROCESSING

Introduction. Detection, isolation, selection and localization of variously shaped objects in images are essential in a variety of applications. Computer vision systems utilizing television and infrared cameras, synthetic aperture surveillance radars as well as laser and acoustic remote sensing systems are prominent examples. Such problems as object identification, tracking and matching as well as combining information from images available from different sources are essential. Objective. Design of image segmentation and object selection methods based on multi-threshold processing. Materials and methods. The segmentation methods are classified according to the objects they deal with, including (i) pixel-level threshold estimation and clustering methods, (ii) boundary detection methods, (iii) regional level, and (iv) other classifiers, including many non-parametric methods, such as machine learning, neural networks, fuzzy sets, etc. The keynote feature of the proposed approach is that the choice of the optimal threshold for the image segmentation among a variety of test methods is carried out using a posteriori information about the selection results. Results. The results of the proposed approach is compared against the results obtained using the well-known binary integration method. The comparison is carried out both using simulated objects with known shapes with additive synthesized noise as well as using observational remote sensing imagery. Conclusion. The article discusses the advantages and disadvantages of the proposed approach for the selection of objects in images, and provides recommendations for their use.

Текст научной работы на тему «Сегментация изображений и селекция объектов на основе многопороговой обработки»

Телевидение и обработка изображений Television and image processing

https://doi.org/10.32603/1993-8985-2019-22-3-24-35 УДК 004.931; 004.932

В. Ю. Волков1, О. А. Маркелов2 М. И. Богачев2

1 Санкт-Петербургский государственный университет аэрокосмического приборостроения ул. Большая Морская, д. 67, Санкт-Петербург, 190000, Россия

2Санкт-Петербургский государственный электротехнический университет "ЛЭТИ" им. В. И. Ульянова (Ленина) ул. Профессора Попова, д. 5, Санкт-Петербург, 197376, Россия

сегментация изображений и селекция объектов на основе многопороговой обработки

Аннотация.

Введение. Задачи обнаружения, выделения, селекции и локализации объектов различной формы на изображениях возникают в различных областях исследований. Ярким примером этого могут служить системы дистанционного радиовидения, использующие телевизионные и инфракрасные камеры, обзорные радиолокаторы с синтезированной апертурой, лазерные и акустические локаторы. При этом круг решаемых задач включает идентификацию объектов, слежение за ними, сопоставление и совмещение изображений от разнородных датчиков, индексацию и восстановление изображений.

Цель работы. Разработка методики сегментации изображений и селекции объектов на них на основе многопороговой обработки.

Материалы и методы. Методы сегментации классифицируют в соответствии с ключевыми элементами на изображении (пикселами, границами, областями и др.): методы пороговой оценки и кластеризации на уровне пикселов, методы обнаружения границ объектов, выделение областей и другие классификаторы, использующие непараметрические методы, машинное обучение, нейронные сети, нечеткие множества и т. д. Особенность предложенного подхода заключается в том, что выбор оптимального порога для селекции каждого объекта осуществляется с использованием апостериорной информации о результатах такой селекции.

Результаты. Результаты работы предложенного метода селекции объектов по площади сравниваются с результатами, полученными с применением известного метода бинарного интегрирования. Сравнение проводилось как на модельных объектах заранее известной формы в условиях добавления синтезированного шума, так и на реальных изображениях, полученных при дистанционном зондировании поверхности Земли. Заключение. В статье обсуждаются достоинства и недостатки предложенного подхода для селекции объектов на изображениях, а также приводятся рекомендации по его применению.

Ключевые слова: многопороговая обработка, сегментация изображений, селекция объектов, метод бинарного интегрирования, вероятностные модели

Для цитирования: Волков В. Ю., Маркелов О. А., Богачев М. И. Сегментация изображений и селекция объектов на основе многопороговой обработки // Изв. вузов России. Радиоэлектроника. 2019. Т. 22, № 3. С. 24-35. doi: 10.32603/1993-8985-2019-22-3-24-35

Источник финансирования. Работа выполнена при поддержке Российского Научного Фонда (исследовательский проект № 16-19-00172-П).

Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.

Статья поступила в редакцию 29.04.2019; принята к публикации 20.05.2019; опубликована онлайн 27.06.2019

© Волков В. Ю., Маркелов О. А., Богачев М. И., 2019

Контент доступен по лицензии Creative Commons Attribution 4.0 License This work is licensed under a Creative Commons Attribution 4.0 License

Vladimir Yu. Volkov1, Oleg A. Markelov2 H, Mikhail I. Bogachev2

1Saint Petersburg State University of Aerospace Instrumentation 67, Bolshaya Morskaya Str., 190000, St. Petersburg, Russia

2Saint Petersburg Electrotechnical University "LETI" 5, Professor Popov Str., 197376, St. Petersburg, Russia

image segmentation and object selection based on multi-threshold processing

Abstract

Introduction. Detection, isolation, selection and localization of variously shaped objects in images are essential in a variety of applications. Computer vision systems utilizing television and infrared cameras, synthetic aperture surveillance radars as well as laser and acoustic remote sensing systems are prominent examples. Such problems as object identification, tracking and matching as well as combining information from images available from different sources are essential. Objective. Design of image segmentation and object selection methods based on multi-threshold processing. Materials and methods. The segmentation methods are classified according to the objects they deal with, including (i) pixel-level threshold estimation and clustering methods, (ii) boundary detection methods, (iii) regional level, and (iv) other classifiers, including many non-parametric methods, such as machine learning, neural networks, fuzzy sets, etc. The keynote feature of the proposed approach is that the choice of the optimal threshold for the image segmentation among a variety of test methods is carried out using a posteriori information about the selection results. Results. The results of the proposed approach is compared against the results obtained using the well-known binary integration method. The comparison is carried out both using simulated objects with known shapes with additive synthesized noise as well as using observational remote sensing imagery.

Conclusion. The article discusses the advantages and disadvantages of the proposed approach for the selection of objects in images, and provides recommendations for their use.

Key words: multi-threshold processing, image segmentation, object selection, binary integration method, statistical modelling

For citation: Volkov V. Yu., Markelov O. A., Bogachev M. I. Image Segmentation and Object Selection Based on Multi-Threshold Processing. Journal of the Russian Universities. Radioelectronics. 2019, vol. 22, no. 3, pp. 24-35.

doi: 10.32603/1993-8985-2019-22-3-24-35

Acknowledgements. This work was supported by the Russian Science Foundation (research project № 16-19-00172- П).

Conflict of interest. Authors declare no conflict of interest.

Submitted 29.04.2019; accepted 20.05.2019; published online 27.06.2019

Введение. Задачи обнаружения, выделения, нением систем дистанционного наблюдения. Ос-

селекции и локализации объектов различной новной целью обработки данных мониторинга слу-

формы на изображениях возникают в различных жит извлечение информации из изображений и пре-

областях исследований. Ярким примером могут вращение содержимого сцены в знания. Снимки,

служить системы дистанционного радиовидения, получаемые в системах дистанционного наблюде-

использующие телевизионные камеры видимого ния, должны автоматически преобразовываться в

диапазона, инфракрасные камеры, обзорные ра- структурированную информацию, которая может

диолокаторы с синтезированной апертурой использоваться в сочетании с другими данными,

(SAR), лазерные и акустические локаторы. При часто - в рамках широко используемых географи-

этом круг решаемых задач включает идентифика- ческих ж^рмаддантгс отстт (ГИС) [2^ [3].

цию объектов, слежение за ними, сопоставление Объектам интереса, как правило, присуща

и совмещение изображений от разнородных датчи- болъшая юмшкгдасга и б°лее регулярная струк-

ков, индексацию и восстановление изображений [1]. тура чем фоновым. разнообразие и изменчивостъ

Современные условия ведения хозяйственной форм и текстур объектов, а также интенсивный

деятельности стимулируют исследования по нестационарный фон определяют сложность об-

классификации местности и акватории с приме- работки. Для областей объектов интереса обычно

характерны небольшие отношения сигнал/фон. Кроме того, зарегистрированное цифровое изображение может иметь низкое качество, малое число уровней квантования, изменчивый характер и нечеткие границы структур объектов, например естественных и искусственных структур (рек, дорог, мостов, зданий). В таких системах случайный фон сильно отличается от гаус-совского, плотности вероятности достаточно асимметричны, а их асимптотичекий вид характеризуется логнормальными или "загрязненными" нормальными (contaminated-normal) закономерностями. При ограниченной выборке однозначная идентификация таких плотностей затруднена.

Фон также может содержать элементы, структурно похожие на сигналы. Такой характер фона практически исключает применение известных методов адаптивной пороговой обработки ввиду отсутствия однородных областей, пригодных для получения оценок. Неправильное формирование порогов может привести к потере полезных объектов на самой ранней стадии. Другой проблемой становится низкое качество формируемых изображений, наличие пятен, размытые границы; кроме того, изображения SAR страдают от серьезного внутреннего спекл-шума [4].

В современных системах дистанционного наблюдения часто интегрируются данные от различных источников в рамках специализированных ГИС, что обусловливает актуальность раннего перехода от исходного растрового к структурированному (объектному или признаковому) представлению изображений.

В традиционных схемах сегментации используются признаки, выделяемые из исходного изображения, которые только косвенно учитывают свойства объектов интереса. В частности, широко используются свойства гистограммы исходного изображения, а также свойства границ. С другой стороны, результаты последующей селекции объектов практически не используются для сегментации [5]-[13]. Следует также отметить, что в классическом определении сегментация изображения предусматривает отнесение каждого пикселя к единственной области. Однако при селекции объектов возможно их наложение, и тогда некоторые пиксели могут принадлежать нескольким объектам одновременно.

При сегментации изображения на отдельные объекты наиболее часто используемыми признаками являются однородность некоторого пара-

метра, например интенсивности в целом или в одном из цветовых каналов. Региональные методы часто основаны на предположении, что соседние пикселы в пределах одного изолированного региона имеют близкие значения классифицирующего параметра, например интенсивности [5].

Существует большое разнообразие методов сегментации объектов для различных приложений анализа изображений не только в системах дистанционного наблюдения, но и в других системах анализа данных, например при микроскопической и биомедицинской визуализации [14], [15].

Подробный обзор современных методов сегментации изображений приведен в [5], где выделены четыре категории, каждая из которых основана на своем ключевом элементе: 1) пикселях; 2) границах; 3) областях; 4) другом. К первой категории относятся методы пороговой обработки и кластеризации, ко второй - детекторы границ. Третья категория включает в себя метод водораздела, разделение и слияние, наборы уровней и активные контуры. Оставшаяся четвертая категория касается использования вейвлетов, нейронных сетей и нечетких множеств.

Разнообразие доступных методов создает проблему выбора наилучшего алгоритма для решения задачи в условиях априорной неопределенности. Оно также усложняет воспроизводимость результатов, учитывая количество свободных входных параметров, которые устанавливаются пользователем и часто выбираются субъективно.

Каждый метод имеет свои возможности учета априорной информации об объектах интереса. Методы, основанные на свойствах областей, например эволюция фрактальной сети (Fractal Net Evolution Approach - FNEA), и методы, основанные на теории графов (Graph methods), доминируют при создании компактных областей поддержки объектов используемых масштабов. Методы с использованием графов представлены четырьмя базовыми алгоритмами: наилучшего слияния (Best Merge -BM), минимального связующего дерева (Minimum Spanning Tree - MST), минимального среднего разреза (Minimum Mean Cut - MMC) и нормализованного разреза (Normalized Cut - NC) [5].

Существует два подхода к формированию областей объектов. Один из них (bottom-up approach) основан на слиянии более мелких объектов в более крупные, для чего используется, в частности, свойство однородности (BM и MST). Другой метод (top-down approach), напротив, рассматривает

исходное изображение как первоначальный единый сегмент с последующей его фрагментацией на отдельные части (MMC, NC).

Указанные подходы конструктивны для сегментации изображений, полученных системами дистанционного зондирования (лазерными локаторами, SAR, мульти- и гиперспектральными, панхроматическими и т. д.). Однако им присущи и существенные ограничения. В первую очередь, это сложность вычислительных процедур, связанная с решением задач оптимизации, и требование высокого быстродействия вычислителей, поскольку часто число конструируемых объектов оказывается большим. Кроме того, получаемые с помощью указанных методов результаты существенно зависят от выбора начальных точек в последовательности итераций, что часто приводит к зависимости решения от изменения начальных условий.

Влияние указанных факторов можно снизить, если в большей мере учитывать специфику селектируемых объектов, вводить обучение, а также комбинирование разных методов для преодоления недостатков каждого из них [8]—[10]. В конечном счете, все рассматриваемые методы сводятся к организации пикселов изображения в некоторые многомасштабные иерархические структуры, которые позволяют селектировать объекты с использованием разных критериев. Задача состоит в том, чтобы сделать такую структуру более прозрачной и упростить ее применение.

Таким образом, в традиционных схемах сегментации используются признаки, выделяемые из исходного изображения, и лишь косвенно учитываются свойства объектов интереса. В частности, широко используются свойства изображения, зависящие от способа их формирования: гистограммы исходного изображения, свойства границ областей сегментации (перепадов интенсивности) и контуров отдельных объектов. С другой стороны, при сегментации практически не учитываются результаты последующей селекции объектов.

Многопороговая обработка. В настоящей статье рассмотрены методы сегментации с применением многопороговой обработки. Такая обработка преобразует исходное монохромное изображение в набор бинарных сечений (срезов). В случае достаточно большого числа порогов можно считать, что потери информации при такой трансформации отсутствуют. В то же время бинарные изображения обрабатываются легче и быстрее, чем многоуровневые.

При объединении полученных бинарных срезов учитываются особенности изменений области, занятой каждым объектом, при возрастании порогового уровня. В результате формируется трехмерная иерархическая структура, в которой каждый объект занимает некоторый объем. В некоторых случаях отдельный пиксел на изображении может принадлежать нескольким объектам. Дальнейшая селекция проводится с использованием различных геометрических критериев. Результаты селекции объектов при каждом значении порога могут использоваться для адаптации пороговых уровней и для результирующей сегментации изображения.

Различные варианты применения многопороговой обработки в целях сегментации изображений рассмотрены в многочисленных работах (см., например, [1], [9]—[13]). Многопороговая сегментация базируется в основном на свойствах гистограммы интенсивности исходного изображения. В большинстве случаев последним шагом становится выбор единственного (глобального) оптимального порогового значения, тогда как для каждого объекта часто требуется установить свой (локальный) порог. Свойства объектов интереса и результаты их селекции при этом никак не учитываются.

Для реализации селекции необходимо описание ожидаемых свойств объектов. Основными предположениями являются связность пикселов в области объекта интереса и изолированность одного объекта от другого. Как правило, существует острая нехватка информации об объектах, за исключением типичного размера и некоторых предположений относительно площади, периметра, формы и ориентации.

Альтернативная идея заключается в выборе и установке оптимального порогового значения по критерию максимума гистограммы числа объектов и/или суммарной площади, занятой объектами, попадающими в заданный диапазон площадей, по результатам предварительной селекции объектов для множества тестовых пороговых значений. Этот подход предложен в работах [14], [15] для селекции мелкомасштабных объектов. Он эффективен при наличии на анализируемых изображениях множества однотипных объектов, когда выбор наилучшего порога опирается на достаточную статистику. Напротив, в условиях малых выборок предпочтительным оказывается анализ гистограммы суммарных площадей.

Развитие этой идеи связано с учетом формы селектируемых объектов. В том случае, когда описанная методика не позволяет однозначно выбрать

наилучшим порог, простеишим вариантом служит выбор одного из близких по значению локальных экстремумов гистограммы. При этом в качестве дополнительного критерия выступает дополнительный геометрический параметр объекта, например отношение квадрата периметра к его площади или отношение квадрата главной оси описывающего эллипса к площади объекта. Предлагаемый метод нашел применение, в частности, для селекции определенных типов клеток на микроскопических изображениях биологических срезов [16], [17].

Дальнейшее развитие описанного подхода изложено в настоящей статье и включает в себя оценивание геометрических параметров объектов на всех бинарных изображениях после многопороговой обработки и селекции их по заданному геометрическому признаку. В дальнейшем выбор оптимального порогового значения осуществляется в соответствии с экстремумом оцениваемого параметра.

Далее рассмотрен метод селекции объектов по площади. Примененный метод подробно проанализирован на тестовых изображениях и на изображениях, регистрируемых дистанционными системами наблюдения.

Селекция объектов по площади. При применении такой селекции считается, что основное свойство, отличающее объект интереса от шумового фона, - это связность смежных пикселов на бинарном изображении Iт. Рассмотрим сначала пороговую обработку с помощью глобального порога.

Структура алгоритма селекции объектов по площади приведена на рис. 1. Фильтр Е осуществляет предварительное сглаживание входного изображения в целях устранения импульсных помех. Квантователи формируют М бинарных слоев, полученных с использованием порогов

Тт, т = 1, М, анализируемые группой из к каналов. Каждый канал настроен на свой диапазон

площадей изолированных объектов Sk, k = 1, K

и включает преселектор таких объектов и счетчик, подсчитывающий число выделенных объектов и входящих в них пикселов. В результате адаптации для каждого канала выбирается свое пороговое значение Ттк, т. е. свой бинарный

срез, на котором объекты, имеющие площадь в заданном диапазоне, селектируются наилучшим образом. Среди полученных канальных результатов выбирается результат, содержащий максимальное число пикселов, отнесенных к объектам. Номер канала и значение порога передаются в выходной селектор, передающий соответствующее этим параметрам изображение на выход.

На рис. 2 представлена модель тестового монохромного зашумленного изображения с размерами 256 х 256 пикс. Изображение содержит прямоугольные объекты с размерами 20 х 8, 20 х 16, 20 х 32 и 20 х 64 пикс., площадь наименьшего объекта равна 160 пикс.

Для характеристики отличия объектов от фона введем понятие отношения сигнал/шум по контрасту. Контраст определяется как разность средней яркости пикселов, принадлежащих объектам и фону: К = Воб - Вф. Тогда отношение сигнал/шум по контрасту имеет вид й = К/ ст, где о - среднеквадрати-ческое отклонение шума. Объекты на тестовом изображении рис. 2 в каждом сигнальном пикселе имеют малое отношение сигнал/шум й=1.163, соответствующее Вф = 110, Воб = 145, ст = 30.

На рис. 3 показаны результаты однопорого-вой селекции связных объектов с учетом удаления мелких объектов при трех значениях пороговых уровней: высоком Т = 130 (а), среднем Т = 123 (в) и низком Т = 109 (г). Псевдоцветом обозначено значение площади селектируемого объекта. Псевдоцветами (полутонами) на рис. 3, а, в, г показана площадь объектов (количество отнесенных к ним пикселов).

Рис. 1. Алгоритм селекции объектов по площади Fig. 1. Algorithm of selection of objects by area

Рис. 2. Тестовое монохромное зашумленное изображение Fig. 2. Test monochrome noisy image

При снижении порога (рис. 3, в) наблюдается присоединение фоновых пикселов, прилежащих к границам, к объектам. Формирующиеся отростки разрастаются, а затем соседние объекты сливаются, образуя конгломераты. В таком случае число полезных объектов может уменьшиться. Наряду с этим в фоновой области возможно появление ложных объектов, площадь которых оказывается сравнимой с площадью полезных объектов. Зависимость числа выделенных объектов от значения порога приведена на рис. 3, б.

На рис. 3 заметны два вида искажения формы объектов: потеря пикселов в области объекта и добавление лишних пикселов по его границам. При высоких значениях порога, необходимых для малого числа ложных объектов, проявляется в основном потеря пикселов полезными объектами.

64

128

192

64

128

192

T = 123

T = 109

г

Рис. 3. Однопороговое выделение связных объектов прямоугольной формы Fig. 3. Selection of connected rectangular objects using single threshold

в

При малых отношениях сигнал/шум полезные объекты претерпевают существенные деформации границ, которые приобретают фрактальный вид. Это приводит к достаточно заметному увеличению периметра таких связных фрагментов.

Оптимальный порог должен обеспечить приемлемое сохранение формы полезных объектов, известной априори. В частности, можно потребовать примерного равенства числа пикселов, потерянных внутри объекта, и числа пикселов, присоединенных на его границе. В этом случае оптимальный порог не соответствует максимуму от-селектированных объектов заданной площади, а несколько смещен в сторону более высоких значений. Так, на рис. 3 условие примерного равенства потерянных и присоединенных пикселов выполнялось при Т = 130 (рис. 3, а), в то время как максимальное число объектов достигалось при значении Т = 109 (рис. 2, г).

Если рассмотреть наименее благоприятный случай, когда значения интенсивностей в пикселах изображения взаимно независимы, то в предположении однородности фона в пределах объекта интереса можно рассчитать эффективность обнаружения данного объекта на заданной площади S, включающей п пикселов. Если порог бинаризации достаточно высок, то можно пренебречь малым числом фоновых пикселов, присоединяемых к объекту на его границах. Тогда объект интереса обнаруживается на фоне в присутствии шума фиксацией к превышений порога из п возможных в области 5 и сравнения статистики к с порогом счета т (метод бинарного интегрирования) [17].

Метод бинарного интегрирования состоит в суммировании числа превышений порога в пределах скользящего окна заданных размеров. При каждом положении скользящего окна статистика к распределена по биномиальному закону. Вероятность достижения или превышения порога кТ статистикой к дается известной формулой

Р (к > кТ )=^Скпрк (1 - ?)П-к , (1)

к=т

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где С^ - биномиальные коэффициенты; р - вероятность превышения порога в каждом пикселе. В области шума р = рд, в области объекта р = Р1, причем полагается, что р > р0. При достаточно больших п биномиальное распределение можно

аппроксимировать гауссовским и ввести дефлек-цию решающей статистики

йк = 4п (Р1 - Р0 ))Р0 (1 - Р0)

как отношение смещения математического ожидания яркости в пределах объекта к среднеквад-ратическому значению шума. При бинарном интегрировании статистика к имеет математическое

ожидание т = пр и дисперсию ст2 = пр (1- р).

Таким образом, в области объекта меняется как математическое ожидание, так и дисперсия решающей статистики.

При селекции объектов по площади возможно существенно снизить вероятность р0 и соответственно уменьшить порог бинаризации для достижения прежней вероятности ложной тревоги. При этом значения р1 в области объекта селекции возрастают, в результате чего повышается эффективность обработки. Однако при этом статистика к уже не подчиняется биномиальному распределению, поскольку селектируются лишь связные объекты, а их число существенно меньше, чем число сочетаний из п по к.

По аналогии со случаем бинарного интегрирования вероятность достижения или превышения порога кТ статистикой к можно записать в виде

Р (к > кТ )= ±вкпрк (1 - р)п-к, к =кТ

где Вп - коэффициенты, значения которых определяют число связных объектов, состоящих из к пикселов на площади в п пикселов. К настоящему времени значения этих коэффициентов определены только для одномерной модели и малой площади объектов п < 9 [18].

Сравнительный анализ методов. Трудности расчетов вероятностей по формуле (1) препятствуют определению точного значения порога счета кТ. Однако сделать это можно с помощью адаптации. Для адаптивной установки порога применяется селекция объектов по площади с учетом ограничений на искажения формы объектов. Для контроля за формой объектов и их границ могут быть использованы различные формализованные признаки, среди которых следует отметить

меру компактности области [1] Р$ = Р' где

Р - периметр объекта, 5 - его площадь.

Результаты моделирования представлены на рис. 4. Тестовое изображение (рис. 4, а) содержит 49 квадратных объектов размером 16*16 пикс. на фоне гауссовского шума. На рис. 4, б показана зависимость числа селектируемых объектов от значения порога. Результаты селекции по площади представлены на рис. 4, в (5"т;п = 120 пикс.), а

результаты обнаружения объектов методом бинарного интегрирования - на рис. 4, г. Отношение сигнал/шум по контрасту в каждом пикселе равно й = 1.163. При селекции объектов по площади приемлемое искажение границ объектов достигается при значениях порога, превышающих Т = 135. При меньших значениях порога форма объектов существенно искажается фрактальным шумом, который разрушает границы. Как видно из рис. 4, г, оптимальный с точки зре-

ния помехоустойчивости метод бинарного интегрирования весьма существенно искажает форму объектов, тогда как при использовании предлагаемого подхода наблюдается удовлетворительное воспроизведение формы исходных объектов.

На рис. 5 представлены результаты селекции объектов по площади на кадре телевизионного аэроизображения (а), зависимость числа связных объектов от значения порога (б) и результаты селекции объектов по площади при нескольких значениях порога: Т = 94 (рис. 4, в), 128 (рис. 4, г), 145 (рис. 4, Э) и 154 (рис. 4, е). Количество выделенных объектов составляет = 40, 33, 31 и

28 соответственно. Псевдоцветами (полутонами) отображена площадь объектов в пикселах. Рис. 5, в соответствует максимальному числу выделяемых связных объектов.

64

128

192

N.

T = 135

в

19— 17— 15— 13— 119

71

5

3 l'

Рис. 4. Результаты моделирования выделения объектов Fig. 4. The results of modeling the selection of objects

128

192

Ps —

г

N.

obj

30

20

10

N

64

128

192

64 128 192

Ps —

64

128 192

64

128

192

64

128

192:

Ps —

21 —

17—

13-

T = 94, Nobj= 40

T = 128, Nobj = 33

64 128 192 x

64

128

192

T = 145, Nobj = 31

Ps-13119

7-

64 128 192 x

l1

64

128

192

T = 154, Nobj = 28

д е

Рис. 5. Селекция объектов по площади на кадре телевизионного аэроизображения Fig. 5. Selection of objects by area on the frame of the television aerial image

Ps

21—

16-

m

0

T

б

а

0

0

x

x

9

5

1

в

г

0

0

5

6

3

С увеличением порога удается повысить разрешение объектов (см. рис. 5, г), но при этом менее интенсивные объекты исчезают. Если объекты изолированы, то после селекции каждый из них локализуется, т. е. определяются координаты его центра, а также другие параметры формы и текстуры.

Недостатком селекции по площади является необходимость задания параметра площади в абсолютных значениях (в пикселах), что затруднительно при изменении масштаба изображения. Этот метод плохо работает в случае неоднородного фона, который может давать ложные объекты, сравнимые по площади с объектами интереса (см. рис. 5, в и г).

Заключение. Предложен подход, основанный на предварительной многопороговой обработке

изображения и селекции изолированных объектов в бинарных слоях с последующим выбором оптимального порога, осуществляемого по результатам селекции. Таким образом, за счет использования результатов селекции для установки порога удается улучшить характеристики как сегментации изображения в целом, так и селекции объектов по ряду критериев, в частности сохранения формы селектируемых объектов, за счет использования апостериорной информации. Платой за это служит большая вычислительная сложность процедуры многопороговой обработки, что отчасти может быть компенсировано простотой алгоритма и возможностью его параллельной реализации.

СПИСОК ЛИТЕРАТУРЫ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера. 2005. 1104 с.

2. Blaschke T. Object based image analyses for remote sensing // ISPRS J. of Photogrammetry and Remote Sensing. 2010. Vol. 65, iss. 1. P. 2-16. doi: 10.1016/j.isprsjprs.2009.06.004

3. Towards a (GE)OBIA 2.0 Manifesto-achievements and open challenges in information & knowledge extraction from big earth data / S. Lang, A. Baraldi, D. Tiede, G. Hay, T. Blaschke // GEOBIA'2018, Montpellier, 18-22 June, 2018. Basel: MDPI AG. P.

4. Gao G. Statistical modeling of SAR images: A survey // Sensors. 2010. Vol. 10, № 1. P. 775-795. doi: 10.3390 /s100100775

5. Zhou W. Troy A. An object-oriented approach for analyzing and characterizing urban landscape at the parcel level // Int. J. of Remote Sensing. 2008. Vol. 29, № 11. P. 3119-3135. doi: 10.1080/01431160701469065

6. An efficient parallel multi-scale segmentation method for remote sensing imagery / H. Gu, Y. Han, Y. Yang, H. Li, Z. Liu, U. Soergel, T. Blaschke, S. Cui // Remote Sensing. 2018. Vol. 10, № 4. P. 590(1-18). doi: 10.3390/rs10040590

7. Fast and accurate online video object segmentation via tracking parts / J. Cheng, Y. Tsai, W. Hung, S. Wang, M. Yang // Proc. of the 2018 IEEE Conf. on Computer Vision and Pattern Recognition. 18-23 June 2018, Salt Lake City. Piscataway: IEEE, 2018. P. 7415-7424. doi: 10.1109/CVPR. 2018.00774

8. Wang M. A. Multiresolution remotely sensed image segmentation method combining rainfalling watershed algorithm and fast region merging // Int. Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. 2008. Vol. XXXVII. Pt. B4. P. 1213-1217.

9. Multilevel thresholding for image segmentation through a fast statistical recursive algorithm // S. Arora, J. Acha-rya, A. Verma, P. K. Panigrahi // Pattern Recognition Letters. 2008. Vol. 29, iss. 2. P. 119-125. doi: 10.1016/j.patrec. 2007.09.005

10. Multi-threshold image Segmentation based on K-means and firefly algorithm // J. Yang, Y. Yang, W. Yu, J. Feng, J. Yang // Proc. of 3rd Int. Conf. on Multimedia Technology (ICMT-13). Paris: Atlantis Press, 2013. P. 134142. doi: 10.2991/icmt-13.2013.17

11. Multi level fuzzy threshold image segmentation method for industrial applications / P. Priyanka, K. Vasu-devarao, Y. Sunitha, B. A. Sridhar // IOSR J. of Electronics and Communication Engineering (IOSR-JECE), 2017, Vol. 12, iss. 2, Ver. III. P. 06-17. doi: 10.9790/2834-1202030617

12. Banimelhem O., Yahya A. Y. Multi-thresholding image segmentation using genetic algorithm // Proc. IPCV, 1619 July 2012, Las-Vegas, Las-Vegas: CSREA, 2012. URL: http://worldcomp-proceedings.com/proc/p2011 /IPC8346.pdf (дата обращения 11.06.2019)

13. Multithreshold segmentation by using an algorithm based on the behavior of locust swarms. Hindawi Publishing Corporation / E. Cuevas, A. González, F. Fausto, D. Zaldívar, M. Pérez-Cisneros // Mathematical Problems in Engineering. Vol. 2015. Art. ID 805357 (1-25). doi: 10.1155/2015/805357

14. Volkov V. Extraction of extended small-scale objects in digital images // The ISPRS Archives. 2015. Vol. XL-5/W6. P. 87-93. doi: 10.5194/isprsarchives-XL-5-W6-87-2015

15. Selection and quantification of objects in microscopic images: from multi-criteria to multi-threshold analysis / M. Bogachev, V. Volkov, G. Kolaev, L. Chernova, I. Vishnyakov, A. Kayumov // Bionanoscience. 2019. Vol. 9, iss. 1. P. 59-65. doi: 10.1007/s12668-018-0588-2 (дата обращения 11.06.2019)

16. Клюев Н. Ф. Обнаружение импульсных сигналов с помощью накопителей дискретного действия. М.: Сов. радио. 1963. 111 с.

17. Волков В. Ю. Адаптивное выделение мелких объектов на цифровых изображениях // Изв. вузов России. Радиоэлектроника. 2017. № 1. С. 17-28.

Волков Владимир Юрьевич - доктор технических наук (1993), профессор кафедры радиотехнических систем Санкт-Петербургского государственного университета аэрокосмического приборостроения. Автор 200 научных работ. Сфера научных интересов - обработка изображений в системах технического зрения; решение задач приема в условиях априорной неопределенности. E-mail: vladimi-volkov@yandex.ru

Маркелов Олег Александрович - кандидат технических наук (2014), доцент кафедры радиотехнических систем Санкт-Петербургского государственного электротехнического университета "ЛЭТИ" им. В. И. Ульянова (Ленина). Автор более 50 научных работ. Сфера научных интересов - статистический анализ временных рядов. https://orcid.org/0000-0002-6099-8867 E-mail: OAMarkelov@etu.ru

Богачев Михаил Игоревич - кандидат технических наук (2006), доцент (2011), ведущий научный сотрудник кафедры радиотехнических систем Санкт-Петербургского государственного электротехнического университета "ЛЭТИ" им. В. И. Ульянова (Ленина). Автор 150 научных работ. Сфера научных интересов -теория сложных систем, статистический анализ данных. https://orcid.org/0000-0002-0356-5651 E-mail: rogex@yandex.ru

1. Gonsales R., Vuds R. Tsifrovaya obrabotka izobra-zhenii [Digital image processing]. Moscow, Tekhnosfera, 2005, 1104 p. (In Russ.)

2. Blaschke T. Object Based Image Analyses for Remote Sensing. ISPRS J. of Photogrammetry and Remote Sensing. 2010, vol. 65, iss. 1, pp. 2-16. doi: 10.1016/j.isprsjprs.2009.06.004

3. Lang S., Baraldi A., Tiede D., Hay G., Blaschke T. Towards a (GE)OBIA 2.0 Manifesto-Achievements and Open Challenges in Information & Knowledge Extraction from Big Earth Data. GEOBIA'2018, Montpellier, 18-22 June, 2018. Basel: MDPI AG. P.

4. Gao G. Statistical Modeling of SAR Images: A Survey. Sensors. 2010, vol. 10, no 1, pp. 775-795. doi: 10.3390 /s100100775

5. Zhou W., Troy A. An Object-Oriented Approach for Analyzing and Characterizing Urban Landscape at the Parcel Level. Int. J. of Remote Sensing, 2008, vol. 29, no. 11, pp. 3119-3135. doi: 10.1080/01431160701469065

6. Gu H., Han Y., Yang Y., Li H., Liu Z., Soergel U., Blaschke T., Cui S. An Efficient Parallel Multi-Scale Segmentation Method for Remote Sensing Imagery. Remote Sensing. 2018, vol. 10, no. 4, pp. 590(1-18). doi: 10.3390/rs10040590

7. Cheng J., Tsai Y., Hung W., Wang S., Yang M. Fast and Accurate Online Video Object Segmentation via Tracking Parts / // Proc. of the 2018 IEEE Conf. on Computer Vision and Pattern Recognition. 18-23 June 2018, Salt Lake City. Piscataway, IEEE, 2018, pp. 7415-7424. doi: 10.1109/CVPR. 2018.00774

8. Wang M. A. Multiresolution Remotely Sensed Image Segmentation Method Combining Rainfalling Watershed Algorithm and Fast Region Merging. Int. Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. 2008, vol. XXXVII, Pt. B4, pp. 1213-1217.

9. Arora S., Acharya J., Verma A., Panigrahi P.K. Multilevel thresholding for image segmentation through a fast statistical recursive algorithm. Pattern Recognition Letters. 2008, vol. 29, iss. 2, pp. 119-125. doi: 10.1016/j.patrec. 2007.09.005

10. Yang J., Yang Y., Yu W., Feng J., Yang J. Multi-Threshold Image Segmentation based on K-means and Firefly Algorithm. Proc. of 3rd Int. Conf. on Multimedia Technology (ICMT-13). Paris: Atlantis Press, 2013, pp. 134-142. doi: 10.2991/icmt-13.2013.17

11. Priyanka P., Vasudevarao K., Sunitha Y., Sridhar B. A. Multi Level Fuzzy Threshold Image Segmentation Method for Industrial Applications. IOSR J. of Electronics and Communication Engineering (IOSR-JECE), 2017, vol. 12, iss. 2, ver. III, pp. 06-17. doi: 10.9790/2834-1202030617

12. Banimelhem O., Yahya A. Y. Multi-Thresholding Image Segmentation using Genetic Algorithm. Proc. IPCV, 16-19 July 2012, Las-Vegas, Las-Vegas: CSREA, 2012. URL: http://worldcomp-proceedings.com/proc/p2011/IPC8346.pdf (accessed 11.06.2019)

13. Cuevas E., González A., Fausto F., Zaldívar D., Pé-rez-Cisneros M. Multithreshold Segmentation by Using an Algorithm Based on the Behavior of Locust Swarms. Hindawi Publishing Corporation. Mathematical Problems in Engineering, vol. 2015, art. ID 805357 (1-25). doi: 10.1155/2015/805357

14. Volkov V. Extraction of Extended Small-Scale Objects in Digital Images. The ISPRS Archives. 2015, vol. XL-5/W6, pp. 87-93. doi: 10.5194/isprsarchives-XL-5-W6-87-2015

15. Bogachev M., Volkov V., Kolaev G., Chernova L., Vishnyakov I., Kayumov A. Selection and Quantification of Objects in Microscopic Images: from Multi-Criteria to Multi-Threshold Analysis. Bionanoscience. 2019, vol. 9, iss. 1, pp. 59-65. doi: 10.1007/s12668-018-0588-2

16. Klyuev N. F. Obnaruzhenie impul'snykh signalov s pomoshch'yu nakopitelei diskretnogo deistviya [Detection of Pulse Signals Using Discrete Action Drives.]. Moscow, Sov. Radio, 1963, 111 p. (In Russ.)

17. Volkov V. Yu. Adaptive Extraction of Small Objects in Digital Images. Journal of the Russian Universities. Ra-dioelectronics. 2017, no. 1, pp. 17-28. (In Russ.)

Vladimir Yu. Volkov - Dr. of Sci. (Engineering) (1993), Professor (1995) of the Department of Radio Engineering Systems of Saint Petersburg Electrotechnical University "LETI. The author of 200 scientific publications. Area of expertise: image processing in computer vision systems; reception under a priori uncertainty conditions. E-mail: vladimi-volkov@yandex.ru

Oleg A. Markelov - Cand. of Sci. (Engineering) (2014), Associate Professor of the Department of Radio Engineering Systems of Saint Petersburg Electrotechnical University "LETI". The author of more than 50 scientific publications. Area of expertise: statistical analysis of time series. https://orcid.org/0000-0002-6099-8867 E-mail: OAMarkelov@etu.ru

Mikhail I. Bogachev - Cand. of Sci. (Engineering) (2006), Associate Professor (2011), Leading Scientist of the Department of Radio Equipment Systems of Saint Petersburg Electrotechnical University "LETI". The author of 150 scientific publications Area of expertise: complex systems theory; statistical data analysis. https://orcid.org/0000-0002-0356-5651 E-mail rogexi@yandex.ru

Книжные новинки

УДК 539.23

ББК З 843.324.1 + З 843.371 П38

Авторы: Минжулина Е. А., Козин А. А., Смирнов В. В., Шаповалов В. И.

Пленки оксинитридов

под ред. В. И. Шаповалова

СПб.: Изд-во СПбГЭТУ "ЛЭТИ", 2018. 180 с. ISBN 978-5-7629-2388-0

Выполнен анализ публикаций, посвященных пленкам оксинитридов переходных металлов. Изложены основные особенности осаждения пленок. Значительное внимание уделено методам реактивного распыления. Приведены результаты экспериментальных исследований химического состава, кристаллической структуры, электрических и других свойств пленок.

Издание предназначено научным работникам и инженерам, чья работа связана с осаждением пленок, а также студентам и аспирантам соответствующих специальностей.

i Надоели баннеры? Вы всегда можете отключить рекламу.