Решетневские чтения. 2018
УДК 004.932
ВАРИАЦИОННЫЕ МОДЕЛИ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ*
М. Н. Фаворская
Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
Е-mail: [email protected]
Сегментация изображений применяется при обработке аэрофотоснимков, устранении размытия, обнаружении визуальных объектов и т. д. Вариационные модели обеспечивают точную, но медленную сегментацию. Рассматривается эволюция таких моделей.
Ключевые слова: сегментация изображений, вариационные модели.
VARIATIONAL MODELS OF IMAGE SEGMENTATION M. N. Favorskaya
Reshetnev Siberian State University of Science and Technology 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation Е-mail: [email protected]
Image segmentation is applied in many applications including aerial photos processing, image deblurring, visual object detection, among others. Variational models provide accurate but slow in computing segmentation. In this report, evolution of these models is considered during last decades.
Keywords: image segmentation, variational models.
Введение. Сегментация изображения как процедура разбиения изображения на непересекающиеся области часто применяется во многих задачах, связанных с обработкой изображений, например, аэрофотоснимков, при поиске объектов интереса на не-стабилизированных видеопоследовательностях, при устранении размытия и т. д. Впервые модель активных контуров была предложена в [1]. В настоящее время известны два типа таких моделей: модели, использующие контурную информацию, и модели, основанные на регионах. Модели активных контуров, анализирующие контурную информацию, требуют построения градиентных изображений и наличия условия останова движения контура. Такие модели чувствительны к исходным заданным кривым и шуму, что ограничивает их применение на практике. В моделях активных контуров, основанных на регионах, используется информация о регионах, что делает их более пригодными для сегментации изображений со слабо выраженными контурами и менее чувствительными к исходным заданным кривым. Рассмотрим эволюцию вариационных моделей сегментации, которая сложилась в течение двух последних десятилетий.
Эволюция вариационных моделей сегментации изображений. Одной из самых популярных моделей активных контуров на основе регионов считалась
модель Чан-Везе (СИап-\^е, СУ), которая вначале успешно применялась для сегментации однородных изображений с двумя регионами, а позже была расширена функциями множественных уровней [2]. Пусть О с Ш2 - изображение, а щ : О ^ Ш - заданный уровень серого. Модель СУ не использует информацию о градиентах. Основная идея заключается в нахождении такого уровня серого щ, который аппроксимирует интенсивности изображения внутри и снаружи контура C с точностью до констант ^ и с2. Энергия FCV(■) минимизируется по формуле
, <--\, ^ ) =
(1)
= | \ы0 (х)-^| dx +Х2 | (Х)-^| dx +v|C|,
outside(C) inside(C)
где inside(C) и outside(C) - регионы внутри и снаружи контура C, | С| - длина контура, Х1, Х2 и v - положительные константы.
Преимуществом модели СУ является нечувствительность к начальным условиям, однако такая модель использует только глобальную информацию и не может применяться для сегментации изображений с неоднородной интенсивностью. Аналогичный недостаток имеют более общие модели, основанные на кусочно-постоянных функциях.
Исследование выполнено при финансовой поддержке Российского фонда фундаментальных исследований, Правительства Красноярского края, Красноярского краевого фонда науки в рамках научного проекта: «Разработка методов и алгоритмов мониторинга диких животных и птиц на особо охраняемых природных территориях по визуальным данным».
Программные средства и информационные технологии
Отметим, что реальные изображения, как правило, имеют неоднородную интенсивность, и модели Чан-Везе являются малопригодными.
Позже была предложена модель масштабируемого сжатия регионов (Region-Scalable Fitting, RSF), которая использовала информацию о локальной интенсивности, но была чувствительная к начальным условиям, что ограничивало область ее применения [3]. Вместо двух констант c1 и c2 из выражения (1) использовались функции локального сжатия f и f>. Энергетическая функция PRSP имеет вид:
Frsf (Ф, f1, f ) = Ersf (ф, f1, f ) + vL (ф) + ^R (ф), (2)
где ф - функция уровня; v и ц - положительные константы; Е^Р(ф, f1, f2) - функция сжатия данных; v L(ф) - функция, определяющая длину дуги; ц R^) - функция, определяющая регуляризацию уровня.
Все функции в правой части выражения (2) являются интегралами, однако на практике они аппроксимируются более простыми выражениями. Функция сжатия данных ЕЖР(ф, f1, f2) строится с использованием Гауссианов, которые позволяют учитывать локальные неоднородности интенсивностей регионов изображения. Однако это может привести к попаданию функции (2) в локальные минимумы, иными словами модель RSF в большей степени зависит от инициализации контура.
В [4] была предложена энергетическая модель на основе сжатия локальной и глобальной интенсивно-стей (Local and Global Intensity Fitting, LGIF), объединившей преимущества модели CV и модели RSF. Модель LGIF более точно сегментирует изображения, однако для выбора баланса двух моделей необходимо выбрать подходящие весовые значения.
Метод разделения Брегмана (split Bregman method) представляет Ll-регуляризацию [5]:
min|ф(и) + H(и),... (3)
где | • |1 - Ll-норма, |Ф(-)|1 и H(-) - выпуклые функционалы.
Выражение (3) эквивалентно выражению с учетом L1- и L2-норм, а именно
min|d^ + H (u), d = Ф(и). (4)
Условия с ограничениями (4) можно переписать в виде условий без ограничений, добавив квадратичную штрафную функцию:
— 2 min dl + H (и )+—I \d -Ф(и )|| , (5)
и ,d I '1 2
где — - положительная константа, || • || - L2-норма.
Квадратичная штрафная функция в выражении (5) усиливает ограничение d = Ф(и), для чего константа
X должна принять максимально большое значение. Однако выполнение условия X ^ да затруднительно с вычислительной точки зрения. В этом случае значение X фиксируется и применяется итерационная процедура Брегмана с использованием дополнительного вектора b :
i k+1 j k+1 \ I U , d I =
л x и - - ц2 Л (6)
= arg mill I d + H (u )+ — d-Ф(и)-bk\ I,
и ,d I1 2" "J
bk+1 = bk +(ф(ик+1)-dk+1) . (7)
Итерационная процедура (6), (7) сходится при k ^ да, ||d-Ф(и)||^0, ||uk-u*|| ^ 0| ^ 0, где и* -
некоторое решение выражения (3).
Метод разделения Брегмана позволяет решить проблему сегментации изображений более эффективно по сравнению с применением CV, RSF и LGIF моделей. Однако ограничение, связанное с однородностью изображений, сохраняется.
Решением проблемы является улучшенная модель активных контуров, использующая локальную и глобальную информацию динамически, иными словами вводятся взвешенные локальные и глобальные функции сжатия. Затем используется итерационная процедура Брегмана, гарантирующая эффективную сегментацию визуальных объектов.
References
1. Kass M., Witkin A., Terzopoulos D. Snakes: active contour models. Int. J. Comput. Vis. 1988. Vol. 1, No 4. P. 321-331.
2. Vese L. A., Chan T. F. A multiphase level set framework for image segmentation using the Mumford and Shah model. Int. J. Comput. Vis. 2002. Vol. 50, No. 3. P. 271-293.
3. Li C., Kao C., Gore J. C., Ding Z. Minimization of region-scalable fitting energy for image segmentation. IEEE Trans. Image Process. 2008. Vol. 17, No. 10. P. 1940-1949.
4. Wang L., Li C., Sun Q., Xia D., Kao C. Active contours driven by local and global intensity fitting energy with application to brain MR image segmentation. J. Comput. Med. Imaging Graph. 2009. Vol. 33, No. 7. P. 520-531.
5. Goldstein T., Osher S. The split Bregman method for L1 regularized problems. SIAM J. Imaging Sci. 2009. Vol. 2, No. 2. P. 323-343.
© Фаворская М. Н., 2018