Научная статья на тему 'Определение границ объектов полутонового изображения'

Определение границ объектов полутонового изображения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
329
51
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
полутоновое изображение / переменная разрешающая способность / клеточные комплексы. / grayscale image / variable resolution / cellular complexes.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — В. Г. Калмыков, А. В. Шарыпанов

Полутоновое изображение содержит информацию об объекте интереса. Свободная от объекта интереса часть изображения относится к фону. Известные методы распознавания, в частности, статистические методы, предусматривают обработку всей площади изображения. Если фон непредсказуемо меняется, то качество обработки и распознавания такого изображения становится проблематичным, поскольку граница, отделяющая объект интереса от фона, заранее неизвестна. Задача определения границ объектов интереса на полутоновых изображениях, при неоднородном фоне и в условиях воздействия помех, с целью дальнейшего использования этих результатов в задачах распознавания является актуальной. Определение границ объектов в зрительной системе человека происходит незаметно, на подсознательном уровне, даже при значительном количестве помех, что обусловлено наличием механизма переменной разрешающей способности в зрительной системе человека. Представлены обзор и анализ известных методов определения границ объектов полутонового изображения. В работе рассмотрены метод, алгоритм для определения границ объектов полутонового изображения, которое представлено как дискретная реализация неизвестной кусочно-гладкой функции. Для адекватного воспроизведения изображения оно представлено в виде клеточных комплексов. Это дает возможность представить границы объектов как одномерные линии без толщины, что, в свою очередь, позволяет точно отразить мельчайшие детали формы объекта при заданной разрешающей способности. При обработке изображения используется переменная разрешающая способность, что обеспечивает возможность автоматической обработки изображения при наличии помех и без предварительного определения их параметров. Приведены результаты экспериментов по определению границ объектов полутонового изображения в сравнении с результатами, которые получены при использовании известных методов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — В. Г. Калмыков, А. В. Шарыпанов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A grayscale image contains information about an object of interest. Part of the image, free from the object of interest, belongs to background. Known methods of recognition, in particular, statistical methods involve processing the entire area of image. If the background changes unpredictably, processing and recognition quality of such image becomes problematic because the boundary, that separates the object of interest from background, is unknown. The task of object boundaries detection in grayscale images, with heterogeneous background and in the presence of noise with the purpose of further use of these results in recognition problems is urgent. Detection of object boundary in human visual system happens imperceptible, at a subconscious level, even with a high level of noise, which is caused by variable resolution mechanism in human visual system. The paper considers the method and the algorithm for detection of objects boundaries in grayscale images that are presented as discrete implementations of an unknown piecesmooth functions. For adequate presentation the image is considered as a set of cellular complexes, which makes it possible to reproduce the boundaries of objects as one-dimensional lines without thickness, which, in turn, allows to accurately display the smallest details of the object shape at a given resolution. Variable resolution is used in image processing, which enables automatic image processing in the presence of noise without first specifying its parameters. The results of object boundaries detection experiments in a grayscale image are presented in comparison to the results obtained using known methods.

Текст научной работы на тему «Определение границ объектов полутонового изображения»

https://orcid.org/0000-0001-8928-182X https://orcid.org/0000-0001-6804-0533

УДК 004.02

В.Г. КАЛМЫКОВ*, А.В. ШАРЫПАНОВ*

ОПРЕДЕЛЕНИЕ ГРАНИЦ ОБЪЕКТОВ ПОЛУТОНОВОГО ИЗОБРАЖЕНИЯ

'Институт проблем математических машин и систем НАН Украины, г. Киев, Украина_

Анотаця. Швтонове зображення м1стить тформацт про об 'ект интересу. Вшъна eid об 'екта интересу частина зображення вiдноситься до фону. Вiдомi методи розтзнавання, зокрема, статистичн методи, передбачають оброблення yciei площi зображення. Якщо фон непередбачувано змiнюеться, то яюсть оброблення та розтзнавання такого зображення стае проблематичною, осктьки межа, що вiдокремлюе об 'ект ттересу вiд фону, заздалегiдь невiдома. Задача визначення меж об 'ектiв ттересу на твтонових зображеннях, при неоднорiдному фон та в умовах впливу завад, з метою подальшого використання цих результатiв у задачах розтзнавання е актуальною. Визначення меж об 'ектiв у зоровт системi людини вiдбуваеться непомтно, на пiдсвiдомому рiвнi, навть при значнт кiлькостi завад, що зумовлено наявтстю мехатзму змiнноi роздтьно1 здатностi у зоровт системi людини. Представлено огляд та аналiз вiдомих методiв визначення меж об'ектiв твтонового зображення. У роботi розглянутi метод, алгоритм для визначення меж об'ектiв твтонового зображення, яке представлене як дискретна реалiзацiя невiдомоi кусково-гладког' функцп. Для адекватного вiдтворення зображення воно представлене у виглядi клтинних комплекав, що даеможливiсть вiдтворювати межi об 'ектiв як одновимiрнi лти без товщини, що, у свою чергу, дозволяе точно вiдобразити найменшi деталi форми об 'екта при задант роздшьнт здатностi. При обробленн зображення застосовуеться змтна роздшьна здаттсть, що забезпечуеможливiсть автоматичного оброблення зображення при наявностi завад без попереднього визначення ix параметрiв. Наведен результати експериментiв щодо визначення меж об 'ектiв твтонового зображення у порiвняннi зрезультатами, як отриман при використанн вiдомиx методiв.

Ключов1 слова: твтонове зображення, змтна роздшьна здаттсть, к^тинн комплекси.

Аннотация. Полутоновое изображение содержит информацию об объекте интереса. Свободная от объекта интереса часть изображения относится к фону. Известные методы распознавания, в частности, статистические методы, предусматривают обработку всей площади изображения. Если фон непредсказуемо меняется, то качество обработки и распознавания такого изображения становится проблематичным, поскольку граница, отделяющая объект интереса от фона, заранее неизвестна. Задача определения границ объектов интереса на полутоновых изображениях, при неоднородном фоне и в условиях воздействия помех, с целью дальнейшего использования этих результатов в задачах распознавания является актуальной. Определение границ объектов в зрительной системе человека происходит незаметно, на подсознательном уровне, даже при значительном количестве помех, что обусловлено наличием механизма переменной разрешающей способности в зрительной системе человека. Представлены обзор и анализ известных методов определения границ объектов полутонового изображения. В работе рассмотрены метод, алгоритм для определения границ объектов полутонового изображения, которое представлено как дискретная реализация неизвестной кусочно-гладкой функции. Для адекватного воспроизведения изображения оно представлено в виде клеточных комплексов. Это дает возможность представить границы объектов как одномерные линии без толщины, что, в свою очередь, позволяет точно отразить мельчайшие детали формы объекта при заданной разрешающей способности. При обработке изображения используется переменная разрешающая способность, что обеспечивает возможность автоматической обработки изображения при наличии помех и без предварительного определения их параметров. Приведены результаты экспериментов по определению границ объектов полутонового изображения в сравнении с результатами, которые получены при использовании известных методов.

Ключевые слова: полутоновое изображение, переменная разрешающая способность, клеточные комплексы.

© Калмыков В.Г., Шарыпанов А.В., 2019 ISSN 1028-9763. Математичш машини i системи, 2019, № 4

Abstract. A grayscale image contains information about an object of interest. Part of the image, free from the object of interest, belongs to background. Known methods of recognition, in particular, statistical methods involve processing the entire area of image. If the background changes unpredictably, processing and recognition quality of such image becomes problematic because the boundary, that separates the object of interest from background, is unknown. The task of object boundaries detection in grayscale images, with heterogeneous background and in the presence of noise with the purpose offurther use of these results in recognition problems is urgent. Detection of object boundary in human visual system happens imperceptible, at a subconscious level, even with a high level of noise, which is caused by variable resolution mechanism in human visual system. The paper considers the method and the algorithm for detection of objects boundaries in grayscale images that are presented as discrete implementations of an unknown piece-smooth functions. For adequate presentation the image is considered as a set of cellular complexes, which makes it possible to reproduce the boundaries of objects as one-dimensional lines without thickness, which, in turn, allows to accurately display the smallest details of the object shape at a given resolution. Variable resolution is used in image processing, which enables automatic image processing in the presence of noise withoutfirst specifying its parameters. The results of object boundaries detection experiments in a grayscale image are presented in comparison to the results obtained using known methods. Keywords: grayscale image, variable resolution, cellular complexes.

DOI: 10.34121/1028-9763-2019-4-52-64

1. Введение

Объем данных, в частности, в виде визуальной информации и сигналов [1—4], которые используются в информационных системах различного назначения, постоянно увеличивается. Для решения текущих задач в составе информационных систем должны быть средства обработки визуальной информации и сигналов, в частности, средства распознавания изображений.

Под изображением понимают часть (кусок) поверхности плоскости, содержащую визуальную информацию об объекте интереса. Свободная от объекта интереса часть изображения относится к фону. Без существенного ограничения общности полутоновое изображение может быть представлено как некоторая кусочно-гладкая функция яркости, определенная на куске плоскости, ограниченной прямоугольником.

Традиционно методы обработки и распознавания изображений и сигналов базируются на принципах теории математической статистики. Согласно этим методам, изображению или сигналу поставлен в соответствие многомерный вектор, компонентами которого являются значения яркостей пикселей. Яркости - компоненты векторов, считаются взаимно независимыми случайными величинами. В определенных случаях статистические методы распознавания позволяют получить удовлетворительный результат.

Но все же предположение о статистической независимости компонентов векторов не соответствует действительности, поскольку значения пикселей представляют собой реализации некоторой кусочно-гладкой функции, соответствующей изображению, а, значит, являются взаимно зависимыми.

Известные методы распознавания, в частности, статистические методы, предусматривают использование всей площади изображения. Если фон непредсказуемо меняется, то качество обработки и распознавания такого изображения становится проблематичным, поскольку граница, отделяющая объект интереса от фона, заранее неизвестна.

Многие парадигмы распознавания требуют, чтобы границы объекта на изображении были определены и он находился в заранее определенном месте в поле изображения, но этап выделения части поля зрения, в которой должен располагаться объект, рассматривается отдельно, как инженерный прием перед распознаванием.

Таким образом, задача определения границ объектов интереса на изображении среди неравномерного фона и помех является актуальной.

Целью статьи является публикация нового метода и алгоритма определения границ объектов, которые могут быть использованы специалистами при создании новых технологий обработки изображений.

2. Известные методы

Одним из известных и общепринятых является метод активных контуров [5] и его реализация - змейка (snake) [6]. Функция, моделирующая контур, изменяется, стремясь достичь минимума собственной энергии (гладкости контура) и минимума несоответствия контура (функция изображения). Метод требует начальной инициализации (как правило, 3-5 точек) и в итерационном процессе рассчитывает производные и градиенты функции яркости изображения по его дискретной реализации. Идея алгоритма заключается в деформации контура с целью размещения внутри его пикселей объекта. С помощью метода активных контуров находят границы объекта на изображениях в том случае, если начальная граница объекта задается пользователем или другим способом, возможно, автоматизированным. Точки контура стремятся к границе объекта при минимизации энергии контура. Для каждой отметки в окрестностях значение энергии находится как

E =aEmt(v,) + 0Eext (v, ^

где Eint (у,) - функция энергии, зависящая от формы контура, а Eext (v,) - функция энергии, зависящая от свойств изображения и типа градиента в окрестности точки, v,, а и в являются константами, которые обеспечивают относительную коррекцию величин энергии.

Недостаток применения метода в автоматизированных системах заключается в необходимости определения коэффициентов а и в, поскольку они корректируются оператором. Также оператор определяет и вид функций энергии внутри контура и за его пределами. На основе данного метода разработаны алгоритмы для выделения контуров объектов различной природы.

Для определения границ объектов на изображении часто используют метод Канни [4, 7]. Для исходного изображения V = {v(m, n) | m = 1,M; n = 1, N} выполняют операцию размытия изображения с использованием фильтра Гаусса для снижения уровня помех, исключения мелких деталей и елементов текстуры изображения:

g (m, n) = G(a) * v(m, n),

где G(a) - фильтр Гаусса для значения среднеквадратичного отклонения а ; g(m, n) - элемент размытого изображения Vg .

Вычисляют частные значения градиентов для горизонтального gm (m, n) и вертикального gn (m, n) направлений на размытом изображении g(m, n), используя, например, оператор Собеля, чтобы получить значения полного градиента M (m, n) и его направления. По значениям M(m, n), с использованием порога T, который должен быть подобран так, чтобы все контурные элементы были выделены, в то время как большинство помех были бы исключены, получают значения MT (m, n) :

fM(m, n), если M(m, n) > T MT (m, n) = \ .

[ 0, в другом случае

Для повышения качества работы метода используют два порога T1 и T2, причем T1 < T2. Если пиксель v(m, n) со значением T < MT (m, n) < T2 имеет в направлении

градиента в(т, п) два соседних пикселя, для каждого из которых Мт (т, п) > Т2, его значение как контурного элемента сохраняется, а если нет, то приравнивается 0 .

Недостатки метода Канни:

- результатом его работы есть границы объектов в виде последовательностей точек, но пиксель является двумерным образованием, в то время как граница объекта представляется как линия, в частности, ломаная линия без толщины;

- результат обработки изображения методом Канни зависит от переменного параметра фильтра Гаусса с, который имеет значение среднеквадратичного отклонения для нормального закона распределения вероятности. В первоисточнике не представлено никаких рекомендаций относительно выбора его значения.

3. Изображение

Полутоновое изображение является аналоговым объектом и может быть представлено как некоторая функция яркости г = / (х, у), аргументы которой определены на сегментах [0, X ] и [0, У], которые соответствуют границам прямоугольника изображения. Яркость г определена на сегменте [0, Я].

В результате пространственной дискретизации и квантования яркости изображение представлено в виде двумерного массива целых чисел, определяющих яркость в каждой точке дискретизированного изображения: к = /(т, п), т е [1,М], п е [1, N], к е [0, К].

Частным случаем полутонового изображения является бинарное изображение. Для бинарного изображения К = 1, то есть яркость пикселей приобретает только два значения.

Под бинарным изображением понимают некоторое множество компактно расположенных на ограниченном сегменте плоскости пикселей квадратной формы, яркость которых может принимать два значения, причем яркости пикселей, образующих объект интереса, имеют одно и то же значение, так же, как и яркости пикселей фона имеют одинаковое значение, отличное от яркости пикселей объекта.

Одной из важнейших задач обработки изображений является кодирование контура объекта интереса бинарного изображения как односвязной замкнутой последовательности граничных элементов объекта в изображении.

Контур объекта изображения - это замкнутая кривая, которая делит изображение на две части: собственно объект и другая часть изображения. Традиционно для бинарного дискретизированного изображения используют пиксели объекта как элементы контура, граничные с пикселями фона, или, наоборот, пиксели фона, граничные с пикселями объекта. Чтобы построить из граничных точек односвязную замкнутую последовательность, соответствующую контуру объекта изображения, должно быть определено понятие их связности - соседство пикселей.

Недостатки традиционного подхода связаны с тем, что в данном случае методы классической математики, развитые для непрерывного евклидова пространства, используются для дискретного точечного пространства, для представления изображений в цифровом виде. Определение линии вообще и линии контура, в частности, используемое в математическом анализе, основывается на представлениях непрерывного топологического пространства. Основным свойством такого пространства является то, что окрестность каждой точки пространства содержит бесконечно большое количество точек этого же пространства. Дискретное точечное пространство изображения состоит из изолированных точек. Дискретное точечное пространство используется для приближенного представления непрерывных изображений, но при этом следует учитывать возможность влияния необоснованной подмены непрерывного топологического пространства дискретным точечным пространством.

Кривая линия в непрерывном пространстве, как следует из ее определения, не имеет толщины. То есть каждая из бесконечно большого множества точек, образующих линию,

является бесконечно малой величиной. Это относится и к замкнутой кривой линии контура (границы) объекта. В то же время в традиционно используемом представлении о кривой линии в дискретном пространстве предполагается, что кривая состоит из минимальных элементов этого пространства - пикселей минимальных элементов изображения, которые имеют не бесконечно малые, а конечные размеры.

Корректное представление изображений в дискретном пространстве требует использования других теоретических представлений о дискретизированном изображении.

3.1. Изображение как клеточный комплекс

Существует много проблем при анализе изображений, которые не могут быть решены в базисе классической геометрии Евклида. Причина заключается в том, что классическая геометрия была создана в предположении, что каждая точка пространства содержит в своей окрестности бесконечное множество точек, какой бы малой ни была эта окрестность. В соответствии с топологическими основами классической геометрии даже самая маленькая окрестность каждой точки содержит бесконечно большое количество других точек. Таким образом, классическая геометрия не имеет средств для обработки дискретных изображений, которые являются множеством изолированных точек, достаточно малые окрестности которых не содержат точек вообще, кроме самой изолированной точки. Но тогда классическая геометрия может описывать дискретное изображение очень приблизительно, с точностью до наименьших пространственных элементов.

Для описания изображения было предложено использовать математический аппарат абстрактных клеточных комплексов [8, 9].

Под абстрактным клеточным комплексом С = (Е, В, &ш) понимают множество Е абстрактных елементов (клеток), находящихся в антисимметричном, иррефлексивном и транзитивном бинарном отношении В ^Е х Е, которое называется граничным отношением, с функцией размерности : Е ^ I с Е на множестве I неотрицательных целых чисел, таких, что &ш(е') < &ш(е") для всех пар (ее") е В . Если (а, Ь) е В , то обычно считают а < Ь или говорят, что клетки а ограничивают клетки Ь . Такие клетки называются инцидентными друг другу.

Примером и частным случаем клеточного комплекса является декартов двумерный клеточный комплекс [10], который используется для представления дискретизированного изображения.

2-мерные клетки поставлены в соответствие пикселям - клеткам решетки. 1-мерные клетки - креки - ограничивают 2-мерные клетки. 0-мерные клетки ограничивают 1 -мерные клетки.

При описании объекта в изображении атрибутами 0-клетки являются ее координаты. Атрибутами 1 -мерной клетки являются координаты ее начала и направление 5 (5 = 0 -вверх, 1 - вправо, 2 - вниз, 3 - влево).

Атрибутами 2-мерной клетки являются координаты ее граничной 0-клетки, ближайшей к началу координат, а также значение яркости соответствующего пикселя изображения. Каждая 2-мерная клетка соответствует пикселю изображения, ограничена четырьмя 1 -мерными клетками - крэками и четырьмя 0-клетками - точками. Каждая 1 -клетка ограничена двумя 0-клетками.

Важнейшей характеристикой объекта изображения является его контур. Контур объекта изображения при представлении его как клеточного комплекса является замкнутой последовательностью 0-мерных клеток и 1 -мерных клеток. Таким образом, описание полутонового изображения как декартова клеточного комплекса содержит множества 0-мерных клеток, 1 -мерных клеток и 2-мерных клеток. Эти множества могут быть представлены в памяти компьютера как отдельные массивы.

4. Структурная модель полутонового изображення

В рамках структурной модели [11] полутоновое изображение рассматривается как отображение неизвестной функции двух переменных, которая задает кусочно-гладкую поверхность. Объекты в поле зрения - это куски гладкой поверхности. Проекции контуров кусков поверхности совпадают с областями определения неизвестных функций, задающих куски поверхности, и являются контурами объектов в поле зрения. Объектами, образующими фон, будем называть объекты в поле зрения, контуры которых частично или полностью совпадают с границами изображения. К возможным объектам интереса могут быть отнесены объекты в поле зрения, не имеющие общих границ с границами изображения. Каждому значению пары координат соответствует одно и только одно значение функции р(х, у), то есть перпендикуляр к плоскости изображения в любой точке (х, у) пересекает поверхность один и только один раз.

С поверхностью в пространстве, которой соответствует полутоновое изображение, совмещена решетка N х М, и для каждого пикселя изображения в пределах его площади определено среднее значение яркости р(п, т), р(п, т) е [0, Я -1], п е [0, N -1], т е [0,М -1].

Будем рассматривать вертикальные и горизонтальные строки пикселей, а точнее, последовательности значений яркости этих строк. Последовательность р(п, т), п е [0, N — 1] при каждом фиксированном т образует горизонтальную строку и соответствует функции рт (х). Последовательность р(п, т) ; т е [0,М — 1] при каждом фиксированном п образует вертикальную строку и соответствует функции рп (у). Согласно

представлениям изображения как двумерного клеточного комплекса, выделение регулярных и особых точек регулярных поверхностей может быть рассмотрено как поиск особых крэков - вертикальных для горизонтальных строк и горизонтальных - для вертикальных строк.

5. Определение особых точек (крэков) функции яркости по ее дискретной реализации

Кривая, соответствующая последовательности значений яркости строк изображения, определяется некоторой функцией у = / (х) , х е[а, Ь]. Эта функция является кусочно-гладкой, если она имеет конечное число разрывов непрерывности на [а, Ь], и сегмент может быть разделен точками на конечное число N сегментов так, что функция у = /(х) имеет непрерывные производные, одновременно не равные нулю на каждом сегменте. Феномен выделения отдельных сегментов графика по своей природе является актом зрительного восприятия. Разрывы непрерывности кривой или ее градиента визуально идентифицируются человеком, а информация о них используется для принятия решений. Сегментация изображений (выделение контуров объектов), вероятно, имеет ту же природу, что и сегментация графиков.

Если в качестве аппроксимирующей функции избраны сплайны, то такая функция задается в виде последовательности полиномов:

у=/ (1)(х) | < х < а / (2)(х) | & < х < а..., /1-Чх) | 1 < х < tN), где/(х) 1(1 п < х < ) = а0п)хк + а^хк-1 +... + а^х + акп).

То есть, для определения кусочно-гладкой функции необходимо определить множество предельных точек Т = {¿0, }, в которых происходит разрыв

непрерывности, и их количество N +1.

В классическом определении непрерывности функции в форме «£-3» утверждается, что если для каждого £ > 0 существует такое 3£) > 0, то для каждого

значения переменной х из 3 -окрестности точки с значение функции / (х) относится к £-окрестности /(с) (рис. 1). Эквивалентное ему определение утверждает, что для непрерывной функции бесконечно малым приращениям аргумента соответствуют бесконечно малые приращения функции.

Непосредственно из этих определений можно вывести алгоритм установления непрерывности функции в точке: начиная с некоторого значения окрестности аргумента | х1 - с | окрестность точки с, последовательно уменьшаясь, приближается к 0:

(| х1 - с |>| х 2 - с |,| х2 - с |>| х3 - с |, ...).

/(х) считается непрерывной в точке с, если в то же время окрестность /(с), уменьшаясь, также приближается к 0:

(| /(х) - /(с) |>| /(х2) - /(с) |, | /(х2) - /(с) |>| /(х3) - /(с) | ,...).

То есть, для анализа непрерывности функции в точке используется переменная окрестность точки [12].

Определения непрерывности, которые успешно используются для анализа непрерывности функции в математическом анализе, не могут быть применены к анализу экспериментальных кривых. Экспериментальные кривые являются реализациями соответствующих неизвестных функций, заданных в виде упорядоченной последовательности измерений. В свою очередь, упорядоченная последовательность измерений является множеством точек в некотором дискретном пространстве.

Как было исследовано, при изучении зрительной системы человека и животных [13, 14] размеры зон возбуждения рецептивных полей нейронов сетчатки глаза в каждый момент времени определяют разрешение зрительной системы. Во время зрительного акта в зрительной системе обработка изображения в поле зрения происходит с различными разрешениями, последовательно меняющимися от минимального («грубого», размытого изображения) до максимального (четкого изображения). Уменьшение размера зоны возбуждения рецептивного поля нейрона зрительной системы во время зрительного акта может рассматриваться как уменьшение окрестности некоторой точки в центре рецептивного поля. Процесс, подобный проверке условия непрерывности в точке в математическом анализе, повторяется в зрительной системе человека и животных во время каждого зрительного акта. Существенное отличие выделения границ объектов в поле зрения при разной разрешающей способности в зрительной системе от анализа непрерывности функции в точке в математическом анализе состоит в том, что элементы рецептивного поля являются объектами дискретного пространства. Но в начале зрительного акта зона возбуждения рецептивного поля состоит из большого количества точек (рецепторов), и пока множество рецепторов в зонах возбуждения рецептивных полей не является пустым, применение определения непрерывности к функции яркости, которая определена в дискретном пространстве рецепторов, не противоречит классической теории непрерывности функций.

Феномен, который наблюдается в зрительной системе человека и высших животных, может быть использован в качестве прототипа для нового метода обработки сигналов с

0 V

с-О с С+О х Рисунок 1 - Непрерывность функции в форме «,■; , 1»

использованием концепции переменной разрешающей споособности. Задача отыскания разрывов непрерывности функции по ее дискретной реализации при переменном разрешении может быть изложена следующим образом: на отрезке [а, Ь] наблюдается реализация неизвестной функции у = /(х), определенной на этом отрезке. Исходя из предположения, что существующая реализация функции является представлением неизвестной кусочно-гладкой функции, необходимо определить границы частичных сегментов функции a = г0 < гх <... < tN = Ь и их количество N +1. Значение разрешения, при котором надо рассматривать реализацию этой функции и при котором может быть выполнен анализ непрерывности этой функции с ее реализацией, неизвестно.

Аналитическое решение задачи сегментации рассматривается как отыскание точек разрыва непрерывности неизвестной кусочно-гладкой функции. Рассматриваются разрывы непрерывности функции, когда е -окрестность значений функции является пустой, и разрывы непрерывности градиента функции. Поскольку наблюдается только дискретная реализация этой функции, для анализа можно использовать только дискретный аналог разрыва непрерывности, а именно, оценку положения особых точек функции по ее дискретной реализации.

Реализация функции может восприниматься как непрерывная или как имеющая разрыв непрерывности при рассмотрении его с различными разрешениями. Размер конечных пространственных интервалов или конечных промежутков времени, через которые происходят измерения, характеризуют разрешение реализации изображения.

Во время рассмотрения изображения при различных разрешениях окрестность аргумента состоит из дискретных элементов пространства. Их количество определяет разрешение, значение дискретной реализации из окрестности аргумента используется для нахождения аппроксимированного значения в точке, характеризующей данную окрестность при данном разрешении. Точки разрыва непрерывности tj неизвестной кусочно-гладкой

функции, устанавливающие границы областей определения ее кусков и которые должны быть отысканы во время выполнения сегментации дискретной реализации функции, являются математическими точками. Согласно п. 3.1, это одномерные объекты, или крэки. Поэтому разрыв непрерывности функции по ее дискретной реализации устанавливается не относительно точки измерения, а между двумя соседними значениями дискретной реализации функции - в минимальной окрестности аргумента.

Поскольку при рассмотрении значений дискретной реализации функции окрестность значений реализации функции также не может стать бесконечно малой, необходимо указать разницу между значениями, при не превышении которой реализация неизвестной функции будет восприниматься как непрерывная:

\Уi-Ум| < d, (1)

где < - определенный порог. Если неизвестная функция имеет разрыв непрерывности в определенной точке, то, начиная с определенной разрешающей способности, на ее дискретной реализации в окрестности этой точки будет обнаружено резкое изменение в последовательности значений сигнала (превышение порога), которое не будет исчезать при дальнейшем увеличении разрешения. Увеличение разрешения соответствует уменьшению количества дискретных элементов сигнала, которые образуют окрестность точки, и характеризует разрешение. Таким образом, анализ непрерывности неизвестной функции в точке можно рассматривать как поиск пар соседних точек дискретных реализаций функции, полученных при различных разрешениях, для которых нарушается условие (1) в минимальной окрестности точки. Поскольку каждый такой ответ получен при своем значении разрешения сигнала, все ответы должны быть пересчитаны для (максимального) разрешения входного сигнала. В таком виде ответы для всех разрешений

могут быть рассмотрены совместно для определения окончательного ответа по сегментации функции яркости по ее дискретной реализации.

6. Эксперименты с модельными сигналами и изображениями

Для описанных ниже экспериментов был взят набор полутоновых модельных (искусственно созданных) изображений и реальных полутоновых изображений из Б8Б8300 - базы данных изображений для проверки и оценки алгоритмов сегментации университета Беркли, Калифорния [15]. Одномерные сигналы были получены как дискретные реализации функций яркости строк изображения. Поиск разрывов непрерывности и разрывов градиента в виде локальных экстремумов выполнялся с применением алгоритма, который был создан опираясь на метод поиска разрывов непрерывности кусочно-гладкой функции по ее дискретной реализации (п. 5).

Этот алгоритм предназначен для определения точек разрыва непрерывности и разрыва непрерывности градиента кусочно-гладкой функции (сегментации сигнала), например, функции яркости строки полутонового изображения у = /(х) , определенной на интервале [а, Ь], по ее дискретной реализации при переменной разрешающей способности. Под дискретной реализацией понимают, как и раньше, последовательность пар отсчетов (хi, yi), I = 1, I, х1 = а, х1 = Ь . На область определения наложена сетка с шагом (интервалом) г, значение которого устанавливается и изменяется во время работы алгоритма. Каждый интервал содержит одинаковое количество отсчетов q, которое определяет разрешение. Количество интервалов J, соответствующих области определения функции, определяет количество «грубых» отсчетов при данном разрешении. Для каждого

интервала г у = 1, J. По последовательности значений отсчетов

™1 = {Уку-1)+1, Уд< у-1)+2,..., Уч-и-х)+ч}, входящих в этот интервал, вычисляют значения

«грубого» отсчета 2 у = g^у) . Все значения «грубых» отсчетов формируют дискретную

реализацию функции 2(т) при данном разрешении т , т = 1, М , где М - общее количество разрешений, используемых при решении определенной задачи с помощью данного алгоритма.

Под событием будем понимать определение возможного разрыва непрерывности функции у = /(х), то есть случай, когда | 2у - 2у+х |> ё, где d - определенный порог. Событие относится к границе между двумя «грубыми» отсчетами у и у +1, характеризуется соответствующим «точным» отсчетом i(3 у = у • q и интервалом «точных» отсчетов 5(у) = [q • (у -1) +1, q • (у +1)], на котором зафиксировано событие. Чтобы достичь наилучшего совпадения возможного разрыва непрерывности функции с границей «грубых» отсчетов, используют наложение п = 1, N сеток интервала г (то есть одного разрешения), сдвинутых друг относительно друга. Сеткой «грубых» отсчетов сигнала называется последовательность интервалов наблюдений сигнала без пропусков. В алгоритме принято N = 3 , поэтому начало каждого интервала сдвинуто на 3 г для сеток с номерами, отличающимися на

1. Каждому наложению сетки п соответствует список событий {/'(у)}п и список интервалов «точных» отсчетов {5(у)}п, на которых эти события зафиксированы. Элементы списков {5(')}п и {5( 1 )}п+1 характеризуют то же событие, когда | £пу) - ^+) |= 3 г. Списки интервалов «точных» отсчетов для всех значений п последовательно объединяют в один список

N

{s(m)} = ^J {s(j)}n , где m - текущее разрешение. Список {s(m)} считается ответом по сегмен-

n=1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

тации при разрешении т . Количество элементов в списке т)} равно К(т). Списки {^(т)} и {т+1)} будем считать соответствующими, если они находятся в однозначном соответствии, то есть К(т) = К(т+1)

и s

( m+1)

с s^m), где к = 1, K

(m)

О 50 100 150 200 250 300

Рисунок 2 - Дискретная реализация функции яркости некоторой строки модельного

изображения, искаженного помехами

6.1. Определение границ объектов на модельных изображениях

Ранее было показано, что значение яркостей пикселей вдоль строки полутонового изображения можно рассматривать как дискретную реализацию функции яркости этой строки (рис. 2), то есть как функцию одной переменной. При этом особые крэки строки изображения ставятся в соответствие точкам разрыва непрерывности функции одной переменной.

1\

О

э-э-

a.1

О ао® ® Ф Qgs se 0@ ®

# о-о-

О—1 0-0-

О-О— о— о— -

0-0---0~з—о— о--

О-----Отэ—te- С---.

С------S-t3—С---I

О-------cr-g----о----

с-------сяа----s----I

с----------с---О----

50

100 150 200 250 300

б.1

50 100 150 200 250 300

100 150 200 250 300

300 250 200 150 100 50 0

50 100 150 200 250 300

Рисунок 3 - Сегментация функции по ее искаженной помехами дискретной реализации алгоритмом, использующим переменную разрешающую способность: (а) - нахождение разрывов непрерывности функции; (б) - нахождение локальных экстремумов

На графике (рис. 3) по оси абсцисс отложены номера дискретных отсчетов. По оси ординат на графиках рис. 3 а, б отложены измеренные значения сигнала (яркости) на каждом отсчете, а на графиках рис. 3 а.1-б.1 - номера разрешений в последовательности разрешений, при которых выполнялась сегментация. Каждая горизонтальная линия на рис.

3 а.1-б.1 соответствует интервалам дискретных отсчетов сигнала, в пределах которых возможен разрыв непрерывности функции (рис. 3 а.1) или разрыв непрерывности ее градиента (рис. 3 б.1) при каждом разрешении. На рис. 3 а.1 горизонтальными линиями черного цвета обозначены резкие изменения - скачки - от большего к меньшему значениям, серыми пунктирными линиями - скачки от меньшего к большему значениям. На рис. 3 б.1 горизонтальными линиями черного цвета обозначены интервалы, где может находиться локальный минимум функции, а серыми пунктирными линиями - интервалы, где могут находиться ее локальные максимумы. Подмножество разрешений, по которому формируется решение, обозначено на соответствующих графиках толстыми вертикальными линиями черного цвета. Информация о наличии локальных экстремумов, полученная при низких разрешениях (рис. 3 б), позволила исключить из рассмотрения интервалы, на которых локальные экстремумы были найдены при больших разрешениях из-за влияния помех.

На рис. 4 приведены результаты сегментации функции по их дискретной реализации предложенным алгоритмом, использующим переменную разрешающую способность.

Рисунок 4 - Результат сегментации функции яркости строки модельного изображения с помехами по ее дискретной реализации

6.2. Определение границ объектов на реальных полутоновых изображениях

Во время экспериментов с реальными полутоновыми изображениями, в соответствии со

структурной моделью, границы объектов определялись как линии разрыва непрерывности кусочно-гладкой

поверхности, которая поставлена в соответствие полутоновому изображению. Согласно строчной модели изображения каждая строка, горизонтальная и вертикальная, представлялась как дискретная реализация функции яркости строки, для которой выполнялся поиск разрывов непрерывности при переменном разрешении.

В методе Канни значение порогов Т1 и Т2,

Тх < Т2 рассчитывались автоматически для размытого изображения при каждом значении а. Если при а = 1 результат определения границ объектов был неудовлетворительным, значение а постепенно увеличивалось.

Реальные полутоновые изображения (рис. 5) были взяты из BSDS300. В BSDS300 также содержатся примеры результатов определения границ объектов и сегментации для каждого алгоритма, который принимал участие в тестировании. Результаты определения границ объектов на изображении (рис. 5 а) при заданном пороге алгоритмом с переменной разрешающей способностью представлены на рис. 5 б. Для сравнения на рис. 5 в приведен первый лучший результат сегментации этого изображения алгоритмами, которые принимали участие в тестировании университета Беркли. Результаты определения границ объектов на изображении рис. 5 а методом Канни при различных значениях а представлены на рис. 5 г. Анализ рис. 5 г во всех трех случаях свидетельствует о том, что даже при постепенном подборе параметра а в результате определения границ объектов все равно остаются лишние детали. Алгоритм определения границ объектов с переменной разрешающей способностью показал автоматическое отсеивание несущественных деталей в поле зрения. Даже при применении строчной модели изображения предложенный алгоритм позволяет получить в рассматриваемом случае удовлетворительные результаты.

£7 = 1 <7 = 1,7 (7 = 4

Рисунок 5 - Определение границ объектов на изображении (а) предложенным методом (б), алгоритмом из BSDS300 (в) и методом Канни для разных значений а (г)

7. Выводы

Применение метода и алгоритма с переменной разрешающей способностью позволило получить удовлетворительные результаты при определении границ объектов интереса на полутоновых изображениях в автоматическом режиме без использования информации о параметрах помех.

Полутоновое изображение рассматривается в рамках структурной модели как дискретная реализация некоторой неизвестной кусочно-гладкой функции в трехмерном пространстве, что позволяет формально определить объекты полутонового изображения как определенные куски поверхности, а границы или контуры объекта полутонового изображения - как границы кусков поверхности, соответствующие объектам. Границы кусков поверхности являются особыми линиями поверхности и геометрическими местами точек разрыва непрерывности кусочно-гладкой функции, определяющей полутоновое изображение.

Итак, границы или контуры объектов могут быть определены как точки разрыва непрерывности кусочно-гладкой функции, соответствующей изображению. Дискретная реализация изображения описывается с помощью понятия декартова клеточного комплекса, позволяющего представить границы или контуры объектов изображения как линии без толщины и избежать искажений формы, которые возникают, когда линии контура или границы объекта изображения представлены в виде последовательности пикселей.

Полученные результаты могут быть применены при обработке полутоновых изображений в информационных технологиях.

СПИСОК ИСТОЧНИКОВ

1. Вишневський В.В. Еволющя технолопчного задуму проекту «Медгрщ». Системи тдтримки прийняттяршень. Теор1я i практика (СППР '2017): зб. доп. наук.-практ. конф. з мiжнар. участю (м. Кив, 5 червня 2017 р.). Кив: 1ПММС НАНУ, 2017. С. 77-80.

2. Кийко В.М., Кийко К.В., Мацелло В.В., Провалов Ю.Л., Шарипанов В.М. Система доступу до примщення на основi розтзнавання людських облич. УкрОБРАЗ'2006: восьма Всеукр. мiжнар. конф. (м. Кт'в, 28-31 серпня 2006 р.). Кт'в: Мiжнародний науково-навчальний центр iнформацiйних технологiй та систем, 2006. С. 123-126.

3. Старостенко В.И., Шарыпанов В.М., Шарыпанов А.В., Савченко А.С., Легостаева О.В., Макаренко И.Б., Куприенко П.Я. Интерактивный программный комплекс Isohypse для построения геолого-геофизических моделей и его практическое использование. Геофизический журнал. 2016. Т. 38. № 1. С. 30-42.

4. Костенко В.В., Лавренюк 1.В., Пономарьов В.М. Дослщження можливостей ефективного використання методiв розтзнавання для обробки фотозображень автомобшьних номерних знакiв. Вюник АМСУ. Техтчт науки. 2014. № 1 (51). С. 48-56.

5. Медведев Д.Г. Метод выделения контуров объектов с нечеткими краями на цветных изображениях. Цифровая Обработка Сигналов. 2014. № 3. С. 62-67.

6. Kaas M., Witkin A., Terzopoulos D. Snakes: Active Contour Models. Int. Journal of Computer Vision. 1987. N 1. P. 312-331.

7. Canny J.F. A computational approach to edge detection. IEEE Trans. Pattern Anal. Machine Intell. 1986. Vol. PAMI-8, N 6. P. 679-698.

8. Kovalevsky V. Finite Topology as Applied to Image Analysis. Computer Vision, Graphics and Image Processing. 1989. Vol. 45, N 2. P. 141-161.

9. Александров П.С. Комбинаторная топология. М., Л.: ОГИЗ. Гос. изд-во технико-теорет. лит, 1947. 660 с.

10. Kovalevsky V.A. Geometry of Locally Finite Spaces. Berlin: Dr. Baerbel Kovalevski, 2008. 322 p.

11. Калмыков В., Вишневский В., Власова Т. Структурная модель полутонового изображения и ее использование в задаче сегментации изображения. Intenational Book Series "Information, Science And Computing", Book 5 "Intelligent Technologies and Applications". Sofia, 2008. С. 153-160.

12. Kalmykov V., Sharypanov A. Segmentation of Experimental Curves Distorted by Noise. Journal of Computer Science Systems Biology. 2017. Vol. 10, Issue 3. P. 50-55.

13. Подвигин Н.Ф. Динамические свойства нейронных структур зрительной системы. Л.: Наука, 1979. 158 с.

14. Ruksenas O., Bulatov A., Heggelund P. Dynamics of Spatial Resolution of Single Units in the Lateral Geniculate Nucleus of Cat During Brief Visual Stimulation. JNeurophysiol. 2007. N 97. P. 1445-1456.

15. Martin D., Fowlkes C., Tal D., Malik J. A Database of Human Segmented Natural Images and its Application to Evaluating Segmentation Algorithms and Measuring Ecological Statistics. Proc. 8th Int'l Conf. Computer Vision (July 2001). 2001. Vol. 2. P. 416-423. URL: https://www2.eecs.berkeley.edu/ Research/Projects/CS/vision/grouping/papers/mftm-iccv01.pdf.

Стаття надiйшла доредакцп 07.10.2019

i Надоели баннеры? Вы всегда можете отключить рекламу.