Научная статья на тему 'ИЕРАРХИЧЕСКАЯ КОНЕЧНОЗНАЧНАЯ ГИББСОВСКАЯ МОДЕЛЬ ДЛЯ СЕГМЕНТАЦИИ ТЕКСТУРНЫХ ИЗОБРАЖЕНИЙ'

ИЕРАРХИЧЕСКАЯ КОНЕЧНОЗНАЧНАЯ ГИББСОВСКАЯ МОДЕЛЬ ДЛЯ СЕГМЕНТАЦИИ ТЕКСТУРНЫХ ИЗОБРАЖЕНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
25
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕГМЕНТАЦИЯ ТЕКСТУРНЫХ ИЗОБРАЖЕНИЙ / РАСПРЕДЕЛЕНИЕ ГИББСА / ИЕРАРХИЧЕСКАЯ МОДЕЛЬ / СТОХАСТИЧЕСКАЯ РЕЛАКСАЦИЯ / БИНАРНЫЙ ПРЕПАРАТ ТЕКСТУРЫ / ОПЕРАТОРЫ ВЫДЕЛЕНИЯ ГРАНИЦ / ВЕЙВЛЕТ-РАЗЛОЖЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Васюков Василий Николаевич, Зайцева Анна Юрьвна

Предлагается подход к решению задачи сегментации текстурных изображений, основанный на применении иерархической конечнозначной гиббсовской модели. Ненаблюдаемый уровень иерархической модели, называемый текстурной картой, представляется в виде реализации случайного поля с гиббсовским распределением вероятностей; назначение текстурной карты - локализация границ между областями наблюдаемого изображения, текстурные параметры которых в пределах границ постоянны, но различаются для разных областей. Итерационная процедура стохастической релаксации, использующая локальные характеристики апостериорного распределения текстурной карты, служит генератором ее реализаций, которые сходятся к истинной карте текстур, что и дает решение задачи сегментации, оптимальное по критерию максимума апостериорной вероятности (МАВ). Таким образом, сегментация сводится к задаче нахождения наиболее вероятной текстурной карты, совместимой с наблюдаемым изображением. Гиббсовское описание полутоновых изображений, используемых в качестве наблюдаемого уровня, чрезвычайно громоздко. Работа посвящена поиску эффективного способа преобразования текстурного изображения в бинарный препарат, сохраняющий характерные свойства текстур. Использование бинарного препарата текстуры вместо исходного полутонового изображения целесообразно с точки зрения снижения вычислительных затрат, а также обеспечения простоты построения иерархической гиббсовской модели. Для получения бинарного препарата текстуры, сохраняющего текстурные характеристики исходного изображения, предлагается использование процедуры выделения контурных линий на изображениях, а также вейвлет-разложения полутонового изображения с последующей бинаризацией коэффициентов детализации. Нахождение и включение в иерархическую модель уровней, эффективно отражающих текстурную информацию различного рода, являются основной задачей исследования. Перспективность предложенного подхода на основе наращивания количества наблюдаемых слоев иерархической модели, каждый из которых представляет собой бинарный препарат текстуры, подтверждается высоким качеством результатов сегментации реальных текстурных изображений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Васюков Василий Николаевич, Зайцева Анна Юрьвна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A HIERARCHICAL FINITELY VALUED GIBBS MODEL FOR TEXTURE IMAGE SEGMENTATION

An approach to texture image segmentation based on the application of the hierarchical finitely valued Gibbs model is suggested. The observer level of a hierarchical model called a texture map is represented in the form of realization of a random field with Gibbs probabilities distribution. The purpose of a texture map is localization of boundaries between image areas whose texture parameters are consistent within the boundaries but differ for various areas. An iterative procedure of stochastic relaxation that uses local characteristics of a posterior distribution of a texture map serves as a generator of its realizations converging to a true texture map. So it gives a solution of the segmentation problem that is optimal according to the criterion of a posteriori probability maximum (APM). Thus segmentation comes to generating the most probable texture map that is compatible with an observed texture image. The Gibbs description of gray-scale images used as observed levels is extremely tedious. The paper is devoted to the search of an efficient technique of converting texture images into a binary preparation retaining characteristic textures properties. Application of a binary preparation instead of an initial gray-scale image seems to be feasible in terms of reducing computational costs and also providing simplicity of hierarchical Gibbs model development. To obtain a binary texture preparation containing texture properties of an initial image a procedure of contour lines extraction is suggested. In addition it is proposed to apply wavelet decomposition of a gray-scale image followed by binarization of detaling coefficients. Finding and insertion of levels that efficiently reflect texture information of various kinds into a hierarchical model is the main task of the investigation. A long-term outlook of the approach based on the expansion of the number of the observed hierarchical model levels each of which represents a binary texture preparation is supported by high quality results of real texture image segmentation.

Текст научной работы на тему «ИЕРАРХИЧЕСКАЯ КОНЕЧНОЗНАЧНАЯ ГИББСОВСКАЯ МОДЕЛЬ ДЛЯ СЕГМЕНТАЦИИ ТЕКСТУРНЫХ ИЗОБРАЖЕНИЙ»

_ДОКЛАДЫ АН ВШ РФ_

2016_июль-сентябрь_№ 3(32)

- ТЕХНИЧЕСКИЕ НАУКИ -

УДК 621.39:519.2

ИЕРАРХИЧЕСКАЯ КОНЕЧНОЗНАЧНАЯ ГИББСОВСКАЯ МОДЕЛЬ ДЛЯ СЕГМЕНТАЦИИ ТЕКСТУРНЫХ ИЗОБРАЖЕНИЙ

В.Н. Васюков, А.Ю. Зайцева

Новосибирский государственный технический университет

Предлагается подход к решению задачи сегментации текстурных изображений, основанный на применении иерархической конечнозначной гиббсовской модели. Ненаблюдаемый уровень иерархической модели, называемый текстурной картой, представляется в виде реализации случайного поля с гиббсовским распределением вероятностей; назначение текстурной карты - локализация границ между областями наблюдаемого изображения, текстурные параметры которых в пределах границ постоянны, но различаются для разных областей. Итерационная процедура стохастической релаксации, использующая локальные характеристики апостериорного распределения текстурной карты, служит генератором ее реализаций, которые сходятся к истинной карте текстур, что и дает решение задачи сегментации, оптимальное по критерию максимума апостериорной вероятности (МАВ). Таким образом, сегментация сводится к задаче нахождения наиболее вероятной текстурной карты, совместимой с наблюдаемым изображением. Гиббсовское описание полутоновых изображений, используемых в качестве наблюдаемого уровня, чрезвычайно громоздко. Работа посвящена поиску эффективного способа преобразования текстурного изображения в бинарный препарат, сохраняющий характерные свойства текстур. Использование бинарного препарата текстуры вместо исходного полутонового изображения целесообразно с точки зрения снижения вычислительных затрат, а также обеспечения простоты построения иерархической гиббсовской модели. Для получения бинарного препарата текстуры, сохраняющего текстурные характеристики исходного изображения, предлагается использование процедуры выделения контурных линий на изображениях, а также вейвлет-разложения полутонового изображения с последующей бинаризацией коэффициентов детализации. Нахождение и включение в иерархическую модель уровней, эффективно отражающих текстурную информацию различного рода, являются основной задачей исследования. Перспективность предложенного подхода на основе наращивания количества наблюдаемых слоев иерархической модели, каждый из которых представляет собой бинарный препарат текстуры, подтверждается высоким качеством результатов сегментации реальных текстурных изображений.

Ключевые слова: сегментация текстурных изображений, распределение Гиббса, иерархическая модель, стохастическая релаксация, бинарный препарат текстуры, операторы выделения границ, вейвлет-разложение.

Б01: 10.17212/1727-2769-2016-3-43-53

Введение

Один из известных подходов к описанию и анализу текстур основан на представлении текстурного изображения в виде реализации случайного поля с гиббсовским распределением вероятностей [1, 2]. Согласно теореме эквивалентности Хэммерсли-Клиффорда гиббсовские случайные поля (ГСП) обладают марковским свойством, что обеспечивает возможность моделирования и анализа текстур на основе их локальных характеристик (условных вероятностей значений поля в точке при заданной конфигурации поля в ее окрестности), совокупность которых

Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований, проект № 16-37-00151.

© 2016 В.Н. Васюков, А.Ю. Зайцева

полностью определяет гиббсовское поле [3]. Алгоритмы генерирования и обработки гиббсовских случайных полей основываются на итерационных методах стохастической релаксации (динамических методах Монте-Карло) [4, 5]. Для решения задачи текстурной сегментации строится иерархическая модель, включающая, помимо наблюдаемого текстурного изображения, скрытое (ненаблюдаемое) изображение поля меток (текстурную карту), при этом апостериорное распределение карты при условии наблюдения текстурного изображения имеет вид распределения Гиббса. Процедура стохастической релаксации, использующая локальные характеристики этого апостериорного распределения, служит генератором реализаций скрытого поля, которые при определенных условиях [5] сходятся к истинной карте текстур, что и дает решение задачи сегментации [1], оптимальное по критерию максимума апостериорной вероятности (МАВ). Таким образом, сегментация сводится к генерированию наиболее вероятной реализации текстурной карты, совместимой с наблюдаемым текстурным изображением.

Непосредственное использование текстурного изображения в качестве наблюдаемого уровня иерархической модели требует больших объемов памяти и вычислительных ресурсов, так как гиббсовское описание цифрового полутонового изображения с 256 уровнями яркости слишком громоздко. С целью снижения вычислительных затрат, а также обеспечения простоты построения иерархической модели целесообразным представляется использование в качестве наблюдаемого уровня вместо исходного полутонового текстурного изображения его бинарного препарата. Сложность заключается в нахождении эффективного способа получения бинарного препарата, сохраняющего текстурные свойства исходного изображения. Одним из таких способов является выделение контурных линий [6]. В настоящей работе проводится сравнение эффективности и качества сегментации изображений на основе контурных препаратов, полученных с использованием различных операторов выделения контуров. Кроме того, рассматривается возможность применения вейвлет-разложения [7] исходных полутоновых текстурных изображений и использования бинаризованных детализирующих коэффициентов в качестве наблюдаемых уровней иерархической модели для текстурной сегментации.

1. Текстурная сегментация на основе иерархической конечнозначной

гиббсовской модели

Для построения иерархической гиббсовской модели текстурного изображения сначала задается распределение Гиббса ненаблюдаемого поля (текстурной карты), описывающего разбиение изображения на однородные непересекающиеся области. Затем для каждой области определяется распределение Гиббса, описывающее текстуру в ее пределах. Совокупность текстурных областей образует наблюдаемое изображение. Иерархическая модель представляет собой совместное распределение наблюдаемого и ненаблюдаемого полей. С помощью этой модели осуществляются генерирование и сегментация текстурных изображений на основе стохастической релаксации [5]. При генерировании вначале порождается карта, а затем соответствующее ей текстурное изображение. При сегментации на основе наблюдаемого изображения генерируется поле, близкое к карте (в идеале совпадающее с ней). Для генерирования полей применяются алгоритмы Гиббса (ОгЬЬь-5атр1ег) и Метрополиса-Хастингса [8].

При построении конечнозначной гиббсовской модели текстурной карты формируется прямоугольная решетка Ьм = {(',]):0 </ < < ] < N2} размерами N1 х N2 ; случайное поле М представляет собой совокупность случайных величин {М5}, 5 е Ьм , принимающих значения из конечного множества

меток{,^2,...,Цк}. Задание распределения Гиббса предполагает определение

на решетке системы клик. Кликой называется совокупность точек решетки, считающихся попарно соседними. Соседство означает наличие взаимодействия между точками, при этом соседние точки не обязательно должны быть геометрически соседними. Окрестностью точки 5 называется совокупность клик, содержащих 5, за вычетом этой точки. Каждой клике приписывается функция значений поля в точках клики, называемая потенциалом. Модель текстурной карты является однородной [1] в том смысле, что множество См всех клик разбито на непересекающиеся подмножества (семейства), каждое из которых образовано всевозможными сдвигами единственной клики в пределах решетки. При этом каждой клике с е См одного семейства приписывается один и тот же потенциал У^1 ().

В простейшем случае, когда рассматривается изображение с двумя типами текстур, текстурную карту можно представить полем, принимающим значения из множества {-1,1}. Все клики образованы парами точек, геометрически соседними

по вертикали или по горизонтали [9]. Потенциалы а^ вертикальных клик назна-

чаются в соответствии со схемой а} »

-1

а, »

' 1 ^

а4 »

1,

потенциалы горизонтальных клик - согласно схеме aj »(-1 -1).

а2 » (-1 1), а2 » (1 -1), а4 » (1 1). Тогда окрестность произвольной внутренней (не принадлежащей границам решетки) точки поля 5 содержит четыре точки (окрестность фон Неймана [10]). При этом существует 24 = 16 конфигураций (реализаций) бинарного поля на окрестности (рис. 1). Реализации текстурной карты и ее значения в точке 5 соответственно обозначаются т и т5. Вероятность реализации т поля карты М

PM (M = m) = ZM exp j- X VM (m) |

I ceCm J

(1)

где нормирующая константа Zм = X ехР 1 X (т) > определяется сумми-

теМ [ сеСм \

рованием по множеству М всех возможных реализаций поля М .

Рис. 1 - Конфигурации бинарного поля на окрестности фон Неймана Fig. 1 - Configurations of a binary field on the von Neumann neighborhood

Модель наблюдаемого поля строится аналогично. Прямоугольной решетке Ьт = {(/,]):0<I <N1; 0<] <N2}соответствует случайное поле Т , принимающее значения из множества {-1,1} . Эта модель неоднородна, так как потенциалы У^ (/|т) клик из множества Ст , которые образуют окрестность точки ^т е Ьт , обусловлены значением текстурной карты в соответствующей точке е Ьм . Условное распределение наблюдаемого поля

Ртм (т = ¿|м = т) = г-М ехр| - X УТ (|т) [,

I сеСт ]

где 2т|м = X ехр <!- X Ус (I т)> определяется суммированием по множе-

[ сеСт ]

ству А всех возможных реализаций поля т при заданном поле м .

Задача сегментации может быть сформулирована как задача нахождения реализации карты, доставляющей максимум апостериорной вероятности, что эквивалентно максимизации совместного распределения, поскольку текстура при этом фиксирована:

Ртм (т = ^м = т) = гмг-м х ехр |- X Усм (т) - X Ут ('|т)|. (2)

[ сеСм сеСт \

Точное решение этой задачи крайне затруднено высокой размерностью и мно-гомодовым характером целевой функции. Для приближенного решения применяется метод стохастической релаксации (моделируемого отжига) [1, 5], при этом в показатель экспоненты выражения (2) вводится множитель 1/т(t), где т (t) называется температурой и убывает с увеличением номера t итерации. Последовательности значений t соответствует последовательность распределений вида (2), при этом с понижением температуры происходит заострение мод распределений и обеспечивается сходимость реализаций к состоянию с максимальной вероятностью. Любая реализация, полученная по прошествии достаточного времени, может быть выбрана в качестве приближенного решения задачи сегментации. Теоретически оптимальный график т ^) понижения температуры [4] обеспечивает нахождение решения лишь при t ^го , в связи с этим актуальны проблемы поиска графика, обеспечивающего достаточно высокое качество сегментации при приемлемом количестве итераций, и определения времени окончания процедуры моделируемого отжига.

Потенциалы УС (t|m), входящие в (2) и необходимые для сегментации, априори неизвестны. Поэтому вначале выполняется грубая предварительная сегментация изображения, после чего производится оценивание потенциалов в пределах полученных областей. Предварительная сегментация осуществляется путем сканирования наблюдаемого изображения скользящим окном прямоугольной формы; при каждом положении окна методом, предложенным в [9], вычисляются оценки значений потенциалов. После сканирования всего изображения каждая точка ха-растеризуется набором оценок потенциалов. Методом кластерного анализа «К-средних» в пространстве признаков размерности, равной количеству оцениваемых потенциалов, производится грубое разбиение изображения на области, различающиеся наборами оценок. В пределах данных областей находятся уточнен-

ные оценки потенциалов УС (t|m), входящих в выражение (2) и используемых для генерирования реализаций текстурной карты, совместимых с наблюдаемым полем.

2. Сегментация на основе бинарного контурного препарата текстуры

Ранее в работах [6, 11] было предложено для текстурной сегментации вместо полутонового изображения использовать бинарный контурный препарат текстуры, полученный с применением детектора границ Кэнни. Поскольку текстура представляет собой характеристику пространственной организации изменений яркости, контурный препарат сохраняет некоторые признаки текстуры, которые могут быть использованы при сегментации (рис. 2).

a b с

Рис. 2 - Текстурное изображение (а), контурный препарат Кэнни (b), контурный

препарат Робертса (с)

Fig. 2 - A texture image (a), Canny contour preparation (b), Roberts contour preparation (c)

Анализ эффективности применения операторов выделения контуров на различных изображениях пар текстур показал, что наиболее предпочтительными с точки зрения обеспечения сегментации являются операторы Собела и Прюитт (рис. 3). Препарат Кэнни наименее пригоден для сегментации. Предположительно это обусловлено свойством алгоритма выделять контурные линии, удовлетворяющие требованию связности. В результате такой препарат является неинформативным, так как содержит протяженные области, заполненные одинаковыми значениями меток. Операторы Робертса, Прюитт и Собела обеспечивают получение более «насыщенного» препарата, что повышает качество сегментации.

Процедура сегментации запускается многократно; начальными реализациями служат реализации независимых случайных полей. Критерием остановки процедуры генерирования текстурной карты в экспериментах являлось достижение некоторого порогового количества различающихся точек реализаций на текущем и на предыдущем шаге итерации (например, допускается различие соседних реализаций в десяти точках). Полученный ансамбль реализаций текстурной карты, полученных при многократном запуске алгоритма сегментации, обрабатывается по мажоритарному принципу: для каждой точки решетки выбирается значение метки, которое чаще встречается в ансамбле конечных реализаций. Эффективность использования данного способа «голосования» для получения окончательного результата сегментации продемонстрирована на рис. 4.

3. Гиббсовская иерархическая модель, дополненная уровнем

с диагональными парными кликами

Повышение эффективности сегментации потенциально могло бы быть достиг-

нуто при использовании вместо окрестности фон Неймана окрестности Мура [9],

которая содержит 8 точек (см. рис. 5, а). Окрестность Мура содержит большее число типов клик (см. рис. 5, b), в результате резко возрастает количество потен-

циалов, подлежащих оцениванию, а также количество конфигураций поля на окрестности (с 24 = 16 до 28 = 256).

Рис. 3 - Текстурное изображение (а); контурный препарат Кэнни (b), Прюитт (d), Робертса f), Собе-ла (h); результаты сегментации на основе их применения (справа), соответственно - (c, e, g, i)

Fig. 3 -A texture image (a), Canny contour preparation (b), Prewitt contour preparation (d), Roberts f), Sobel (h); segmentation results obtained on the base of their application respectively (c, e, g, i)

d e f

Рис. 4 - Иллюстрация эффективности метода «голосования». Примеры результатов сегментации однократного запуска алгоритма сегментации (а, Ь, с, с1, е), результат «голосования» по ансамблю из 20 реализаций (/)

Fig. 4 - Voting method efficiency illustration. Examples of segmentation result of a single initiation of segmentation (a, b, c, d, e), 20 realization sensemble voting segmentation result (f)

Рис. 5 - Окрестность Мура (серые клетки) для произвольной внутренней точки (белая клетка) (а), типы клик, формирующих окрестность Мура (b), диагональная окрестность (белые клетки) и окрестность фон Неймана (черные клетки) для произвольной внутренней точки (серая клетка) (с), возможные конфигурации бинарного поля на парных кликах диагонального типа (d)

Fig. 5 - The Moor eneighborhood (greyboxes) for an arbitrary inner point (whitebox) (a), clique types forming the Moore neighborhood (b), a diagonal neighborhood (whiteboxes) for an arbitrary inner point (greybox) and the von Neumann neighborhood (black boxes) (c), possible configurations of a binary field on pair-wise diagonal cliques (d)

Для более полного использования информации при приемлемой сложности модели предлагается в дополнение к окрестности фон Неймана использовать диагональную окрестность (рис. 5, с), образованную парными диагональными кликами (рис. 5, d). За счет добавления в двухуровневую иерархическую модель еще одного (наблюдаемого) уровня T , описание которого основано на диагональных кликах, возможно повышение эффективности сегментации. При этом количество конфигураций бинарного поля на окрестности увеличится в два раза (2*24 = 32), что в 8 раз меньше числа конфигураций на окрестности Мура (28 = 256). Потенциалы парных диагональных клик оцениваются в ходе предварительной сегментации тем же методом, что и потенциалы парных вертикальных и горизонтальных клик [10]. Полученные значения включаются в выражение (2) в виде дополнительных слагаемых X VT2 (?2 |m) в показателе экспоненты. СеСГ2

Исследование показало, что использование трехуровневой иерархической модели обеспечивает лучшее качество сегментации (рис. 6).

1

b

Рис. 6- Сравнение качества сегментации: наблюдаемый уровень (а), результат окончательной сегментации (окрестность фон Неймана) (b), результат окончательной сегментации (окрестности фон Неймана и диагональная окрестность) (с) Fig. 6 - Comparison of segmentation results: a binary contour texture preparation as an observable level (a), final segmentation result with the von Neumann neighborhood (b), final segmentation result with the von Neumann and diagonal neighborhoods (c)

a

с

4. Применение вейвлет-разложения для получения бинарного препарата текстурного изображения

Предлагаемый альтернативный способ получения бинарного препарата текстуры основан на использовании вейвлет-разложения функции яркости полутонового текстурного изображения с последующей бинаризацией коэффициентов. Для разложения в качестве вейвлет-базиса выбран базис Хаара, как наиболее простой в использовании [7]. Коэффициенты высокочастотного фильтра разложения относительно выбранного вейвлет-базиса также называются детализирующими коэффициентами. Различают горизонтальные, вертикальные и диагональные детализирующие коэффициенты. Для получения бинарного препарата изображения детализирующих коэффициентов подвергаются бинаризации на основе сравнения с нулевым порогом (рис. 7).

а

b cd

Рис. 7 — Полутоновое текстурное изображение (а) и детализирующие коэффициенты первого уровня разложения горизонтального направления (b), вертикального направления (с) и диагонального направления (d)

Fig. 7 - Gray-level texture image (a) and binary detalization coefficients of the first decomposition level in a horizontal (b), vertical (c) and a diagonal direction (d)

Бинаризованные детализирующие коэффициенты отражают текстурные различия и могут быть использованы в качестве трех наблюдаемых уровней иерархической модели при восстановлении текстурной карты. Результат сегментации изображения (рис. 7, а) с применением четырехуровневой иерархической гиббсовской модели, наблюдаемые уровни которой представлены изображенными на рис. 7, b, c, d бинаризованными детализирующими коэффициентами первого уровня вейвлет-разложения, продемонстрирован на рис. 8 в качестве примера сегментации реальных текстурных изображений на основе предложенного подхода.

Заключение

В работе представлены результаты исследований, направленных на повышение эффективности сегментации текстурных изображений на основе иерархической гиббсовской модели. С целью снижения вычислительных затрат текстурные

Рис. 8 — Результат сегментации с применением четырехуровневой иерархической гиббсовской модели Fig. 8 - Segmentation result applying a four-level hierarchical Gibbs model

изображения заменяются бинарными препаратами, включаемыми в модель в качестве наблюдаемых уровней, при этом семейства клик ГСП могут ограничиваться окрестностью фон Неймана. Проведено сравнение контурных операторов Кэн-ни, Робертса, Прюитт и Собела по их пригодности для получения бинарных препаратов текстур, обеспечивающих эффективную сегментацию реальных текстурных изображений. Универсального решения, по-видимому, не существует; наиболее подходящим в каждом случае является оператор, обеспечивающий наибольшую густоту контурных линий.

Для более полного использования текстурной информации предложено дополнить модель наблюдаемым уровнем, описываемым распределением Гиббса, основанным на кликах диагонального типа. При этом наблюдается заметное повышение качества сегментации.

В качестве альтернативного способа получения бинарного препарата текстуры предложено использовать бинаризованные детализирующие коэффициенты вейвлет-разложения. Эксперименты с использованием базиса Хаара показали перспективность этого подхода. Однако следует отметить, что для разных текстур наиболее информативными оказываются коэффициенты вейвлет-разложения, относящиеся к разным масштабам. Вопрос об автоматическом выборе наилучшего масштаба в процессе сегментации требует дальнейших исследований.

ЛИТЕРАТУРА

1. Gimel'farb G. Image textures and Gibbs random fields. - Dordrecht, Netherlands: Kluwer Academic Publishers, 1999. - 250 p.

2. Derin H., Elliott H. Modelling and segmentation of noisy and textured images using Gibbs random fields // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 1987. -Vol. PAMI-9, N 1. - P. 39-55.

3. Hammersley J.M., Clifford P. Markov field on finite graphs and lattices: manuscript. -1971. - Unpublished.

4. Winkler G. Image analysis, random fields and dynamic Monte Carlo methods. - Berlin; Heidelberg: Springer-Verlag, 1995. - 324 p.

5. Geman S., Geman D. Stochastic relaxation, Gibbs distributions, and the Bayesian restoration of images // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 1984. -Vol. PAMI-6, N 6. - P. 721-741.

6. Vasyukov V.N. Image processing algorithms based on finite-state Gibbs models // The 1st International Forum on Strategic Technology (IFOST 2006): proceedings. - Ulsan, Korea, 2006. - P. 287-288.

7. Смоленцев Н.К. Основы теории вейвлетов. Вейвлеты в MATLAB. - М.: ДМК Пресс, 2005. - 304 c.

8. Equations of state calculations by fast computing machines / N. Metropolis, A.W. Rosenbluth, M.N. Rosenbluth, A.H. Teller, E. Teller // The Journal of Chemical Physics. - 1953. - Vol. 21. - P. 1087-1091.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Васюков В.Н. Оценивание параметров конечнозначных гиббсовских полей с использованием достаточных статистик // Автометрия. - 2001. - № 4. - С. 110-118.

10. Ilachinski A. Cellular automata: a discrete universe. - Singapore: World Scientific Publishing, 2001. - 808 p.

11. Vasyukov V.N., Zaitseva A.Yu. Segmentation of textured images described by hierarchical Gibbs model // 11 International Forum on Strategic Technologies (IFOST 2016): proceedings, Novosibirsk, 1-3 June 2016. - Novosibirsk: NSTU Publ., 2016. - Pt. 1. - P. 452-455.

A HIERARCHICAL FINITELY VALUED GIBBS MODEL FOR TEXTURE IMAGE SEGMENTATION

Vasyukov V.N., Zaitseva A.Yu.

Novosibirsk State Technical University, Novosibirsk, Russia

An approach to texture image segmentation based on the application of the hierarchical finitely valued Gibbs model is suggested. The observer level of a hierarchical model called a texture map is represented in the form of realization of a random field with Gibbs probabilities distribution. The purpose of a texture map is localization of boundaries between image areas whose texture parameters are consistent within the boundaries but differ for various areas. An iterative procedure of stochastic relaxation that uses local characteristics of a posterior distribution of a texture map serves as a generator of its realizations converging to a true texture map. So it gives a solution of the segmentation problem that is optimal according to the criterion of a posteriori probability maximum (APM). Thus segmentation comes to generating the most probable texture map that is compatible with an observed texture image. The Gibbs description of gray-scale images used as observed levels is extremely tedious. The paper is devoted to the search of an efficient technique of converting texture images into a binary preparation retaining characteristic textures properties. Application of a binary preparation instead of an initial gray-scale image seems to be feasible in terms of reducing computational costs and also providing simplicity of hierarchical Gibbs model development. To obtain a binary texture preparation containing texture properties of an initial image a procedure of contour lines extraction is suggested. In addition it is proposed to apply wavelet decomposition of a gray-scale image followed by binarization of detaling coefficients. Finding and insertion of levels that efficiently reflect texture information of various kinds into a hierarchical model is the main task of the investigation. A long-term outlook of the approach based on the expansion of the number of the observed hierarchical model levels each of which represents a binary texture preparation is supported by high quality results of real texture image segmentation.

Keywords: texture image segmentation, Gibbs distribution, hierarchical model, stochastic relaxation, binary texture preparation, edge detection operators, wavelet decomposition.

DOI: 10.17212/1727-2769-2016-3-43-53

REFERENCES

1. Gimel'farb G. Image textures and Gibbs random fields. Dordrecht, Netherlands, Kluwer Academic Publishers, 1999. 250 p.

2. Derin H., Elliott H. Modelling and segmentation of noisy and textured images using Gibbs random fields. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1987, vol. PAMI-9, no. 1, pp. 39-55.

3. Hammersley J.M., Clifford P. Markov field on finite graphs and lattices: manuscript. 1971. (Unpublished).

4. Winkler G. Image analysis, random fields and dynamic Monte Carlo methods. Berlin, Heidelberg, Springer-Verlag, 1995. 324 p.

5. Geman S., Geman D. Stochastic relaxation, Gibbs distributions, and the Bayesian restoration of images. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1984, vol. PAMI-6, no. 6, pp. 721-741.

6. Vasyukov V.N. Image processing algorithms based on finite-state Gibbs models. The 1st International Forum on Strategic Technology (IFOST 2006), Ulsan, Korea, 2006, pp. 287-288.

7. Smolentsev N.K. Osnovy teorii veivletov. Veivlety v MATLAB [Foundations of the wavelets theory. Waveletsin MATLAB]. Moscow, DMK Press, 2005. 304 p.

8. Metropolis N., Rosenbluth A.W., Rosenbluth M.N., Teller A.H., Teller E. Equations of state calculations by fast computing machines. The Journal of Chemical Physics, 1953, vol. 21, pp. 1087-1091.

9. Vasyukov V.N. Otsenivanie parametrov konechnoznachnykh gibbsovskikh polei s ispol'zovaniem dostatochnykh statistik [Parameter estimation of finitely-values Gibbs fields with using sufficient statistics]. Avtometriya - Optoelectronics, Instrumentation and Data Processing, 2001, no. 4, pp. 110-118. (In Russian)

10. Ilachinski A. Cellular automata: a discrete universe. Singapore, World Scientific Publishing, 2001. 808 p.

11. 11. Vasyukov V.N., Zaitseva A.Yu. Segmentation of textured images described by hierarchical Gibbs model. 11 International Forum on Strategic Technologies (IFOST 2016): proceedings, Novosibirsk, 1-3 June 2016, pt. 1, pp. 452-455.

СВЕДЕНИЯ ОБ АВТОРАХ

Васюков Василий Николаевич - родился в 1951 году, д-р техн. наук, профессор, профессор кафедры теоретических основ радиотехники Новосибирского государственного технического университета. Область научных интересов: цифровая обработка и статистический анализ сигналов и изображений. Опубликовано около 120 научных работ. (Адрес: 630073, Россия, Новосибирск, пр. Карла Маркса, 20, E-mail: [email protected], [email protected]).

VasyukovVassilyNikolaevich (b. 1951) - Doctor Sciences (Eng.), professor, head of the department of theoretical fundamentals of radio engineering, Novosibirsk State Technical University. His research interests are currently focused on digital signal and image processing and analysis. He is the author of 120 scientific papers. (Address: 20, Karl Marx Av., Novosibirsk, 630073, Russia, E-mail: [email protected], [email protected]).

Зайцева Анна Юрьевна - родилась в 1993 году, аспирант второго года обучения, Новосибирский государственный технический университет. Область научных интересов: алгоритмы обработки и анализа сигналов и изображений. Опубликовано 13 научных работ. (Адрес: 630073, Россия, Новосибирск, пр. К. Маркса, 20, E-mail: [email protected], [email protected]).

Zaitseva Anna Yuryevna (b. 1993) - a second year PhD student, Novosibirsk State Technical University. Her research interests include algorithms of signal and image processing and analysis. She is the author of 13 scientific papers. (Address: 20, Karl Marx Av., Novosibirsk, 630073, Russia, E-mail: [email protected], [email protected]).

Статья поступила 17 сентября 2016 г.

Received September 17, 2016

To Reference:

Vasyukov V.N., Zaitseva A.Yu. Ierarkhicheskaya konechnoznachnaya gibbsovskaya model' dlya segmentatsii teksturnih izobrajeniy [A hierarchical finitely-valued Gibbs model for texture image segmentation]. Doklady Akademii nauk vysshei shkoly Rossiiskoi Federatsii - Proceedings of the Russian higher school Academy of sciences, 2016, no. 3 (32), pp. 43-53. doi: 10.17212/1727-27692016-3-43-53

i Надоели баннеры? Вы всегда можете отключить рекламу.