Научная статья на тему 'Методика ускорения классического метода Уорда для кластеризации пикселей изображения'

Методика ускорения классического метода Уорда для кластеризации пикселей изображения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
741
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАСТЕРНЫЕ МЕТОДЫ / ИЕРАРХИЧЕСКАЯ СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ / МЕТОД УОРДА / ОБРАТИМЫЕ ВЫЧИСЛЕНИЯ / УЛУЧШЕНИЕ КАЧЕСТВА ИЗОБРАЖЕНИЯ / CLUSTER METHODS / HIERARCHICAL IMAGE SEGMENTATION / WARD METHOD / REVERSIBLE CALCULATIONS / IMPROVING THE IMAGE QUALITY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ханыков Игорь Георгиевич

Сегментация относится к стадии предварительной обработки изображений. От ее результатов зависит дальнейшее выделение объектов, распознавание признаков, анализа сцен и прогнозирования ситуаций. К современным алгоритмам сегментации предъявляют требования: отказ от использования априорной информации, наличие функционала качества для оценки результата, варьируемое число сегментов в разбиении исходного изображения, линейная вычислительная сложность и адекватность результатов сегментации. Среди методов кластерного анализа, удовлетворяющих большинству из приведенных требований, подходящим является метод Уорда. Однако его высокая вычислительная сложность препятствует его прямому применению. Цель исследования заключается в поиске способа преодоления чрезмерно высокой вычислительной сложности классического метода Уорда. Методы: сопоставляются классические методы кластерного анализа, удовлетворяющие актуальным требованиям к современным алгоритмам сегментации изображений. Обосновывается выбор классического метода Уорда. Приводятся его достоинства и недостатки. Описывается применение идеи обратимых операций в обработке изображений. Результаты: приводится ряд отдельных модификаций вычислительного процесса метода Уорда. Предлагается типовая блок-схема последовательности алгоритмов, позволяющая обойти проблему вычислительной сложности, характерную для метода Уорда. Приводятся экспериментальные результаты по улучшению качества традиционной сегментации. Практическая значимость: предлагаемая схема позволяет обойти проблему вьиислительной сложности за счет разделения процесса обработки на три последовательных этапы. Схема пригодна к улучшению качества любой традиционной сегментации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Methods for Accelerating the Classical Ward Method for Clustering Pixels of Image

Segmentation refers to the stage of pre-processing images. Further selection of objects, recognition of features, analysis of scenes and prediction of situations depend on its results. The requirements to modern segmentation algorithms are as following: refusal to use a priori information, availability of a quality functional for evaluation of the result, a variable number of segments in decomposition of the original image, linear computational complexity and adequacy of the segmentation results. The Ward method is appropriate among the methods of cluster analysis that satisfy most of the above requirements. However, its high computational complexity prevents its direct application. The aim of the study is to find a way to overcome the excessively high computational complexity of the classical Ward method. The methods: classical methods of cluster analysis that meet the current requirements for modem image segmentation algorithms are compared. The choice of the classical Ward method is substantiated. Its advantages and disadvantages are given. The application of the idea of reversible operations in image processing is described. Results: a number of some modifications of the computational process of the Ward method are given. A typical block scheme of a sequence of algorithms is proposed, that allows to circumvent the problem of computational complexity characteristic of the Ward method. Experimental results are presented to improve the quality of traditional segmentation. Practical significance: the proposed scheme allows to circumvent the problem of computational complexity by dividing the processing course into three consecutive stages. The scheme is suitable for improving the quality of any traditional segmentation.

Текст научной работы на тему «Методика ускорения классического метода Уорда для кластеризации пикселей изображения»

УДК 004.932

DOI: 10.18101/2304-5728-2018-3-60-71

МЕТОДИКА УСКОРЕНИЯ КЛАССИЧЕСКОГО МЕТОДА УОРДА ДЛЯ КЛАСТЕРИЗАЦИИ ПИКСЕЛЕЙ ИЗОБРАЖЕНИЯ

© Ханыков Игорь Георгиевич младший научный сотрудник,

Институт информатики и автоматизации Российской академии наук Россия, 199178, г. Санкт-Петербург, 14 линия В.О., д. 39 E-mail: igk@iias.spb.su

Сегментация относится к стадии предварительной обработки изображений. От ее результатов зависит дальнейшее выделение объектов, распознавание признаков, анализа сцен и прогнозирования ситуаций. К современным алгоритмам сегментации предъявляют требования: отказ от использования априорной информации, наличие функционала качества для оценки результата, варьируемое число сегментов в разбиении исходного изображения, линейная вычислительная сложность и адекватность результатов сегментации. Среди методов кластерного анализа, удовлетворяющих большинству из приведенных требований, подходящим является метод Уорда. Однако его высокая вычислительная сложность препятствует его прямому применению. Цель исследования заключается в поиске способа преодоления чрезмерно высокой вычислительной сложности классического метода Уорда. Методы: сопоставляются классические методы кластерного анализа, удовлетворяющие актуальным требованиям к современным алгоритмам сегментации изображений. Обосновывается выбор классического метода Уорда. Приводятся его достоинства и недостатки. Описывается применение идеи обратимых операций в обработке изображений. Результаты: приводится ряд отдельных модификаций вычислительного процесса метода Уорда. Предлагается типовая блок-схема последовательности алгоритмов, позволяющая обойти проблему вычислительной сложности, характерную для метода Уорда. Приводятся экспериментальные результаты по улучшению качества традиционной сегментации. Практическая значимость: предлагаемая схема позволяет обойти проблему вьиислительной сложности за счет разделения процесса обработки на три последовательных этапы. Схема пригодна к улучшению качества любой традиционной сегментации.

Ключевые слова: кластерные методы; иерархическая сегментация изображений; метод Уорда; обратимые вычисления; улучшение качества изображения.

Введение

Задача сегментации относится к предварительной обработке цифровых изображений. К актуальным алгоритмам сегментации изображений (АСИ) выдвигают следующие требования [1]:

1) Отсутствие априорной информации об объектах интереса.

2) Наличие установленного критерия качества, который позволяет оценивать полученное разбиение изображения на кластеры/сегменты.

3) Возможность сегментирования/дробления изображения на любое число цветов/кластеров от 1 до /V, где N — число пикселей в рассматриваемом изображении.

4) Выполнение вычислений в режиме реального времени.

5) Адекватность результатов, заключающейся в соответствии выделенных сегментов/кластеров границам и областям объектов на изображении.

Большинству приведённых требований удовлетворяет группа кластерных методов. Самыми распространенными кластерными методами являются методы Уорда [2], Оцу [3], К-средних [4] и модель сегментации Мамфорда-Шаха [5], [6], сопоставляемые в таблице 1. Методы обладают следующими особенностями.

Таблица 1.

Сопоставление классических методов кластеризации пикселей, _сегментации изображений

№ Признак^^^ Оцу К-средних Мамфор-да-Шаха Уорда

1 Априорная информация Нет Нет Нет Нет

2 Функционал качества Да Да Да Да

3 Изменяемое Нет, Нет, фиксиро- Да, итера- Да, итера-

число кла- фиксиро- вано, тивно воз- тивно воз-

стеров/ сег- вано, равно к, растает от растает от

ментов равно 2. 1 <к<Ы. 1 до Ж 1 до Ж

4 Линейная выч. сложность Да, О(Л') Нет, О (и2), где п — число кластеров Да, О(Л') Нет, >0(Л'2)

5 Адекватность результатов Да, ограничено 2 кластерами. Нет Нет Да

Во-первых, ни один из методов не требует задания априорной информации об изображении (признак №1). Приведенные методы пригодны для обработки изображений любого содержания и тематики.

Во-вторых, приведенные методы минимизируют установленный функционал качества (признак №2), значение которого служит индикатором качества разбиения изображения на кластеры пикселей, сегменты изображения. Например, метод Оцу и метод Уорда минимизирует суммарное квадратичное отклонение; метод К-средних — суммарное расстояние до центров кластеров; модель сегментации Мамфорда-Шаха — энергетический функционал.

Различие рассматриваемых кластерных методов проявляется в способе разбиения изображения на кластеры пикселей или сегментов (признак №3). Метод Оцу разбивает все пиксели только на два кластера. Метод К-средних разбивает пиксели изображения на заранее задаваемое и фиксированное на число кластеров. Модель сегментации Мамфорда-Шаха и метод Уорда генерируют множество разбиений исходного изображения от 1 до N, где N — число пикселей в исходном изображении. Но если в методе Уорда рассматривается все сочетания кластеров, то в модели Мамфорда-Шаха — только пары смежных сегментов изображения.

Сопоставляемые методы обладают различной вычислительной сложностью и, следовательно, различной возможностью обработки изображений в режиме реального времени. Классический метод Оцу [3] разбивает пиксели за линейное время. Время, затрачиваемое методом К-средних на разбиение изображения на фиксированное число кластеров, зависит квадратично от задаваемого значения числа кластеров. Модель Мамфорда-Шаха сегментирует изображение за линейное время близкое реальному. Вычислительная сложность классического метода Уорда возрастает квадратично с ростом числа рассматриваемых кластеров пикселей, что затрудняет применение метода напрямую в обработке изображений.

Выбор метода влияет как на качество результата обработки, так и на адекватность сегментации изображения (признак №5). Субъективное, зависящее от индивидуального восприятия пользователя, определение адекватности результатов сегментации подразумевает соответствие выделенных кластеров пикселей или сегментов изображения областям и границам объектов заданного исходного изображения. Для объективного оценивания результатов в настоящей работе используется суммарное квадратичное отклонение.

Несмотря на критику [7], которая уместна только в условиях задачи сопоставления различных контрольного и поверяемого изображений при заданной метрике из категории full-reference, либо reduced-reference, применение суммарного квадратичного отклонения оправдано по ряду причин. Во-первых, это — классическая величина и она должна рассматриваться в первую очередь. Во-вторых, оно легко в подсчете, имеет ясное физическое значение, и математически удобно в контексте оптимизации. В-третьих, суммарное квадратичное применяется в кластерном анализе для оценки качества объединения элементов в классы.

Из рассматриваемых методов к адекватным относятся метод Оцу и метод Уорда. Метод Оцу генерирует оптимальное разбиение на два кластера, но применим только для полутоновых изображений, редуцируя их до бинарных. Более общий метод Уорда, применимый как к цветным, так к полутоновым изображениям, генерирует множество разбиений, каждое последующее из которых получается слиянием пары кластеров в один. Разбиения получаются адекватными, но общее время обработки изображения оказывается слишком велико из-за полного перебора всех пар возможных сочетаний.

Метод К-средних и модель Мамфорда-Шаха относятся к категории менее адекватных. Результаты метода К-средних зависят от начального выбора центров кластеров. При их «плохом» задании метод останавливается в локальном минимуме. Зачастую результат получается неприемлемым. Модель Мамфорда-Шаха возвращает грубую сегментацию, так как на каждом шаге рассматриваются только пары смежных пикселей, сегментов.

Рассматриваемый в работе метод Уорда удовлетворяет четырём из пяти требованиям, приведенных к актуальным АСИ: (признак №1), (признак №2), (признак №3), (признак №5). Однако, метод Уорда обладает рядом недостатков, существенный из которых — высокая вычислительная сложность (признак №4). Настоящая работа посвящена методике нивелирования недостатков классического метода Уорда, позволяющей применять его в обработке изображений в задачах кластеризации и сегментации.

В разделе 1 рассматривается классический метод Уорда, приводятся его достоинства и недоставки, ставится задача преодоления вычислительной сложности. В разделе 2 описывается ряд отдельных модификаций классического метода Уорда, позволяющие ускорить вычислительный процесс. В разделе 3 раскрывается типовая блок-схема последовательности алгоритмов, обходящая недостатки классического метода посредством промежуточной обработки исходного изображения для кластеризации его пикселей. В разделе 4 описано применение идеи обратимых операций в обработке изображений. В разделе 5 обсуждаются экспериментальные результаты.

1. Кластеризация методом Уорда

Идея метода Уорда [2] заключается в последовательном слиянии пар кластеров в один. Оценкой качества служит приращение АЕ суммарной квадратичной ошибки Е. При слиянии на каждом шаге выбирается пара кластеров объединение которых возвращает минимум приращения А/^

/ ч П.П; и и2

АЕ^(и) = —>0

щ +п}

где /, / — кластеры, я,. — число пикселей в кратерах, /,. /; — средние значения трехмерной яркости пикселей внутри кластеров.

Под приближением изображения понимается кусочно-постоянное разбиение исходного изображения на однородные по цвету области, значения пикселей которых усреднены внутри кластеров. Последовательность приближений образует иерархию, так как очередное приближение получается из предыдущего объединением двух областей.

Достоинства метода Уорда:

1) метод работает при любом числе кластеров от 1 до N числа элементов в исходном множестве, что удобно при разработке методов «слепой» сегментации.

2) метод использует критерий качества, который позволяет оценить качество объединения пар и выбрать оптимальное решение из набора вариантов. Выбор на каждом шаге определяется минимальным значением функционала качества.

3) метод позволяет проследить последовательность объединений пикселей в укрупненные множества. Запоминание иерархии позволяет двигаться в обратном направлении до необходимого состояния.

4) метод Уорда как алгоритм кластеризации пикселей относится к адекватным методам. Это один из немногих методов, которые реально минимизирует суммарное квадратичное отклонение.

Недостатки метода Уорда:

1) методу свойственна неоднозначность решений в зависимости от выбора пар для слияния при равнозначных вариантах.

2) вычислительная сложность метода Уорда возрастает квадратично с ростом числа пикселей.

Первый недостаток незначителен и проявляется при независящих от исходного кода программы факторах, например, при переносе программного кода на платформу с иной операционной системой; при смене настроек работы процессора и проч. Второй недостаток кроется в самом программном коде и зависит от навыков программиста. Он затрудняет применение классического метода Уорда напрямую в обработке изображений, в частности в задачах сегментации, и требует нетривиальных решений.

Настоящая работа рассматривает ряд способов для преодоления чрезмерно высокой вычислительной сложности классического метода Уорда. Приводится ряд отдельных модификаций вычислительного процесса. Описывается блок-схема из комбинации базовых алгоритмов с иерархической структурой данных, позволяющих подготовить данные для последующей кластеризации классическим методом Уорда.

2. Отдельные модификации вычислительного процесса метода Уорда

Способ 1. Буферизация минимумов снижает вычислительную сложность до квадратичной зависимости от числа пикселей N в изображении. При загрузке в оперативную память изображения запоминается ряд минимумов. Вместе с преобразованием множества пикселей при вычислении очередного приближения выполняется обновление содержимого буфера. Это процедура избавляет от сканирования всего множества пикселей при поиске оптимальной пары для выполнения операции слияния кластеров.

Способ 2. Кластеризация пикселей изображения «по частям» [8] снижает вычислительную сложность до Исходное изображение разбивается на фрагменты, например, методом сегментации Мамфорда-Шаха. Каждый фрагмент обрабатывается как самостоятельное изображение, для которого строится иерархия приближений. Затем иерархии «сшиваются» между собой.

Способ 3. Сокращение числа обрабатываемых множеств пикселей повышает скорость вычислений. Если при минимизации приращения АЕтег^е вместо всевозможных пар кластеров анализировать только пары укрупненных смежных множеств пикселей, называемых суперпикселями, то кластеризация пикселей по методу Уорда выполняется для меньшего числа суперпикселей.

3. Типовая блок-схема последовательности алгоритмов

Обзор методов сегментации изображений и способов повышения вычислительной эффективности позволил сформировать типовую схему, обеспечивающую снижение вычислительной сложности классического метода Уорда. Представленная на рис. 1 схема кластеризации пикселей или сегментации изображения состоит из трех последовательных блоков, первые два из которых имеют различные варианты программной реализации. В первом блоке выполняется быстрое построение грубой иерархии. Во втором блоке выполняется улучшение качества заданного приближения при фиксированном числе цветов (кластеров). В третьем блоке выполняется кластеризация суперпикселей методом Уорда.

Рис. 1. Типовая блок-схема последовательности алгоритмов аппроксимации изображения

Блок «а) построение иерархии связных сегментов» быстро строит грубую иерархию приближений, генерация которой возможна двумя разными вариантами. Первый вариант заключается в применении модели Мам-форда-Шаха для построения грубой иерархии сегментов, посредством укрупнения сегментов на каждом шаге. Второй вариант заключается в разделении изображения на фрагменты регулярной сеткой с последующей обработкой каждого фрагмента как самостоятельного изображения классическим методом Уорда с последующим объединением иерархий в одну.

Блок «б) Формирование заданного числа суперпикселей» улучшает качество заданного приближения при фиксированном числе кластеров (цветов). Разработаны два базовых алгоритма улучшения качества: ЛУ-мстод (Segmentation Improvement) [9], [10] и K-mecmless метод (метод К-

средних-без-средних) [11], [12]. Множество программных реализаций блока «б)>> обусловлено как возможностью комбинированного сочетания пары базовых методов S/ и К-теаЫеяя (отдельно, последовательно, циклично), так и версиями самих методов (сегментарная, кластерная).

4. Применение идеи обратимых операций в обработке изображений

Впервые идея применения обратимых операций в вычислительной технике предложена в работе [13]. В работе [9] описано применение встречной пары операций слияния и разделения в обработке изображений. Отличие развиваемой в настоящей работе идеи от оригинальной [13] в том, что обратная операция слияния по отношению к прямой операции разделения выполняется не обязательно с теми же элементами, что участвовали в прямой операции. Тем самым операция «отката в прошлое состояние» обобщена до операции «выхода в новое состояние».

Л/-мстод улучшения качества заданного разбиения изображения заключается в разделении одного сегмента на два и объединения пары смежных в один. На каждом шаге выбирается тройка (1, 2, 3) такая, чтобы по выполнении встречной пары операций «слияния-разделения» значение ошибки падало, соответственно, качество разбиения росло. Сегмент 1 выбираем из расчета максимального падения значения приращения ошибки при разделении его на составные части:

ттА£,и,е(1)<0

Сегменты 2, 3 объединяем так, чтобы значение суммарной квадратичной ошибки минимально увеличилось:

1шпА£^(2,3)>0.

В процессе выполнения алгоритма число сегментов изображения (кластеров пикселей) фиксировано. Показателем качества разбиения служит значение суммарной квадратичной ошибки Е. При фиксированном числе кластеров пикселей или сегментов изображения лучшему разбиению соответствует меньшее значение Е. ЛУ-мстод заключается в циклическом выполнении пары реверсивных операций слияния-разделения с множествами писклей или сегментами изображения при их фиксированном числе. На каждом шаге метод стремимся максимально понизить величину Е, характеризующую качество оптимизации разбиения:

ДЕ^а 2, 3) = ДЕ^С) + 3), ттАЕсотЫпе(1, 2, 3) < 0 .

Условие останова состоит в том, как только суммарное приращение ошибки превысит 0:

А£сотЫпе(1,2,3)>0.

Существует две версии ЛУ-мстода: сегментарная и кластерная. В сегментарной версии Л'/-мстода объединяемые множества (2, 3) обязательно должны быть смежными, в кластерной версии — любыми.

5. Экспериментальные результаты

На рис. 2 и 3 представлены результаты улучшений качеств заданных разбиений. Исходное изображение расположено на рис. 2а. Его исходное приближение на рис. 26 задано регулярной сеткой и получено сжатием в 64 раза с последующим восстановлением исходного размера. Каждая ячейка сетки представлена усреднением цветов, входящих в нее пикселей. Во втором ряду представлены результаты улучшения качества исходного приближения последовательным применением 57-метода (рис. 2в) и К-теапЫзз метода (рис. 2г). Под каждым приближением приведены показатели качества - значения суммарных квадратичных отклонений а.

а) исходное изображение

б) исходное разбиение г а=21,94260

в) улучшенное приближение г) улучшенное приближение

<7=11,95288 (,81-метод) о=8,19082 (К-теаЫезз метод)

Рис. 2. Последовательное применение 57 и К-теап1ез8 методов

На рис. Зв приведено «ошибочное» приближение, которое существенно отличается от заданного регулярной сеткой на рис. 26. Для его генерации использовано вспомогательное изображение «Мандрил» рис. За такого же размера 512x512, которое было редуцировано до 1024 цветов/кластеров (рис. 36). Затем полученные области вспомогательного разбиения (рис. 36) заполнены пикселями исходного изображения «Лена» (рис. За). Конечное улучшенное приближение на рис. Зг получено применением пары 57 и К-меап1е88 методов в цикле.

Суммарная квадратичная ошибка, сгенерированного «ошибочного» приближения изображения «Лены» (рис. Зв) на треть выше (качество хуже), чем у приближения, полученного регулярной сеткой (рис. 26). При этом, суммарное квадратичное отклонение итогового улучшенного приближения рис. Зг (о=7,47459) меньше, чем у аналогичного на рис. 2г (¿7=8,19082). Заметим, что применение пары методов (57 и К-меапЫзз) в цикле возвращает более лучший результат, чем их разовое последовательное применение.

а) вспомогательное изображение

б) приближение в 1024 цветах о-= 18,92676

в) исходное приближение в 1024 г) К-теапЫзя-З! в цикле

цветах по чужому разбиению о = 7,47459

<7 = 31,53760

Рис. 3. Циклическое применение 57 и К-теап1е88 методов

Заключение

В работе:

1) приведены требования к актуальным алгоритмам сегментации изображений;

2) обосновано предпочтение группы методов кластеризации данных;

3) сопоставлен ряд классически методов кластерного анализа: метод Оцу, Уорда, К-средних, модель Мамфорда-Шаха;

4) обосновано преимущество метода Уорда перед остальными сопоставляемыми методами;

5) описана идея метода Уорда, его достоинства и недостатки;

6) приведены способы организации вычислительного процесса для преодоления вычислительной сложность классического метода Уорда;

7) описана типовая схема последовательности алгоритмов для скоростной аппроксимации изображения иерархической последовательностью приближений.

Предложенная трехэтапная схема позволяет:

1) обойти проблему вычислительной сложности за счет разделения процесса обработки на этапы;

2) строить различные программные реализации блоков при условии использования единой структуры данных.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Приведенные экспериментальные результаты свидетельствуют о пригодности рассматриваемой схемы к улучшению качества любой традиционной сегментации.

Литература

1. Поршнев С. В., Левашкина А. О. Универсальная классификация алгоритмов сегментации изображений // Журнал научных публикаций аспирантов и докторантов. 2008. Т. 3. С. 163-172.

2. Ward J. Н., Jr. Hierarchical grouping to optimize an objective function // J. Am. Stat. Assoc. 1963. Vol. 58, Issue 301. P. 236-244.

3. Otsu N. A threshold selection method from gray-level histograms // IEEE transactions on systems, man, and cybernetics. 1979. T. 9, №. 1. C. 62-66.

4. Lloyd S. P. Least squares quantization in PCM // IEEE Transactions on Information Theory. 1957/1982. T. 28, №. 2. C. 129-137. DOI: 10.1109/TIT. 1982.1056489.

5. Mumford D., Shah J. Boundary detection by minimizing iunctionals // IEEE Conference on Computer Vision and Pattern Recognition. 1985. T. 17. C. 137-154.

6. Mumford D., Shah J. Optimal approximations by piecewise smooth functions and associated variational problems // Communications on pure and applied mathematics. 1989. T. 42, №. 5. C. 577-685.

7. Wang Z., Bovik A. C. A universal image quality index // IEEE signal processing letters. 2002. T. 9, №. 3. C. 81-84.

8. Харинов M. В., Ханыков И. Г. Применение метода Уорда для кластеризации пикселей цифрового изображения // Вестник Бурятского государственного университета. Математика, информатика. 2016. № 4. С. 34-42.

9. Харинов М. В., Ханыков И. Г. Оптимизация кусочно-постоянного приближения сегментированного изображения // Труды СПИИРАН. 2015. Т. 3, №. 40. С. 183-202.

10. Khanykov I. G., Kharinov М. V., Patel С. Image Segmentation Improvement by Reversible Segment Merging. (2017, December 1-2). Int. Conf. on Soft Computing and its Engineering Applications, icSoftComp-2017, IEEE Gujarat Section Proceedings. C. 1-8. DOI: 10.1109/icsoftcomp.2017.8280096.

11. Kharinov M. Reclassification formula that provides to surpass K-means method//arXiv preprint arXiv: 1209.6204. 2012. C. 1-4.

12. Dvoenko S. D. Meanless k-means as k-meanless clustering with the bi-partial approach//Proceedings of PRIP 2014 Conference, Minsk. 2014. C. 50-54.

13. Toffoli T. Reversible computing // International Colloquium on Automata, Languages, and Programming. Springer, Berlin, Heidelberg, 1980. C. 632-644.

METHODS FOR ACCELERATING THE CLASSICAL WARD METHOD FOR CLUSTERING PIXELS OF IMAGE

Igor G. Khanykov Junior Researcher,

Institute of Informatics and Automation RAS, 39, V.O. 14 Line, St. Petersburg, 199178, Russia E-mail: igk@iias.spb.su

Segmentation refers to the stage of pre-processing images. Further selection of objects, recognition of features, analysis of scenes and prediction of situations depend on its results. The requirements to modern segmentation algorithms are as following: refusal to use a priori information, availability of a quality functional for evaluation of the result, a variable number of segments in decomposition of the original image, linear computational complexity and adequacy of the segmentation results. The Ward method is appropriate among the methods of cluster analysis that satisfy most of the above requirements. However, its high computational complexity prevents its direct application. The aim of the study is to find a way to overcome the excessively high computational complexity of the classical Ward method. The methods: classical methods of cluster analysis that meet the current requirements for modern image segmentation algorithms are compared. The choice of the classical Ward method is substantiated. Its advantages and disadvantages are given. The application of the idea of reversible operations in image processing is described. Results: a number of some modifications of the computational process of the Ward method are given. A typical block scheme of a sequence of algorithms is proposed, that allows to circumvent the problem of computational complexity characteristic of the Ward method. Experimental results are presented to improve the quality of traditional segmentation. Practical significance: the proposed scheme allows to circumvent the problem of computational complexity by dividing the processing course into three consecutive stages. The scheme is suitable for improving the quality of any traditional segmentation.

Keywords: cluster methods, hierarchical image segmentation, the Ward method, reversible calculations, improving the image quality.

References

1. Porshnev S. V., Levashkina A. O. Universal'naya klassifikatsiya algoritmov segmentatsii izobrazhenij [The Universal Classification of Image Segmentation Algorithms] . Zhurnal nauchnykh publikatsij aspirantov i doktorantov - The Journal of Scientific Publications of Post-Graduate Students and Doctoral Students. 2008. V. 3. Pp. 163-172.

2. Ward J. H., Jr. Hierarchical grouping to optimize an objective function. J. Am. Stat. Assoc. 1963. V. 58. Issue 301. Pp. 236-244.

3. Otsu N. A threshold selection method from gray-level histograms. IEEE transactions on systems, man, and cybernetics. 1979. V. 9, No. 1. Pp. 62-66.

4. Lloyd S. P. Least squares quantization in PCM. IEEE Transactions on Information Theory (1957/1982). V. 28, No. 2. Pp. 129-137. DOI: 10.1109/TIT. 1982.1056489.

5. Mumford D., Shah J. Boundary detection by minimizing functionals. IEEE Conference on Computer Vision and Pattern Recognition. 1985. V. 17. Pp. 137-154.

6. Mumford D., Shah J. Optimal approximations by piecewise smooth functions and associated variational problems. Communications on pure and applied mathematics. 1989. V. 42, No. 5. Pp. 577-685.

7. Wang Z., Bovik A. C. A Universal Image Quality Index. IEEE signal processing letters. 2002. V. 9, No. 3. Pp. 81-84.

8. Kharinov M. V., Khanykov I. G. Primenenie metoda Uorda dlya klasterizatsii pikselej tsifrovogo izobrazheniya [Utilization of Ward's Method for Clustering of Pixels of Color Image]. Vestnik Buryatskogo gosudarstvennogo universiteta. Matematika, informatika. [Bulletin of Buryat State University. Mathematics, Informatics]. 2016. No. 4. Pp. 34-42.

9. Kharinov M. V., Khanykov I. G. Optimizatsiya kusochno-postoyannogo pribliz-heniya segmentirovannogo izobrazheniya [Optimization of Piecewise-Constant Approximation for Segmented Image], Trudy SPIIRAN [SPIIRAS Proceedings], 2015. V. 3, No. 40. Pp. 183-202.

10. Khanykov I. G., Kharinov M. V., Patel C. Image Segmentation Improvement by Reversible Segment Merging. (2017, December 1-2). Int. Conf. on Soft Computing and its Engineering Applications, icSoftComp-2017, IEEE Gujarat Section Proceedings. Pp. 1-8. DOI: 10.1109/icsoftcomp.2017.8280096.

11. Kharinov M. Reclassification formula that provides to surpass K-means method // arXiv preprint arXiv: 1209.6204. 2012. Pp. 1-4.

12. Dvoenko S. D. Meanless k-means as k-meanless clustering with the bi-partial approach. Proceedings ofPRIP 2014 Conference, Minsk. 2014. Pp. 50-54.

13.Toffoli T. Reversible Computing. International Colloquium on Automata, Languages, and Programming. Springer, Berlin, Heidelberg, 1980. Pp. 632-634.

i Надоели баннеры? Вы всегда можете отключить рекламу.