Научная статья на тему 'Локализация объектов на цифровом изображении посредством кусочно-постоянных приближений'

Локализация объектов на цифровом изображении посредством кусочно-постоянных приближений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
95
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВОЕ ИЗОБРАЖЕНИЕ / АППРОКСИМАЦИЯ / КУСОЧНО-ПОСТОЯННОЕ ПРИБЛИЖЕНИЕ / КЛАСТЕРИЗАЦИЯ ПИКСЕЛЕЙ / СЕГМЕНТАЦИЯ / ИЕРАРХИЯ / СУММАРНАЯ КВАДРАТИЧНАЯ ОШИБКА / ВЫПУКЛАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ / МЕТОД УОРДА / МЕТОД K-СРЕДНИХ / DIGITAL IMAGE / APPROACHING / PIECEWISE CONSTANT APPROXIMATION / PIXEL CLUSTERING / SEGMENTATION / HIERARCHY / STANDARD DEVIATION / CONVEX SEQUENCE / WARD'S METHOD / K-MEANS METHOD

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Харинов Михаил Вячеславович

Анализируются возможности применения классических методов локализации и детектирования объектов на цветовом изображении посредством генерации иерархической последовательности кусочно-постоянных приближений изображения, описываемой выпуклой последовательностью значений суммарной квадратичной ошибки. Для характеристики наличия объектов на изображении вводится «мера яркостной неоднородности участков изображения», которая оценивается как абсолютная величина приращения суммарной квадратичной ошибки при разделении надвое кластеров пикселей. Предлагается способ кодирования иерархической последовательности разбиений цветового изображения посредством стереопары его полутоновых представлений. Приводятся результаты эксперимента.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LOCALIZATION OF OBJECTS IN A DIGITAL IMAGE BY PIECEWISE CONSTANT APPROXIMATIONS

In this paper classical methods of object localization and detection of objects on a color image are presented. The utilization of classical methods of cluster analysis for object localization and detection through the generation of a hierarchical sequence of piecewise constant image approximations described by a convex sequence of values of the total squared error are analyzed. To characterize the presence of objects in the image, a "measure of the brightness nonuniformity of the image areas" is introduced, which is estimated as the absolute value of the increment of the total squared error caused by dividing into two of pixel clusters. A method for encoding of a hierarchical sequence of color image partitions by means of a stereopair of its halftone representations is proposed. The experimental results are presented.

Текст научной работы на тему «Локализация объектов на цифровом изображении посредством кусочно-постоянных приближений»

УДК 004.932

ЛОКАЛИЗАЦИЯ ОБЪЕКТОВ НА ЦИФРОВОМ ИЗОБРАЖЕНИИ ПОСРЕДСТВОМ КУСОЧНО-ПОСТОЯННЫХ ПРИБЛИЖЕНИЙ

М.В. Харинов

Анализируются возможности применения классических методов локализации и детектирования объектов на цветовом изображении посредством генерации иерархической последовательности кусочно-постоянных приближений изображения, описываемой выпуклой последовательностью значений суммарной квадратичной ошибки. Для характеристики наличия объектов на изображении вводится «мера яркостной неоднородности участков изображения», которая оценивается как абсолютная величина приращения суммарной квадратичной ошибки при разделении надвое кластеров пикселей. Предлагается способ кодирования иерархической последовательности разбиений цветового изображения посредством стереопары его полутоновых представлений. Приводятся результаты эксперимента.

Ключевые слова: цифровое изображение, аппроксимация, кусочно-постоянное приближение, кластеризация пикселей, сегментация, иерархия, суммарная квадратичная ошибка, выпуклая последовательность, метод Уорда, метод К-средних.

Стремительное развитие вычислительной техники и ее внедрение в большинство областей человеческой деятельности сталкивается с необходимостью частичного пересмотра базовых методов обработки данных и общепринятых стереотипов, сложившихся в предшествующий период использования циркуля, линейки и арифмометра в качестве основных инструментов теоретических и практических расчетов. При этом оказывается особенно актуальной модернизация классических принципов обработки данных, обеспечивающие технологический прогресс без чрезмерных трудовых и прочих затрат.

Область цифровой обработки изображений возникла с появлением ЭВМ. При этом ограничения классических методов обработки данных в обработке изображений оказались наиболее заметны. В частности, это касается классического кластерного анализа, применение которого в современной обработке изображений крайне ограничено из-за сложившихся стереотипов, к которым относятся следующие утверждения, касающиеся аппроксимации изображения кусочно-постоянными приближениями:

- сложность современных изображений резко увеличилась и продолжает возрастать;

- минимизация СКО (среднеквадратичного отклонения) является №-полной задачей;

- критерий СКО «плохо согласуется с критерием субъективного восприятия» [1];

- метод К-средних является методом, минимизирующим СКО;

- без привлечения априорных данных об изображении невозможна его эффективная обработка.

В совокупности перечисленные и подобные им утверждения без необходимых оговорок побуждают к ошибочному заключению о неприменимости классического кластерного анализа для построения, программной реализации и широкого внедрения математических моделей изображения, анализируемого без предварительного обучения программной системы и привлечения априорных данных о содержании сцены. При этом по поводу перечисленных утверждений необходимо заметить следующее:

- пока возможности современных средств машинного зрения уступают возможностям человека, сложность изображений, оцениваемая по количеству объектов, остается практически неизменной;

- минимизация СКО является NP-полной задачей, если речь идет о точном решении, но в большинстве случаев обсуждается приближенное решение и ограниченное число кластеров пикселей или сегментов изображения;

- СКО плохо согласуется с субъективным восприятием при сравнении двух независимых изображений, если же изображение сравнивается со своим кусочно-постоянным приближением, то оценка СКО вполне адекватна;

- условие минимизации расстояний до центров кластеров в методе ^-средних не следует из условия минимизации СКО и приводит к множеству ложных «локальных» минимумов;

- за рубежом активно развивается направление «Salient region detection», в котором контекст изображения не предполагается заранее известным.

Целью статьи является развитие модели детектирования объектов на цифровых изображениях с учетом перечисленных уточнений.

Постановка задачи. Постановка задачи локализации и детектирования объектов сцены подобна постановке задачи вычисления на изображении «наиболее заметных областей» (salient region detection [2, 3]). При этом для изображения строится так называемая карта заметных областей, которая обычно преобразуется в черно-белую маску «объект-фон» пороговым преобразованием.

В данной модели кластеризации пикселей изображения постановка задачи [2, 3] обобщается и развивается.

На выходе кластеризации поддерживается бинарная иерархия кластеров, сформированная в алгоритме итерактивного слияния множеств пикселей. Выходная иерархия кластеров содержит N приближений изображения. Приближения содержат всего 2N -1 различных кластеров пикселей. Из них N кластеров неделимы, т к. состоят из отдельных пикселей, а для каждого из N -1 остальных кластеров поддерживается операция разделения надвое, при которой запоминается и по мере необходимости восстанавливается пара кластеров пикселей 1 и 2 , слиянием которых данный кластер 3 получен: 3 ® 1,2 : 3 = 1 и 2 .

Иерархическая кластеризация пикселей, в частности, сегментация изображения, выполняется для последующей фильтрации и формирования «объектов интереса» из множества «объектов», детектируемых компьютером в виде кластеров пикселей приближений изображения. Пиксели приближения, относимые к различным кластерам, при актуальных значениях числа кластеров различаются по цвету.

На этапе кластеризации пикселей, выполняемой для последующей фильтрации объектов, возникает проблема упорядочения кластеров пикселей (цветов) по некоторому признаку «заметности», «контрастности» [2,3] или, в терминологии [4], «сложности» фрагмента изображения. Фактически, требуется ввести своего рода меру яркостной неоднородности пикселей на участках изображения, обеспечивающую локализацию и детектирование иерархически структурированных объектов, и при этом являющуюся таким же предсказуемым параметром, как число п пикселей в кластере, которое монотонно уменьшается по мере разделения данного кластера 1 и 2 на составные части 1 и 2: п(1 и 2)> п(1), п(2).

Минимизация СКО. Для решения сформулированной задачи необходимо эффективно вычислять квазиоптимальные приближения изображения, аппроксимирующие оптимальные приближения с установленной точностью.

Известно, что последовательность оптимальных приближений в зависимости от числа g кластеров пикселей в приближении описывается

монотонно возрастающей последовательностью ЛЕ2 £ ЛЕ3 £... .. £ ЛЕ^-1 £ 0 неположительных приращений Е или выпуклой последовательностью самих значений Е :

Ег £ Е-1 + Е +1, g = 2,3,...,N-1. g 2

В общем случае последовательность оптимальных приближений не является иерархической, в чем нетрудно убедиться на примере изображения с линейным возрастанием яркости по одной из координат. Для вычисления, запоминания и преобразования оптимальных приближений цветового изображения с разумной вычислительной сложностью пока не создано эффективных алгоритмов. Поэтому в развиваемой модели квазиоптимальной кластеризации пикселей решается задача аппроксимации последовательности оптимальных приближений иерархической последовательностью приближений с числом g кластеров пикселей от 1 до N. Полагается, что:

- в целевой иерархии квазиоптимальных приближений любая тройка, вложенных друг в друга кластеров описывается выпуклой последовательностью трех значений ошибки аппроксимации. Так же, как это имеет место в случае неирархической последовательности оптимальных приближений;

- при некотором числе кластеров g о, задаваемом в диапазоне от 2 до N -1, иерархия квазиоптимальных приближений максимально приближается по Е к последовательности оптимальных приближений.

162

Здесь число кластеров go вводится как модельный параметр. Полагается, что при g = go изображение разделяется на целостные объекты, части которых не встречаются при g > go, а объединения не встречаются при g < go. Эти соображения позволяют выбирать параметр go для наилучшего детектирования конкретных «объектов интереса».

Формально требования к минимизации E при аппроксимации изображения приближением c go кластерами пикселей выражаются тремя утверждениями:

1) итеративное разделение каждого кластера надвое в зависимости от числа кластеров g описывается выпуклой последовательностью значений E;

2) ошибку аппроксимации E при данном числе go кластеров пикселей (цветов в приближении изображения) нельзя уменьшить посредством разделения одного кластера надвое и слияния двух других кластеров;

3) при установленном параметре g = g o ошибку аппроксимации E нельзя уменьшить посредством реклассификации (переноса) той или иной предусмотренной части из одного кластера в другой кластер пикселей.

Здесь первое условие непосредственно следует из первого условия предыдущего списка и в расчетах обеспечивается итеративной кластеризацией пикселей по методу Уорда [5,6]. Второе условие обеспечивается применением версии SI (Segmentation 1тргоуетеП;)-метода [7] снижения ошибки аппроксимации E. Третье условие обеспечивается минимизацией E и s методом «К-средних без средних» [8,9].

Применение оригинальной версии Уорда [6] обеспечивает выполнение первого и второго условий, но требует чрезмерно много времени. В ускоренном варианте первые два условия обеспечиваются поочередным применением SI-метода в сочетании с обработкой методом Уорда изображения по частям, т.е. по кластерам пикселей, обрабатываемым как самостоятельные изображения. Если обсуждаемые условия выполняются, то иерархия приближений с числом кластеров g от go до N методом Уорда достраивается до полной иерархии приближений с g от 1 до N, описываемой выпуклой последовательностью Ei,E2,...,En значений ошибки аппроксимации E. При этом благодаря второму условию не возникает нарушения выпуклости при go кластерах, и достигаются ограниченные значения ошибки аппроксимации Eg , которые не превышают определенного порога:

Eg£ Ei

\ - gЛ

N

V /

где Е1 - ошибка аппроксимации изображения одинаковыми пикселями средней яркости.

Таким образом, гарантируется исправление грубых начальных приближений изображения. Третье условие при выполненных первых двух обеспечивает дальнейшую минимизацию Eg при g = gо кластерах.

В целом, обсуждаемые три условия обеспечивают аппроксимацию оптимальных приближений квазиоптимальными, и аппроксимацию выпуклой последовательности оптимальных значений ЕШ1П такой же выпуклой последовательностью значений Eg, с минимизированной разницей

Eg - Eg » 0 при g = gо кластерах.

Метод Уорда. Апостериори любую выпуклую последовательность Eg=l, Eg=2, ..., Eg=N, можно получить укрупнением пикселей методом

Уорда, в котором вначале каждый пиксель составляет самостоятельный кластер. Затем на каждом шаге сливается пара кластеров i, у, отвечающая минимальному приращению ошибки аппроксимации ЛЕте^е(г, у):

г, У ® I и у : г, у = а^шт ЛЕтег§е(1,у), ¡,]=0,2,..^-1

где число кластеров снижается от N до 1, а приращение ошибки аппроксимации ЛЕте^е(/, у) выражается через число пикселей щ, пу и трехком-

понентные средние значения ¡^, I у пикселей внутри кластеров i, у в виде

у

2

^те^е ^ У) = -ЛЕрШ(г и у) = -П+П-6 ^ щ + п у

¡г - ¡у

> 0.

где ЛЕ8рцг (г и у )£ 0 - неположительная величина приращения ошибки аппроксимации при разделении надвое кластера г и у .

Если каждому кластеру г и у из двух и более пикселей сопоставляется падение |ЛЕр^ (г и у) ошибки аппроксимации Е при его разделении надвое, т.е. на пару кластеров г,у, слиянием которых он получен, то величина \ЛЕ8р1^ (г и у) монотонно убывает по мере разделения кластеров надвое:

\ЛEsplit(г и 7 } > \ЛEsplit(г ^\ЛEsplit (7 } .

Поэтому величина |ЛЕр^ (г и у)| может рассматриваться в качестве

искомого параметра, характеризующего меру яркостной неоднородности или сложности фрагмента изображения, который составляют пиксели данного кластера г и у .

Рис. 1 иллюстрирует результаты обработки стандартного изображения «Лена» методом Уорда. Вместо исходного изображения в левом верхнем углу демонстрируется его кусочно-постоянное приближение, полученное усреднением цветов сегментам приближения изображения в 16 цветах.

Справа от изображения на рис. 1 показана стереопара полутоновых представлений изображения, которая задает кластеризацию пикселей изображения на 1, 2, ... ,16 кластеров и называется «стереопарой рейтинга объектов». В нижнем ряду демонстрируются сами кластеры изображения с номерами 0, 1 и 2 при общей нумерации # составных кластеров от 0 до

N - 2 в порядке убывания \ДЕ8рЦ1 (#). Одна из двух «половин», на которые

разделяется каждый кластер, помечена узором в виде квадратной решетки. Под представлениями изображения приводится сопутствующая информация.

22943 цвета

ш I

16 тонов

к, VI.

16 тонов

ЛЕ^, (0) = 1044118472 |ЛЕ^ (1) = 199485831 |ЛЕ^, (2) =

166789840

Рис. 1. Верхний ряд: приближение изображения с 25186 сегментами (слева) и пара рейтинговых представлений объектов (справа). Нижний ряд: начальные составные кластеры пикселей № 0 - 2 (слева - направо)

Кодирование иерархии кластеров пикселей в стереопаре рейтинга объектов выполняется в порядке последовательного разделения кластеров надвое и сводится к записи номера итерации по координатам одной «половины» кластера в первом представлении стереопары и другой «половины» во втором представлении. При этом в первое представление записываются координаты «половины» кластера, центр тяжести которых находится левее, а во второе представление стереопары - координаты, центр тяжести которых находится правее. Альтернативные «половины» кластеров в каждом представлении стереопары сохраняют обозначения материнского кластера.

Для считывания координат пикселей минимального кластера с максимальным номером # достаточно составить для каждого представления стереопары и объединить списки координат пикселей максимальной ярко-

165

сти. При этом замена максимальных значений пикселей на номера материнского кластера в каждом представлении обеспечивает редукцию стереопары рейтинга объектов и извлечение следующего кластера с номером #-1.

Стереопара рейтинга объектов позволяет задать иерархию N -1 составных кластеров пикселей в виде двух полутоновых изображений с одинаковым числом N -1 тонов яркости. Наглядную визуализацию иерархической кластеризации рис. 1 полезно использовать при настройке локализации и детектирования объектов, например, при установлении диапазона номеров # , обеспечивающих проявление на изображении «объектов интереса» при достаточно малой доле случайных искажений.

Метод А-средних без средних. В силу выраженной повторяемости пар кластеров г, у , отвечающих минимальным значениям ЛЕ^г^/', у), на

начальных шагах слияния кластеров результаты итеративного слияния кластеров методом Уорда зависят от выбора порядка слияния и описывается множеством переплетающихся выпуклых последовательностей значений ошибки аппроксимации Е^1, Eg=2, ..., Eg=N [10].

Выбор иерархии и отвечающей ей кривой Eg=l, Eg=2, ..., Eg=N в

г ~ т-шт т-шт т-шт

точке g = g0, приближающейся к кривой Eg=l, Eg=2, ..., Eg=N, для оптимальных значений обеспечивается методом К-средних без средних, в котором для иерархии частей у кластеров г минимизируется (если достигается) отрицательное приращение ЛЕсоггес1.(/', у, к) ошибки аппроксимации: г, у, к = а^шт ЛЕ^е^, Л к) < 0,

г,у=1,2,...,^0, к=1,...,2п/-1 где приращение ЛЕ^^^г, у, к) ошибки аппроксимации при реклассифи-кации к-й части кластера г в кластер у выражается в виде

ЛЕсотс, (г, у, к )=у. Iу - ¡к 2 -ЛЦг _ ¡кР,

пу + пк

п/ - пк

где пг, пу, пк < пг и ¡г, ¡у, ¡к - значения числа пикселей и трехмерных

средних яркостей в кластерах г,у,к соответственно.

Выписанная формула следует из условия минимизации Е или о. Если в ней опустить дробные коэффициенты, учитывающие количества пикселей щ, пу, пк в кластерах г, у, к, то получится критерий минимизации метода ^-средних. При расчетах с помощью линейки, циркуля и арифмометра метод ^-средних позволяет избежать операций с чрезмерно большими числами и трудоемкой операции извлечения квадратного корня на арифмометре. Но в приложении к кластеризации пикселей этот метод приводит к большому числу ложных решений, главным образом, из-за нарушения порядка слияния/разделения кластеров, выбираемого из условия минимизации приращения ошибки аппроксимации ЛЕ на каждом шаге формирования бинарной иерархии приближений изображения.

166

Динамические деревья. Скоростные операции с иерархически структурированными кластерами пикселей изображения поддерживаются в терминах деревьев. При этом вместо традиционных деревьев, дендро-грамм и пр. удобнее использовать динамические деревья Слейтора - Тарь-яна [11 - 13]. Если в традиционной интерпретации дерева при слиянии множеств пикселей порождается новый узел, то при интерпретации по Слейтору - Тарьяну сами пиксели упорядочиваются в структуре дерева, и слияние множеств пикселей описывается установлением дуги между корневыми узлами деревьев.

Рис. 2 поясняет различие в интерпретации деревьев на примере изображения из четырех пикселей.

о о о о] о; о| Гоу

Рис. 2. Формирование бинарной иерархии кластеров пикселей в терминах традиционных деревьев (вверху) и динамических деревьев

Слейтора - Тарьяна (внизу)

В отличие от традиционных деревьев при использовании динамических деревьев Слейтора - Тарьяна:

- метаданные, описывающие иерархию кластеров пикселей, и сами кластеры задаются на одном и том же множестве координат;

- для минимизации е или а реализуется обобщенный механизм обратимых вычислений, при котором состояние вычислительной системы в любой момент времени восстанавливается не обязательно прежним, и реализуется минимизация е при обратном ходе вычислений;

- бинарная иерархия кластеров пикселей, описываемая бинарными традиционными деревьями, задается, вообще говоря, нерегулярными динамическими деревьями Слейтора - Тарьяна.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Динамические деревья Слейтора - Тарьяна позволяют реализовать все возможности традиционных деревьев при минимальных затратах памяти и благодаря первому из перечисленных свойств обеспечивают простейшую реализацию обратимых вычислений. В разработанной структуре данных динамические деревья (ациклические графы) строятся в нескольких видах и дополняются циклами (циклическими графами), в сочетании с которыми они образуют динамическую сеть, поддерживающую скоростное вычисление, запоминание и преобразование миллионов множеств пикселей в оперативной памяти компьютера.

Заключение. Реализованный в терминах динамической сети аппарат генерации и оптимизации кусочно-постоянных приближений изображения по ошибке аппроксимации E или среднеквадратичному отклонению о (СКО) обеспечивает:

- улучшение любой традиционной сегментации изображения, причем как по E (или о), так и по визуальному восприятию [14];

- улучшение любой иерархической сегментации изображения по тем же параметрам [15];

- синхронное выделение объектов на двух изображениях стереопары или нескольких изображениях, снятых в различном ракурсе и совмещенных в одно изображение [16].

Правда, имеющееся в настоящее время программное обеспечение не позволяет единообразно выделять объекты на стереопарах, обрабатываемых как раздельные изображения. По всей видимости, это связано с разбросом оптимизированных приближений по E (или о) при начальных значениях g 0, для которых пока программно не реализован метод ^-средних без средних [8].

Список литературы

1. Сойфер В.А. Методы компьютерной обработки изображений. М.: Физматлит, 2001. 784 с.

2. Frequency-tuned salient region detection / R. Achanta, S. Hemami, F. Estrada, S. Susstrunk // Computer vision and pattern recognition (CVPR): IEEE conference. 2009. P. 1597 - 1604.

3. Global contrast based salient region detection / M.M. Cheng, N.J. Mitra, X. Huang, P.H. Torr, S.M. Hu // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2015. V. 37(3). P. 69 - 582.

4. Чочиа П. А. Теория и методы обработки видеоинформации на основе двухмасштабной модели изображения: дис. ... д-ра техн. наук. М.: ИППИ РАН, 2016. 302 с.

5. Прикладная статистика: Классификация и снижение размерности / С. А. Айвазян, В.М. Бухштабер, И.С. Енюков, Л. Д. Мешалкин. М.: Финансы и статистика, 1989. 607 с.

6. Ward Jr J. H. Hierarchical grouping to optimize an objective function // Journal of the American statistical association. 1963. V. 58. No. 301. P. 236 -244.

7. Харинов М.В., Ханыков И.Г. Оптимизация кусочно-постоянного приближения сегментированного изображения // Труды СПИИРАН. 2015. Вып. 3(40). С. 183 - 202.

8. Dvoenko S.D. Meanless k-means as k-meanless clustering with the bi-partial approach // Proc. of the 12th International Conference on Pattern Recognition and Information (PRIP'2014). Minsk, Belarus. 2014. P. 50 - 54.

9. Kharinov M.V. Reclassification formula that provides to surpass K-means method // arXiv preprint, arXiv:1209.6204, 28 Sep 2012. 10 p.

10. Ханыков И. Г., Харинов М.В. Модель цифрового изображения на основе модифицированного метода Уорда кластеризации пикселей // Вестник Бурятского государственного университета. Математика, информатика. Улан-Удэ: Изд-во Бурятского госуниверситета, 2017. №2. С. 61 - 70.

11. Харинов М.В. Разработка динамических структур данных системы автоматизированного распознавания изображений: автореф. дис. ... канд. техн. наук. СПб., 1993. 20 с.

12. Nock R., Nielsen F. Statistical Region Merging // IEEE Trans. Pattern Anal. Mach. Intell. 2004. 26(11). P. 1452 - 1458.

13. Kharinov M.V. Pixel Clustering for Color Image Segmentation // Programming and Computer Software. Pleiades Publishing, Ltd. 2015. V. 41. No. 5. P. 258 - 266.

14. Khanykov I.G., Kharinov M.V., Patel С. Image segmentation improvement by reversible segment merging // International Conference on Soft Computing and its Engineering Applications (icSoftComp). Changa, Anand, India, IEEE Publisher, 2017. P. 1 - 8.

15. Харинов М.В. Основы модели квазиоптимальных приближений изображения // Вестник Бурятского государственного университета. Математика и информатика. 2016. №1. С. 60 - 72.

16. Харинов М.В., Ханыков И.Г. Комбинированный метод улучшения сегментации изображения // Вестник Бурятского государственного университета. Математика и информатика. 2015. №9. С. 118 - 124.

Харинов Михаил Вячеславович, канд. техн. наук, доцент, старший научный сотрудник, kharaiias. spb. su, Россия, Санкт-Петербург, Санкт-Петербургский институт информатики и автоматизации Российской академии наук

LOCALIZA TION OF OBJECTS IN A DIGITAL IMAGE BY PIECEWISE CONSTANT

APPROXIMA TIONS

M. V. Kharinov

In this paper classical methods of object localization and detection of objects on a color image are presented. The utilization of classical methods of cluster analysis for object localization and detection through the generation of a hierarchical sequence of piecewise constant image approximations described by a convex sequence of values of the total squared error are analyzed. To characterize the presence of objects in the image, a "measure of the brightness nonuniformity of the image areas" is introduced, which is estimated as the absolute value of the increment of the total squared error caused by dividing into two of pixel clusters. A method for encoding of a hierarchical sequence of color image partitions by means of a stereopair of its halftone representations is proposed. The experimental results are presented.

Key words: digital image, approaching, piecewise constant approximation, pixel clustering, segmentation, hierarchy, standard deviation, convex sequence, Ward's method, K-means method.

Kharinov Mikhail Vyacheslavovich, candidate of technical sciences, docent, senior researcher, khar@,iias. spb. su, Russia, St. Petersburg, St. Petersburg Institute for Informatics and Automation of the Russian Academy of Sciences

УДК 621.327

ФОРМИРОВАНИЕ ТЕХНОЛОГИИ ПОЛУЧЕНИЯ И ОБРАБОТКИ ИЗОБРАЖЕНИЙ НА БАЗЕ ЭРЕДИТАРНОЙ МОДЕЛИ

А.И. Алатар, А.А. Михайлов

Приведен сравнительный анализ динамических систем с полной памятью, которые проходят через все состояния непрерывным образом без потерь и представляются интегралом свертки, марковских систем с полным отсутствием памяти и эредитарных систем, занимающих промежуточное место между марковскими и простыми системами с полной памятью для использования их при восстановлении динамических изображений. Рассмотрена возможность использования наиболее простых wavelet-преобразований при формировании эредитарной модели для алгоритмов обработки динамических изображений с родительской (материнской) wavelet-функцией в виде ступенчатой функцией Хаара (интегрирование первого порядка), которые можно использовать в обобщенном спектральном анализе динамических изображений, например при их сжатии.

Ключевые слова: марковские системы с полным отсутствием памяти, эредитарные системы, системы с полной памятью, wavelet-преобразования, функция Хаара, фрактал.

Современное состояние решения проблемы. Условия, в которых внедряются в настоящее время глобальные системы позиционирования и наблюдения, ужесточают требования к качеству решения задачи получения и обработки изображений. Большинство технологических операций технологии решения данной задачи заимствованы из области традиционной статистической цифровой обработки сигналов, а повышение качества изображений достигается использованием комплекса решения подзадач обработки изображений: улучшением (коррекцией), фильтрацией и восстановлением (реставрацией) [1]. Искажения изображений вызываются вносимыми системой регистрации смазом или расфокусировкой, а также шумом, и технология решения задачи уменьшения искажений путем фильтрации, реконструкции и восстановления искаженных изображений сводится к компенсации искажений. Наиболее эффективные технологии решения задач обработки изображения характеризуются учетом всей возможной априорной информации об исследуемом объекте, разнообразие которой определяет нотация решаемой задачи. Эффективность получаемых оценок повышается с полнотой априорной информации об исследуемых процессах, которая тоже задается в нотации решаемой задачи. Разнообразие нотационных элементов определяет и разнообразие моделей для технологий решения задач получения и обработки изображения.

i Надоели баннеры? Вы всегда можете отключить рекламу.