Научная статья на тему 'Адаптивная оценка количества информации изображения'

Адаптивная оценка количества информации изображения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
385
65
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
адаптивная оценка / изображение / количество информации изображения

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Харинов Михаил Вячеславович, Евневич Елена Людвиговна, Белаш Елена Владимировна

Предлагается формальная интерпретация колмогоровской оценки количества информации, для которой изображение раскладывается в сумму инвариантного и произвольного представлений. При этом инвариантное представление вычисляется по изображению независимо от изменения произвольного представления в определенных пределах. Количество информации оценивается как объем цифровых данных произвольного представления в байтах. Для адаптации оценки количества информации к текущим условиям вычислений в алгоритмах иерархической сегментации строится последовательность оценок убывающей величины. Приводятся экспериментальные результаты.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Харинов Михаил Вячеславович, Евневич Елена Людвиговна, Белаш Елена Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A formal interpretation for Kolmogorov information quantity estimation is proposed and described in terms of image processing, the image under estimation being decomposed into the sum of invariant and arbitrary representations. An Invariant representation is constructed in the frameworks of restricted variations of the arbitrary one within the computed limits. The information quantity is estimated as a number оf bytes of the arbitrary representation. For the adaptation of the estimation of the information quantity to the current conditions, a sequence of decreasing estimation values is constructed by algorithms оf a hierarchical segmentation. The experimental results are presented.

Текст научной работы на тему «Адаптивная оценка количества информации изображения»

УДК 681.322; 681.391 М. В. Харинов, Е. Л. Евневич, Е. В. Белаш

АДАПТИВНАЯ ОЦЕНКА КОЛИЧЕСТВА ИНФОРМАЦИИ ИЗОБРАЖЕНИЯ

Предлагается формальная интерпретация колмогоровской оценки количества информации, для которой изображение раскладывается в сумму инвариантного и произвольного представлений. При этом инвариантное представление вычисляется по изображению независимо от изменения произвольного представления в определенных пределах. Количество информации оценивается как объем цифровых данных произвольного представления в байтах. Для адаптации оценки количества информации к текущим условиям вычислений в алгоритмах иерархической сегментации строится последовательность оценок убывающей величины. Приводятся экспериментальные результаты.

Хранение, передача, анализ и распознавание изображений предполагает количественную обработку содержащейся в изображении информации. Для оценки количества информации существуют классические подходы [1-3]. Они могут служить первоосновой для построения эффективных решений, что, однако, пока недостаточно подтверждается сложившейся практикой и компенсируется разделением области обработки изображений на множество предметных областей. С одной стороны, применению классических подходов к количественной оценке информации препятствует неопределенность, многозначность самого понятия информации, что отмечается в современных исследованиях по проблемам информатики [4]. С другой стороны, классические оценки количества информации в современных условиях оказываются неочевидными для эффективной программной реализации на ЭВМ и требуют уточнения в терминах обработки изображений [5].

В настоящей статье предлагается интерпретация количества информации согласно комбинаторному подходу А. Н. Колмогорова [3]. Интерпретация развивается на примере изображений. Изображение описывается как некий виртуальный носитель цифровых данных (ВНЦД) с аддитивно записанной на нем

информацией «сообщения» (природной, встроенной, шумовой и пр.), изменение которой не влияет на результат сегментации изображения по определенному алгоритму. При этом виртуальный носитель вычисляется как сегментированное изображение и представляется как своеобразная среда существования информации сообщения, подобная ячейкам памяти, ленте или диску. Подобно обычному диску ВНЦД обеспечивает запись/считывание информации без искажений и имеет не зависящую от записываемых данных емкость.

В отличие от обычного диска емкость ВНЦД:

- выбирается из нескольких предусмотренных значений;

- изменяется от точки к точке;

- выражается нецелым числом бит.

Формальное определение виртуального носителя цифровых данных (ВНЦД) фиксированной емкости описывается далее.

Определение ВНЦД. Под координатой х условимся понимать множество точек минимального сегмента (клетки, пиксела) изображения, обычно указываемое парой значений, относящихся к центральной точке. Используя множество х в качестве аргумента функции, будем заключать его в фигурные скобки. Далее, чтобы не перегружать формульное описание специальными терминами, условимся минимальный сегмент (пиксел) именовать точкой изображения, если речь не идет об объединении сегментов. Под представлением изображения имеется в виду преобразованное изображение, полученное на исходном множестве координат по некоторому алгоритму.

Рассмотрим множество и изображений и, заданных ограниченными дискретными яркостными функциями и(х) на одном и том же множестве координат х. (Термины «изображение» и «яркостная функция» употребляются далее как синонимы).

Построим некоторое отображение Я множества и изображений и во множество подмножеств и.

Пусть Я — такое, что совпадение образов любых изображений и и V из и равносильно условию, что прообразы и и V принадлежат любому из них.

Яи = Яv о и, V е Яи.

В частности, и принадлежит своему образу Яи.

Тогда получается, что множество образов вида Яи порождает разбиение множества и. Указанное разбиение описывается отношением ~ изображений и и V, которое на множестве и определяется условием совпадения их образов:

и ~ V о Яи = Яv .

Очевидно, оно является отношением эквивалентности, а Яи — классами эквивалентности по отношению ~. Пример вычисления Яи описывается ниже.

Пусть Q — некоторый алгоритм выбора представителя из каждого множества Яи. Определим преобразование QЯ:

ШЯ )и = ( Q ( Яи ))еи .

Тем самым определим преобразование Р множества изображений и в себя, которое, очевидно, при повторном применении остается неизменным:

р = оя = р2,

то есть преобразование Р обладает свойством идемпотентности (проекционно-сти). Под идемпотентным (проекционным) представлением Ри{х} понимается результат преобразования изображения.

Рассмотрим для координаты х множество значений функций яркости и{х], V{х],... изображений и, V... из одного класса Ри. Обозначим через к{х}

количество различных значений, которые принимают функции яркости различных изображений из Ри в координате х.

Для получения оценки количества информации, по А. Н. Колмогорову, рассмотрим к{х} значений функций яркости из класса Ри в координате х в качестве значений независимых переменных. Согласно условию независимости переменных построение нового изображения (функции яркости) путем произвольного выбора в каждой координате х одного из к{х} значений дает изображение из того же класса Ри.

Количество изображений, построенных вышеуказанным способом, оценивается как произведение значений к {х] по всем координатам: Пк {х} . Приме-

х

няя комбинаторную колмогоровскую оценку [3], получаем:

2' =П к {х] о I = £ ад,

хх

где '{х} = 1о§2 к {х] — комбинаторная оценка, по А. Н. Колмогорову, количества бит информации для координаты х, а I — суммарное количество бит информации изображения и в целом.

По построению Ри{х} инвариантно относительно независимого изменения значений и{х} в пределах к{х} значений.

Определение. Инвариантное идемпотентное (проекционное) представление Ри{х} называется виртуальным носителем цифровых данных (ВНЦД).

Если в рассматриваемых выражениях под элементарными, неделимыми носителями информации вместо отдельных пикселов понимать некоторые их объединения (связные сегменты изображения, объединения сегментов и пр.) с одинаковыми значениями к, которые избыточным образом содержат повторяющуюся информацию, приписанную каждому из пикселов, то х следует трактовать как объединения координат. Тогда суммирование количества информации по отдельным пикселам определяет емкость изображения, которая, вообще говоря, превышает количество содержащейся в нем информации. Далее, имея в виду суммирование по отдельным пикселам, будем называть величину '{х} емкостью пиксела (точки, отсчета яркости в точке х), а величину I — емкостью изображения. В общем случае, когда речь идет о произвольном объединении пикселов, продолжаем использовать термины «количество информации» и «координата», где под координатой понимается пиксел, связный сегмент в виде объединения пикселов одной емкости либо некоторая совокупность сегментов из пикселов равной емкости с повторяющейся информацией.

196

Интерпретация ВНЦД. Уточним способ построения отображения Я. Множество Яи определяется парой яркостных функций т и М, которые вычисляются по изображению и как его приближения снизу и сверху, то есть в каждой координате х значение т{х} не превосходит и{х}, а значение М{х} не меньше и{х}. В простейшем случае полагается, что произвольная функция V принадлежит множеству Яи, если ее значение в каждой координате х лежит в установленных пределах [т { х}, М { х}]:

V е Яи о Ух т{х} < у{х} < М{х}.

В этом случае к{х} совпадает с увеличенной на 1 разностью точной верхней и точной нижней границ:

к{х} = 1 + М {х} - т{х},

а множество представлений Яи имеет смысл окрестности изображения и.

Запишем функцию яркости и{х} из окрестности Яи в виде Ри {х} + к {х} :

т {х} < Ри {х} + к {х} < М {х},

где к{х} — встроенное (например, скрытое «сообщение»), которое кодируется произвольным изменением яркостей изображения по координатам х в пределах значений числового отрезка [т {х}, М {х}]. Тогда виртуальный носитель Ри{х} описывается (рис. 1) соотношением

Р(Ри {х} + к{х}) = Ри {х}.

Изображение и {х} ВНЦД Ри Iх)

Границы т >М

Рис. 1. Представление виртуального носителя цифровых данных для одномерного фрагмента изображения из отдельных пикселов

Рис. 1 поясняет идею ВНЦД, которая заключается в том, что, с одной стороны, ВНЦД вычисляется по исходному изображению, а с другой стороны, не зависит от исходного изображения в допустимых пределах произвольных ярко-стных изменений.

Смысл определения ВНЦД сводится к тому, что по исходному изображению (темная линия на рис. 1) в каждой точке х вычисляется диапазон допустимого изменения яркости между точной нижней границей т{ х} и точной верхней границей М{ х}, которые не меняются при варьировании изображения в установленных пределах. На рис. 1 окрестность Ри в виде «коридора» ограничена пунктирными линиями. Виртуальный носитель цифровых данных Ри{х} вычисляется как функция, заданная внутри «коридора» Ри, например, как осевая линия (светлый пунктир на рис. 1). Сообщением считается информация, кодируемая в каждой точке разностью яркости изображения и яркости ВНЦД Ри{х}, который служит началом отсчета. Ширина «коридора» в точке х, равная к{х}, определяет емкость или количество информации 1{х} = 1о§2 к {х}, которое содержится в данной точке (отсчете яркости, пикселе) изображения.

Для конкретизации оценки количества информации необходимо уточнить, что преобразование Р относится к алгоритмам сегментации [5-8] с уменьшением в представлении Ри{х} числа связных сегментов из одинаковых пикселов за счет слияния сегментов изображения и{х}. В зависимости от решаемой задачи преобразование Р может уточняться и модифицироваться следующим образом:

1. Для сохранения наглядного сходства изображения и{ х} и представления Ри{х} имеет смысл требовать, чтобы в представлении Ри{х} яркостные соотношения больше/меньше между парами точек изображения и{х} не менялись на противоположные и сохранялись с точностью до преобразования в равенства (рис. 1). (При указанном сохранении яркостных соотношений Ри{х} является гомоморфным образом и{х} по яркостному порядку).

2. Для инвариантной оценки количества информации изображение предварительно замещается некоторым идемпотентным представлением Ри {х} (где

Р2 = Р ), которое не зависит от изменения абсолютной величины разности яркостей между произвольными (или только смежными [6]) точками изображения при сохранении яркостных соотношений больше/меньше. При этом свойства инвариантности представления Р и {х}, очевидно, переносятся и на оценку количества информации.

Таким образом, в изложенной интерпретации комбинаторного подхода А. Н. Колмогорова оценка количества информации, как и в алгоритмическом подходе того же автора [3], опирается на сравнение двух последовательностей яркостных кодов (в данной статье — яркостей пикселов исходного и сегментированного изображения). Однако предлагаемая оценка отождествляется не с объемом программы преобразования одного изображения в другое, а с объемом произвольных цифровых данных, которые помещаются в допустимые диапазоны яркостного изменения, определяемые некоторым алгоритмом сегментации. Конкретный алгоритм сегментации изображения может выбираться из работ [5-8] с учетом пп. 1-2 в зависимости от типа задачи: автоматизация распозна-

вания объектов, улучшение зрительного восприятия, повышение надежности передачи видеоданных и пр.

Адаптивная оценка количества информации. Для адаптивной оценки количества информации в условиях конкретной задачи итеративно строится иерархическая последовательность вложенных окрестностей изображения (в виде вложенных «коридоров), которая порождает последовательность убывающих оценок количества информации.

На последовательных итерациях вложенные окрестности ограничиваются монотонными приближениями яркости изображения снизу и сверху, которые стягиваются к изображению (рис. 2) и на определенном шаге совпадают с ним.

Яркость

1

Пределы произвольного изменения яркости 1 1

Изображение Г 1-1

1 1 | Приближения изображения снизу

—►

Номер итерации

Рис. 2. Последовательность приближений яркости пиксела изображения

Для каждой итерации устанавливаются пределы изменения яркостей изображения, при которых произвольное изменение яркости в определенном диапазоне влияет только на последующие приближения (пунктир на рис. 2) и не влияет на приближения изображения снизу и сверху на текущей и предыдущих итерациях. Тогда на текущей итерации разность приближений изображения сверху и снизу определяет диапазон произвольного изменения яркости и соответствующую оценку количества информации. Последовательность убывающих оценок определяет адаптивную оценку количества информации в точках изображения и для изображения в целом.

Конкретный результат построения приближений на примере первых четырех итераций обработки стандартного изображения «Лена» по алгоритму иерархической сегментации [6-8] (в гистограммном варианте) иллюстрируется рис. 3.

Первая и третья колонки рис. 3 показывают итеративные приближения изображения снизу и сверху, которые различаются взаимно однозначным преобразованием градаций яркости и сохраняют яркостные соотношения исходного изображения с точностью до замещения неравенств равенствами, то есть являются гомоморфными образами изображения по яркостному порядку. Геометрически приближения представляют собой иерархию вложенных разбиений изображения с возрастающим числом сегментов. При этом яркости пикселов

I______

{0 5-8 10-11 13 16-17 22 30 41}

Рис. 3. Построение ВНЦД и оценка емкости изображения: первая колонка — приближения изображения снизу, вторая колонка — виртуальные носители цифровых данных; третья колонка — приближения сверху; четвертая колонка —

представления емкости ВНЦД

приближений снизу и сверху вычисляются как граничные яркости из определенного диапазона, который на следующей итерации разделяется на поддиапазоны. Полагается, что пикселы изображения, имеющие граничные яркости того

или иного диапазона, не подлежат изменению и имеют нулевую емкость, а их яркости как внешние границы определяют пределы изменения остальных пикселов с яркостями из того же диапазона. Благодаря сохранению в приближениях изображения снизу и сверху пикселов граничной яркости по любому промежуточному приближению как по исходному изображению воспроизводится вся иерархия предыдущих приближений снизу и сверху, включая рассматриваемые приближения. Пикселы неделимых диапазонов яркости, которые имеют в приближениях снизу и сверху одинаковые яркости (совпадающие с яркостью исходного пиксела изображения), считаются незначащими, а остальные пикселы

— значащими. Незначащим пикселам, а также пикселам изображения, для которых яркости приближений снизу и сверху различаются на 1, приписывается нулевое число возможных значений яркости (они ограничивают пределы изменений пустого множества остальных пикселов).

Во второй колонке на рис. 3 для каждой итерации показана последовательность виртуальных носителей цифровых данных (ВНЦД), вычисленных по приближениям снизу и сверху как некоторое промежуточное приближение. Каждый виртуальный носитель, обрабатываемый как исходное изображение, определяет последовательность предыдущих носителей цифровых данных и воспроизводится на рассматриваемой итерации. Над виртуальными носителями для каждой итерации указана емкость ВНЦД в байтах. При этом на рис. 3 указана интервальная оценка емкости. Верхняя граница емкости вычислена в предположении записи данных сообщения в полные яркостные диапазоны, содержащие нецелое число бит. Нижняя оценка отражает объем произвольных данных, содержащихся в целочисленных количествах бит емкости ВНЦД. Интервальная оценка емкости выполнена для неизбыточной записи данных без дублирования в пределах сегментов или градаций яркости.

В последней, четвертой, колонке приведены представления емкости ВНЦД, показывающие для каждого пиксела число возможных значений яркости. Яркости визуальных картин эквидистантно нормализованы на полный рабочий диапазон. Под каждой картиной в фигурных скобках выписаны яркост-ные градации ненормализованного представления.

Применение. Характерной областью применения адаптивной оценки количества информации является область передачи цифровых данных (сообщений), неявно встроенных в изображение, или оцифрованный звуковой сигнал [9].

В задачах указанной области предложенная оценка количества информации трактуется в буквальном смысле объема сообщения, которое встраивается в исходное изображение (контейнер) без нарушения ВНЦД. Последовательность оценок количества информации позволяет при заданном объеме сообщения подобрать подходящую емкость контейнера, чтобы обеспечить минимальное изменение яркостей контейнера при максимальном распределении встроенных данных по его объему.

В сравнении с известными методами преимущества использования сокрытия данных посредством адаптивной оценки количества информации иллюстрируются рис. 4.

Предлагаемый

метод

Рис. 4. Представления емкости в различных методах сокрытия сообщений

На рис. 4 показаны представления емкости при встраивании сообщения известными и предлагаемым методом:

а) в простейшем варианте «ЬББ»-метода [9], в котором сообщение кодируется изменением фиксированного числа младших бит в последовательных байтах изображения;

б) при поблочном встраивании [10], в котором используется запись списков координат блоков данных ЬББ-методом;

в) при встраивании данных по участкам текстур, которое предполагает известным сообщение в виде, например, водяного знака [11];

г) при встраивании сообщения на основе адаптивной оценки количества информации без ограничений на сообщение и записи списков координат встроенных данных.

Предлагаемый метод отличает от известных решений распределение произвольных данных сообщения не только по зависящим от контейнера координатам, но и по яркостным диапазонам, причем без использования не зависящей от контейнера управляющей информации, которая требует самостоятельной защиты.

Сокрытие данных на основе адаптивной оценки количества информации позволяет преодолеть характерные недостатки современных методов:

- использование неадаптивной управляющей информации (заранее известного факта сокрытия сообщения, списков координат блоков встраивания данных, ключей и пр.);

- использование тривиального встраивания данных или управляющей информации в фиксированное число младших бит или по не зависящим от контейнера координатам;

- единообразное встраивание сообщения в различные контейнеры, в том числе — в малоградационные сигналы, например, в контейнер из одних нулей;

- неравномерность заполнения контейнера при встраивании сообщения;

- недостаточные возможности управления встраиванием данных со стороны пользователя.

В задачах встраивания сообщений адаптивная оценка количества информации переносится на оцифрованные звуковые сигналы, обрабатываемые как одномерные изображения.

Как показывают эксперименты, адаптивная оценка количества информации, помимо задач встраивания данных, применима в стандартных задачах улучшения качества изображений, выделения объектов, сжатия и упаковки информации и др. Она также оказывается полезной при обработке изображений с недостаточно формализованными объектами:

- для подавления шумов на медицинских ультразвуковых и других снимках посредством вычисления значащих пикселов изображения;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- для автоматизации картографирования аэрокосмических снимков ледовой обстановки посредством представлений емкости;

- для классификации по характеристикам убывания последовательных оценок суммарной емкости медицинских Кирлиан-изображений излучений пальцев рук, а также для определения пола по фотографиям лиц.

* * *

Определение и дальнейшее применение адаптивной оценки количества информации завершает обобщение результатов экспериментальных исследований по обработке изображений на основе адаптивной иерархической сегментации [6-8]. Для программно-алгоритмической реализации удобно использовать «псевдотроичную» систему счисления [6], которая без неиспользуемых кодов поддерживает однозначное описание разделения конечных множеств и эквивалентна тернарной логике, предусматривающей нейтральное решение в случае равноправных альтернатив (логике с импликацией «из нейтрального решения следует нейтральное решение»). Для упрощения вычислений полезно пользоваться так называемыми «динамическими» (перестраиваемыми) деревьями [8], которые в единой программной реализации обеспечивают адаптивную оценку количества информации в предположении ее неизбыточного кодирования и вариантов избыточного кодирования с повторениями.

Для развития адаптивной оценки количества информации представляет интерес экспериментальное изучение возможностей ее единообразного использования для различных классов изображений и аудиосигналов, а также формализация общих закономерностей, которые характерны для последовательностей суммарных оценок количества информации, количеств значащих элементарных носителей информации и других характеристик, что определяет перспективу продолжения работ.

БИБЛИОГРАФИЧЕСКИЕ ССЫЛКИ

1. Хартли Р. Л. Передача информации // Теория информации и ее применения. М., 1959. С. 5- 35.

2. Шеннон К. Э. Работы по теории информации и кибернетике / Пер. с англ. М., 1963.

3. Колмогоров А. Н. Три подхода к определению понятия «Количество информации» // Проблемы передачи информации. 1965. Вып. 1. Т. 1. С. 3-8.

4. Юсупов Р. М., Заболотский В. П. Научно-методологические основы информатизации. СПб., 2000.

5. Прэтт У. Цифровая обработка изображений. Т. 1-2. М., 1982.

6. Харинов М. В., Горохов В. Л. Псевдотроичная система счисления и анализ изображений // Известия вузов России. Радиоэлектроника. 2003. Вып. 2. С. 49-53.

203

7. Levachkine S., Velazquez A., Alexandrov V., Kharinov M. Semantic Analysis and Recognition of Raster-Scanned Color Cartographic Images, LNCS Volume 2390 Graphics Recognition. Springer-Verlag, 2002. P. 171-182.

8. Харинов М. В. Разработка динамических структур данных системы автоматизированного распознавания изображений / Руков. В. В. Александров: Автореф. дис. ... канд. техн. наук. СПб., 1993.

9. Грибунин В. Г., Оков И. Н., Туринцев И. В. Цифровая стеганография. М., 2002.

10. Hioki Hirohisa. A data embedding method using BPCS principle with new complexity measures, Proc. of Pacific Rim Workshop on Digital Steganography 2002, January 2002. P. 30-47.

11. Gorodetsky V. I., Samoilov V. I. Simulation-Based Exploration of SVD-Based Technique for Hidden Communication by Image Steganography Channel, Proc. of the Sec. Int. Workshop on Math. Methods, Models, and Architectures for ComputerNetwork Security MMM-ACNS. St. Petersburg: Springer-Verlag-Berlin-Heidelberg, Sep. 2003. P. 349-359.

M. Kharinov, E. Evnevich, E. Belash AN ADAPTIVE ESTIMATION OF INFORMATION QUANTITY OF AN IMAGE

A formal interpretation for Kolmogorov information quantity estimation is proposed and described in terms of image processing, the image under estimation being decomposed into the sum of invariant and arbitrary representations. An Invariant representation is constructed in the frameworks of restricted variations of the arbitrary one within the computed limits. The information quantity is estimated as a number of bytes of the arbitrary representation. For the adaptation of the estimation of the information quantity to the current conditions, a sequence of decreasing estimation values is constructed by algorithms of a hierarchical segmentation. The experimental results are presented.

i Надоели баннеры? Вы всегда можете отключить рекламу.