Научная статья на тему 'Количество информации в пикселе цифрового изображения'

Количество информации в пикселе цифрового изображения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
338
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОЛИЧЕСТВО ИНФОРМАЦИИ / QUANTITY OF INFORMATION / ЦЕЛОЧИСЛЕННАЯ ОЦЕНКА / ИЕРАРХИЯ КЛАСТЕРОВ ПИКСЕЛЕЙ / HIERARCHY OF PIXEL CLUSTERS / ИЕРАРХИЧЕСКАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ РАЗБИЕНИЙ / HIERARCHICAL SEQUENCE OF PARTITIONS / ВЫПУКЛАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ / CONVEX SEQUENCE / INTEGER-VALUED ESTIMATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Харинов Михаил Вячеславович

В статье рассматривается проблема оценки количества информации в пикселе цифрового изображения. Дается определение целочисленной оценки посредством вычисления бинарной иерархии кластеров пикселей изображения. Рассматриваются способы построения иерархии кластеров и получения иерархической последовательности приближений изображения, оптимизированных по среднеквадратичному отклонению приближения от изображения. Приводятся экспериментальные результаты расчетов целочисленной оценки, которые сравниваются с результатами, полученными по классическим формулам.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INFORMATION QUANTITY IN A PIXEL OF DIGITAL IMAGE

The article is devoted to the problem of estimating of information quantity in a pixel of digital image. The definition of an integer estimation of information quantity by means of binary hierarchy of pixel clusters is proposed. The methods of constructing the cluster hierarchies and generating the hierarchical sequences of image approximations, minimized in standard deviation of approximation from the image are considered. The experimental results on integer-valued estimation are compared with the results obtained by using classical formulas.

Текст научной работы на тему «Количество информации в пикселе цифрового изображения»

УДК 621.391

О М.В. Харинов

КОЛИЧЕСТВО ИНФОРМАЦИИ В ПИКСЕЛЕ ЦИФРОВОГО ИЗОБРАЖЕНИЯ

В статье рассматривается проблема оценки количества информации в пикселе цифрового изображения. Дается определение целочисленной оценки посредством вычисления бинарной иерархии кластеров пикселей изображения. Рассматриваются способы построения иерархии кластеров и получения иерархической последовательности приближений изображения, оптимизированных по среднеквадратичному отклонению приближения от изображения. Приводятся экспериментальные результаты расчетов целочисленной оценки, которые сравниваются с результатами, полученными по классическим формулам.

Ключевые слова: количество информации, целочисленная оценка, иерархия кластеров пикселей, иерархическая последовательность разбиений, выпуклая последовательность.

О M.V. Kharinov

INFORMATION QUANTITY IN A PIXEL OF DIGITAL IMAGE

The article is devoted to the problem of estimating of information quantity in a pixel of digital image. The definition of an integer estimation of information quantity by means of binary hierarchy of pixel clusters is proposed. The methods of constructing the cluster hierarchies and generating the hierarchical sequences of image approximations, minimized in standard deviation of approximation from the image are considered. The experimental results on integer-valued estimation are compared with the results obtained by using classical formulas.

Keywords: quantity of information, integer-valued estimation, hierarchy of pixel clusters, hierarchical sequence of partitions, convex sequence.

Введение

При расчетах на компьютере множество пикселей цифрового изображения разбивают на кластеры, которыми служат связные сегменты, наборы несмежных сегментов или иных подмножеств пикселей, и изображение описывают в терминах рассматриваемых структурных элементов. При этом помимо яркости характерным аддитивным признаком пикселя является количество информации, которую «содержит» данный пиксель. Одинаковым пикселям принято приписывать равное количество информации, оцениваемое по классическим формулам [1]. В оценке по Р. Хартли количество информации qt в i -ом пикселе изображения одинаково для всех пикселей и выражается в битах как логарифм по основа-

нию 2 от числа градаций g:

q1=log2g, (1)

а в оценке по К. Шеннону количество информации в / -ом пикселе изображения вычисляется логарифмированием частного от деления общего числа N пикселей на число ni пикселей данной яркости:

Чг = 1°§2 ~~~ • (2)

Щ

Для множества пикселей, в частности множества пикселей изображения, количество информации <2 вычисляется посредством сложения qi:

N ¿=1

В обеих классических оценках (1) и (2) значения количества информации получаются вещественными, что нарушает понимание бита как минимальной единицы информации. В нашей стеганографической модели изображения как запоминающей среды [2, 3] указанной трудности интерпретации не возникает, так как, согласно модели, цифровое изображение порождает собственную «виртуальную» память, которая при встраивании и извлечении данных используется подобно памяти обычного компьютера. При этом количество информации определяется как максимальный объем встроенных данных, и оценка количества информации оказывается целочисленной. В настоящее время модель развивается в задаче оптимальной сегментации изображений [4, 5]. В рамках модели развивается и метод целочисленной оценки. Целью статьи является определение целочисленной оценки количества информации и ее сопоставление с классическими оценками.

1. Целочисленная оценка количества информации

На множестве пикселей изображения и построим бинарную иерархию кластеров Н(и), в которой для каждого неоднородного кластера определена операция разделения на два вложенных кластера с различной средней яркостью пикселей. При этом однородными называются кластеры из одинаковых пикселей, которые считаются неделимыми.

Сформулируем определение целочисленной оценки количества информации в пикселе изображения.

Определение. Количество бит информации в пикселе изображения отождествляется с числом неоднородных кластеров из бинарной иерархии Н(и), содержащих данный пиксель.

В простейшем случае однородные кластеры совпадают с множествами пикселей той или иной яркости. При этом если кластеры из иерархии Н(и) разделяются на вложенные кластеры, состоящие из одинакового числа однородных кластеров, то приведенное определение выражается оценкой по Р. Хартли (1). Если иерархия Н(и) такова, что каждый кла-

стер разделяется на вложенные кластеры с одинаковым числом пикселей, то оно выражается шенноновской оценкой (2).

Основной смысл определения состоит в непосредственном подсчете бинарных значений информации, которые при разделении неоднородных кластеров надвое можно последовательно «считывать» с пикселей, оказывающихся во вложенных кластерах с большей и меньшей средней яркостью.

2. Инвариантное представление изображения

В наглядной форме бинарная иерархия кластеров пикселей изображения Н(и) описывается в виде инвариантного представления изображения Ни. Инвариантное представление Ни является изображением, в котором множество кластеров Н{и) упаковано в иерархическую последовательность разбиений множества пикселей с минимальными повторениями однородных кластеров.

Инвариантное представление Ни задает иерархию кластеров, кодируемую в значениях пикселей в псевдотроичной системе [2], и в режиме итеративного разделения кластеров строится следующим образом.

На первой итерации рассматриваются все пиксели изображения, отнесенные к одному кластеру, и пикселям Ни присваивается начальное нулевое значение.

На следующей итерации каждый кластер пикселей изображения разделяется на два вложенных кластера, а значения пикселей инвариантного представления удваиваются. Затем все пиксели кластера инвариантного представления увеличиваются на 1, если кластер пикселей изображения оказался однородным. Если кластер пикселей изображения не однороден, то пиксели инвариантного представления, отвечающие пикселям изображения, содержащимся во вложенном кластере с большей средней яркостью, увеличиваются на 2. Преобразование остальных пикселей инвариантного представления, отвечающих пикселям изображения из вложенного кластера с меньшей средней яркостью, на данной итерации ограничивается удвоением значений. Построение инвариантного представления Ни завершается, когда множество пикселей изображения распадается на однородные кластеры.

Кодирование в псевдотроичной системе позволяет для каждого пикселя инвариантного представления Ни воспроизвести последовательность значений, полученных на каждой итерации, что выполняется посредством итеративного деления нечетных значений нацело на 2, а четных значений — делением нацело на 4 с последующим удвоением [2]. При этом целочисленное количество информации в пикселе изображения совпадает с числом четных значений в обсуждаемой последовательности значений пикселя инвариантного представления. Таким образом, при известном Ни целочисленная оценка выполняется тривиально и не требует возвращения к анализу изображения. Интерпретация преобразований значений

пикселей как сдвигов кодов в виртуальной памяти посредством арифметических операций со степенями 2 дает основания считать Ни образом изображения, записанным в цифровую память, которая порождается изображением и подобна памяти обычного компьютера [2, 3].

Представление Ни называется инвариантным, так как при подходящем алгоритме разделения неоднородного кластера на пару вложенных, например, методом Оцу [6], оно не меняется при линейном преобразовании изображения по яркости. Преобразование изображения в инвариантное представление коммутирует с его преобразованием в негатив, а также с масштабированием изображения посредством дублирования пикселей. Характерным свойством инвариантного представления на всех итерациях построения является то, что оно получается изотоновым преобразованием средних яркостей кластеров пикселей изображения в целочисленные значения пикселей инвариантного представления Ни без изменения яр-костного порядка. Иными словами, инвариантное представление изоморфно по яркости (сохраняет яркостные соотношения) кусочно-постоянных приближений изображения «в средних яркостях», в которых значения пикселей замещаются средними по кластерам значениями.

3. Квазиоптимальные иерархические приближения изображения

Согласно предложенному определению, конкретная целочисленная оценка количества информации существенно зависит от способа построения иерархии кластеров Н{и), которая может задаваться также в виде кусочно-постоянных приближений изображения, порождаемых некоторой последовательностью разбиений пикселей изображения на кластеры. Стандартным критерием качества разбиения и соответствующего приближения является среднеквадратичное отклонение сг приближения от

изображения или суммарная квадратичная ошибка Е = Л'сг2 [7]. При этом наилучшими считаются приближения, которые минимально отличаются от изображения по Е или по сг при последовательном значении кластеров. В общем случае последовательность оптимальных приближений изображения не является иерархической [4]. Тем не менее в задачах обработки изображений оказывается возможной аппроксимация последовательности оптимальных приближений иерархическими последовательностями квазиоптимальных приближений [8].

В простейшем случае последовательность квазиоптимальных приближений изображения получается, если выполнять разделение неоднородных кластеров надвое гистограммным методом Оцу [6], вычисляя пороговое значение яркости из условия максимального падения суммарной квадратичной ошибки Е . Однако метод Оцу [6] не имеет очевидного обобщения на случай цветовых и многоспектральных изображений. С точки зрения многомерного обобщения более перспективным является способ разделения кластера посредством обращения итеративного слияния вложенных в него кластеров на последнем шаге [4, 5, 8].

Вычисление иерархической последовательности квазиоптимальных приближений изображения 1, 2, 3, ... кластерами пикселей выполняется в два этапа, что позволяет избежать анализа повторений кластеров. На первом этапе вычисляется «компактное» инвариантное представление изображения Ни, которое задает последовательность разбиений множества пикселей изображений на 1, 2, 4, ... кластера. На втором этапе по компактному представлению, из условия максимального падения суммарной квадратичной ошибки Е или среднеквадратичного отклонения сг, вычисляются приближения с последовательно возрастающим числом кластеров.

Результаты расчетов представляются либо в виде кусочно-постоянных приближений изображения в 1, 2, 3,... средних яркостях, либо в виде соответствующих инвариантных представлений, которые описывают кусочно-постоянные приближения изображения в средних яркостях аналогично тому, как Ни описывает исходное изображение.

Отличительным признаком обсуждаемых квазиоптимальных приближений изображения в 1, 2, 3,... средних яркостях является то, что соответствующая последовательность Е1, Еп ,Е3,... значений суммарной квадратичной ошибки Е является выпуклой:

Е,<Е'-1+2Ем, 1 = 2,3, -1. (4)

Таким образом, квазиоптимальные приближения сохраняют свойство (4) оптимальных приближений.

4. Экспериментальные результаты

Для иллюстрации содержания статьи приведем результаты вычислений, полученные для стандартного изображения «Лена» (рис. 1).

Рис. 1. Стандартное изображение «Лена»

Рис. 2 позволяет оценить качество квазиоптимальных приближений по сравнению с оптимальными [4].

Рис. 2. Оценка качества квазиоптимальных приближений в зависимости от числа кластеров пикселей изображения

На рис. 2 в логарифмическом масштабе по оси абсцисс приведены графики зависимости среднеквадратичного отклонения сг от числа кластеров g для оптимальных приближений (нижняя пунктирная кривая), а также для приближений изображения, вычисленных с применением метода Оцу, и приближений, полученных посредством итеративного слияния кластеров (две сплошные верхние кривые).

Как видно на рис. 2, кривые практически сливаются между собой, что иллюстрирует возможность аппроксимации неиерархической последовательности оптимальных приближений иерархической последовательностью квазиоптимальных приближений, которые гораздо проще вычислять, запоминать и анализировать при компьютерной обработке.

Рис. 3 позволяет наглядно сравнить для 2, 3 и 4 градаций средней яркости оптимальные приближения изображения, показанные в верхнем ряду, с квазиоптимальными, которые показаны в двух нижних рядах в инвариантном представлении, нормализованном на рабочий диапазон яркости.

Рис. 3. Оптимальные и квазиоптимальные кусочно-постоянные при-

ближения изображения

Приближения на основе разделения кластеров надвое методом Оцу показаны в среднем ряду. Приближения на основе разделения кластеров посредством обращения итеративного слияния [4, 5, 8] показаны в нижнем ряду. По зрительному восприятию последовательности квазиоптимальных приближений воспроизводят изображение не хуже оптимальных приближений. При этом инвариантное представление незначительно влияет на восприятие, но в задачах распознавания может существенно улучшать устойчивость результатов сегментации изображений.

Графики на рис. 4 иллюстрируют сравнение суммарной целочисленной оценки О количества информации в изображении с классическими оценками в зависимости от числа кластеров g, вычисленных для представлений изображения, в которых значения пикселей рассматриваемых g кластеров формально рассматриваются как неделимые или замещаются средними по кластерам значениями.

100 ^

юо п О

90

80

70

60

50

40

30

20

10

0

200

200

Рис. 4. Сравнение целочисленной оценки количества информации с

классическими

Кривые для шенноновской оценки на графиках рис. 4 показаны пунктиром, для оценки по Р. Хартли выполнены в сером цвете, а для целочисленной оценки показаны жирной черной линией.

График на рис. 4 слева построен по данным работы [3], в которой иерархия кластеров строится для стеганографического встраивания и выполняется разделением кластера на вложенные из условия минимизации по абсолютной величине разности количеств пикселей во вложенных кластерах. В этом случае целочисленная оценка количества информации принимает промежуточные значения между классическими оценками и с ростом числа кластеров приближается к шенноновской. Как показано в [3], при этом с шенноновской оценкой согласуется не только интегральная величина количества информации, но и ее распределение по пикселям изображения. Однако при построении приближений суммарная квадратичная ошибка Е не принимается во внимание.

График рис. 4 справа иллюстрирует поведение оценки О количества информации в изображении для случая приближений, построенных из условия минимизации суммарной квадратичной ошибки для варианта разделения кластеров посредством обращения итеративного слияния [4, 5, 8]. В этом случае кривая целочисленной оценки располагается несколько выше кривой для шенноновской оценки и переплетается с кривой для оценки по Р. Хартли. Для варианта с разделением кластера методом Оцу получаются аналогичные результаты. В целом по результатам проведенных экспериментов можно заключить, что предложенная целочисленная оценка согласуется с классическими.

Заключение

В статье мы постарались развить и обобщить понятие целочисленной оценки количества информации, избегая изложения деталей ранее запатентованной стеганографической модели изображения с виртуальной памятью [2, 3], в частности, деталей встраивания данных в изображение (патенты РФ № 2006119146, 2006119273). При этом мы сформулировали определение целочисленного количества информации и проверили его правдоподобие, сравнив результаты с результатами, полученными по классическим формулам.

На текущем этапе исследования разработанная целочисленная оценка количества информации имеет непосредственное практическое значение для стегано графических задач. Может показаться, что область применения целочисленной оценки и связанных с ней понятий при решении так называемой «проблемы сегментации» ограничена гистограммными методами обработки. Однако это не совсем так. Эффективная аппроксимация последовательности оптимальных приближений изображения иерархической последовательностью квазиоптимальных приближений позволяет свести решение задачи оптимальной аппроксимации изображения связными сегментами к простому уменьшению количества сегментов в кластерах пикселей квазиоптимальных приближений.

Разработка методов построения квазиоптимальной иерархии приближений изображения с ограниченным числом связных сегментов и изучение возникающих при этом особенностей целочисленной оценки количества информации определяют дальнейшее направление исследований.

Литература

1. Юсупов P.M. Теоретические основы прикладной кибернетики. -Л.: Типография ВИКА им. А. Ф.Можайского, 1973. - Вып. 1. Элементы теории информации. - 110 с.

2. Харинов М.В. Запоминание и адаптивная обработка информации цифровых изображений. - СПб.: Изд-во С.-Петерб. ун-та, 2006. - 138 с.

3. Харинов М.В., Заболотский В.П. Стеганографическая защита документов на основе модели запоминания информации изображения // Информация и связь. - 2010. - №1. - С. 77-81.

4. Харинов М.В. Устойчивая сегментация изображения // Вестник Бурятского государственного университета. - 2012. - Вып. 9. - С. 64-69.

5. Харинов М.В. Модель локализации объектов на цифровом изображении // Вестник Бурятского государственного университета. - 2013. -Вып. 9. - С. 182-189.

6. Otsu N. A Threshold Selection Method from Gray-Level Histograms // IEEE Transactions on systems, MAN, and CYBERNETICS. - 1979. - Vol. SMC-9, №. 1,- P. 62-66.

7. Прикладная статистика: Классификация и снижение размерности / С.А.Айвазян, В.М. Бухштабер, И.С. Енюков, Л.Д. Мешалкин. - М.: Финансы и статистика, 1989. - 607 с.

8. Kharinov M.V. Image segmentation by optimal and hierarchical piecewise constant approximations // 11th International Conference on Pattern Recognition and Image Analysis: New Information Technologies (PRIA-11-2013). Proc. of the 11-th. Int. Conf. Samara: IPSI RAS, September 23-28, 2013. Vol. 1.-P. 213-216.

Харинов Михаил Вячеславович, кандидат технических наук, старший научный сотрудник лаборатории прикладной информатики Санкт-Петербургского института информатики и автоматизации, тел. (812) 3281919. E-mail: [email protected].

Kharinov Mikhail Vyacheslvovich, candidate of technical sciences, senior researcher, Laboratory of Applied Informatics, St. Petersburg Institute for Informatics and Automation of the Russian Academy of Sciences.

i Надоели баннеры? Вы всегда можете отключить рекламу.