Исследование эффективности фрактальных методов компрессии биомедицинских изображений с помощью принципа минимальной длины описания

Гуров Игорь Петрович; Окунев Вадим Вячеславович; Потапов Алексей Сергеевич

УДК 004.932.2

И. П. Гуров, В. В. Окунев, А. С. Потапов

ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ ФРАКТАЛЬНЫХ МЕТОДОВ

КОМПРЕССИИ БИОМЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ С ПОМОЩЬЮ ПРИНЦИПА МИНИМАЛЬНОЙ ДЛИНЫ ОПИСАНИЯ

Исследована эффективность применения фрактальных методов компрессии изображений мазков крови, получаемых с помощью микроскопа. Оценка эффективности выполнена на основе принципа минимальной длины описания, позволившего объединить частные критерии степени сжатия и информационных потерь. Установлено, что фрактальные представления изображений данного типа менее эффективны по сравнению с другими способами представления.

Ключевые слова: фрактальное сжатие, компрессия изображений, телемедицина, репрезентационная минимальная длина описания.

Введение. В течение последних десятилетий технологии телемедицины активно используются при диагностике, лечении и профилактике заболеваний, а также при проведении научных исследований [1].

В связи с тем что по телемедицинским сетям передаются значительные объемы графической информации, актуальной является задача разработки эффективных методов сжатия изображений.

В настоящей работе рассматриваются методы сжатия информации, основанные на фрактальных представлениях изображений [2]. Известны также представления на основе эвристического подхода, статистических характеристик изображений, контурные и структурные представления и т.д. [3]. На сегодняшний день подходы к объективному оцениванию качества самих представлений, не относящихся к какой-либо конкретной решаемой задаче анализа изображений, не формализованы.

В настоящей работе предложен подход к сравнению эффективности представлений изображений, основанный на принципе репрезентационной минимальной длины описания (РМДО), обобщающем хорошо известный в теории индуктивного вывода принцип минимальной длины описания (МДО), используемый для выбора оптимальных моделей данных [4]. В рамках такого подхода оптимальной считается модель, для которой достигается минимум длины описания самой модели и длины описания данных посредством модели. Принцип РМДО здесь применяется для задания критерия оптимальности представления данных, обеспечивающего минимум суммарной длины описания заданного множества наборов данных.

Классическая теория кодирования позволяет получить оптимальный (минимальной длины) код на основе знания модели источника информации. Однако при компрессии изображений сама модель и ее класс, как правило, неизвестны. Таким образом, оптимальное представление по критерию РМДО выбирается в результате сравнения эффективности разных представлений изображений на основе характеристик соответствующих методов компрессии. В работе проведено сравнение фрактального представления с другим представлением изображений, используемым в методе сжатия JPEG.

Метод фрактального сжатия изображений. Основная идея метода заключается в том, чтобы описывать изображение не через значения яркостей его пикселов, а через коэффициенты преобразований, переводящих одни его области в другие [5]. Изображение разбивается на доменные и ранговые блоки.

Ранговыми блоками называют совокупность областей, покрывающих все изображение без взаимных пересечений, в простейшем случае это — прямоугольники равного размера.

В более сложном случае проводят разбиение в форме квадродерева [6], в котором каждый из ранговых блоков может быть разделен на четыре равные части.

Доменными блоками называют любые (возможно, перекрывающиеся) области изображения, которые сопоставляются с ранговыми блоками. Обычно выбираются доменные блоки, геометрически подобные ранговым, но вдвое большего размера.

Рассмотрим для простоты квадратные изображения размером N х N пикселов, разделенные

на ранговые блоки r х r пикселов. Общее число ранговых блоков будет (N/r) . Каждому ранговому блоку ставится в соответствие некоторый доменный блок. При этом доменный блок уменьшается в два раза и может быть дополнительно повернут на 90, 180 или 270°, а также зеркально

отражен. Доменных блоков размером 2r х 2r будет (N - 2r +1) . Помимо геометрического преобразования блоков выполняется также линейное яркостное преобразование, в результате которого должны быть минимизированы отклонения яркости пикселов доменного и рангового блоков.

Результатом компрессии является сжатый файл, в котором для каждого рангового блока указываются номер поставленного ему в соответствие доменного блока, а также параметры геометрического и яркостного преобразований.

Несложно оценить размер сжатого файла. Если nd — число доменных блоков, то для

кодирования номера домена потребуется [log2 nd ] бит. Для указания вида геометрического преобразования требуется три бита. При кодировании каждого из коэффициентов c и b для каждого блока можно выделить по восемь бит, что обеспечит яркостное преобразование между доменным и ранговым блоками с точностью до одной градации яркости. При представлении разбиения в форме квадродерева необходимо для каждого блока указывать, разделен ли он на подблоки, для чего требуется один бит. Таким образом, полная длина фрактально сжатого изображения составит

Limg = nr ([log2 nd] + 20) бит (1)

где nr — число ранговых блоков.

Оценка качества сжатия в соответствии с принципом РМДО. Для оценки методов сжатия с потерями обычно используют два критерия эффективности: коэффициент сжатия и качество восстановленного изображения. Принцип РМДО позволяет объединить эти два критерия. Если полагать, что в сжатом файле содержится модель изображения, то размер сжатого файла равен длине модели. Длина описания отклонений восстановленного после декомпрессии изображения от исходного (в предположении о статистической независимости отклонений в разных пикселах) составляет

Lioss = N2H(f - f'), (2)

где через f обозначено исходное изображение, через f' — восстановленное, H — энтропия отклонений:

n h H(x) = -ZPi log2 Pi, Pi =N¡2 '

h — количество пикселов яркости i. Суммарная длина описания

L = Limg + Lloss (3)

является критерием эффективности представления изображения. Данный критерий может быть использован при выборе параметров сжатия в любом методе компрессии. Следует отметить, что величина L^j V, где V — объем исходного (несжатого) файла, является коэффициентом сжатия изображения, тогда как Lloss /V можно назвать коэффициентом информационных потерь.

Рассчитав длину описания Ь, можно определить оптимальные параметры метода сжатия, позволяющие достичь наилучшего соотношения степени сжатия и информационных потерь. Для определения эффективности использованного в конкретном способе сжатия представления изображений необходимо вычислить суммарную длину описания по выборке изображений. При этом эффективность представления может изменяться в зависимости от предметной области [7].

Таким образом, алгоритм сравнения эффективности представлений изображений на основе методов сжатия по критерию РМДО следующий.

1. Составить выборки изображений, обладающие характерными сюжетными или структурными особенностями, которые могут или, наоборот, не могут быть отражены в рамках исследуемого представления.

2. Для каждого изображения выборки:

— осуществить компрессию с разной степенью сжатия;

— вычислить значение для каждого из вариантов компрессии на основе размера

сжатого файла, из которого вычтена длина метаданных;

— вычислить значение Ь^ (см. (2));

— найти установочные параметры, при которых достигается минимальное значение для каждого из представлений.

3. Вычислить суммарную длину описаний по каждой выборке для каждого из представлений.

Экспериментальное исследование эффективности фрактальных представлений.

Для экспериментальных исследований использовалась выборка из 16 изображений, получаемых с помощью микроскопа при исследовании проб мазков крови (представлены фрагменты, а также уменьшенные копии полноразмерных изображений). На рис. 1 приведены оригинальные изображения, на рис. 2 — восстановленные.

Изображение № 1 Изображение № 6 Изображение № 8 Изображение № 13

Рис. 1

Изображение № 1 Изображение № 6 Изображение № 8 Изображение № 13

Рис. 2

Каждое изображение было сжато с помощью фрактального алгоритма в двух режимах: с использованием одинаковых ранговых блоков и с разбиением в форме квадродерева. Для сравнения была проведена компрессия с помощью алгоритма JPEG с различными значениями

параметра качества сжатия. На рис. 3 приведены примеры разбиений изображений в форме квадродерева.

Рис. 3

Эксперимент с использованием фрактального алгоритма при постоянном размере блоков показал, что качество восстановленного изображения ухудшается при увеличении размера рангового блока. В то же время степень сжатия увеличивается. Критерий РМДО позволяет найти оптимальный размер рангового блока, при котором достигается компромисс информационных потерь и степени сжатия. Следует отметить, что для некоторых изображений не наблюдается экстремум критерия РМДО, что может служить указанием на неприменимость фрактального представления в данном случае.

Результаты тестирования алгоритма JPEG при разных значениях параметра качества сжатого изображения показали одновременное увеличение информационных потерь (при уменьшении указанного параметра) и повышение степени сжатия (т.е. уменьшение размера сжатого файла).

Были получены следующие средние по выборке значения длины описания изображений: 274 193 и 270 628 бит для фрактального сжатия (без использования квадродерева и с ним) и 266 618 бит для алгоритма JPEG. При этом фрактальное сжатие с применением квадродерева выигрывает у JPEG-сжатия примерно в 43 % случаев. Таким образом, фрактальное сжатие (в том числе и при использовании более эффективного разбиения в форме квадроде-рева) в случае данной выборки изображений несущественно проигрывает сжатию JPEG. В связи с этим необходимо отметить, что для других предметных областей (например, снимков макрообъектов, получаемых с помощью цифровых фотокамер) фрактальное представление более эффективно [8].

Неэффективность фрактального представления в случае данного типа изображений обусловлена, видимо, тем, что подобие фрагментов изображений здесь присутствует на одном масштабном уровне, тогда как при классическом фрактальном сжатии для каждого рангового блока производится поиск подобного ему доменного блока на другом масштабном уровне (как правило, масштабный коэффициент берется равным двум). Этот вывод подтверждается и анализом квадродеревьев, приведенных на рис. 3: наиболее крупные ранговые блоки располагаются в областях изображений, на которых не присутствует клеток крови, тогда как остальные ранговые блоки вовсе не соответствуют отдельным клеткам.

Наличие на изображениях данного типа сходных фрагментов, влекущее существенную информационную избыточность, не учитывается во фрактальном представлении (равно как и в алгоритме JPEG, в котором блоки изображения сжимаются независимым образом), в связи с чем требуется разработка предметно-зависимого представления, в рамках которого эффективность сжатия может быть существенно повышена.

Заключение. На основе результатов сжатия изображений проведено сравнение их эффективности по критерию РМДО. При этом информационные потери оцениваются по энтропии отклонений исходного и восстановленного изображений, тогда как длина описания

модели изображения, сохраненного в сжатом файле, вычисляется непосредственно по размеру файла (при исключении вспомогательной информации). Минимальная длина описания изображения в рамках выбранного представления оценивается при оптимизации управляющего параметра алгоритма компрессии.

Установлено, что эффективность фрактального представления изображений, полученных с помощью микроскопа, оказывается ниже (в отличие от изображений других типов). Данный результат объясняется тем, что фрагменты данных изображений взаимно подобны, масштабный фактор близок к единице, тогда как во фрактальном сжатии требуется подобие доменных и ранговых блоков изображения, различающихся по масштабу. Таким образом, как при фрактальных методах сжатия, так и при использовании алгоритма JPEG не устраняется информационная избыточность изображений данного типа, что приводит к необходимости разработки специализированных представлений изображений.

Работа выполнена при финансовой поддержке Министерства образования и науки Российской Федерации.

список литературы

1. Страница регистрации к обследованию // Всемирная организация здравоохранения [Электронный ресурс]: <http://www.who.int/entity/goe/data/global_e-health_survey_2009_ru.pdi>.

2. Ali M., Clarkson T. G. Survey of block based fractal image compression and its applications // Proc. 2nd Seminar on Information Technology and its Applications (ITA'92). 1992. P. 110—122.

3. Потапов А. С., Гуров И. П., Васильев В. Н. Математические методы и алгоритмическое обеспечение анализа и распознавания изображений в информационно-телекоммуникационных системах // Всероссийский конкурсный отбор обзорно-аналитических статей по приоритетному направлению „Информационно-телекоммуникационные системы". 2008 [Электронный ресурс]: <http://www.ict.edu.ru/ft/005648/62325e1-st12.pdf>.

4. Vitanyi P. M. B., Li M. Minimum description length induction, Bayesianism, and Kolmogorov complexity // IEEE Trans. Inform. Theory. 2000. Vol. 46, N 2. P. 446—464.

5. Jorgensen P. E. T., Song M. S. Analysis of fractals, image compression, entropy encoding, Karhunen-Loeve transforms // Act. Appl. Math. 2009. Vol. 108, N 3. P. 489—508.

6. Yigang Wang, Yiwen Jin, Qunsheng Peng. Merged quadtree fractal image compression // Optical Engineering. 1998. Vol. 37, N 8. P. 2284—2289.

7. Потапов А. С. Сравнительный анализ структурных представлений изображений на основе принципа репрезентационной минимальной длины описания // Оптич. журн. 2008. Т. 75, № 11. С. 35—41.

8. Окунев В. В., Потапов А. С. Анализ фрактального представления изображений по критерию репрезентационной минимальной длины описания // Тр. науч.-исслед. центра фотоники и оптоинформатики / Под ред. И. П. Гурова и С. А. Козлова. СПб: СПбГУ ИТМО, 2010. Вып. 2. С. 315—325.

Игорь Петрович Гуров

Вадим Вячеславович Окунев

Алексей Сергеевич Потапов

Сведения об авторах д-р техн. наук, профессор; Санкт-Петербургский государственный университет информационных технологий, механики и оптики, кафедра компьютерной фотоники и видеоинформатики; заведующий кафедрой

канд. техн. наук; Санкт-Петербургский государственный университет информационных технологий, механики и оптики, кафедра компьютерной фотоники и видеоинформатики; младший научный сотрудник; E-mail: [email protected]

д-р техн. наук, профессор; Санкт-Петербургский государственный университет информационных технологий, механики и оптики, кафедра компьютерной фотоники и видеоинформатики; E-mail: [email protected]

Рекомендована кафедрой

компьютерной фотоники и видеоинформатики

Поступила в редакцию 01.08.11 г.

Analysis of Efficiency of Fractal Methods of Compression of Biomedical Images on the Base of the Minimal Description Length Principle