УДК 621.391
В.И. ХАХАНОВ, В.В. БАРАННИК, И.В. ХАХАНОВА
СЖАТИЕ ВИДЕОДАННЫХ НА ОСНОВЕ КОДИРОВАНИЯ ТРАНСФОРМАНТ
Создается компактное представление видеоданных, основанное на принципиально новом подходе к процессам устранения избыточности в трансформантах ортогональных преобразований. Разрабатывается полиадическое кодирование трансформант ортогональных преобразований. Сжатие изображений достигается в результате сокращения комбинаторной избыточности в трансформантах ортогональных преобразований.
1. Введение
В развитии общественных отношений и организации народного хозяйства важное место занимают такие процессы как: сбор, хранение, передача, переработка информации, ее анализ информации и принятие решений. С 90-х годов широко развиваются видеоинформационные процессы взаимодействия. Возникает необходимость удовлетворения потребностей абонентов в услугах, предоставляемых на основе информационных технологий. Сюда относится связь, интерактивное, высококачественное, многопрограммное телевещание, интерактивный высокоскоростной доступ к ресурсам сети Интернет, видеоконференциаль-ная связь, вещание видео по сети, видеофотомониторинг Земли, компьютерная диагностика состояния здоровья. Основная особенность видеоинформационного обмена состоит в больших объемах цифрового представления изображений. Это является основной причиной больших временных задержек в процессе обработки и передачи видеоданных по сетям. Отсюда цель исследований состоит в необходимости уменьшения объемов видеоданных. Для этого в структуре информационных систем (ИС) используется подсистема сжатия видеоданных (ПСВ) [1 - 5].
2. Формулировка проблемы
В настоящее время разработано несколько десятков различных методов компактного представления изображений. Некоторые методы сжатия реализованы в графических стандартах. В зависимости от требований, предъявляемых к качеству восстанавливаемых изображений, все методы сжатия классифицируются на две группы. Первую группу образуют методы компактного представления с контролируемой потерей качества. Во вторую группу входят методы компактного представления без внесения погрешности.
Методы сжатия дополнительно делятся на базовые и комплексные. Комплексные методы в процессе сжатия используют несколько базовых методов сжатия. В свою очередь базовые методы разделяются по виду сокращаемой избыточности в изображениях. Вероятностная и статистическая избыточность снижается на основе кодов Хаффмана и арифметического кодирования (АК). Данные типы кодов являются поэлементными. Кодограмма формируется для отдельных элементов входных сообщений. Ее длина зависит от вероятности появления символов алфавита во входном сообщении. Вероятностные и статистические характеристики входных последовательностей зависят от класса изображений. Реалистические изображения имеют высокую степень насыщенности мелкими деталями. В этом случае уменьшается степень неравномерности распределения вероятностей. Это обуславливает низкую степень сжатия (до 2-х раз). Методы такого класса реализованы в стандартах сжатия данных MNP5 и MNP7 [2, 3].
Простейшая структурная избыточность сокращается на базе следующих методов [3]:
- кодирования длин серий (КДС). К семейству методов КДС относится алгоритм RLE. Реализуются в графических форматах PCX, ВМР;
- методы LZ77, LZSS, LZW, GLZW, BTLZ. Реализуются в стандарте сжатия V.42bis и графических форматах GIF, TIFF. Основная идея: второе и последующие вхождения некоторой строки символов в сообщение заменяются ссылкой на ее первое появление в сообщении.
Степень сжатия для данных методов зависит от частоты цветовых перепадов и от размеров областей, окрашенных одним цветом.
Недостатком базовых методов сжатия без внесения погрешности являются высокие временные затраты на обработку и передачу данных. Временные задержки достигают нескольких минут.
Методы компактного представления с контролируемой потерей качества учитывают особенности зрительного восприятия. Наиболее распространенными являются методы форматов JPEG (используется дискретное косинус-преобразование) и JPEG 2000 (используется wavelet-преобразование). Сокращается визуальная избыточность изображений. Обеспечивается выигрыш по степени сжатия реалистических изображений относительно методов без внесения погрешности [1, 4].
В то же время при увеличении объемов передаваемых видеоданных суммарное время на их доведение увеличивается до нескольких минут. Такой недостаток объясняется: ограниченной степенью сжатия для методов форматов JPEG и JPEG2000. Низкая степень сжатия достигается для пикового отношения сигнал/шум на уровне 40 дБ и в режиме lossless.
Отсюда следует, что для снижения времени доведения данных в ИС на основе ПСВ требуется увеличить степень сжатия для методов, использующих ортогональные и wavelet-преобразования.
Поэтому научной задачей является разработка метода сжатия, обеспечивающего увеличение коэффициента сжатия изображений, на основе:
- использования ортогональных преобразований;
- организации процессов сжатия трансформант за счет устранения новых видов избыточности.
3. Основной материал исследований
Представляет интерес рассмотрение трансформанты (матрицы коэффициентов дискретного косинус-преобразования (ДКП)) как комбинаторного объекта. Трансформанты ортогональных преобразований в отличие от исходных блоков изображений имеют комбинаторную избыточность. Такая избыточность объясняется [5]:
- неравномерными значениями элементов в строках трансформанты;
- остаточной корреляцией компонент ДКП;
- взаимной зависимостью компонент ДКП;
- неравномерностью распределения значений компонент ДКП.
Наличие комбинаторной избыточности в трансформантах преобразований имеет статистическую и психовизуальную интерпретации:
- психовизуальная избыточность вызвана нечувствительностью зрения человека к некоторым аналоговым особенностям изображений. Следовательно, найдутся такие различные перестановки элементов изображения, которые будут восприниматься визуально одинаково. Эти перестановки являются избыточными и сокращаются в результате полиадического кодирования;
- вероятностная и статистическая избыточность определяется различной вероятностью появления некоторых последовательностей элементов изображений. С точки зрения комбинаторики это можно трактовать как безвозвратную выборку из элементов с различными значениями спецификаций (количество элементов одного вида). Значит, появляются избыточные выборки элементов изображений.
Комбинаторная избыточность исключаются методами полиадического кодирования. В этом случае массив данных рассматривается как полиадическое число. Для него строится смешанная система оснований. Полиадическое кодирование компонент ДКП задается выражением
= J yki hk (1)
k=1 w
где ук,£ - целая часть вещественного значения (к,£) компонента ДКП Ук£; ^^ -полиадический код £ столбца трансформанты ДКП; п - размерность трансформанты; hk
- весовой параметр к строки трансформанты к=1,п, п =2,п.
Одномерные полиадические числа формируются на базе столбцов трансформанты ДКП. Матричная запись вычисления значений кодов номеров имеет вид
^^ = Н^(1), т т
где Нт - транспонированный вектор Нт ={ П ^п,•", П ^п,—,1} весовых коэффициентов
П = 2 п=i+1
одномерного полиадического числа; Y(1) - столбец трансформанты Y компонентов ДКП Y = Г(п1) Х(т1,т2) Гт(п2); Х(т1,т2) - матрица фрагмента исходного изображения; Г(п1), Гт(п 2) - исходная и транспонированная матрица базисных коэффициентов ДКП; -
код-номер одномерного полиадического числа Y(1).
Особенность трансформант ДКП заключается в уменьшении значений компонент по Ъ
- развертке. Развертка начинается в верхнем левом углу и заканчивается в нижнем правом углу. Такую особенность необходимо учитывать для двумерного полиадического числа. Величина двумерных полиадических кодов будет зависеть от значений элементов в верхнем левом углу. Следует обеспечить соответствие между свойствами полиадических кодов и особенностями трансформант преобразований. Это приведет к увеличению коэффициента сжатия.
Для уменьшения значений кодов ^^ на основе учета свойств компонент ук, £ и
полиадических кодов предлагается производить переформатирование трансформанты ДКП. Форматирование трансформанты заключается в следующих действиях: трансформанта разворачивается на 180 градусов; проводится замена принципа индексации компонентов.
Индексация заключается в обходе трансформанты по Ъ развертки. При программной или аппаратной реализации кодирующего устройства форматирующие действия не проводятся. При кодировании трансформанты сразу задается способ обхода ее компонент.
Для дополнительного повышения количества сокращаемой комбинаторной избыточности и исключения переполнения равномерной кодограммы предлагается организовывать комбинированное полиадическое кодирование. Такое кодирование основано на комбинированном использовании полиадических кодов отдельных столбцов и полиадических кодов нескольких столбцов (всей трансформанты). Такая комбинация позволяет адаптироваться процессу кодирования к структурным особенностям каждого блока данных.
Комбинированное полиадическое кодирование соответствует процессу выбора столбцов трансформанты или всей трансформанты, для которых вычисляется один общий код. Для остальных столбцов код находится по отдельности. Отбор столбцов трансформанты, для которых формируется общий код, осуществляется на основе неравенства:
п п* м
П П®ку2 2М-1 (2)
к= 1 у = 1
где п* - выборочное количество столбцов из трансформанты ДКП, п* =1, п; ®к,у -
основание обобщенного полиадического числа, определяемое как минимальное значение из двух максимумов у -й строки и к-го столбца трансформанты.
Если неравенство (2) выполняется, то для всех п * столбцов формируется общий полиадический код Щп*). Значения полиадических кодов для £ -го и у -го столбцов находятся
по выражениям (1). Решающее правило, заданное неравенством (2), позволяет отобрать те столбцы трансформант, для которых можно сформировать общий полиадический код
^п*). При этом длина кодограммы под код-номер ^п*) не будет превышать длину 20
машинного слова M. Поэтому если значения полиадических чисел для n * столбцов трансформанты удовлетворяют неравенству (2), то для них вычисляется общий код N(n* ) :
n n
N(n* ) = S Sbk,Y hk, Y , (3)
k=1 y=1
где hk, y - накопленное произведение оснований обобщенного полиадического числа
• •
n n n
hk,Y = П ro£ u П П ro£u ;
u=Y+1 £ =k+1u=1
ra£ u - основание обобщенного полиадического числа, определяемое как минимальное значение из двух максимумов £ -й строки и u -го столбца:
ro£ u = min ( Ц, Xu);
, Xu - соответственно максимальные значения компонент в £ -й строке и u -м столбце, увеличенные на 1.
При этом значение N(n*) будет не больше, чем накопленное произведение кодов-номеров полиадических чисел для n* столбцов, заданное левой частью соотношения (2):
n n *
N(n*) < П П rok,y . (4)
k=1 y=1
Но поскольку значение в правой части неравенства (4) можно представить машинным словом длины М, то под значение числа N(n* ) также будет отведено М разрядов.
С другой стороны, значение N(n* ) будет больше, чем значения полиадических чисел ( I = 1, n * ) . Следовательно, число разрядов для представления N(n* ) ближе к значению М, чем число разрядов для полиадического числа N^1) :
^og2 N^ < tog2 N(n*) < M . (5)
Данная особенность позволяет увеличить степень сжатия без внесения погрешностей.
4. Оценка эффективности разработанного метода
Для сравнительной оценки эффективности существующих (JPEG, JPEG2000) и разработанной (ПК) технологий сжатия проводилась экспериментальная обработка реалистических изображений. Было выявлено, что:
- средние значения коэффициента сжатия изображений в режиме без потери качества (рис. 1) для ПК изменяются от 2 до 3,5 раз в зависимости от степени насыщенности фрагментов изображений;
3,5 3 ' 2,5 • 2 ' 1,5' 1 ■ 0,5 • 0'
насыщенные насыщенные насыщенные
k РЕ ^
LZ JPEG \ *
Сильно- Средне- Низко-
Рис. 1. Зависимость величины к от класса изображений в режиме сжатия без потери качества - значение коэффициента сжатия в режиме контролируемых потерь качества для сильно-, средне- и низконасыщенных изображений достигает соответственно 30, 80 и 100 раз (рис. 2 - 4).
30 25 k
20
15 JPEG 2000
10
5 JPEG
0 26 28 30 32 34 36 38 h 40
Рис. 2. Зависимость величины к от h для сильнонасыщенных изображений
Рис. 3. Зависимость величины к от h для средненасыщенных изображений
Рис. 4. Зависимость величины к от h для низконасыщенных изображений Выводы
1. Разработан метод и алгоритм сжатия изображений. Научная новизна созданных результатов заключается в том, что впервые трансформанта дискретного косинусного преобразования рассматривается как комбинаторный объект. Для сокращения комбинаторной избыточности в трансформантах ДКП разрабатывается полиадическое кодирование, включающее:
- комбинированное полиадическое кодирование трансформант ДКП. Это позволит сжимать изображения за счет сокращения комбинаторной избыточности (от 3 до 3,5 раз в зависимости от корреляции данных). Исключаются потери информации из-за нехватки разрядов в машинном слове;
- межтрансформантное полиадическое кодирование. В этом случае дополнительно повышается (до 70%) коэффициент сжатия изображений за счет сокращения комбинаторной избыточности в соседних трансформантах;
- сжатие матриц признаков столбцов полиадическими кодами. Это обеспечит дополнительное уменьшение объема сжатых изображений в 1,7 раза.
2. Практическая значимость состоит в том, что созданный метод обеспечивает выигрыш по степени сжатия по сравнению с существующими методами: для режима без потери качества в среднем на 40%; для пикового отношения сигнал/шум (ПОСШ) 40 дБ в среднем на 46 %; для ПОСШ 35 дБ в среднем на 50 %.
Выигрыш по суммарному времени на обработку и передачу видеоданных по каналам связи для разработанного метода относительно существующих методов достигает в среднем 1,38 и 1,5 раза соответственно для режимов без потери качества и для пикового отношения сигнал/шум 35 дБ.
Рекомендации относительно применения разработанной технологии:
- в системах дистанционного зондирования Земли;
- в системах аэрокосмического мониторинга;
- в системах видеоконференций;
- в системах фотовидеонаблюдения;
- в системах мобильной связи третьего поколения (системы 3G);
- в системах архивирования. Для создания высококачественных электронных фондов библиотек, музеев и картинных галерей;
- в системах хранения космических снимков.
Список литературы: 1. Adams M.D. The JPEG-2000 Still Image Compressio 1 N 2412, Sept. 2001. 2. Andreasen P. University of Copenhagen, Department of Mathematics, July 2001. 3. Bell T. C. Text compression. Englewood Clifs, N. J.: Prentice-Hall, 1990. 4. Wallace G.K. The JPEG Still Picture Compression Standard // Communication in ACM. 1991. V34, .№4. P.31-34. 5. БаранникВ.В. Метод сжатия изображений комбинированным полиадическим кодированием трансформант // ИУСЖТ. 2000. .№2. С. 66 - 69.
Поступила в редколлегию 15.03.2007
Хаханов Владимир Иванович, д-р техн. наук, декан факультета компьютерной инженерии и управления, профессор кафедры автоматизации проектирования вычислительной техники ХНУРЭ. Научные интересы: обработка и передача информации. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-326.
Баранник Владимир Викторович, д-р техн. наук, старший научный сотрудник научно-исследовательской лаборатории Харьковского университета Воздушных Сил. Научные интересы: обработка и передача информации. Адрес: Украина, 61023, Харьков, ул. Сумская, 77/79.
Хаханова Ирина Витальевна, канд. техн. наук, доцент кафедры автоматизации проектирования вычислительной техники ХНУРЭ. Научные интересы: проектирование цифровых систем на кристаллах, обработка и передача информации. Увлечения: английский язык, музыка. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-326. E-mail: [email protected]