ИИ и < 1ФОРМАЦИ Н О
А И ТЕХНО. ►НЕРГЕТИК ригигти
УДК 519.673
СЖАТИЕ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ ПРЕОБРАЗОВАНИЙ УОЛША: АЛГОРИТМЫ И СРАВНИТЕЛЬНЫЙ АНАЛИЗ ИХ ЭФФЕКТИВНОСТИ
И.И. ИСМАГИЛОВ*, М.Ю. ВАСИЛЬЕВА**
*Институт проблем информатики АН РТ, Казань **Казанский государственный энергетический университет
В данной статье проводится сравнительный анализ эффективности алгоритмов поблочного сжатия изображений в двумерном базисе различных упорядочений дискретных функций Уолша. Подробно описывается алгоритм сжатия изображений с частичной экстраполяцией и многопотоковым кодированием, обеспечивающий достижение наилучших показателей. Данный алгоритм сравнивается с известным 1РЕО-подобным алгоритмом по коэффициенту сжатия изображений. Приводятся примеры по сжатию цифровых изображений, полученных при наблюдении энергетических объектов и тепловизионном обследовании объектов в целях энергоресурсосбережения.
На сегодняшний день цифровая обработка сигналов (ЦОС) стала одним из сопутствующих факторов научно-технического прогресса. К важным задачам ЦОС относятся задачи обработки, передачи и хранения цифровых изображений. В энергетике такая необходимость возникает при обеспечении безопасности объектов, при предупредительной диагностике оборудования и энергосбережении, а также при автоматизированном контроле производственных процессов. В настоящее время для этих целей широко используют системы видеонаблюдения и тепловизионного контроля [1-4].
Перспективным направлением развития систем видеонаблюдения энергетических объектов и технологических территорий является разработка и внедрение беспроводных систем видеонаблюдений, обеспечивающих возможность передачи изображений по низкоскоростным каналам связи. Решение этой задачи связано с использованием средств сжатия изображений.
На основе тепловизионных исследований могут быть разработаны необходимые энергосберегающие мероприятия, и по результатам этих обследований выявленные дефектные элементы зданий и участки ограждающих конструкций могут подвергаться дальнейшему детальному обследованию. Например, экономический эффект от проведения мероприятий по тепловому контролю высоковольтных линий передачи (110 - 750 кВ) в результате уменьшения числа аварийных отключений в энергетических системах оценивается в несколько десятков миллионов рублей в год. В строительстве наибольший экономический эффект достигается при обнаружении дефектов теплоизоляции зданий. Особенно остро эта задача стоит в регионах с холодным климатом. По оценке зарубежных специалистов тепловые потери зданий и
© И.И. Исмагилов, М.Ю. Васильев Проблемы энергетики, 2008, № 9-10
сооружений превышают 30% общих энергетических потерь. Основные преимущества тепловизионного контроля: высокая производительность,
дистанционность испытаний (в пределах прямой видимости), создание архивов термограмм. Создание эффективных архивов тепловизионных изображений объектов контроля требует использования средств их сжатого представления.
Визуальная информация в системах видеонаблюдения и тепловизионного контроля хранится и передается в цифровой форме, что обеспечивает ее качественную и достоверную дистанционную передачу с использованием современных каналов связи. Вышеперечисленные задачи, связанные со сжатием изображений в системах обеспечения безопасности и охраны объектов в энергетике, тепловизионных комплексах, свидетельствуют об актуальности разработок методов и средств сжатия цифровых изображений.
В современных таких системах применяются методы сжатия, использующие как межкадровое (поточное) сжатие, так и внутрикадровое сжатие. Алгоритмы, использующие данные методы сжатия изображений, в свою очередь делятся на обратимые и квазиобратимые. Использование обратимых алгоритмов, несмотря на высокое качество восстанавливаемых изображений, требует больших объемов дискового пространства, что во многих описанных выше случаях неприемлемо. Альтернативой являются алгоритмы квазиобратимого сжатия, устраняющие психофизиологическую избыточность изображений. Эти алгоритмы позволяют сжимать изображения с высокой степенью сжатия и незначительными, с точки зрения человека, потерями.
Наибольшее распространение среди квазиобратимых алгоритмов, использующих внутрикадровое сжатие изображений, получил алгоритм JPEG [5]. Он относится к весьма популярным в практике сжатия изображений алгоритмам поблочного кодирования с преобразованием, основанным на дискретных ортогональных преобразованиях (ДОП). В данных алгоритмах часто используются ДОП фиксированной структуры, имеющие быстрые алгоритмы преобразований [6]. Основные достоинства алгоритма JPEG заключаются в достаточно высоком коэффициенте сжатия и регулируемости потери качества изображения, а к наиболее существенным недостаткам алгоритма можно отнести вычислительную трудоемкость и сложность аппаратной реализации.
Следует отметить, что алгоритм JPEG способен кодировать как чернобелые, так и полноцветные изображения. В последнем случае можно сжать изображения при любом типе цветовой модели (RGB, HSI, CMY, CMYK). Однако наилучшая степень сжатия достигается при приведении вышеуказанных цветовых моделей к модели, основанной на выделении яркостной компоненты (YCbCr, YUV, YQI, HSV) [5]. Очевидно, что широко распространенные растровые изображения формата BMP (Windows BitMap) сжимаются алгоритмом JPEG, так как в этом формате используется цветовая модель RGB.
Алгоритмы сжатия изображений, представленные в данной статье, основаны на тех же принципах, что и JPEG, однако вместо дискретного косинусного преобразования (ДКП) для обработки компонент цветности в них используется дискретное преобразование Уолша (ДПУ), призванное обеспечить более высокую скорость работы алгоритмов. Отметим, что на сегодняшний день существуют разработки JPEG-подобных алгоритмов на основе ДПУ с коэффициентом сжатия, превышающим стандартный алгоритм JPEG при высоком качестве изображения [7].
Кратко остановимся на вопросе вычислительной сложности алгоритмов. В алгоритмах поблочного сжатия изображений с преобразованием основная вычислительная нагрузка приходится на ядро алгоритма, т.е. на ДОП. Приведем
результаты оценки вычислительных затрат, которые необходимы для вычисления преобразований блоков изображения алгоритмов с использованием ДПУ, по сравнению с алгоритмом JPEG. Для выполнения двумерного быстрого ДКП блока размерности 8x8 пикселей с использованием алгоритма [8] необходимо произвести следующее количество целочисленных операций: 96 умножений, 96 двоичных сдвигов и 466 сложений. При вычислении двумерного ДПУ блока размерности 8x8 по быстрому алгоритму [6] требуется 384 операций целочисленного сложения. Опираясь на характеристики процессора Pentium 4 при работе с внутренними регистрами [9], определим, что одна операция целочисленного сложения эквивалентна по времени выполнения операции двоичного сдвига, а также выполняется примерно в 11 раз быстрее, чем одна операция целочисленного умножения. Тогда коэффициент ускорения вычислений ДПУ блоков изображений по сравнению ДКП будет примерно равен 4. Объем необходимых вычислений при вычислении обратного ДПУ и ДКП остается примерно тем же, что и в случае алгоритмов прямых преобразований.
В разработанных нами алгоритмах, в отличие от алгоритмов сжатия на основе ДПУ с отбрасыванием нулевых трансформант, используется двухэтапный подход к сжатию изображений [10]. В основу этого подхода положено следующее свойство разложения дискретных степенных функций k-го порядка (k=1,2..,n-1) по дискретным функциям Уолша (ДФУ) размерности N=2n, где n - целое число больше 1: в пределах групп коэффициентов преобразования k-го и (k-^-го дифференциальных порядков между коэффициентами наблюдаются двоичные зависимости. Под дифференциальным порядком базисной функции здесь понимается порядок операторов конечной разности, формирующих эту функцию. Из этого свойства следует, что по первым элементам групп коэффициентов Уолша k-го и (k-1)-ro дифференциальных порядков их двоичным масштабированием могут быть получены остальные элементы этих групп. В двумерном случае при использовании разложения по двумерным ДФУ двоичные зависимости наблюдаются в пределах определенного числа подгрупп трансформант Уолша k-го и (k-^-го дифференциальных порядков.
Рассматриваемый подход к сжатию цифровых изображений предполагает разбиение изображения на блоки 8х8 пикселей и их раздельную обработку. На первом этапе обработки блока вычисляется двумерный спектр Уолша, далее на втором этапе формируется сигнал ошибки предсказания части спектра, при этом предсказание отдельных подгрупп его элементов осуществляется экстраполяцией по соответствующим первым трансформантам Уолша (далее для них будем придерживаться названия трансформанты-представители). Парциальные процедуры экстраполяции строятся на основе полиномиальной модели блока изображения, т.е. основаны на аналитических соотношениях между элементами спектра Уолша двумерных степенных полиномов невысоких порядков. Отбор существенной информации по выбранному критерию приближения изображения проводится из совокупности значащих трансформант-представителей Уолша и ошибок предсказания части элементов спектра. Операции экстраполяции лишь незначительно увеличивают вычислительную трудоемкость алгоритмов с использованием ДПУ, т.к. при этом используются операции двоичного сдвига и вычитания, выполнение которых эквивалентно выполнению операций сложения.
На базе двухэтапного подхода разработан ряд алгоритмов сжатия изображений. В работе проведен анализ разработанных алгоритмов сжатия с преобразованием по следующим известным системам упорядочений ДФУ [6]:
• секвентивному упорядочению (Уолша-Качмажа);
• диадическому упорядочению (Уолша-Пэли);
• упорядочению в соответствии с расположением строк в матрице Адамара (Уолша-Адамара).
Исследован также алгоритм сжатия на основе разностно-упорядоченых ДФУ, предложенных авторами [11].
Для выбора наиболее эффективного алгоритма сжатия изображения нами разработан программный экспериментальный комплекс, реализованный в среде Matlab 6.5. Тестовый материал был представлен выборкой из стандартного тестового набора Waterloo Bragzone (Calgary Corpus) [12], составленного из цветных изображений в 24 битовом формате BMP. При этом были использованы следующие показатели сжатия изображений: коэффициент сжатия по битам (CR), пиковое отношение сигнал/шум (PSNR). Осуществлялась также визуальная оценка качества восстановленного изображения.
Проведены исследования следующих пяти алгоритмов сжатия изображений:
1. Алгоритм сжатия изображений с частичной экстраполяцией трансформант Уолша, охватывающей трансформанты первого и второго дифференциальных порядков. Здесь наилучшие результаты получены при использовании упорядочения Уолша-Качмажа.
2. Алгоритм сжатия изображений с полной экстраполяцией трансформант Уолша, охватывающий трансформанты дифференциальных порядков i = 1,5. Наилучшие результаты также получены при использовании упорядочения Уолша-Качмажа. В среднем по тестовому набору алгоритм проигрывает по CR и по скорости алгоритму с частичной экстраполяцией трансформант Уолша.
3. Комбинированный алгоритм сжатия изображений, в основу которого заложены традиционный алгоритм сжатия изображений с отбрасыванием нулевых трансформант Уолша и альтернативный алгоритм сжатия изображений с частичной экстраполяцией трансформант Уолша с упорядочением Уолша-Качмажа. Блоки размера 8х8 изображения обрабатываются каждым алгоритмом, затем информация об алгоритме, позволяющем достичь наибольшего коэффициента сжатия, заносится в массив-индикатор. Этот массив определяет наиболее оптимальный с точки зрения сжатия алгоритм. При применении данного алгоритма сжатия в отдельных блоках изображения происходит незначительное увеличение CR по сравнению с первыми двумя алгоритмами. Небольшое увеличение CR достигнуто за счет значительного усложнения алгоритма, что снижает скорость сжатия больших по размеру изображений.
4. Алгоритм сжатия изображений с частичной экстраполяцией трансформант Уолша с многопоточным кодированием. В среднем по тестовому набору по CR алгоритм выигрывает у рассмотренных выше алгоритмов. Использование многопоточного кодирования ведет к усложнению алгоритма. Однако применение разностно-упорядоченных ДФУ в алгоритме сжатия изображений с многопоточным кодированием упрощает алгоритм в части формирования выходных потоков данных.
5. Алгоритм сжатия изображений с отбрасыванием нулевых трансформант Уолша с упорядочением Уолша-Качмажа. Реализован алгоритм, предложенный в работе [7]. Алгоритм превосходит алгоритм 4 по скорости, но проигрывает по CR.
В дальнейшем для этих алгоритмов будем придерживаться обозначений А1, А2, А3, А4, А5.
В табл. 1 представлены результаты сравнительного анализа рассмотренных алгоритмов сжатия изображений.
Алгоритм сжатия изображений с частичной экстраполяцией трансформант Уолша с многопоточным кодированием показал наибольший CR из пяти представленных алгоритмов. Оценка PSNR также соответствует высокому © Проблемы энергетики, 2008, № 9-10
качеству восстановленного изображения. Рассмотрим этот алгоритм более подробно.
Таблица 1
Результаты сравнения алгоритмов сжатия изображений по СК и PSNR
файл алгоритм А1 алгоритм А2 алгоритм А3 алгоритм А4 алгоритм А5
CR PSNR CR PSNR CR PSNR CR PSNR CR PSNR
monarch 12,33 41,59 11,56 41,18 12,50 41,59 14,43 41,01 11,62 41,58
peppers 12,78 41,23 11,44 41,14 12,92 41,23 13,95 41,22 11,87 41,22
serrano 6,30 38,23 6,54 37,73 6,38 38,23 6,86 38,22 6,21 38,23
lena 11,23 40,77 9,55 40,64 11,47 40,77 13,29 39,90 10,98 40,77
sail 7,78 40,06 7,99 39,50 7,87 40,07 8,08 37,37 7,60 40,06
tulips 9,19 40,74 8,41 40,48 9,29 40,74 9,74 40,72 8,76 40,73
Среднее 9,94 40,44 9,25 40,11 10,07 40,44 11,06 39,74 9,51 40,43
Алгоритм включает в себя следующие шаги:
1. Преобразование цифрового изображения из цветовой системы ЯОБ в цветовую систему УСЬСг.
2. Субдискретизация цветовых компонент изображения.
3. Вычисление двумерного прямого ДПУ компонент изображения, разбитых на блоки 8x8 пикселей.
4. Частичная экстраполяция трансформант Уолша.
5. Вычисление ошибок предсказания трансформант, охваченных парциальными процедурами экстраполяции.
6. Квантование полученных значащих трансформант и ошибок предсказания.
7. Запись квантованных значащих трансформант и ошибок предсказания в выходные потоки данных.
8. Сжатие полученных потоков данных методами КЬЕ и Хаффмана [5].
Рассмотрим более подробно процедуры экстраполяции и многопоточного
кодирования (шаги 4, 5 и 7 алгоритма).
В алгоритме мы используем разностно-упорядоченую систему ДФУ, это упрощает запись в различные выходные потоки групп трансформант Уолша определенных дифференциальных порядков. На рис. 1 показаны схемы
формирования групп трансформант Уолша. При этом заливкой более темного цвета выделены трансформанты-представители соответствующих подгрупп трансформант, а на позициях остальных элементов подгрупп представлены двоичные веса, используемые для их экстраполяции. Предсказанное значение трансформанты Уолша определяется делением трансформанты-представителя соответствующей подгруппы на соответствующий двоичный вес. Вычисление ошибок предсказания трансформант сводится к нахождению разностей между элементами подгрупп трансформант и соответствующими их предсказанными значениями.
1) d = 1 2) d = 2
1) й = 3 2) й = 4, 5, 6
Рис. 1. Схемы формирования групп трансформант Уолша дифференциального порядка й
Общая схема многопоточного кодирования аналогична схеме, рассмотренной в [13]. На первом этапе квантованные элементы спектров записываются в потоки данных, каждый поток соответствует элементам группы трансформант определенного дифференциального порядка (табл. 2). На втором этапе полученные потоки независимо кодируются алгоритмами ИЬЕ и Хаффмана.
Таблица 2
Распределение трансформант Уолша по выходным потокам
№ выходного потока Дифференциальный порядок трансформант
0 0
1 1
2 2
3 3
4 4, 5, 6
Алгоритм обладает достаточно хорошими сжимающими свойствами, так как в результате процедур экстраполяции трансформант Уолша и последующего вычисления ошибок предсказания трансформант, охваченных парциальными процедурами экстраполяции, образуются потоки данных с большим количеством нулевых элементов, которые в процессе многопотокового кодирования отбрасываются.
В работе также проведено сравнение размеров исходного изображения и сжатых изображений, полученных с помощью разработанного нами алгоритма А4 и алгоритма А5, предложенного в работе [7]. Полученные данные позволяют сделать вывод, что представленный алгоритм А4 превосходит алгоритм А5 по СИ на тестовом наборе в среднем на 15 % при высоком качестве восстановленного изображения (табл. 3).
Таблица 3
Результаты сравнения алгоритмов по СИ, %
Файлы Алгоритм Выигрыш по CR, %
А4 А5
monarch 14,43 11,62 24
peppers 13,95 11,87 18
serrano 6,86 6,21 10
lena 13,29 10,98 21
sail 8,08 7,60 6
tulips 9,74 8,76 11
Среднее значение 15
Отметим, что наблюдаемое увеличение коэффициента сжатия алгоритма А4 практически не ухудшает визуальное качество восстановленного изображения. Данный алгоритм позволяет эффективно сжимать изображения в случаях, когда
критична скорость его работы и необходима возможность прогрессивной передачи данных.
Приведем некоторые примеры по сжатию цифровых изображений, полученных при наблюдении энергетических объектов и тепловизионном обследовании объектов в целях энергоресурсосбережения.
На рис. 2 показано изображение блок-модульной дизельной электростанции, обработанное алгоритмом А4.
1) исходное изображение 2) С]? = 20,26
3) СК = 40,31 4) СК = 85,87
Рис. 2. Оценка визуального качества изображения при различных СК
На рис. 3 представлено тепловизионное изображение стены жилого дома, обработанное алгоритмом А4.
3) СК = 40,05 4) СК = 78,06
Рис. 3. Оценка визуального качества изображения при различных СК
Светлым цветом на изображениях отображены участки стены жилого дома с нарушенной теплоизоляцией панелей.
Когда критичным является качество восстановленных изображений, эффективнее использовать комбинированный алгоритм А3, показавший второй по величине СИ из пяти представленных алгоритмов. На рис. 4 показаны тепловизионные изображения и сопряженное изображение видеоканала распределительного трансформатора, обработанные алгоритмом А3.
1) изображение видеоканала 2) исходное тепловизионное
Изображение
3) СК = 17,01 4) СК = 33,02
Рис. 4. Оценка визуального качества изображения при различных СК
Светлым цветом на тепловизионных изображениях отображены участки выделения избыточного тепла, образованные в результате появления внутреннего дефекта и низкого уровня масла в распределительном трансформаторе.
В заключение отметим следующее. Полученные результаты свидетельствуют об эффективности предлагаемых алгоритмов сжатия изображений с использованием ДПУ. Данные алгоритмы могут найти эффективное применение в энергетике при решении задач сжатия изображений, возникающих в системах видеонаблюдения, тепловизионного контроля энергетических объектов и теплотехнического состояния зданий. Основные характеристики алгоритмов: значительная экономия дискового пространства, возможность использования маломощных приемников и передатчиков графической информации, возможность передачи информации по низкоскоростным каналам связи, поддержка прогрессивного сжатия. Отметим также относительную простоту аппаратной реализации алгоритмов в виде специализированных процессоров.
Summary
In present article comparative analyzis of blocks compressing efficasy in 2-dimension basis of different consequences of discrete Walch functions is done. The algorithm of images to compress by means of partial extrapolation and multistream coding, which provides the best results, is describes in detail. The present algorithm is comparing with the know JPEG-similar one by the coefficient of the images compressing. The examples of digital images compressing obtained by watching energetic objects and termovision researching of objects to save energy and resources are represented.
Литература
1. Карнеев Д.В., Богданов И.В. Тепловизорная техника на службе охраны // Энергетик. - 2005. - №12. - С. 42-43.
2. Бондарев О.Ю. Козлов В.Р. Применение камер глобального наблюдения CA-ZOOM PTZ на объектах ядерной энергетики // Контроль. Диагностика. - 2005. - №8. - С. 21-22.
3. Печников В.В. Тепловой контроль электрооборудования и требования, предъявляемые к аппаратуре // Энергетик. - 2007. -№1 - С. 46-47.
4. Будадин О.Н., Троицкий-Марков Т.Е. Технология комплексного
теплового неразрушающего контроля зданий и строительных сооружений. //
Контроль. Диагностика. - 2005. - №3. - С. 23-24.
5. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео / Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин. - М.: ДИАЛОГ-МИФИ, 2002. - 384 с.
6. Ахмед Н., Рао К.Р. Ортогональные преобразования при обработке
цифровых сигналов: Пер. с англ. - М.: Связь, 1980. - 248 с.
7. Карагодин М.А., Осокин А.Н. Алгоритм сжатия изображений на основе функций Уолша // Материалы международной конф. "Информационные системы и технологии ИСТ'2003". - Т. 2. - Новосибирск, 2003. - С. 126-130.
8. Cho N., Lee S. Fast algorithm and implementation of 2-D discrete cosine transform // IEEE Trans. Circuits and Systems. - 1991. - V.38. - P.297-305.
9. Брей Б. Микропроцессоры Intel 8086/8088, 80186/80188, 80286, 80386, 80486, Pentium, Pentium Pro Prossecor, Pentium II, Pentium III, Pentium 4. Архитектура, программирование интерфейсы. Шестое издание: Пер. с англ. -СПб.: БХВ-Петербург, 2005. - 1328 с.
10. Исмагилов И.И., Васильева М.Ю. Оценка эффективности двухэтапных алгоритмов сжатия изображений на основе преобразований Уолша // Исследования по информатике. Вып. 11. - Казань: Отечество, 2007. - С. 95-102.
11. Исмагилов И.И., Васильева М.Ю. Разностно-упорядоченные системы дискретных функций Уолша // Инфокоммуникационные технологии глобального информационного общества: Сб. науч. тр. 2-й науч. - прак. конф., Казань, 2004 г. -М: Новые технологии, 2004. - С. 298-302.
12. http://links.uwaterloo.ca/bragzone.base.html. Сайт Calgary Corpus (тестовые наборы изображений).
13. Умняшкин С.В. Метод кодирования дискретных изображений на основе преобразования Крестенсона-Леви // Микроэлектроника и информатика -96. Тезисы докл. межвуз. науч. - тех. конф. - М.: МГИЭТ (ТУ), 1996. - С. 167.
Поступила 31.12.2007