ПРИМЕНЕНИЕ ПОПУЛЯРНЫХ АЛГОРИТМОВ КОМПРЕССИИ ИЗОБРАЖЕНИЙ ДЛЯ СЖАТИЯ ИЗМЕРИТЕЛЬНЫХ ДАННЫХ

Левенец А. В.; Токарев Р. Е.; Чье Ен Ун

УДК 004.627

ПРИМЕНЕНИЕ ПОПУЛЯРНЫХ АЛГОРИТМОВ КОМПРЕССИИ ИЗОБРАЖЕНИЙ ДЛЯ СЖАТИЯ ИЗМЕРИТЕЛЬНЫХ ДАННЫХ

Левенец А. В. - канд. техн. наук, доц. кафедры «Автоматика и системотехника», тел.: 8-914-191-33-39, e-mail: [email protected]; Токарев Р. Е. - магистрант кафедры «Автоматика и системотехника», тел. 8-909-8417778, e-mail: [email protected]; Чье Ен Ун - д-р техн. наук, проф., зав. кафедрой «Автоматика и системотехника», тел. 8-924-109-08-98, e-mail: [email protected] (ТОГУ)

В статье изучается возможность применения алгоритмов сжатия изображений PNG, JPEG и JPEG2000 для сжатия измерительных данных, представленных двумерными объектами. Исследуется зависимость коэффициента сжатия от соотношения сторон изображения и способа кодирования исходных данных. Полученные результаты позволяют выбрать параметры изображения, оптимальные для сжатия телемеханических данных.

In this paper we study the possibility of image compression algorithms, PNG, JPEG and JPEG 2000, to compress the measuring data formed as two-dimensional objects. Dependence of compression coefficient on the ratio of the image sides and the coding method of the initial data is investigated. The results obtained allow selecting image parameters, optimal for compression of the telemechanical data.

Ключевые слова: сжатие данных, PNG, JPEG, JPEG2000, измерительные данные, телемеханические данные.

Для информационно-измерительных систем сжатие данных было и остается актуальной задачей. Так, существующие на текущий момент алгоритмы сжатия данных не всегда обеспечивают хорошее сжатие измерительных данных в силу присущих им статистических особенностей [1]. Можно предположить, что одним из возможных способов учесть внутренние корреляционные связи в потоке измерительных данных и таким образом получить хорошее сжатие является представление таких данных двумерными объектами и применение к ним алгоритмов сжатия изображений [2]. Очевидно, что для получения максимального сжатия в данном случае следует разрабатывать специализированные алгоритмы сжатия двумерных объектов, способные учитывать статистические особенности измерительных данных, представленных в такой форме. Тем не менее, для оценки перспективности предлагаемо-

ВЕСТНИК ТОГУ. 2012. № 4(27)

ВЕСТНИК ТОГУ. 2012. № 4 (27)

го способа можно воспользоваться уже существующими, хорошо известными алгоритмами сжатия изображений.

В качестве тестовых алгоритмов в данной работе использовались алгоритмы, применяемые в широко распространенных графических форматах PNG, JPEG и JPEG2000. Можно отметить ряд особенностей, свойственных таким алгоритмам. Так, формат PNG использует комбинацию алгоритмов LZ77 и алгоритма Хаффмана и обеспечивает сжатие без потерь данных. Алгоритм JPEG использует дискретное косинусное преобразование и сжимает только с потерями, а алгоритм JPEG2000 является развитием формата JPEG, использует дискретное вейвлет-преобразование и может обеспечивать сжатие, как с потерями, так и без них. В дальнейшем в этой статье используемый алгоритм сжатия обозначается соответствующим графическим форматом, в котором он применяется. Очевидно, что для большинства систем передачи данных алгоритм JPEG не представляет интереса, в силу вносимых им погрешностей в сжимаемые данные, тем не менее, в данной работе этот алгоритм рассматривался в качестве некоторого контрастного метода.

Наиболее простым способом представления данных можно считать прямое отображение каждого бита исходных данных в один пиксель монохромного изображения. Преимущество такого представления данных состоит в том, что пиксель принимает лишь два значения цвета, что позволяет использовать алгоритмы сжатия с потерями, например JPEG с минимальными настройками качества. При этом минимизировать ошибки, вносимые алгоритмом сжатия, можно фильтрацией распакованных данных.

Первичная проверка возможностей предложенного способа сжатия осуществлялась на тестовом измерительном сигнале, представляющем собой синусоидальный сигнал, зашумленный случайной величиной с нормальным распределением. Были проведены исследования влияния на результат сжатия предварительного кодирования исходных данных рефлексным кодом Грея. Также исследовалась зависимость эффективности сжатия от соотношения сторон сгенерированного изображения. Эффективность сжатия алгоритмов оценивалась коэффициентом сжатия, т.е. соотношением объема сжатых данных к объему исходных данных. Результаты проведенных исследований для незашумленного сигнала приведены в табл. 1.

Полученные данные показывают, что при простом представлении данных добиться их приемлемого сжатия не удается. Тем не менее, следует отметить, что алгоритм PNG обеспечивает более хорошее сжатие, чем JPEG, несмотря на максимальные настройки сжатия последнего. При этом минимальные значения коэффициента сжатия для алгоритма PNG получаются на вертикально вытянутых, а для алгоритма JPEG - на горизонтально вытянутых изображениях. Следует отметить, что алгоритм JPEG2000 обеспечивает наихудшее сжатие среди рассмотренных алгоритмов, причем коэффициент сжатия практически не зависит ни от способа кодирования исходных данных, ни от размеров сжимаемого изображения.

Таблица 1

Коэффициенты сжатия для данных, представленных монохромным _изображением_

PNG JPEG JPEG 2000

Разрешение Бинарный код Код Грея Бинарный код Код Грея Бинарный код Код Грея

38400x1 1,262 1,247 4,969 5,001 7,995 7,998

9600x4 1,263 1,246 2,413 2,343 7,998 7,996

2400x16 1,263 1,248 1,387 1,380 7,998 7,998

600x64 1,267 1,251 1,411 1,398 7,995 7,995

300x128 1,274 1,258 1,415 1,414 7,987 7,966

256x150 1,275 1,261 1,403 1,380 7,988 7,905

150x256 1,285 1,268 1,419 1,427 7,996 7,987

128x300 1,286 1,269 1,366 1,333 7,964 7,901

64x600 1,299 1,288 1,309 1,269 7,998 7,980

16x2400 1,332 1,332 1,182 1,145 7,396 7,382

4x9600 1,466 1,429 2,448 2,459 7,998 7,999

1x38400 1,422 1,393 5,277 5,313 7,998 7,997

Также следует отметить, что применение кода Грея для кодирования исходных данных приводит к некоторому улучшению эффективности их сжатия. Этот факт можно объяснить достаточно плавным изменением входного сигнала и свойствами самого кода.

При зашумлении сигнала эффективность сжатия, как и ожидалось, снижается, однако не существенно. Так, при величине ОСШ, равной трем, значения коэффициента сжатия увеличились не более чем на 3-4%.

Учитывая неэффективность сжатия исходных данных, представленных монохромными изображениями, было предложено использовать более сложное их представление в виде цветного изображения. В этом случае каждый пиксель исходного изображения кодировался несколькими байтами исходных данных, определяющими глубину цвета. В данной статье приведены результаты для случая 32-битной глубины цвета, при которой достигается наибольшая эффективность сжатия.

Условия исследования не изменялись, за исключением того что, алгоритм JPEG использовался в режиме сжатия с наименьшими потерями. Результаты проведенного исследования для случая незашумленного сигнала приведены в табл. 2.

Из полученных данных следует, что лучшее сжатие обеспечивается алгоритмом JPEG при кодировании бинарным кодом. Это отличается от результатов первого эксперимента, где алгоритм PNG с кодом Грея давал несколько лучший результат.

ВЕСТНИК ТОГУ. 2012. № 4 (27)

Таблица 2

Коэффициенты сжатия для данных, представленных цветным изображением

Размер изображения PNG JPEG JPEG 2000

Бинарный код Код Грея Бинарный код Код Грея Бинарный код Код Грея

38400x1 0,212 0,525 0,584 0,635 0,664 0,749

9600x4 0,212 0,634 0,307 0,293 0,749 0,749

2400x16 0,213 0,526 0,156 0,151 0,749 0,749

600x64 0,465 0,616 0,158 0,156 0,703 0,749

300x128 0,440 0,655 0,179 0,177 0,702 0,749

256x150 0,317 0,626 0,196 0,195 0,733 0,748

150x256 0,472 0,571 0,194 0,190 0,716 0,749

128x300 0,486 0,586 0,187 0,178 0,724 0,749

64x600 0,485 0,614 0,162 0,158 0,729 0,748

16x2400 0,506 0,714 0,149 0,152 0,736 0,749

4x9600 0,692 0,8 0,290 0,293 0,749 0,749

1x38400 0,629 0,830 0,627 0,686 0,678 0,749

Более низкая степень сжатия, характерная для алгоритмов сжатия без потерь (PNG и JPEG2000), обусловлена тем, что в изображение помещается большое количество периодов синусоидального сигнала, в результате чего полученное изображение как визуально, так и статистически приближается к шумовому виду.

Также следует отметить специфичные особенности каждого из алгоритмов при работе с разным соотношением сторон изображения. Так, использование алгоритма PNG обеспечивает лучшее сжатие на строчном изображении с незначительным ухудшением эффективности сжатия при переходе к квадратному изображению и, далее, к столбцу. Алгоритм JPEG плохо обрабатывает столбцы и строки, показывая наилучшее сжатие на изображениях, размеры которых близки к квадратным, при этом алгоритм JPEG2000 демонстрирует обратное поведение, лучше сжимая вертикально вытянутые изображения.

Здесь еще раз следует отметить, что, несмотря на хорошие значения коэффициента сжатия, свойственные алгоритму JPEG, его применение для сжатия реальных данных зачастую неприемлемо, т.к. это алгоритм сжатия с потерями. В свою очередь, как показали проведенные эксперименты, алгоритм JPEG2000 не обеспечивает существенного сжатия измерительных данных, поэтому в дальнейшем в статье рассматривается алгоритм PNG, показавший более высокую эффективность.

Представляют определенный практический интерес зависимость эффективности алгоритма PNG от уровня стохастичности сжимаемых данных. На рис. 1 приведены зависимости коэффициента сжатия от соотношения сторон изображения, полученные при разных ОСШ. Анализ полученных данных позволяет сделать вывод о зависимости степени сжатия изображения для данного алгоритма только от факта наличия шума в исходных данных, тогда как уровень шума лишь незначительно влияет на коэффициент сжатия.

Рис. 1. Зависимость коэффициента сжатия от соотношения сторон изображения при разных ОСШ

Для определения оптимальных параметров алгоритма PNG было проведено исследование эффективности сжатия при использовании изображений с различной глубиной цвета (8, 16, 24 и 32 бит на пиксель). Полученные для 32-битных изображений результаты полностью коррелируют с результатами, полученными для других значений глубины цвета, однако следует отметить существенное уменьшение степени сжатия по мере уменьшения значений этого параметра. Так, например, для размера изображения 256^150 с кодированием исходных данных кодом Грея были получены коэффициенты сжатия 0,924, 0,993, 0,925 и 0,626 для глубины цвета 8, 16, 24 и 32 бит на пиксель соответственно. Аналогичные результаты получены для всех рассматривае-

ВЕСТНИК ТОГУ. 2012. № 4 (27)

мых в статье размеров изображений и способов кодирования, поэтому для дальнейших исследований использовалась глубина цвета 32 бита на пиксель.

На следующем этапе работы проверялась возможность повышения степени сжатия за счет использования разностей соседних изображений. Общая методика проведения исследований состояла в следующем. Исходная последовательность тестовых данных разбивалась на последовательность кадров фиксированного размера, затем производилось поэлементное вычитание значений младшего кадра из старшего, после чего проводилось сжатие полученного разностного кадра алгоритмом PNG. Усредненные результаты проведенных исследований представлены в табл. 3.

Таблица 3

Результаты сжатия тестовых данных при разностном представлении

ОСШ Обычное представление Представление разностями

Бинарный код Код Грея Бинарный код Код Грея

3 0,954 0,965 0,957 0,966

10 0,884 0,925 0,887 0,923

без шума 0,574 0,777 0,083 0,112

Анализ данных показывает, что использование разности кадров приводит к существенному увеличению степени сжатия тестовых данных в виде «чистого» синусоидального сигнала, но несколько ухудшает эффективность сжатия при наличии шумового сигнала. При этом применение обычного бинарного кода по-прежнему обеспечивает наилучшее сжатие. Этот факт можно объяснить нарушением равномерности получаемого изображения в случае появления шумов в исходных данных, причем код Грея в этом случае в силу своих свойств будет давать более неравномерное изображение, что и сказывается на эффективности сжатия.

После проведения исследований на тестовых сигналах, было проведено изучение реального массива телемеханических данных, подробный анализ статистических свойств которых приведен в работе [2]. Общий объем исходных данных составлял 7232166 байт. Вопрос корректного разделения этого массива данных на части, а также подбора оптимального соотношения сторон изображения оказался нетривиальным и потребовал значительных ручных вычислений. В конечном итоге, массив данных был разделен на 46 изображений по 647^81 пикселей. Пример такого изображения показан на рис. 2, а.

Здесь важно отметить, что сжимаемые телемеханические данные представляют собой циклически повторяющиеся опросы наборов датчиков, при этом в одну строку изображения помещается нецелое число отсчетов, что существенно ухудшает структурированность изображения и, как следствие, приводит к увеличению коэффициента сжатия.

Для повышения эффективности сжатия размер изображения был скорректирован до значения 648x81, причем недостающие данные для последних

81 пикселей дублировались значениями из предыдущей строки. Результат такой коррекции представлен на рис. 2, б. Очевидно, что более упорядоченная структура кадра должна привести к снижению коэффициента сжатия.

б)

Рис. 2. Графическое представление телемеханических данных до (а) и после (б) коррекции

Результаты исследований, проведенных как с исходными, так и с корректированными телемеханическими данными приведены в табл. 4. Аналогично с результатами, полученными для тестовых данных, при сжатии некорректи-рованных данных телемеханики наилучшее сжатие обеспечивается в случае работы с разностями соседних кадров при бинарном кодировании.

Однако при работе с данными, подвергшимися коррекции, использование разности кадров приводит только к ухудшению результатов. Таким образом, можно резюмировать, что эффективность применения разностей кадров существенно зависит от свойств сжимаемых данных, используемого способа кодирования, а также метода разбиения данных на кадры и требует тщательного анализа перед применением.

Таблица 4

Результаты сжатия телемеханических данных_

Данные Обычное представление Представление разностями

Бинарный код Код Грея Бинарный код Код Грея

Исходные 0,484 0,481 0,276 0,317

Корректированные 0,223 0,264 0,293 0,364

Опираясь на результаты исследований, полученных на тестовых данных, можно предположить, что алгоритм PNG лучше всего сжимает изображения

ВЕСТНИК ТОГУ. 2012. № 4(27)

ВЕСТНИК ТОГУ. 2012. № 4 (27)

максимально приближенные к строке высотой в один пиксель. Это утверждение было проверено на данных телемеханики. В силу простоты разбиения, условие о помещении целого количества циклов в строку изображения, было легко соблюдено.

Проведенные исследования показали, что лучшее значение коэффициента сжатия («0,271) приходится на случай сжатия разностей кадров, закодированных простым двоичным кодом. Кодирование Грея приводит ко второму по значимости результату «0,312. Незначительно худший результат дает сжатие исходных данных - «0,329 для бинарного кода и «0,34 для кода Грея. Таким образом, представление реальных данных изображениями такого размера не приводит к увеличению эффективности сжатия, но может представлять некоторый практический интерес в связи с простотой формирования изображения.

Для получения некоторой предельной величины коэффициента сжатия, было проведено формирование единого изображения из всего объема телемеханических данных с последующим его сжатием алгоритмом PNG. При таком представлении данных лучший коэффициент сжатия достигается при кодировании исходных данных кодом Грея и составляет «0,191, в то время как обычное бинарное кодирование обеспечивает коэффициент сжатия «0,2.

Таким образом, результаты проведенных исследований показывают возможность применения существующих алгоритмов сжатия изображений к задаче сжатия измерительных данных. При этом набор телемеханических данных сжимался более чем в 5 раз. Необходимо отметить, что за рамками исследования остался вопрос ресурсоемкости и быстродействия предлагаемого способа сжатия, что может быть критичным при его использовании в системах с небольшими вычислительными мощностями или в системах, работающих в режиме жесткого реального времени. Поэтому дальнейшее развитие предлагаемого способа сжатия измерительных данных можно определить как разработку алгоритма выбора оптимальных параметров изображения, модификацию (с точки зрения быстродействия) алгоритма сжатия, а также в поиск оптимального способа кодирования исходных данных.

Библиографические ссылки

1. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. - М.: ДИАЛОГ-МИФИ, 2003. - 384 с.

2. Чье Ен Ун, Левенец А. В., Нильга В. В. Представление телемеханических данных однородными п-мерными структурами как предварительная обработка в задачах сжатия // Информационно-управляющие системы, 2011. - №6(55), С. 7-10.

3. Левенец А. В. Классификация телемеханических данных и их разностных рядов с точки зрения задачи сжатия // Вестник Тихоокеанского государственного университета. - 2009. - №4(15). - С. 71-80.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Левенец А. В., Токарев Р. Е., Чье Ен Ун

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Левенец А. В., Токарев Р. Е., Чье Ен Ун

Application of Typical Algorithms of Image Compression for Compres-sion of Measuring Data

Текст научной работы на тему «ПРИМЕНЕНИЕ ПОПУЛЯРНЫХ АЛГОРИТМОВ КОМПРЕССИИ ИЗОБРАЖЕНИЙ ДЛЯ СЖАТИЯ ИЗМЕРИТЕЛЬНЫХ ДАННЫХ»