УДК 004.627
В.Г. ИВАНОВ, д.т.н., проф., зав. каф. НЮАУ им. Я. Мудрого,
Харьков,
Ю.В. ЛОМОНОСОВ, к.т.н., доц. НЮАУ им. Я. Мудрого, Харьков,
М.Г. ЛЮБАРСКИЙ, д.ф.-м.н., проф. НЮАУ им. Я. Мудрого,
Харьков,
Н.А. КОШЕВА, к.т.н., доц. НЮАУ им. Я. Мудрого, Харьков,
М.В. ГВОЗДЕНКО, ст. преп. НЮАУ им. Я. Мудрого, Харьков,
Н.И. МАЗНИЧЕНКО, ст. преп. НЮАУ им. Я. Мудрого, Харьков
СЖАТИЕ ДАННЫХ В СИСТЕМЕ ХААРА С УЧЕТОМ
ОБЪЕМА ПЕРВИЧНОЙ ДИСКРЕТИЗАЦИИ
Формализован процесс вычисления коэффициентов Хаара непрерывных функций с учетом объема первичной дискретизации сигналов и получены сравнительные оценки эффективности этих преобразований в задачах сжатия сообщений. Ил.: 2. Библиогр.: 15 назв.
Ключевые слова: сжатие; система Хаара. дискретизация сигналов.
Постановка проблемы и анализ литературы. Методы сжатия данных стали перманентной состаляющей практически всех алгоритмов и компьютерных систем, и сетей хранения, обработки, передачи или поиска мультимедийной информации [1 - 6].
При этом одной из основных проблем проектирования устройств сжатия данных является проблема эффективного дискретного представления непрерывных сообщений /(/) как функции дискретного времени /(?,), которая характеризуется совокупностью координат Ук ,
полученных в результате разложения контролируемого параметра по системе каких-либо ортогональных базисных функций.
При этом повышение коэффициента сжатия в устройствах связано со свойством сходимости аппроксимирующего ряда из этих коэффициентов. Чем лучше сходимость, тем меньше членов ряда, а следовательно, и координат требуется для аппроксимации исходной функции при заданной точности и приемлемой сложности вычислений.
Таким критериям отвечают алгоритмы сжатия исходных данных на основе базовых вейвлетов Хаара.
Идея вейвлетной декомпозиции сигналов является основой для многих алгоритмов и методов фильтрации, кодирования или распознавания данных [2, 6 - 11]. Однако кодирование сигналов на основе вейвлет-преобразований Хаара с учетом как объема первичного
квантования так и аппроксимирующих свойств рядов Хаара, исследовано не достаточно.
Цель статьи. Формализовать процесс вычисления коэффициентов Хаара непрерывных функций с учетом объема первичной дискретизации и получить сравнительные оценки эффективности этих преобразований в задачах сжатия данных.
Решение задачи. Известно [12], что любая непрерывная на отрезке [0, 1] функция /(х), отображающая сигнал, подлежащий обработке, разлагается в равномерно сходящийся ряд
ад
/(х) = Х Сь г к(х), (1)
к=1
где Ск и г к (х) - соответственно коэффициенты и функции Хаара.
Легко показать, что учитывая свойства системы функций %к (х), коэффициенты Хаара могут быть вычислены по формуле:
С = 2 2
Ст] 2
(2)
где /т- - соответственно левая и правая половина двоичного отрезка
определения функций Хаара.
При формировании сообщения, содержащего " п" координат Хаара, оценка поведения параметра без учета влияния шумов первичного квантования получается в виде:
п
/ *(х) = Х Ск г к(х) • (3)
к=1
Используя известное положение теории квадратурных формул [13], заменим интегралы в (2) их частичными суммами:
м
8м = Х /(хп )Ахп , (4)
п=1
В — А В — А
где Ах„ =------, х_ = А н----п , а А и В - соответственно верхний и
п мпм
нижний пределы интегрирования.
Тогда выражение (2) можно переписать следующим образом:
т-1Гм-1 м-1
* * ' (5)
С = 2 2
Ст] 2
X / (хп )^Хп — X / (х**)Ах*п
т—1
1тт
тт
п=0
п=0
Так как для системы Хаара
2 } -1 2(7-1) * 2 } 2 }-1
Дг„ = —----------------- и Дх„ = —--------------
2"
то (5) запишется в виде
С ■ = 2 2
Ст} 2
2/-1 2 І-2 2 /-1 2 І-2
—-------------М-1 —--------—
лт г.т \ г.т г.т
■ Е /(п-
п=0
+^) - -2 т
2 І 2 І-1 2 І 2 І-1
——— М-1 —---—
т т т т
■ Е / (п -
п=0
+
т
(6)
где М - число отсчетов функции на Iт интервалах.
После соответствующих преобразований выражение (6) приводится к виду:
С =
СЩ!
т+1 М-1 2 2
М
Е [/ ( у -~т) - / (у)
(7)
где у = ■
+ 2} -1 2 т
Полученная формула (7) позволяет вычислить коэффициенты Хаара функции /(х). Причем, частота первичной дискретизации, т.е. расстояние между /п и /п+1, будет разной при вычислении коэффициентов с различными порядковыми номерами, а число выборок на двоичных отрезках Iт будет постоянно при любом т.
Используя среднеквадратичный критерий, запишем мощность ошибки при аппроксимации сигнала /(х) рядом Хаара:
=11 Т *
N
/ (X)-Е Ск X к (х)
к=1
& .
После преобразований будем иметь:
N
8 = Р-Е
к=1
2-(т+1) М-1 М-1 М-1 М-1
—Т Е / 2( у —) -2 Е / (у-ІГ)-Е / (у) +Е / 2( у)
М п=0 2 п=0 2 п=0 п=0
(8)
(9)
где Р определяет мощность сигнала.
Выражение (9) позволяет оценить ошибку представления сигнала в базисе Хаара при конечном числе членов ряда (1) с учетом шумов первичного квантования, т.е. с различным числом отсчетов функции, необходимых для определения коэффициентов Хаара.
т
т
т
2
2
2
т-1
М
М
М
М
п
2
Однако, применение на практике формулы (7) несет в себе ряд неудобств, так как вычисление коэффициентов Хаара с большими порядковыми номерами, т.е. когда /*■ мало, не выгодно с точки зрения
вычислительных затрат, а с технической стороны требует перестройки частоты временного квантователя.
Если функционально изменять величину М в (7) при переходе от значения т к (т+1) таким образом, чтобы ошибка 8 в выражении (9) оставалась в допустимых пределах, то число вычислительных операций может быть снижено.
Запишем рекурентное соотношение для значения М при переходе к вычислению коэффициента Хаара с большим порядковым номером в
виде -М и представим после преобразований выражение (7) в виде
2я
т} М ^ 2 т + 2 І -1
3т-1 М
2 2 2‘
Ст} = — Е [/(2 ) - /(2)
п=0
(10)
2т
Полученная формула (10) позволяет существенно снизить число отсчетов, а следовательно, и вычислительные затраты при ортогональном разложении сигналов в ряд Хаара.
Если М четное, то использование выражения (10) позволяет нелинейно изменять число отсчетов функции /(х) на двоичных отрезках, оставляя длительность между отсчетами постоянной, что очень существенно в практическом плане, тогда как вычисления по формуле (7) требуют изменения частоты выборки на каждом двоичном отрезке. Если, например, на всем интервале определения сигнала имеется 128 отсчетов функции, то при вычислении первого коэффициента по формуле (10) будут учитываться все отсчеты, при вычислении второго коэффициента -64 отсчета и т.д.
Как уже отмечалось, эффективность устройств cжатия данных существенным образом зависит от экстремальных свойств ортогональных рядов по выбранной системе базисных функций. Учитывая тот факт, что не существует базиса, который обеспечивал бы наилучшую cходимость для всех классов аппроксимируемых функций, можно сказать, что на передний план выдвигаются такие свойства базисных функций, которые обеспечивают минимальную сложность вычислений коэффициентов.
В этой связи перспективным видится использование рассматриваемого базиса Хаара.
Число отсчетов при представлении сигналов в этом базисе, а следовательно, и вычислительных операций по формулам (7) и (10) будет
равно соответственно М(2т+1 -1) + 2т и (4М + 2т), где т определяет высший порядок используемых функций Хаара.
В случае использования тригонометрического базиса Фурье для представления сигнала /(х), объём вычислительных операций составит
М2 умножений и столько же сложений.
Если предварительно вычислить значение суммы в (7) и (10) на двоичных отрезках минимальной длительности, то коэффициенты можно определить с использованием алгоритма быстрого преобразования Хаара [14]. Причем вычислительные затраты в этом случае составят
соответственно М • 2т + (2т -1) и М + 2(2т -1) операций типа сложения
- вычитания.
Один из наиболее простых вариантов сжатия сигнала, заключается в ограничении его спектра [15].
При разложении непрерывного сигнала £(¿) по системе функций {л(к, О} образуется спектр {С(к)}.
Ограничение спектра заключается в том, что фильтр пропускает все составляющие спектра {Ск } с порядком не выше к < п и задерживает все
составляющие при к > п .
Сигнал на выходе фильтра и выходной спектр связаны соотношениями:
П г~^
£ (к) = X С(к)ч(к, ¿1),
к=0 Т
1 2 2
С(к) = —— |£(¿)ц(к,, (11)
г Т о
где Рг означает мощность базисных функций.
Таким образом, процесс фильтрации можно записать в виде
г/
~ /2
ад = х £ (ОД п , (12)
о
где Д п (¿, ¿1) - ядро Дирихле, которое полностью определяется базисом {л(к, ¿)} и фильтром (числом п удерживаемых членов ряда Фурье). Эффективность фильтра будет тем выше, чем меньше значение п в
выражении (12) при одинаковых среднеквадратических ошибках восстановления. Однако, такой критерий не учитывает вычислительных особенностей базисов таких, например, как Фурье и Хаара.
В этой связи представляется небезынтересным введение такого критерия, как зависимость среднеквадратичной ошибки аппроксимации (8) от времени обработки.
На рис. 1 и 2 приведены рассчитанные на ЭВМ графики зависимости среднеквадратичной ошибки представления реализаций стационарного процесса с периодической функцией корреляции от числа удерживаемых членов ряда фильтра Фурье и Хаара, которые показывают сравнительную эффективность обработки при различном числе первичных отсчетов М. Для рис. 1 и 2 приняты следующие обозначения:
1 - базис Фурье; кривые 2, 3, 4 - базис Хаара при различных значениях М в выражениях (7) и (10), причем М(2) > М(3) > М(4).
В %
25 20 15 10
4
1
16 32 64
Рис. 1. Зависимости среднеквадратичной ошибки представления сигналов
коэффициентами ряда в базисе Фурье (1) и в базисе Хаара (2, 3, 4)
Анализ полученных результатов показывает, что эффективность обработки в базисе Хаара (рис. 2, кривая 2) с большим значением первичных отсчетов М выше, чем когда используется меньшее число первичных отсчетов. Эта эффективность растет с увеличением числа удерживаемых коэффициентов ряда.
Представление сигналов в базисе Хаара с использованием нелинейного изменения числа отсчетов М согласно выражению (10)
(рис. 2, кривая 4), при всех значениях нормированного времени / дает ошибку фильтрации почти в два раза меньшую, чем использование представления в соответствии с выражением (7). Т.е. при одинаковом значении нормированного времени /, число удерживаемых коэффициентов ряда Хаара будет большим при использовании формулы (10). Причем кривая 4 на рис. 2 имеет более крутой спад в начале нормированного времени обработки, что говорит о низкочастотном характере спектра Хаара. Графики под номером 5 и 6 на рис. 2 показывают эффективность обработки в базисе Хаара с использованием алгоритма быстрого преобразования и выражений (7) и (10) соответственно.
£“о
5
1
3 5 7 9
Рис. 2. Зависимость среднеквадратичной ошибки фильтров Фурье (1) и Хаара (2, 3, 4, 5) от времени обработки
Эти результаты распространяются на класс случайных стационарных процессов с периодической функцией корреляции, т.е. предложенное эмпирическое нелинейное преобразование отсчетов М = ф(т) гарантирует неувеличение среднеквадратичной ошибки фильтрации е.
Выводы. Практическая ценность полученных результатов заключается в том, что они позволяют вычислить коэффициенты и оценить ошибку представления сигналов рядом Хаара как с учетом числа первичных отсчетов, так и числа удерживаемых коэффициентов ряда на
интервале анализа и позволяют найти приемлемый компромисс между заданным временем и качеством обработки.
Как и следовало ожидать, для данного класса сигналов фильтр Фурье оказался предпочтительнее фильтра Хаара, так как тригонометрические функции с кратными периодами являются оптимальным базисом в случае стационарного процесса с периодической корреляционной функцией.
Список литературы: 1. Мюррей Д. Энциклопедия форматов графических файлов / Д. Мюррей, Уван Райнер. - К.: Издательская группа BHV, 1997. - 672 с. 2. Гонсалес Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. - М.: Техносфера, 2005. - 1072 с. 3. Сэломон Д. Сжатие данных, изображений и звука / Д. Сэломон. - М.: Техносфера, 2004. -368 с. 4. Ричардсон Ян. Видеокодирование. Н. 264 и MPEG-4 - стандарты нового поколения / Ян. Ричардсон. - М.: Техносфера, 2005. - 368 с. 5. Иванов В.Г. Фурье и вейвлет-анализ изображений в плоскости JPEG технологий / В.Г. Иванов, М.Г. Любарский, Ю.В. Ломоносов // Проблемы управления и информатики. - Київ, 2004. - № 5. - С. 111-124. 6. Форсайт Д. Компьютерное зрение. Современный подход / Д. Форсайт, Д. Понс. - М.: Вильямс, 2004. -928 с. 7. Иванов В.Г. Сокращение содержательной избыточности изображений на основе классификации объектов и фона / В.Г. Иванов, М.Г. Любарский, Ю.В. Ломоносов // Проблемы управления и информатики. - Київ, 2007. - N° 3. С. 93-102. 8. Уэлстид С. Фракталы и вейвлеты для сжатия изображений в действии: Учеб. пособ. / С. Уэлстид. - М.: Триумф, 2003. - 320 с. 9. Кинтцель Тим. Руководство программиста по работе со звуком / Тим Кинтцель. - М.: ДМК Пресс, 2000. - 432 с. 10. Кравченко В.Ф. Wavelet-системы и их применение в обработке сигналов / В. Ф. Кравченко, В.А Рвачев // Зарубежная радиоэлектроника. - М.: Радио и связь, 1996. - № 4. - С. 3-20. 11. Иванов В.Г. Применение вейвлет-анализа к сжатию звуковых сигналов / В.Г. Иванов, М.Г. Любарский, Ю.В. Ломоносов // Вісник Національного технічного університету "Харківський політехнічний інститут". - Харків: НТУ "ХШ", 2003. - Т. 1. - № 7. - С. 39-50. 12. Соболь И.М. Многомерные квадратурные формулы и функции Хаара / И.М. Соболь. -М.: Наука, 1970. - 288 с. 13.Микеладзе Ш.Е. Численные методы математического анализа / Ш.Е. Микеладзе. - М.: Гос. изд-во технико-теоретич. лит., 1953. - 527 с. 14. Іванов В.Г. Формальное описание дискретных преобразований Хаара / В.Г. Иванов // Проблемы управления и информатики. - 2003. - № 5, - С. 68-75. 15. Трахтман А.М. Введение в обобщенную спектральную теорию сигналов / А.М. Трахтман. - М.: Сов. Радио, 1972. -352 с.
УДК 004.627
Стиснення даних в системі Хаара з урахуванням об'єму первинної дискретизації / Іванов В.Г., Ломоносов Ю.В., Любарський М.Г, Кошева Н.А., Гвозденко М.В., Мазниченко Н.І. // Вісник НТУ "ХПІ". Тематичний випуск: Інформатика і моделювання. -Харків: НТУ "ХПІ". - 2011. - № 17. - С. 51 - 59.
Формалізований процес обчислення коефіцієнтів Хаару безперервних функцій з урахуванням об'єму первинної дискретизації сигналів і отримані порівняльні оцінки ефективності цих перетворень в завданнях стиснення повідомлень. Іл.: 2. Бібліогр.: 15 назв.
Ключові слова: стиснення, система Хаару, дискретизація сигналів.
UDC 004.627
Compression of data in the system of Haar taking into account the volume of primary digitization / Ivanov V.G., Lyubarsky M.G., Lomonosov U.V, Kosheva N.A., Gvozdenko M.V., Maznichenko N.I. // Herald of the National Technical University "KhPI".
Subject issue: Information Science and Modelling. - Kharkov: NTU "KhPI". - 2011. - №2. 17. -P. 51 - 59.
The process of calculation of coefficients of Haar of continuous functions is formalized taking into account the volume of primary digitization of signals and the comparative estimations of efficiency of these transformations are got to the tasks of compression of reports. Figs.: 2. Refs.: 15 titles.
bywords: compression, system of Haar, digitization of signals.
Поступила в редакцию 10.02.2011