Научная статья на тему 'Формирование вейвлет-функций в задаче идентификации музыкальных сигналов'

Формирование вейвлет-функций в задаче идентификации музыкальных сигналов Текст научной статьи по специальности «Математика»

CC BY
305
71
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Фадеев А. С.

Предложен подход, позволяющий формировать вейвлет-функции на основе периодических сигналов и фрагментов сигналов музыкальных инструментов. Рассмотрены необходимые и достаточные условия, предъявляемые к формируемым вейвлет-функциям. Описан эксперимент, позволяющий идентифицировать несколько гармонических составляющих сигнала, локализованных во времени. Показана возможность применения разработанного подхода в задачах идентификации сложных музыкальных сигналов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Формирование вейвлет-функций в задаче идентификации музыкальных сигналов»

УДК 517.5

ФОРМИРОВАНИЕ ВЕЙВЛЕТ-ФУНКЦИЙ В ЗАДАЧЕ ИДЕНТИФИКАЦИИ МУЗЫКАЛЬНЫХ СИГНАЛОВ

A.C. Фадеев

Томский политехнический университет E-mail: fas@aics.ru

Предложен подход, позволяющий формировать вейвлет-функции на основе периодических сигналов и фрагментов сигналов музыкальных инструментов. Рассмотрены необходимые и достаточные условия, предъявляемые к формируемым вейвлет-функциям. Описан эксперимент, позволяющий идентифицировать несколько гармонических составляющих сигнала, локализованных во времени. Показана возможность применения разработанного подхода в задачах идентификации сложных музыкальных сигналов.

Рост информационных технологий последних лет сделал возможным программные и аппаратные реализации многих математических задач, связанных с распознаванием образов. Благодаря развитию современных высокопроизводительных вычислительных систем решен ряд задач в области распознавания речи, графических объектов, обработки сейсмических данных, кардиограмм и ряда других. Менее изучены задачи в области распознавания музыкальной информации и возможность их применения в системах автоматизированной обработки информации [1]. Одной из таких задач является задача идентификации отдельных нот в одноголосных и многоголосных мелодиях, исполненных на определенных музыкальных инструментах.

Основу вычислительно эксперимента представляет математическая модель музыкального сигнала F(t), полученного при звукозаписи мелодии определенного музыкального инструмента: F(t)=Aini(t-ei)+A2n2(t-e2)+...+ANnN{t-e^+h(t),

где и;(0 - амплитудно-временные характеристики отдельных нот мелодии; - временные смещения, определяющие начальные моменты звучания каждой ноты; А, - громкость звучания отдельной ноты; h(t) - сигнал помехи, вносимой звукозаписывающей аппаратурой; t - время.

Большинство музыкальных инструментов обладают свойством автомодельности, которое позволяет из временной функции одной ноты и0(/) определенного музыкального инструмента получить временную функцию любой другой ноты и;(0 этого музыкального инструмента масштабированием функции nfl(t) вдоль оси времени:

«,(')= «о

где mi - коэффициент масштабирования, i - положение ноты n,(f) по высоте относительно ноты nfl(t). Для равномерно темперированного строя европейской музыки т;=2~"п, i= 0,+1,+2... .

Например, нота «до» второй октавы расположена на 12 полутонов выше ноты «до» первой октавы и имеет частоту основного тона в два раза выше частоты основного тона ноты «до» первой октавы. Временная функция ноты «до» второй октавы n2(t) будет сжата в два раза относительно функции n{(t)\

n2(t)=nx

-12 2 12

= Wj(2/).

В качестве базовой ноты и0(/) может быть выбрана любая нота из диапазона определенного инструмента, вне зависимости от использования в конкретном музыкальном сигнале F(t). Например, за и0(/) можно принять временную функцию ноты «ля» первой октавы с частотой основного тона о=440 Гц.

Это свойство применено во всех современных музыкальных синтезаторах использующих метод волнового табличного синтеза [2]. Такие синтезаторы используют банк данных сигналов одной (базовой) ноты для каждого музыкального инструмента. При формировании мелодии одного инструмента сигнал базовой ноты каждый раз масштабируется по высоте основного тона на значение Каждая нота сдвигается во времени на величину и масштабируется по амплитуде на величину А, согласно партии этого инструмента. Все сформированные функции для одного музыкального инструмента суммируются. В результате модель музыкального сигнала, формируемого синтезатором для конкретного музыкального инструмента, имеет вид:

m=I>,

i

Аналогично, для ^-различных музыкальных инструментов, имитируемых синтезатором, музыкальный сигнал может быть представлен суммой сигналов всех нот, сыгранных в различные моменты времени с различной амплитудой:

k i

где «ДО - временная функция сигнала базовой ноты к-го музыкального инструмента; - временной интервал смещения ноты щк((); rrii - масштаб ноты иДО относительно базовой ноты яДО, задающий частоту основного тона; А, - амплитуда звучания ноты n,k(t).

Функция f(t) представляет собой идеализированную модель музыкального сигнала, полученного аналогично звукозаписи нескольких музыкальных инструментов (оркестра, ансамбля).

Соответственно модели музыкального сигнала flj), задачу распознавания музыкального сигнала

можно представить как задачу идентификации амплитуд нот с определенным масштабом т, и смещением во времени в{ для всех ^-музыкальных инструментов, присутствующих в исследуемом сигнале ДО- Частным случаем этой задачи может быть задача идентификации мелодии отдельно записанного музыкального инструмента или мелодии сгенерированной музыкальным синтезатором.

При выборе математического аппарата для исследования частотно-временных свойств сигнала f{t), который является нестационарным и непериодическим сигналом, было решено применить непрерывное вейвлет-преобразование (НВП) [3]: 00

ivs s

где w(t) - материнский вейвлет; s - коэффициент масштабирования вейвлета; г - коэффициент сдвига вейвлета.

Одной из особенностей НВП является формирование семейства вейвлетов wST(t) путем сдвигов г и масштабирования s материнского вейвлета w(t). Формирование семейства вейвлетов схоже с системой формирования семейств нот п-(Г) из одной базовой n0k(t) путем сдвигов 0г и масштабирования тг Поэтому использование НВП в данной задаче весьма органично.

Процедура выбора функции материнского вейвлета остается эмпирической для каждой конкретной задачи и сводится к перебору функций материнских вейвлетов в НВП до достижения желаемого результата. Исследования свойств вейвлет-функ-ций [4] показали, что наилучшие графические представления результатов НВП получены при схожести частотных спектров сигнала ДО и вейвлета w(t).

Для каждого конкретного масштаба s функция Wfs( г) аналогична взаимной корреляционной функции сигналов ws(t) и ft) и описывает как степень сходства формы двух сигналов, так и их взаимное расположение друг относительно друга по оси времени:

00 -00

Известно, что значения взаимной корреляционной функции максимальны при совпадении функций [6]. В данном случае значения Wfs(г) будут максимальным для таких г, при которых функции ft) и ws(t- г) равны: ft)=ws(t-r).

Очевидно, что кроме сдвига г, для выполнения этого условия необходимо и равенство двух функций в каждой точке t.

Вейвлет-функция, используемая в НВП должна удовлетворять ряду необходимых условий [5]:

1. Ограниченности во времени:

0, при оо;

2. Кусочной непрерывности функции w(t).

3. Интегрируемости с равенством нулю:

J w(t)dt = 0.

Примером материнской вейвлет-функции, удовлетворяющей всем приведенным условиям, может служить вейвлет Морле (рис. 1).

>ко,

г

V КО' к J

. 1 11 >

Рис. 1. Вейвлеты семейства Морле: а) материнский вейвлет Морле, полученный масштабированием 5=0,2; б) вейвлет семейства Морле, полученный сдвигом на т=5 и масштабированием 5=2

В силу условий временной локализации, наложенных на функцию материнского вейвлета, значение функции г) тем больше, чем более точно вейвлет масштаба 5 совпадет с локальным

участком сигнала ДО- Для точного совпадения на локальных временных отрезках функции вейвлета и сигнала должны быть равны.

В данной работе предлагается использовать функцию материнского вейвлета, сформированную из локального участка исследуемого музыкального сигнала. Для более узкой задачи - идентификации нот музыкального инструмента, обозначенной выше, материнский вейвлет можно сформировать из локального участка функции сигнала базовой ноты этого инструмента щ(0 (рис. 2).

ъ + т

it)

/

У I

Рис. 2. Функция n0(t) и сформированный на основе ее фрагмента вейвлет w( t)

Для формируемого вейвлета должны выполняться изложенные условия 1-3.

1. Ограниченности во времени

w(0=0, при te[0,7];

w(t)= л0(Ж0), при fe[0,7].

Здесь t(} характеризует момент времени, с которого значения вейвлет-функции w(t) равны значе-

ниям функции сигнала /?„(/), а значение Г равно длительности фрагмента сигнала n0(t), совпадающего с вейвлетом w(t). Значения t{) и Г выбираются таким образом, чтобы обеспечить остальные необходимые условия для вейвлет-функций [5].

2. Кусочной непрерывности

Функция базовой ноты гф) на всем интервале существования является непрерывной, так как описывает колебания физического тела с конечной массой во времени и по определению не может иметь разрывов.

Для обеспечения кусочной непрерывности функции материнского вейвлета необходимо выполнение условия равенства нулю начального и конечного значений функции гф) на интервале [tib T+Q:

3. Интегрируемости с равенством нулю

Одним из свойств музыкальных инструментов

является отсутствие гармонических составляющих с частотой меньше частоты основного тона ноты. В том числе, в сигналах музыкальных инструментов отсутствует нулевая гармоника [1]. Это свойство позволяет обеспечить нулевое среднее для гф) на интервале [/„, T+Q при наличии на данном интервале целого числа периодов в функции n0(t).

Таким образом, для формирования вейвлета, обладающего наибольшими избирательными способностями к сигналу n{)(t), необходимо использовать периодический участок сигнала n{)(t) с нулевыми начальным гф0) и конечным щ(Т+10) момен-

T+t0

тами, такой, чтобы J n(]{t)dt = 0.

to

Идентификация нот музыкального произведения состоит в определении частот основных тонов самих нот и времени начала и длительности их звучания. Одним из свойств функции вейвлета, определяющего основную частотно-временную избирательную способность НВП, является локализация вейвлета в частотной и временной областях [5]. При НВП каждый вейвлет одного семейства (полученный из одного материнского вейвлета) образует частотно-вре-менное окно конечного размера. Площадь окна для вейвлетов одного семейства на плоскости сдвиг-масштаб всегда остается постоянной [3] (рис. 3).

s А

Рис. 3. Окно частотно-временной локализации вейвлета при различных значениях параметров сдвига т и масштаба 5

Однако в ходе проведения ряда экспериментов выяснилось, что при изменении самого вейвлета,

геометрические характеристики окна изменяются. Так, с увеличением количества периодов в материнском вейвлете (а, следовательно, и во всех вей-влетах семейства), окно вытягивается вдоль оси времени, сужаясь относительно оси масштабов, и, наоборот, с уменьшением числа периодов в материнском вейвлете, окно вытягивается вдоль оси масштабов б, сужаясь вдоль оси времени (рис. 4).

а б

Рис. 4. Окно частотно-временной локализации вейвлетов с числом периодов а) N=2 и б) N=8

Для задач выявления элементарных составляющих (нот) в музыкальном сигнале, необходимо формирование семейства вейвлетов удовлетворяющих двум условиям:

1. разрешение по частоте (ширина окна вдоль оси масштабов Ад) должна обеспечивать такое разрешение, чтобы частоты основных тонов двух соседних ноты были различимы;

2. разрешение по времени (ширина окна вдоль оси времени Ат) должно позволять выполнять идентификацию всех нот минимально возможной длительности.

1. Разрешение по частоте

С целью оценки разрешающей способности искусственно создаваемых материнских вейвлетов был проведен эксперимент. Целью эксперимента являлось определение количества периодов в вейвлете, позволяющего идентифицировать частотные масштабы т, всех нот, присутствующих в сигнале одновременно (при НВП эквивалентом т, будут масштабы вейвлета я, относительно материнского).

В эксперименте использовано трезвучие «до-мажор» первой октавы. Частоты основных тонов нот этого трезвучия соответствуют гармоническим сигналам с частотами 261,6, 329,6 и 392 Гц. Продолжительность сигнала условно выбрана равной 0,2 с: ДО = 8ш(2л:261,60 + 8ш(2л:329,60 +8т(2тг392 ().

Для исследования тестового сигнала были созданы материнские вейвлеты /и>,(/). Количество периодов гармонического сигнала в вейвлетах составляло 1, 2, 4, 8 и 16 периодов соответственно (рис. 5).

Для тестового сигнала ДО было произведено НВП со всеми семействами вейвлетов Для каждого преобразования были построены графические интерпретации результатов в виде трехмерных моделей и карт проекций изолиний. На рис. 6 приведены карты проекций изолиний результатов НВП для семейств вейвлетов Ось ординат каждой карты проекций изолиний представляет собой ось масштабов вейвлета я, Ось абсцисс - ось временных

сдвигов т. т0, т{ - время начала и окончания сигнала /О- Оттенками серого отображается амплитуда результатов НВП: более темные участки соответствуют большей амплитуде результатов НВП (рис. 6).

Рис. 5. Материнские вейвлеты с числом периодов гармонического сигнала 1,2, 4 и 16

N=1

N=2

7У=4

'/К.................................

т0-Ат

5ЙМ ~'?/И ^; -УУИ О-»V

т0

т0-Ат т°

Т1+Ат

Т1+Ат

частоте. Однако семейство вейвлетов с шестнадцатью периодами дает высокое разрешение по частоте (все гармоники, присутствовавшие в сигнале, однозначно идентифицируются), но низкое по времени.

2. Разрешение по времени

Нотная запись предполагает использование символов нот и пауз для обозначения элементов мелодии и промежутков мелодии, на которых ноты не звучат. Длительность нот, так же как и длительность пауз, кратна длительности звучания «целой» ноты - ноты максимально возможной длительности. Система нотной записи, состоящая из чередующихся нот и пауз, накладывает жесткие ограничения на моменты начала звучания нот и начала пауз. Моменты начала звучания нот дискре-тизованны с периодом дискретизации равном длительности самой короткой ноты. Как в классических, так и в современных музыкальных произведениях самой короткой по продолжительности считается нота с длительностью ¿64=1/64-^. На практике, в силу технической сложности исполнения, ноты с длительностью /64 встречаются крайне редко. Практически самой короткой нотой можно считать длительность ¿32=1/32-^. На рис. 7 приведен фрагмент двухголосной мелодии. В каждый момент времени звучит не более двух нот одновременно. Самой короткой является нота 2. Ноты 1,3, 4 равны по длительности и в два раза длиннее ноты 2 и паузы. Если то нота 2 и пауза будут длительностью ¿з2, а ноты 1,3,4- ¿16.

Рис. 6. Графические интерпретации результатов НВП для вейвлетов с различным числом периодов N гармонического сигнала

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Как видно из рис. 6, при использовании вейвлета с одним периодом зона нечетких результатов в области временных сдвигов т, продолжительностью Ат достаточна мала, следовательно мала погрешность временных оценок сигнала. При этом разрешение по частоте настолько низкое, что для большей части масштабов 5, результаты НВП имеют большие значения, означающие относительно равномерное присутствие частотных компонент на всем частотном диапазоне исследования. Хотя, в тестовом сигнале /О присутствуют только три гармоники.

Из рис. 6 видно, что для вейвлета с 16 периодами на протяжении сигнала/0, в интервале от т0 до ть большие значения имеются только у результатов НВП для трех масштабов 5, эквивалентных частотам 261,6, 329,6 и 392 сигнала ДО- Для остальных значений 5 результаты НВП практически равны нулю. Низкое разрешение по времени формирует нечеткие результаты в моменты возникновения и затухания сигнала с промежуточными значениями амплитуды на интервалах продолжительностью Ат, не позволяя на этом интервале судить об изменениях амплитуды тестового сигнала.

Таким образом, семейство вейвлетов с одним периодом синусоидального сигнала при НВП дает высокое разрешение по времени, но крайне низкое по

й н о и

гч й н о к

й

СП >

й К

й н о м

й Н О

м

Рис. 7. Временная дискретизация на чала звучания и продол -жительности нот и пауз в многоголосной мелодии

При продолжительности вейвлета Т=\А огибающая взаимно-корреляционной функции \Vfli) вейвлета и совпадающего с ним по форме сигнала одной ноты (для конкретных значений 5), вырождаясь в автокорреляционную функцию, будет иметь форму равностороннего треугольника с максимумом в центре звучания ноты [6] и шириной Ъй (рис. 8, а). Если отбросить все значения \Vfli), меньшие то время идентификации ноты составит /и. При WfJ<t)=Ъ¿Wf1J<t\ 4=0,5^. Это значит, что время идентификации ноты равно половине ее длины.

При Г=0,5^, огибающая корреляционной функции Щ( т) вейвлета и совпадающего с ним по форме сигнала одной ноты будет иметь форму равнобокой трапеции, ширина верхней грани которой равна 0,5\А (рис. 8, б). Если отбросить все значения Щ(/), меньшие Щош(1), то время идентификации ноты со-

ставит /„. При И^|М(?)=0,5И^Л(0, Ги=0,5?, Это значит, что время идентификации ноты равно ее длине.

а б

Id

0,5k

ИОД

Wfmaxi^)

Щош(Т)

нота

I-1 "«(О

ГЛ

/,т

Рис. 8, Огибающие корреляционной функции ноты и вей-влета и/(соответствующего частоте основного тона ноты масштаба

При дальнейшем уменьшении ширины вейвле-та Г, и условии Ж/ОШ(1)=0,5Ж/ШЯХ(1), время идентификации ноты 4 останется постоянным, равным | Вывод: для временной идентификации ноты наименьшей длины необходимо использовать вейвлет длиной Г, не большей ь.

Запишем условия на продолжительность Гвей-влета во времени:

1. 7>16/и, где и - частота основного тона идентифицируемой ноты;

2. Т<1,

Вычислим граничные значения частоты основного тона ноты и, достоверная идентификация которой возможна и по времени, и по частоте: Т= 16/и, '/'=/,„ следовательно Ь=16/и или и= 16/ь. Зависимость о(^) определяет минимальную (граничную) частоту и основного тона ноты продолжительностью которая будет однозначно идентифицирована вей влетом с 16 периодами.

Темп исполнения большинства произведений, как правило, колеблется в диапазоне 60-180 четвертных долей в минуту, что соответствует времени звучания одной целой ноты ¿,=1,3...4,0 с. Соответственно, звучание ноты длительностью 4 при быстром темпе

воспроизведения (180 ударов в минуту) составит ?32=1,3/32=0,041 с. Соответственно, длина вейвлета, способного идентифицировать временной интервал ноты наименьшей длительности при высоком темпе должна составлять не больше td=t}2=0,041 с. Значение граничной частоты идентификации основного тона ноты o(L)= 16/0,041=390 Гц. Это означает, что точная идентификация времени начала и окончания звучания ноты возможна только для нот с частотой основного тона выше 390 Гц (рис. 9) (начиная с ноты «соль» первой октавы, частота основного тона которой составляет 392 Гц).

Для более медленного темпа исполнения произведений или для задач выявления нот большей длительности, чем ti2, граничная частота будет уменьшаться. Так, например, для современных клубных танцевальных композиций темп воспроизведения колеблется около значения 120 уд./мин, а самой короткой нотой является /d=i16=0,125 с. Значение граничной частоты идентификации основного тона ноты v(td)= 16/0,125=128 Гц. Точная идентификация времени начала и окончания звучания ноты возможна только для нот выше «до» большой октавы с частотой основного тона 130,8 Гц. Большинство музыкальных произведений используют ноты из диапазона малой, первой и второй октав, что выше диапазона большой октавы.

Выводы

Предложенный подход позволяет создавать семейства материнских вейвлетов с заранее определенными избирательными способностями. Вейвлет, созданный из фрагмента определенного базового сигнала, позволяет выявлять не отдельные ча-стотно-временные характеристики исследуемого сигнала, а частотно-временное поведение базового сигнала в исследуемом.

Э к с п е р и м е н тал ь н о получены материнские вей-влеты для инструментов различных оркестровых групп: фортепиано, органа, скрипки, колокольчика и трубы. Все вейвлеты содержат по 16 периодов сигнала соответствующего музыкального инструмента с частотой основного тона 55 Гц. При вычислении НВП материнский вейвлет масштабируется так, чтобы очередной вейвлет И'.(г) частотой основного тона совпадал с частотой основного тона ноты n(t) музыкального инструмента.

Исследования семейств материнских вейвлетов, созданных на базе нот музыкальных инструментов, показали возможность выявлять частотные и временные параметры нот определенного инструмента в одноголосных и многоголосных мелодиях. Кроме того, в ряде экспериментов удалось идентифицировать мелодию определенного музыкального инструмента на фоне звучания другого [7].

Предполагается дальнейшее исследование применения данной методики в задачах, требующих выявления в сигнале фрагментов определенного семейства конечной длины на фоне других сигналов или помех.

зоо

"0,03 0,041 0;09 0,125 0,15

Рис. 9. Зависимость граничной частоты идентификации основного тона ноты от ее продолжительности

СПИСОК ЛИТЕРАТУРЫ

1. Кудинов A.A. Использование распознавания образов для обработки и восстановления музыкальных сигналов: Дис. ... канд. техн. наук. -М., 2003. - 179 с.

2. Симаненков И.О. Цифровые синтезаторы музыкальных звуков // Компьютерра. - 1998. - № 32. - С. 21-24.

3. Астафьева Н.М. Вейвлет-анализ: основы теории и примеры применения // Успехи физических наук. - 1996. - Т. 166. -№11. -С 1145-1170.

4. Фадеев A.C., Кочегурова Е.А. Выбор вейвлет-функций для анализа музыкальной информации // Современные техника и технологии: Труды XII Междунар. научно-практ. конф. студентов и молодых ученых. - Томск: ТПУ, 2006 - Т. 2. - С. 194-196.

5. Новиков JI.B. Основы вейвлет-анализа сигналов. - СПб.: ООО МОДУС+, 1999.- 152 с.

6. Курс лекций по сигналам и системам обработки сигналов. [Электронный ресурс] / авт. курса, A.B. Давыдов. - Электрон, текстовые дан. (32 файла) - [Екатеринбург]. - Режим доступа: http://prodav.narod.ru/signals/index.html, свободный. - Загл. с экрана. - Яз. рус., англ.

7. Кочегурова Е.А., Фадеев А.С. Вейвлет анализ в задаче идентификации музыкальной информации // Молодежь и современные информационные технологии: Сб. трудов IV Всеросс. на-учно-практ. конф. студентов, аспирантов и молодых ученых. -Томск: Изд-во ТПУ, 2006. - С. 149-151.

8. Смоленцев Н.К. Основы теории вейвлетов. Вейвлеты в Mat-Lab. - М.: ДМК Пресс, 2005. - 304 с.

9. Фадеев А.С., Кочегурова Е.А. Подготовка результатов непрерывного вейвлет-преобразования к автоматизированной обработке // Известия Томского политехнического университета. -2006.-Т. 309.-№7.-С. 32-35.

10. Fujinaga I. Machine recognition of Timbre Using Steady-State tone of Acoustic musical Instruments // International Computer Music Conference. - Singapore, San Francisco, CA: ICMA, 2003. -P. 89-96.

11. Hebert S., Peretz I. Recognition of music in long-term memory: Are melodic and temporal patterns equal partners? // Memory & Cognition. - 1997. - V. 25. - № 4. - P. 518-533.

Поступила 19.10.2007г.

УДК 004.93

ПРОСТОЙ АЛГОРИТМ ВЕЙВЛЕТ-СЖАТИЯ ПОЛУТОНОВЫХ И ЦВЕТНЫХ ИЗОБРАЖЕНИЙ

Д.В. Сидоров, А.Н. Осокин

Томский политехнический университет E-mail: rauco@mail.ru

Разработан простой алгоритм ввйвлвт-сжатия, позволяющий реализовать недорогие аппаратно-программные платформы для систем видеонаблюдения и систем обработки телевидения высокой четкости в реальном времени.

Введение

Стандарт сжатия цифровых изображений JPEG2000 на основе вейвлет-преобразования считается одним из наиболее перспективных. Он состоит из двух обширных частей (JPEG2000 Part I, JPEG2000 Part II). В пределах стандарта существует множество программных реализаций (ACDSee, Le-adTools, Mjp2000, Jasper, Lurawave и т. д.), значительно отличающихся степенью и скоростью сжатия изображений [1, 2]. Реализация JPEG2000 от ACDSee согласно [1] обладает наилучшими характеристиками: скоростью сжатия, степенью сжатия и качеством восстановленного изображения (далее при упоминании стандарта JPEG2000 будет рассматриваться реализация от ACDSee). JPEG2000 имеет явный выигрыш в 20...25 % в качестве восстановленного изображения по метрике PSNR [2, 3] (при равном коэффициенте сжатия) относительно обычного JPEG. Главной причиной ограниченного распространения JPEG2000 является сложность программной реализации и, как следствие, низкая скорость сжатия. Длительность процесса сжатия вызвана в большей степени сложностью этапов квантования, блочного кодирования и организации выходного

потока, занимающих порядка 80 % общего времени сжатия [2]. Поэтому, на основе первой и второй частей стандарта JPEG2000 (Part I, Part II) нами был разработан более простой и быстрый алгоритм вей-влет-сжатия QWC (Quick Wavelet Compress, название авторов), обладающий практически равным JPEG2000 качеством восстановленного изображения (при одинаковой степени сжатия).

Алгоритм сжатия QWC

Алгоритм QWC имеет аналогичную стандарту JPEG2000 схему сжатия (рис. 1).

Этапы предварительной обработки и вейвлет-преобразования стандарта JPEG2000 и алгоритма QWC совпадают. Согласно стандарту JPEG2000 предварительная обработка входного изображения состоит в выравнивании значений цветовых компонент RGB пикселей относительно нуля. Предварительная обработка изображения происходит только в том случае, если значения цветовых компонент RGB пикселей лежат в интервале [0, 2*-1] (где N-разрядность бит цветовых компонент RGB или яркости пикселей изображения), тогда значение каждой цветовой компоненты RGB пикселей уменьшается на 2я"1:

i Надоели баннеры? Вы всегда можете отключить рекламу.