Научная статья на тему 'МЕТОД КОНТРОЛЯ ШУМОВ КВАНТОВАНИЯ ВЕЙВЛЕТНЫХ КОЭФФИЦИЕНТОВ В ПЕРЦЕПЦИОННОМ СЖАТИИ ЗВУКОВЫХ СИГНАЛОВ'

МЕТОД КОНТРОЛЯ ШУМОВ КВАНТОВАНИЯ ВЕЙВЛЕТНЫХ КОЭФФИЦИЕНТОВ В ПЕРЦЕПЦИОННОМ СЖАТИИ ЗВУКОВЫХ СИГНАЛОВ Текст научной статьи по специальности «Физика»

CC BY
44
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ШУМЫ КВАНТОВАНИЯ / КОМПРЕССИЯ ЦИФРОВЫХ АУДИОДАННЫХ / ВЕЙВЛЕТНЫЙ ДОМЕН КОДЕКА

Аннотация научной статьи по физике, автор научной работы — Ковалгин Ю.А., Фадеев Д.Р.

Излагается разработанный метод адаптации психоакустической модели ААС к вейвлетному домену.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A METHOD OF CONTROLLING THE QUANTIZATION NOISE OF THE WAVELET COEFFICIENTS IN PERCEPTUAL COMPRESSION OF AUDIO SIGNALS

Discusses the quantization noise arising in the codec working in wavelet space, and the method of adaptation psychoacoustic model AAS (AMP AAS) to the calculation of the masking performed in the wavelet domain.

Текст научной работы на тему «МЕТОД КОНТРОЛЯ ШУМОВ КВАНТОВАНИЯ ВЕЙВЛЕТНЫХ КОЭФФИЦИЕНТОВ В ПЕРЦЕПЦИОННОМ СЖАТИИ ЗВУКОВЫХ СИГНАЛОВ»

требований по скорости передачи в заданной полосе или увеличить скорость передачи данных при удовлетворении требований по достоверности.

Тем не менее, полезно провести сравнение и с другими, в том числе новыми, алгоритмами обработки расширяющих спектр последовательностей, в частности, с алгоритмами на основе двойственного базиса [3].

Список используемых источников

1. Борисов В. И., Зинчук В. М., Лимарев А. Е., Шестопалов В. И. Помехозащищенность систем радиосвязи с расширением спектра прямой модуляцией псевдослучайной последовательностью. М.: РадиоСофт, 2011. 548 с. ISBN 978-5-93274-032-3.

2. Ипатов В. П. Широкополосные системы и кодовое разделение сигналов. Принципы и приложения. М.: Техносфера, 2007. 488 с. ISBN 978-5-94836-128-4.

3. Когновицкий О. С. Двойственный базис и его применение в телекоммуникациях. СПб.: Линк, 2009. 424 с. ISBN 978-5-98595-020-5.

МЕТОД КОНТРОЛЯ ШУМОВ КВАНТОВАНИЯ ВЕЙВЛЕТНЫХ КОЭФФИЦИЕНТОВ В ПЕРЦЕПЦИОННОМ СЖАТИИ ЗВУКОВЫХ СИГНАЛОВ

Ю.А. Ковалгин, Д.Р. Фадеев

Излагается разработанный метод адаптации психоакустической модели ААС к вейвлетному домену.

Ключевые слова: шумы квантования, компрессия цифровых аудиоданных, вейвлетный домен кодека

A METHOD OF CONTROLLING THE QUANTIZATION NOISE OF THE WAVELET COEFFICIENTS IN PERCEPTUAL COMPRESSION OF AUDIO SIGNALS

Fadeev D., Kovalgin Y.

Discusses the quantization noise arising in the codec working in wavelet space, and the method of adaptation psychoacoustic model AAS (AMP AAS) to the calculation of the masking performed in the wavelet domain.

Key words: the quantization noise, compression of digital audio data, wavelet-domain codec

Вычисление порога маскировки непосредственно в домене вейвлетного преобразования имеет ряд важных преимуществ. Метод позволяет увеличить скорость вычислений, так как отпадает необходимость в дополнительных ранее применяемых преобразованиях, вследствие чего сложность расчетов уменьшается. Это более простой алгоритм, позволяющий выполнять все операции в одном домене с учетом его особенностей. Однако дискретное вейвлетное преоб-

разование не обеспечивает компактного представления распределения энергии для чистых тонов.

Снижение скорости цифрового потока при кодировании высококачественных звуковых сигналов радиовещания и телевидения обеспечивают алгоритмы, используемые в стандарте MPEG-4 КОЛЕС 14496-3 в квантовании коэффициентов вейвлетного преобразования. Однако указанное преобразование не обеспечивает компактного представления распределения энергии для чистых тонов [1].

В качестве примера на рисунке 1 показаны ступенчатые функции распределения энергии вейвлетных коэффициентов 8(к), в дБ, в 28 полосах кодирования для тона с частотой 10 000 Гц. Вейвлетное преобразование исходного сигнала было выполнено с использованием вейвлетов Добеши 4 (сплошная линия) и Добеши 20 (пунктирная линия). Даже вейвлет Добеши 20 (рис. 1) с длиной импульсной характеристики 40 отсчетов, лишь частично повышает локализацию энергии вейвлетных коэффициентов для тональных сигналов.

Рис. 1. Энергетический спектр вейвлетных коэффициентов для тонального сигнала частотой 10 000 Гц

Так как вейвлетное преобразование обладает плохой частотной локализацией энергии тональных сигналов в спектре вейвлетных коэффициентов, то пороги маскировки, полученные на основе вычисления энергии вейвлетных полос, как показали проведенные исследования, не соответствуют в полной мере необходимым значениям [2]. Для улучшения эффективности работы вейвлетно-го кодека требуется более точный расчет порога маскировки для каждой полосы при квантовании вейвлетных коэффициентов.

Вследствие недостаточной избирательности анализирующих фильтров кодера фильтров шумы квантования, появляющиеся на одном уровне вейвлетного преобразования, после восстановления выборки сигнала в декодере будут присутствовать с разным уровнем в различных участках частотного спектра. Сле-

довательно, при расчете порога маскировки в случае с вейвлетами необходимо учитывать не только область частот вблизи маскирующего сигнала, но и другие, несмежные с ним, области [3].

Энергетические частотные спектры вейвлетных коэффициентов, представленные на рисунках 2 и 3, показывают, что вне зависимости от терминального узла, шумы квантования при обратном дискретном вейвлетном преобразовании в разной степени распространяются по всему частотному спектру (при наличии шума в анализирующем дереве фильтров только в одной полосе кодирования). При этом имеет место сложная по форме огибающая частотного спектра.

N

Рис. 2. Энергетический частотный спектр вейвлетных коэффициентов для шумов квантования при наличии шума в полосе 1. Вейвлет Добеши 4

N

Рис. 3. Энергетический частотный спектр вейвлетных коэффициентов для шумов квантования при наличии шума в полосе 9. Вейвлет Добеши 4

Выходом адаптируемой ПАМ_ААС является вектор из 49 значений отношения сигнал-маска (в случае с длинным блоком и частотой дискретизации 44100 Гц). На рисунке 4 спектральные линии энергетического частотного спектра восстановленного сигнала сгруппированы в соответствии с правилом [1]:

Т Щ = тах[£ (Ыь (sЬ): Ын (sb))],

где Т^Ъ) - максимальный уровень энергии сигнала в полосе психоакустического анализа sЪ, дБ, Ы^Ъ) - номер (индекс) спектральной линии, соответствующей нижней граничной частоте полосы психоакустического анализа sЪ, Ы^Ъ) -номер спектральной линии, соответствующей верхней граничной частоты полосы психоакустического анализа 8Ъ.

Рис. 4. Значения энергии шумов квантования, вычисленные для полос психоакустического анализа ПАМ_ААС

Данный подход позволяет описать в виде вектора, состоящего из 49 элементов, энергетический спектр шумов квантования для каждого терминального узла вейвлетного дерева в отдельности. В данном случае мы имеем матрицу M размерностью 28х49, состоящую из 28 строк и 49 столбцов. Элементами матрицы являются значения энергии шумов квантования, выраженные в дБ. При наличии подобной матрицы для максимального уровня энергии шумов квантования остальные значения могут быть получены по правилу [2]:

Nl = Nmax - 6,02 • L, дБ,

где Nmax - максимальный уровень энергии шумов квантования (для кодового слова длиной 2 бита), L - количество битов, используемых для кодирования вейвлетных коэффициентов в рассматриваемой полосе (без учета знакового бита).

Схема расчета значений энергии шумов квантования для одной строки матрицы M для полосы 4 приведена на рисунке 5. В начале расчета синтезируется дерево нулевых вейвлетных коэффициентов, т. е. содержащее в качестве коэффициентов вейвлетного преобразования только нулевые значения. К одному из терминальных узлов (в примере на рисунке 5 это узел 4) подключается генератор белого шума, имитирующий шумы квантования максимального уровня.

Рис. 5. Схема вычисления строки матрицы M

После этого выполняется обратное вейвлетное преобразование, восстанавливающее исходный сигнал во времени s[n] и вычисляется его амплитудный спектр Далее спектральные линии группируются в соответствии с полосами психоакустического анализа ПАМ AAC Для каждой полосы анализа ПАМ_ААС определяется максимальное значение энергии. Это значение сохраняется в качестве соответствующего элемента матрицы шумов квантования M.

На рисунке 6 дано семейство уровней энергии шумов квантования при наличии источника шума в первом терминальном узле для 1000 итераций. По оси абсцисс отложен индекс спектральной компоненты, по оси ординат - выраженный в дБ максимальный уровень энергии шумов квантования в полосе психоакустического анализа ПАМ-ААС. Как следует из рисунка, имеет место некоторый разброс значений максимумов в среднем около 10 дБ.

Рис. 6. Семейство значений энергии шумов квантования вейвлетных коэффициентов при наличии шума в первом терминальном узле

В результате серии аналогичных экспериментов при фиксированном типе вейвлетной функции была получена матрица M размером 28х49. В конце каждой серии выполненных итераций оставались только максимальные значения

энергии шумов квантования для каждой полосы вейвлетного анализа. На рисунке 7 представлена визуализация матрицы M (28x45). Яркость элементов матрицы здесь говорит о величине энергии шума квантования, в дБ, в соответствии со шкалой, представленной справа от рисунка самой матрицы.

Рис. 7. Визуализация матрицы M (28x49)

Проверенный в работе анализ характера распределения уровня энергии шумов квантования вейвлетных коэффициентов по частоте позволяет предложить принцип прозрачного кодирования, основанный на контроле уровня допустимого уровня энергии шумов квантования в полосах кодирования.

В соответствии с принципами психоакустической компрессии для незаметного на слух устранения избыточности необходимо, чтобы значение энергии шумов квантования в соответствующей полосе кодирования оставалось ниже уровня маски, рассчитанной психоакустической моделью ПАМ_ААС.

Рассматривается энергетический спектр источника шумов квантования г-ой полосы (г-ая строка матрицы M). Значения вектора уровня энергии шума квантования N в полосе кодирования г подвергаются масштабированию с шагом 6,02 дБ до тех пор, пока они еще находятся ниже порога маскировки Т(к) в каждой из 49 полос психоакустического анализа.

Как только будет достигнуто максимально допустимое значение уровня энергии шумов квантования, выбирается следующая строка матрицы M. Ее значения перед проверкой на превышение порога маскировки поэлементно суммируются с рассчитанными ранее значениями энергии шумов квантования вейвлетных источников шума в каждой полосе. В результате этих итерацией учитывается вклад шумов квантования вейвлетных коэффициентов каждой из 28 полос.

Процедура происходит итеративно до тех пор, пока не будет достигнуто наилучшее распределение допустимого значения энергии шумов квантования вблизи порога маскировки. Количество шагов масштабирования уровня энергии шумов квантования к-ой полосы определяет минимальное количество битов кодовых слов вейвлетных коэффициентов для данной полосы кодирования.

Список используемых источников

1. Ковалгин Ю. А., Вологдин Э. И. Аудиотехника : учебник для вузов. М.: Горячая линия - Телеком, 2013. 742 с. ISBN 978-5-9912-0241-1.

2. Рогозинский Г. Г. Применение метода оптимизации вейвлетов в перцепционном кодировании звука // Радиотехника. 2010. № 5. С. 94-97.

3. Lee P. Wavelet Filter Banks in Perceptual Audio Coding, Master Thesis, University of Waterloo, Canada, 2003.

ИССЛЕДОВАНИЕ МЕТОДА АУТЕНТИФИКАЦИИ ДВОИЧНЫХ ИЗОБРАЖЕНИЙ ПРИ ПОМОЩИ ЦВЗ

В.И. Коржик, И.А. Тришневская

Аутентификация двоичных изображений является важным средством обеспечения информационной безопасности, особенно медицинских и полицейских баз данных. Однако известные методы аутентификации изображений с градациями серого и использования ЦВЗ не могут быть применены для решения непосредственно данной задачи. Поэтому предлагается техника с использованием сжатия арифметическими кодами некоторых функционалов двоичных изображений. Приводятся результаты экспериментов, которые показывают, что данный подход может обеспечить достаточную надежность аутентификации при одновременном выполнении высокого качества изображения сразу после вложения.

Ключевые слова: аутентификация, двоичные изображения, арифметическое кодирование

INVESTIGATION OF BINARY IMAGE AUTHENTICATION WITH THE USE OF DIGITAL WATERMARKING

Korzhik V., Trishnevskaya I.

Authentication of binary image is a very important approach in order to provide security especially of both medical and police databases. However it is impossible to use directly well-known methods of gray-scale image authentication with digital watermarking. The technique with the use of special image compression by arithmetic codes for solution of this problem is proposed. Experimental results regarding possible authenticator sizes and quality of images just after embedding are presented.

Keywords: binary images, authentication, arithmetic codes, texture of image

Аутентификация двоичных изображений (ДИ) является важным средством обеспечения информационной безопасности, особенно медицинских и полицейских баз данных.

Фундаментальной проблемой аутентификации ДИ является поиск метода вложения, который позволит затем восстановить исходное изображение без искажений.

Обычно вложение производится в цветные изображения или в изображения с градациями серого. Методы вложения основаны на том, что незначительное изменение в одном из цветовых каналов пикселя незаметно для человече-

i Надоели баннеры? Вы всегда можете отключить рекламу.