Научная статья на тему 'ПОГРУЖЕНИЕ ЦИФРОВЫХ ВОДЯНЫХ ЗНАКОВ В АУДИОСИГНАЛЫ С ПОМОЩЬЮ ИСПОЛЬЗОВАНИЯ ЧАСТОТНО СЕЛЕКТИВНОГО ИЗМЕНЕНИЯ ФАЗЫ'

ПОГРУЖЕНИЕ ЦИФРОВЫХ ВОДЯНЫХ ЗНАКОВ В АУДИОСИГНАЛЫ С ПОМОЩЬЮ ИСПОЛЬЗОВАНИЯ ЧАСТОТНО СЕЛЕКТИВНОГО ИЗМЕНЕНИЯ ФАЗЫ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
105
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТЕГАНОГРАФИЯ / ЦИФРОВЫЕ ВОДЯНЫЕ ЗНАКИ / ФАЗА АУДИОСИГНАЛА / ЗНАЧИМЫЕ ТОЧКИ / ВЕЙВЛЕТ ДОБЕШИ / СЛУХОВАЯ СИСТЕМА ЧЕЛОВЕКА / СТАНДАРТ СЖАТИЯ / STEGANOGRAPHY / DIGITAL WATERMARKS / PHASE OF AUDIO SIGNAL / SALIENT POINTS / DAUBECHIES WAVELETS / HUMAN AUDITORY SYSTEM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Алексеев Василий Геннадьевич, Коржик Валерий Иванович

Методы вложения стегоинформации в аудиосигналы, основанные на манипуляциях с фазой сигнала представляют большой интерес, так как слуховая система человека восприимчива к изменению фазы звукового сигнала слабее, нежели к изменению его амплитуды или частоты. Метод погружения стегоинформации в аудиосигналы, основанный на частотно селективном изменении фазы, при котором исходный сигнал разбивается на 32 частотных поддиапазона, часть из которых выбирается для вложения дополнительных данных с помощью фазовых фильтров, устойчив к стандартным манипуляциям аудиоданными, таким как сжатие с потерями, изменение частоты дискретизации, микширование, квантования, добавление шума, а так же к де-синхронизирующим атакам. Возможно «слепое» выделение погруженной информации. Максимальная скорость вложения данных может превышать 1000 бит в одну секунду аудиозаписи для стереосигналов. Метод можно использовать как для скрытия данных, так и для внедрения цифровых водяных знаков с целью подтверждения неизменности исходных данных. Алгоритм может быть оптимизирован для работы с музыкальными произведениями записанными, с частотой дискретизации 44 кГц, 32 кГц или 22 кГц. Для решения вопроса синхронизации при выделении вложенной информации используется механизм «значимых точек». Местами появления таких точек выбираются положения быстрых переходов энергии, так как их определение не требует больших вычислительных усилий, и положение самих точек остается неизменным при стандартных манипуляциях с аудиоданными. В детекторе сигнал каждого из выбранных для вложения поддиапазонов, подвергается быстрому z-преобразованию по спиральному контуру для выявления применяемого при вложении фильтра.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Алексеев Василий Геннадьевич, Коржик Валерий Иванович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EMBEDDING OF DIGITAL WATERMARK SIGNALS WITH THE USE OF A FREQUENCY SELECTIVE PHASE CHANGING

Embedding of digital watermarks into audio signals based on phase manipulations lies in area of great research interests, because human auditory system is less sensitive to some phase changing than to amplitude or frequency modulation. The proposed embedding method of a frequency selective phase changing is resistant to standard transformation of audio signal like lossy compression, changing of sampling frequency, requantization and mixing. Maximal embedding rate can be provided at least 1000 bit/sec. Embedding algorithm can be matched with musical works with sampling frequency 44kHz, 32kHz or 22kHz. In order to provide a resistance of synchronization problem during different signal transformation can be used well know method of “salient point”. Resistance of the proposed watermarks system to mp3 compression algorithm against block length is investigated.

Текст научной работы на тему «ПОГРУЖЕНИЕ ЦИФРОВЫХ ВОДЯНЫХ ЗНАКОВ В АУДИОСИГНАЛЫ С ПОМОЩЬЮ ИСПОЛЬЗОВАНИЯ ЧАСТОТНО СЕЛЕКТИВНОГО ИЗМЕНЕНИЯ ФАЗЫ»

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т 11 № 6-2019

'АДИОТЕХНИКА И СВЯЗЬ

doi: 10.24411/2409-5419-2018-10292

ПОГРУЖЕНИЕ ЦИФРОВЫХ ВОДЯНЫХ ЗНАКОВ В АУДИОСИГНАЛЫ С ПОМОЩЬЮ ИСПОЛЬЗОВАНИЯ ЧАСТОТНО СЕЛЕКТИВНОГО ИЗМЕНЕНИЯ ФАЗЫ

АЛЕКСЕЕВ

Василий Геннадьевич1 КОРЖИК

Валерий Иванович2

Сведения об авторах:

1Общество с ограниченной ответственостью «Орион», г. Санкт-Петербург, Россия, i@vasay.ru

2д.т.н, профессор, профессор Санкт-Петербургского государственного университета телекоммуникаций имени профессора М.А. Бонч-Бруевича, г. Санкт-Петербург, Россия, val-korzhik@yandex.ru

АННОТАЦИЯ

Методы вложения стегоинформации в аудиосигналы, основанные на манипуляциях с фазой сигнала представляют большой интерес, так как слуховая система человека восприимчива к изменению фазы звукового сигнала слабее, нежели к изменению его амплитуды или частоты. Метод погружения стегоинформации в аудиосигналы, основанный на частотно селективном изменении фазы, при котором исходный сигнал разбивается на 32 частотных поддиапазона, часть из которых выбирается для вложения дополнительных данных с помощью фазовых фильтров, устойчив к стандартным манипуляциям аудиоданными, таким как сжатие с потерями, изменение частоты дискретизации, микширование, квантования, добавление шума, а так же к де-синхронизирующим атакам. Возможно «слепое» выделение погруженной информации. Максимальная скорость вложения данных может превышать 1000 бит в одну секунду аудиозаписи для стереосигналов. Метод можно использовать как для скрытия данных, так и для внедрения цифровых водяных знаков с целью подтверждения неизменности исходных данных. Алгоритм может быть оптимизирован для работы с музыкальными произведениями записанными, с частотой дискретизации 44 кГц, 32 кГц или 22 кГц. Для решения вопроса синхронизации при выделении вложенной информации используется механизм «значимых точек». Местами появления таких точек выбираются положения быстрых переходов энергии, так как их определение не требует больших вычислительных усилий, и положение самих точек остается неизменным при стандартных манипуляциях с аудиоданными. В детекторе сигнал каждого из выбранных для вложения поддиапазонов, подвергается быстрому г-преобразованию по спиральному контуру для выявления применяемого при вложении фильтра.

КЛЮЧЕВЫЕ СЛОВА: стеганография; цифровые водяные знаки; фаза аудиосигнала; значимые точки; вейвлет Добеши; слуховая система человека; стандарт сжатия.

Для цитирования: Алексеев В.Г., Коржик В.И. Погружение цифровых водяных знаков в аудиосигналы с помощью использования частотно селективного изменения фазы // Наукоемкие технологии в космических исследованиях Земли. 2019. Т. 11. № 6. С. 22-29. doi: 10.24411/2409-5419-2018-10292

¿¿у

i&tf-!t iff,

il'I Ifa'

6-2019, H&ES RESEARC

Ведение

Предлагаемый в статье метод погружения информации в аудиосигналы основывается на низкой чувствительности человеческого слухового аппарата к изменениям фазы аудиосигнала [1]. К основным его особенностям относятся устойчивость к стандартным манипуляциям аудиоданными, таким как сжатие с потерями, изменение частоты дискретизации, микширование, квантизация, добавление шума, устойчивость к де-синхронизирующим атакам, возможность «слепого» выделения погруженной информации. Максимальная скорость вложения данных может превышать 1000 бит на одну секунду аудиозаписи. Метод можно использовать как для скрытия данных, так и для внедрения цифровых водяных знаков. Алгоритм оптимизирован для работы с музыкальными произведениями записанными, с частотой дискретизации 44 кГц, 32 кГц или 22 кГц. Метод основан на идее, представленной в работе [2].

Схемы погружения и извлечения данных приведены на рис. 1.

Нахождение значимых точек

Важным моментом в реализации рассматриваемого метода является обеспечение синхронизации при погружении и извлечении цифровых водяных знаков (ЦВЗ). Это необходимо для того, чтобы обеспечить нахождения ЦВЗ в аудиосигнале и сделать его устойчивым к де-синхронизирующим атакам таким, как удаление некоторых отсчетов сигнала и микширование. При этом использование каких-либо дополнительных синхросигналов крайне нежелательно, так как они могут вызвать допол-

Vol 11 N

RF TECHNOLOGY AND COMMUN!

нительные слышимые искажения, а также увеличивают вероятность обнаружения вложения атакующим. По этим причинам был выбран другой подход — использование значимых точек (или «SP», Salient point) [3]. Выбор SP может основываться на различных естественных особенностях аудиосигнала.

Метод выделения SP должен обеспечивать один и тот же набор SP как до, так и после атак, таких как сжатие, добавление шума, или прохождение сигнала через фильтр нижних частот. Для того, чтобы достичь этого, извлечем SP, основываясь на тех особенностях звукового сигнала, к которым было бы чувствительно человеческое ухо. Таким образом, если атакующий решит уничтожить SP, он должен будет сильно исказить аудио сигнал.

При реализации данного метода погружения ЦВЗ, местами появления таких точек были выбраны положения быстрых переходов энергии, так как их определение не требует больших вычислительных усилий, и положение самих точек остается неизменным при стандартных манипуляциях с аудиоданными [4].

Рассмотрим аудио сигнал x(n) состоящий из N отсчетов (n = 1,..., N). Процедура анализа аудио сигнала будет выглядеть следующим образом:

1. Аудио сигнал проходит через полосовой фильтр, который отбрасывает частоты, не воспринимаемые человеком.

2. Для каждого отсчета x(n) в аудио сигнале, энергия r отсчетов до точки n и энергия r отсчетов после точки n вычисляется по формулам:

Рис. 1. Схема погружения данных

х>>\ \\\\

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т АДИОТЕХНИКА И СВЯЗЬ

№ 6-2019

Ebefore (n)= Z ^ (n + i)

i=-r r-1

Eafter (n )=Zx (n + i )

i=0

3. Для каждого х(п) вычисляется отношение:

ratio (n ) = -

-'after

(n )

^ before

(n )

4. Если отношение тио(п)>Т1 и ЕаАвг(п)>Т2, то х(п) помечается как точка быстрого возрастания энергии.

5. Точки быстрого возрастания энергии обычно появляются группами. Точки, отделенные количеством отсчетов, меньшим, чем Т3 объединяются в одну большую группу.

6. В каждой группе, отсчет, имеющий наибольшее значение га^о(п), считается SP.

7. Если SP получен из группы, где наибольшее га^о(п) находится в первых Т4 отсчетах, то SP удаляется.

8. Первые 2Р отсчетов следующими за SP считаются областью, чувствительной к атаке.

Шаг 1 служит для предотвращения атаки добавления неслышимого сигнала (сигнала с частотой за пределом слышимости) с большой энергией, который повлиял на процесс выделения SP. Шаги со 2-го по 6-й ищут точки, где энергия растет наиболее быстро. Условие Еа^ег(п)>Т2 необходимо для того, чтобы х(п) не считался «значимой точкой», только потому, что имеет почти нулевое значение. Пункты с 5-го по 7-й служат для улучшения стабильности SP. Они предотвращают слияние или удаление групп точек быстрого возрастания энергии, которое может произойти при искажении сигнала из-за сжатия, или добавления шумов.

Пороги Т3 и Т4 могут быть установлены в 30 и 100, соответственно, а Т1 и Т2 подбираются для каждого конкретного случая.

Вычисления во втором шаге могут быть упрощены:

Параметры выделения SP выбираются таким образом, чтобы обеспечить появление 4-6 точек на одну секунду сигнала [5].

Начиная с первого SP, аудиосигнал разбивается на блоки. Принцип разбиения на блоки показан на рис. 2:

Как видно из рис. 2, после SP1 блоки идут последовательно, один за другим, до тех пор, пока количество отсчетов сигнала, оставшееся от конца последнего блока SP2, не будет меньше длины блока. Тогда, эти отсчеты не используются для погружения битов ЦВЗ, а следующий блок начинается с SP2.

Длина блока не может быть меньше 640 отсчетов, это связанно с особенностями разложения на поддиапазоны, таким образом, при частоте дискретизации 32 кГц один блок охватывает 20 мсек. сигнала, а при частоте дискретизации 44 кГц-15 мсек.

Разложение на поддиапазоны

Сигнал в каждом блоке, при помощи дискретного вейвлет-преобразования [6], разбивается на 32 частотных поддиапазона. Для обеспечения стойкости и скрытности вложения, ЦВЗ вкладывается только в некоторые частотные полосы.

В предлагаемой схеме погружения ЦВЗ, сигнал разбивается на 32 поддиапазона, а для вложения выбираются диапазоны с 4 по 15. Диапазоны с 16 по 32 не используются в связи с тем, что при сжатии аудио сигнала они кодируются с наибольшими потерями [7], а вложения в первые три поддиапазона вызывают слышимые искажения.

Для разложения сигнала на поддиапазоны воспользуемся пятиуровневым вейвлет разложением сигнала с использованием вейвлета Добеши десятого порядка. Данный вейвлет позволяет восстановить сигнал после разложения с погрешностью не превышающей 5,2 10-12 [8].

Преобразование, как прямое, так и обратное, рассчитывается путем вычисления свертки сигнала в каждой

Рис. 2. Принцип разбиения сигнала на блоки

его точке с функцией вейвлета, называемой фильтром [9]. В дискретном случае фильтры задаются просто перечислением их значений (коэффициентов) в точках дискретизации. Сигнал преобразуется с использованием двух дополняющих друг друга фильтров — низких и высоких частот. Вейвлет Добеши относятся к классу квадратурных зеркальных фильтров (КЗФ). Особенностью этого класса фильтров является то, что фильтр высоких частот получается из соответствующего фильтра низких частот простой перестановкой его коэффициентов в обратном порядке и изменением знака половины из них, причем только четных или только нечетных. При этом вейвлет выделяет локальные особенности сигнала в каждой точке и является, таким образом, фильтром высоких частот, а соответствующий фильтр низких частот описывается так называемой масштабирующей функцией.

Продуктом прямого преобразования являются два сигнала, один из которых, называемый аппроксимирующим. Он несет информацию о низких частотах исходного сигнала, другой, называемый детализирующим — о высоких. Длина этих сигналов может быть уменьшена в два раза, так как частотный диапазон каждого из них сокращается вдвое относительно частотного диапазона исходного сигнала.

Аппроксимирующий и детализирующий сигналы вычисляются по формуле (1):

' Аргох[] = 5[]• аъ[19]+5[- 1}<й[18]+... + 5[ -18]-<»[1]+5[-19]-£Й>[0] \DetaUs[i] = 5 [ ]• аъ [0 ]-5[ - 1]аъ[1]+... - 5 [ - 18]аъ[18 ]+5 [-19 ]аъ[ 19]

(1)

где — отсчеты исходного сигнала;

Уо! 11 N0 6-2019, И&БЗ РР ТБСНМЮЮСУ АШ СОММУМ

db — отсчеты вейвлета Добеши.

Для того чтобы разложить исходный сигнал на 32 частотных поддиапазона необходимо повторить преобразование пять раз. На рис. 3 показаны первые 3 три уровня разложения.

Результатом преобразований станут 32 сигнала, длиной 1/32 исходного.

Двенадцать из них, с четвертого по пятнадцатый включительно, считаются пригодными для погружения ЦВЗ. Верхние частоты не используются, потому что при сжатии с потерями и при понижении частоты дискретизации они просто отбрасываются. Такое разбиение необходимо, для того чтобы сделать вложение менее заметным для человеческого уха и более устойчивым к атакам по его удалению.

При этом нужно иметь в виду, что длина полученных сигналов не должна быть меньше длинны вейвлета, т.е. меньше 20 отсчетов. Таким образом, длина одного блока должна быть больше 32 20=640 отсчетов, что, при частоте дискретизации 32 кГц, соответствует 20 миллисекундам. Учитывая, что в один блок вкладывается 12 бит, максимальная скорость погружения ЦВЗ не может превышать 600 бит/ сек (1200 бит/сек для двухканального стерео сигнала).

Погружение информации

В каждый из двенадцати выбранных поддиапазонов вкладывается по одному биту ЦВЗ. Для погружения информации отсчеты поддиапазонов проходит через один из двух фазовых фильтров. Один из фильтров применяется если нужно вложить «1», другой если нужно вложить «0». В формуле 2 приведены передаточные функции фильтров.

Рис. 3. Три уровня разложения вейвлет преобразования

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т

№ 6-2019

'АДИОТЕХНИКА И СВЯЗЬ

//

1) Н (г ) =

2) Н (г ) =

1 +1,273 • г + 0,81-г2 0,81 +1,273 • г + г2

1 -1,273 • г + 0,81-г2 0,81 -1,273 • г + г2

(2)

Особенность данных фильтров заключается в том, что их амплитудно-частотная характеристика (АЧХ) равна единице во всем диапазоне частот. Следствием этого является то, что фильтры изменяют только фазу сигнала, оставляя его амплитуду без искажений.

Карты нулей и полюсов (КНП) этих фильтров показаны на рис. 4 и рис. 5 соответственно:

Отсчеты сигнала на выходе фильтров вычисляются по формулам (3)

1) 5 [Л = 0,815 [Л + 1,2735 [/ - 1] + 5 [г - 2] -

' вытх-1 ■ вх ^ ^ ■ вх ь л вх л

(3)

Рис. 3. КНП первого фильтра

- 1,273 5 [г - 1] + 0,815 [г - 2]

' J ' вых1- л

2) 5 [г] = 0,815 [i] - 1,273 5 [г - 1] + 5 [г - 2] +

вых вх вх вх

+ 1,273 5 [г - 1] + 0,815 [г - 2]

вых вых

где 5вх — отсчеты входного сигнала; 5 — отсчеты выходного сигнала.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Извлечение информации

Для извлечения вложенной информации сигнал также разлагается на 32 частотных поддиапазона. Далее необходимо определить, «1» или «0» были вложены в соответствующий поддиапазон.

Данная задача сводится к нахождению примененного ранее при погружении ЦВЗ фазового фильтра. Для ее решения используется метод спектрального анализа сигнала, который позволяет определить положение «нулей» фильтров, через которые проходил сигнал.

Из рис. 4 и рис. 5 видно, что нули фильтров имеют одинаковые радиусы г0 = 1/0,9, и разные углы: ю01 = 0,75п и ю02 = 0,25п.

В детекторе сигнал каждого из двенадцати, выбранных для вложения поддиапазонов, подвергается быстрому г-преобразованию по спиральному контуру с радиусом г = 1/0,9 [10].

г-преобразование по спиральному контору было выбрано, так как оно позволяет определить положение нулей используемых при вложении фильтров. В общем случае оно вычисляется по формуле (4):

X &) = 1 ^ х(п)А-Ш"кк,

(4)

Рис. 5. КНП второго фильтра

где к = 0,1,...М - 1; W = W0exp(-jф0); А = А0ехр(-Д).

В нашем случае, для определения примененного к сигналу фильтра, контур г-преобразования имеет вид окружности с радиусом г = 1/0,9. Такой радиус выбран в связи с тем, что нули обоих фазовых фильтров лежат на удалении г = 1/0,9, от центра окружности (см. рис. 4 и 5).

Примем W0 = 1, а А0 =1/0,9, тогда формула (4) приобретет вид:

X, = ехр(-]ф0к2/2)

X£хп 09 " ехР(-7ео)ехР(-,/Фо«2 / 2)ехР(-,;х0 (к - П)2 / 2), к = 0,1,& М -1 (5)

В этом случае вычисление z-преобразования по контуру с r = 1/0,9 можно произвести по схеме, показанной на рис. 6:

FFT — прямое быстрое преобразование Фурье, IFFT — обратное быстрое преобразование Фурье.

На рис. 7 и рис. 8 показаны графики относительного спектра амплитуд сигналов.

Как видно из графиков, полученные спектры амплитуд имеют минимумы в точках соответствующих углу нулей фильтров. Таким образом, задача детектирования вложенных битов сводится к определению положения минимума в спектры амплитуд.

Рис. 6. Схема вычисления z-преобразования по контуру

Vol 11 No 6-2019, H&ES RF TECHNOLOGY AND COMMUNI

При сжатии с потерями вероятность появления ошибки зависит как от степени сжатия, так и от размера блока, применяемого для вложения 12 бит.

Исследуемый метод был програмно реализован на языке с++. Были произведены эксперименты по погружению и извлечению информации в различные аудиосигналы.

В табл. приведены зависимости процента ошибок от степени сжатия тр3 и длинны блока на котором производилось вложение 12 бит, полученные во время экспериментов.

Таблица

Зависимость процента ошибок от степени сжатия тр3 и длинны блока

Длина блока вложения 12 бит Вероятность ошибки при выделении ЦВЗ

Без сжатия 256 кбит/сек 128 кбит/сек VBR

1280 отсчетов 4 % 8 % 22 % ЦВЗ удален

3200 отсчетов 3 % 6 % 15 % 25 %

4800 отсчетов 1 % 4 % 7 % 11 %

Стойкость информации вложенной в аудиосигнал к атакам по ее удалению

Устойчивость вложения к десинхронизирующим атакам (микширование, удаление отсчетов) полностью определяется надежностью выделения значимых точек. Сжатие с потерями, квантование, фильтрация могут вносить дополнительные ошибки.

Использование разбиения на частотные поддиапазоны защищает вложение от уменьшения частоты дискретизации вдвое. Дальнейшее ее уменьшение приводит к удалению вложенной информации по причине потери информации в верхних частотных поддиапазонах, выбранных для вложения, однако это так же приводит и к заметным на слух изменениям звучания сигнала. Аналогичная ситуация происходит и с применением фильтра нижних частот.

0 0р5 0,1 0,15 0,1 0,» 0,3 0.И 0,4 0,45 0,5 0,55 0,6 0,65 0,7 0,75 0,в 0,85 0.9 0.9S

Рис. 7. Относительный спектр амплитуд сигнала с вложенным «0»

Заключение

Если сравнивать предлагаемый метод с другими перспективными алгоритмами погружения ЦВЗ в аудиосигналы, например, основанными на использовании эхо-сигналов [11] и ревербераций [12] к его достоинствам можно отнести:

• скорость вложения более 1000 бит в секунду для стерео-сигналов с частотой дискретизации 40 кГц.

• устойчивость к стандартным цифровым манипуляциям аудиоданными;

• использование неинформированного декодера;

• возможность определения декодером мест возникновения ошибок;

• более высокую незаметность вложений.

0 0,05 0,1 0,15 0,; 0,25 0,3 0,35 0,4 0,45 0,5 0,55 0,6 0,55 0.7 0,75 0,8 0,85 0,9 0,95

Рис. 8. Относительный спектр амплитуд сигнала с вложенным «1»

X<N\ \\\\ Ч>Л\\ \\\\

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т

'АДИОТЕХНИКА И СВЯЗЬ

Однако метод имеет и некоторые недостатки:

• возможность проведения преднамеренной атаки по удалению ЦВЗ;

• сильная зависимость надежности выделения ЦВЗ от точности синхронизации начала блока.

Литература

1. Вологдин Э. И. Слух и восприятие звука. Курс лекций. СПб.: Владос, 2012. C. 32.

2. Bender W., Gruhl D., Morimoto N., Lu A. Techniques for data hiding // IBM Systems Journal. 1996. No. 35(3/4). Pp. 313-336.

3.FulchironP-Y., Silvestre G. C. M., HurleyN. J. Synchronisation of Audio Watermarking by Salient Point Extraction // Proc. of the Irish Signals and Systems Conference, Limerick, Ireland, July 2003. IEEE, 2003 Pp. 40-45.

4. Hamidi M., Chetouani A., El Haziti M., El Hassouni M., Cherifi H. Blind Robust 3D Mesh Watermarking Based on Mesh Saliency and Wavelet Transform for Copyright Protection // Information. 2019. No. 10(2). URL: https://doi.org/10.3390/ info10020067 (дата обращения 15.08.2019).

5. Korzhik V., Alekseev V., Morales-Luna G. Audio watermarking system resistant to removal attacks by dereverberation // International Journal of Computer Science and Applications. 2018. No. 15(1). Pp. 1-15.

№ 6-2019

6. MallatS. A Wavelet Tour of Signal Processing. 3rd Edition. Orlando, FL, USA: Academic Press, 2008. 832 p. doi:10.1016/ B978-0-12-374370-1.X0001-8

7. Nilsson M. The audio/mpeg Media Type. RFC3003, November 2000. doi:10.17487/RFC3003 URL: https://www.rfc-ed-itor.org/info/rfc3003 (дата обращения 15.08.2019).

8. Daubechies I. Ten Lectures on Wavelets. Philadelphia, SIAM 1992. 357 p.

9. Popov D., Gapochkin A., Nekrasov A. An Algorithm of Daubechies Wavelet Transform in the Final Field When Processing Speech Signals // Electronics. 2018. Vol. 7. No. 7. URL: https://doi. org/10.3390/electronics7070120 (дата обращения 15.08.2019).

10. Rajmic P., Prusa Z., Wiesmeyr C. Computational cost of Chirp Z-transform and Generalized Goertzel algorithm // Proceedings of 22nd European Signal Processing Conference (Lisbon, Portugal, 1-5 Sept. 2014). IEEE, 2014. Pp. 1004-1008.

11. Korzhik V., Morales-Luna G, Fedyanin I. Audio watermarking based on echo hiding with zero error probability // International Journal of Computer Science and Applications. 2013. No. 10(1). Pp. 1-10.

12. Arend J. M., Porschmann C. Audio Watermarking of Binaural Room Impulse Responses // Proceedings of Audio Engineering Society International Conference on Headphone Technology, Aalborg, Denmark, 24-26 August 2016. URL: https://doi.org/10.17743/aesconf.2016.978-1-942220-09-1 (дата обращения 15.08.2019).

Vol 11 N

RF TECHNOLOGY AND COMMUN!

!> iff, ¡•¡1 ////

6-2019, H&ES RESEARC

EMBEDDING OF DIGITAL WATERMARK SIGNALS WITH THE USE OF A FREQUENCY SELECTIVE PHASE CHANGING

VASILII G. ALEKSEEV,

St. Petersburg, Russia, i@vasay.ru

KEYWORDS: steganography; digital watermarks; phase of audio signal; salient points; Daubechies wavelets; human auditory system.

VALERY I. KORZHIK,

St. Petersburg, Russia, val-korzhik@yandex.ru

ABSTRACT

Embedding of digital watermarks into audio signals based on phase manipulations lies in area of great research interests, because human auditory system is less sensitive to some phase changing than to amplitude or frequency modulation. The proposed embedding method of a frequency selective phase changing is resistant to standard transformation of audio signal like lossy compression, changing of sampling frequency, requantization and mixing. Maximal embedding rate can be provided at least 1000 bit/sec. Embedding algorithm can be matched with musical works with sampling frequency 44kHz, 32kHz or 22kHz. In order to provide a resistance of synchronization problem during different signal transformation can be used well know method of "salient point". Resistance of the proposed watermarks system to mp3 compression algorithm against block length is investigated.

REFERENCES

1. Vologdin E. I. Sluh i vospriyatie zvuka. Kurs lekcij [Hearing and sound perception. Lecture course] St. Petersburg: Vlados, 2012. P. 32. (In Russian)

2. Bender W., Gruhl D., Morimoto N., Lu A. Techniques for data hiding. IBM Systems Journal. 1996. No. 35(3/4). Pp. 313-336.

3. Fulchiron P-Y., Silvestre G. C. M., Hurley N. J. Synchronisation of Audio Watermarking by Salient Point Extraction. Proc. of the Irish Signals and Systems Conference, Limerick, Ireland, July 2003. IEEE, 2003 Pp. 40-45.

4. Hamidi M., Chetouani A., El Haziti M., El Hassouni M., Cherifi H. Blind Robust 3D Mesh Watermarking Based on Mesh Sa-liency and Wavelet Transform for Copyright Protection. Information. 2019. No. 10(2). URL: https://doi.org/10.3390/info10020067 (date of access 15.08.2019).

5. Korzhik V., Alekseev V., Morales-Luna G. Audio watermarking system resistant to removal attacks by dereverberation. Internation-

al Journal of Computer Science and Applications. 2018. No. 15(1). Pp. 1-15.

6. Mallat S. A Wavelet Tour of Signal Processing. 3rd Edition. Orlando, FL, USA: Academic Press, 2008. 832 p. doi:10.1016/B978-0-12-374370-1.X0001-8

7. Nilsson M. The audio/mpeg Media Type. RFC3003, November 2000. doi:10.17487/RFC3003 URL: https://www.rfc-editor.org/info/ rfc3003 (date of access 15.08.2019).

8. Daubechies I. Ten Lectures on Wavelets. Philadelphia, SIAM 1992. 357 p.

9. Popov D., Gapochkin A., Nekrasov A. An Algorithm of Daubechies Wavelet Transform in the Final Field When Processing Speech Signals. Electronics. 2018. Vol. 7. No. 7. URL: https://doi.org/10.3390/ electronics7070120 (date of access 15.08.2019).

10. Rajmic P., Prusa Z., Wiesmeyr C. Computational cost of Chirp Z-transform and Generalized Goertzel algorithm. Proceedings of 22nd European Signal Processing Conference (Lisbon, Portugal, 1-5 Sept. 2014). IEEE, 2014. Pp. 1004-1008.

11. Korzhik V., Morales-Luna G, Fedyanin I. Audio watermarking based on echo hiding with zero error probability. International Journal of Computer Science and Applications. 2013. No. 10(1). Pp. 1-10. 13. Arend J. M., Porschmann C. Audio Watermarking of Binaural Room Impulse Responses. Proceedings of Audio Engineering Society International Conference on Headphone Technology, Aalborg, Denmark, 24-26 August 2016. URL: https://doi.org/10.17743/ aesconf.2016.978-1-942220-09-1 (date of access 15.08.2019).

INFORMATION ABOUT AUTHORS:

Alekseev V.G., Orion LTD;

Korzhik V.I., PhD, Full Professor, Professor of The Bonch-Bruevich Saint-Petersburg State University of Telecommunications.

For citation: Alekseev V.G., Korzhik V.I. Embedding of digital watermark signals with the use of a frequency selective phase changing. H&ES Research. 2019. Vol. 11. No. 6. Pp. 22-29. doi: 10.24411/2409-5419-2018-10292 (In Russian)

i Надоели баннеры? Вы всегда можете отключить рекламу.