Научная статья на тему 'Засекречивание речевой информации на основе вейвлетов'

Засекречивание речевой информации на основе вейвлетов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
937
66
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕЧЕВОЙ СИГНАЛ / ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЕ / ЗАСЕКРЕЧИВАНИЕ РЕЧЕВОЙ ИНФОРМАЦИИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горшков Ю. Г., Кузин А. Ю., Цирлов В. Л.

Рассмотрены недостатки существующих методов засекречивания речи с использованием алгоритмов преобразования Фурье. Представлены результаты исследований в области создания технологии высокоточной обработки речевого сигнала на вейвлетах, обеспечивающей высокую стойкость засекреченной информации к «взлому» при сохранении высокого качества восстановленного сигнала. Приведены экспериментальные данные тестирования тракта многоуровневого вейвлет-преобразования речи и соно-граммы открытого и засекреченного сеансов связи.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Засекречивание речевой информации на основе вейвлетов»

УДК 004.934

Ю. Г. Горшков, А. Ю. Кузин, В. Л. Цирлов

ЗАСЕКРЕЧИВАНИЕ РЕЧЕВОЙ ИНФОРМАЦИИ НА ОСНОВЕ ВЕЙВЛЕТОВ

Рассмотрены недостатки существующих методов засекречивания речи с использованием алгоритмов преобразования Фурье. Представлены результаты исследований в области создания технологии высокоточной обработки речевого сигнала на вейвлетах, обеспечивающей высокую стойкость засекреченной информации к «взлому» при сохранении высокого качества восстановленного сигнала. Приведены экспериментальные данные тестирования тракта многоуровневого вейвлет-преобразования речи и соно-граммы открытого и засекреченного сеансов связи.

E-mail: ygorshkov@rambler.ru

Ключевые слова: речевой сигнал, вейвлет-преобразование, засекречивание речевой информации.

Защита речевых сообщений, передаваемых по каналам связи является одной из актуальных проблем информационной безопасности [1, 2]. Основная цель систем засекречивания речи [3] — преобразование исходного речевого сигнала в соответствии с заданным законом для достижения минимальной остаточной разборчивости, а также обеспечение значительного пространства ключей и высокой стойкости засекреченного сигнала к криптоанализу. Трудности реализации таких систем обусловлены ограничениями полосы на ширину пропускания канала связи в сочетании с требованиями по обеспечению нормальной работы при различных характеристиках используемых каналов и сохранением качества восстановленной на приемной стороне речи, а также ограничениями на вносимую задержку, вычислительную сложность используемых алгоритмов.

Традиционные и самые доступные системы засекречивания речи — системы, основанные на перестановках компонентов речи, изменяющих форму (спектр) сигнала в канале, которые осуществляют перемешивание (скремблирование) отдельных временных или спектральных отрезков исходного сигнала. Как правило, в подобных системах [4] используется быстрое преобразование Фурье (FFT). Применение традиционных алгоритмов обработки сигналов для реализации таких систем приводит к ряду трудностей. В частности, перестановка частотных полос может сопровождаться значительными искажениями различных спектральных компонентов исходного речевого сигнала, что существенно снижает разборчивость восстановленного сигнала на приемной стороне.

Новые методы высокоточной обработки нестационарных сигналов позволяют существенно расширить возможности использования усложненных методов и алгоритмических схем засекречивания речевой информации при сохранении высокого качества восстановленной речи.

Преобразование Фурье непрерывного времени. Классический метод частотного анализа стационарных непрерывных сигналов основан на преобразовании Фурье непрерывного времени (CTFT). При этом сигнал раскладывается в базис синусов и косинусов различных частот. Коэффициенты преобразования находят путем вычисления скалярного произведения сигнала с комплексными экспонентами:

Р(©) = —\ /(х)е~ШхСх. (1)

Результат преобразования CTFT — амплитудно-частотный спектр, по которому можно определить присутствие некоторой частоты в исследуемом сигнале.

С практической точки зрения CTFT имеет ряд недостатков. Для получения преобразования на одной частоте требуется вся временная информация. Это означает, что должно быть известно будущее поведение сигнала. На практике не все сигналы стационарны. Например, резкий скачок амплитуды сигнала во временной области распространится по всей частотной области его преобразования Фурье. Для преодоления этих недостатков CTFT вводят кратковременное, или оконное преобразование Фурье (STFT):

1 +ОТ

Р(а,, Ь) = — \ /(х)в-'ахм>(х - Ь)сХ. (2)

2л -да

Окном w(x - Ь) является локальная функция, которая сдвигается вдоль временной оси х для вычисления преобразования в нескольких позициях Ь. При этом преобразование зависит от времени и сигнал имеет частотно-временное представление. Такой подход позволяет определить факт присутствия в сигнале любой частоты и интервал ее присутствия, что значительно расширяет возможности STFT по сравнению с STFT. К недостаткам STFT следует отнести то, что при его вычислении используется фиксированное окно, которое не может быть адаптировано к локальным свойствам сигнала.

Речевой сигнал является примером нестационарного процесса, в котором информативен сам факт изменения его частотно-временных характеристик. Для выполнения анализа таких процессов требуются базисные функции, обладающие способностью выявлять в анализируемом сигнале как частотные, так и временные характери-

стики. Другими словами, сами функции должны обладать свойствами частотно-временной локализации.

Непрерывное вейвлет-преобразование. Вейвлет-преобразова-ние заключается в том, что разложение сигнала проводится по базису, образованному сдвигами и разномасштабными копиями функции-прототипа (или материнского вейвлета) ¥(/):

-1 (г

= я — . (3)

V я ;

Переменная я, представляющая собой параметр масштаба, задает растяжение материнского вейвлета, переменная т задает сдвиг функции по оси времени. Большие значения я соответствуют низким частотам, малые — высоким. Операция умножения на окно содержится в базисной функции, которая позволяет его уменьшать либо увеличивать. Отсюда появляется возможность выбора параметров окна, близкого к форме исследуемого сигнала.

Материнский вейвлет должен удовлетворять двум основным условиям

1. Условие допустимости. Среднее значение (интеграл по всей прямой) равен нулю:

JV(t) dt - 0. (4)

Выполнение этого условия необходимо для существования обратного преобразования.

2. Функция быстро убывает при г ^ да.

Выбор вида материнского вейвлета при обработке речевого сигнала определяет внесение минимальных искажений на всех этапах его преобразования и достижение, в конечном счете, максимальной разборчивости восстановленной речи. Общим правилом здесь является то, что вид вейвлета должен быть похож на форму анализируемого сигнала.

Непрерывное вейвлет-преобразование имеет вид

1 +ОТ / \

СТШТГ1, я) - 8(V х-1 у(х)¿х, (5)

-1 V я )

где — коэффициент, используемый для сохранения нормы.

В соответствии с принципом неопределенности Гейзенберга, чем лучше функция сконцентрирована во времени, тем больше она размыта в частотной области. При масштабировании функции произведение временного и частотного диапазонов остается постоянным и

представляет собой площадь ячейки в частотно-временной плоскости. Преимущество вейвлет-преобразования перед преобразованием Фурье заключается в том, что оно покрывает фазовую плоскость ячейками одинаковой площади, но разной формы (рис. 1). Это позволяет хорошо локализовать низкочастотные детали сигнала в частотной области (преобладающие гармоники), а высокочастотные — во временной (резкие скачки, пики и т. п.).

На практике при вычислении вейвлет-преобразования с использованием вычислительных средств интегралы заменяют суммами. При этом дискретизация параметров масштаба и сдвига должна удовлетворять следующим условиям:

Параметр масштаба 5 дискретизируется на логарифмической сетке

5 = 50' при 5о > 1. (6)

Дискретизация параметра сдвига зависит от параметра масштаба:

т = Ь'т0 при т0 > 0 (7)

Из формулы (7) следует, что с увеличением параметра масштаба шаг сдвига также увеличивается. С учетом выражений (6) и (7) формула (3) для непрерывной вейвлет-функции принимает вид

Г' ^ «) = 5о -'^(5о ' - кто ), (8)

а выражение для ряда вейвлет-преобразований дискретного времени —

ВТШ8Г (к) = 80"2 | ' _ к т0)/(х)Сх.

a

Рис. 1. Разбиение частотно-временного (а) и преобразовании Фурье (б)

плана при вейвлет-преобразовании

Дискретное вейвлет-преобразование. Реализация алгоритма непрерывного вейвлет-преобразования требует значительных объемов вычислений. Кроме того, в результате получается избыточное число коэффициентов, намного превосходящее число отсчетов исходного сигнала. Дискретное вейвлет-преобразование (ДВП) является более экономичным как по числу операций, так и по объему требуемой памяти и вместе с тем обеспечивает достаточно качественный синтез речи.

Из алгоритмов дискретного вейвлет-преобразования наиболее эффективным считается алгоритм Маллата (Mallat algorithm), при правильном выборе материнского вейвлета он обеспечивает достаточно высокое качество восстановленного сигнала.

Реализация алгоритма дискретного вейвлет-преобразования. Для засекречивания речевого сигнала используется перестановка коэффициентов его вейвлет-разложения. Дискретное вейвлет-преобра-зование выполняется при помощи модифицированного алгоритма Маллата — древовидно-соединенных низко- и высокочастотных двухканальных блоков. Для обеспечения возможности осуществления перестановки полос необходимо, чтобы количество коэффициентов вейвлет-разложения, соответствующих каждой полосе, было одинаковым. Поэтому в отличие классического алгоритма Маллата, в котором каскадирование фильтров производится только по низкочастотной составляющей сигнала, в рассматриваемом случае используется схема полного дерева разложения — на каждом уровне разложению подвергаются низкочастотная и высокочастотная составляющие, полученные на предыдущем уровне (рис. 2).

Таким образом, на n-м уровне разложения получается 2" частотных полос. После их перестановки выполняется обратное вейвлет-преобразование.

Число отсчетов сигнала, передаваемых алгоритму вейвлет-преоб-разования на каждом уровне разложения, должно быть четным. В противном случае для обеспечения последующего правильного восстановления сигнал необходимо дополнить до четной длины. Для того чтобы исключить выполнение проверки на четность, следует выбирать размер блока исходного сигнала, передаваемого на вход всей схемы преобразования, кратным 2n (где n — число уровней разложения). Также необходимо учитывать, что число отсчетов сигнала, передаваемое алгоритму вейвлет-преобразования, не должно быть меньше порядка используемого фильтра.

Выбор материнского вейвлета. Согласно проведенным экспериментальным исследованиям, максимальная разборчивость восстановленного речевого сигнала достигается при использовании в качестве материнского вейвлета функции, сходной по форме с гармонической. К таким функциям, в частности, относятся вейвлеты Добеши (Daubechi) высоких порядков и вейвлеты Койфмана (Coiflets).

&ск юодсго агнагв (к от счет св)

L

Гёрвьй урсва-ь ревгша-ич 2 гогосы(пэк/ 2 от снегов)

Вгсрсй урсва-ь реаггоен/н 4 готхы( по к/ 4 от снег св)

Рис. 2. Многоуровневый алгоритм засекречивания речевого сигнала

Наилучшие результаты из рассмотренных семейств вейвлетов достигнуты с использованием вейвлета СоШе1 18 (порядок фильтра 18). На рис. 3 показан вид его материнской функции.

Рис. 3. Вид материнской функции вейвлета СоИ1е1 18

Рис. 4. Сонограмма исходного сигнала (a) и сонограмма соответствующего засекреченного сигнала (b)

а

b

Рассмотренный алгоритм четырехуровневого преобразования (16 частотных полос) обеспечивает засекречивание речевой инфор-

13

мации мощностью ключевого множества порядка 2 • 10 с задержкой, не превышающей 100 мс, при использовании процессора Samsung S3C2410 с тактовой частотой 266 МГц.

Засекречивание речевого сигнала. На рис. 4 представлены со-нограммы исходного и засекреченного речевых сигналов.

Оценка качества восстановленного сигнала. Для исследования качества восстановленного сигнала использовалось программное средство RightMark Audio Analyzer. Результаты тестирования представлены ниже:

Параметр Значение Оценка Неравномерность АЧХ (от 40 Гц до 15 кГц),

дБ................................................................................................................+0,02, -0,01 Отлично

Уровень шума, дБ........................................................................-91,7 Очень хорошо

Нелинейные искажения, %................................................0,011 Хорошо

Интермодуляционные искажения, %........................0,018 Очень хорошо

Общая оценка..................................................................................Очень хорошо

Таким образом, проведена оценка возможности реализации засекречивания телефонной связи с использованием вейвлет-преобразования речевого сигнала. Созданы алгоритмы и разработано специальное программное обеспечение WAVELET-FONE засекречивания телефонных переговоров при работе на каналах сети общего

пользования. Выбраны параметры преобразования, обеспечивающие максимальную защиту передаваемой речевой информации при высоком качестве восстановленного сигнала.

Программа WAVELET-FONE обеспечивает засекреченную дуплексную телефонную связь в реальном масштабе времени с использованием стационарных персональных компьютеров и смартфонов.

СПИСОК ЛИТЕРАТУРЫ

1. Горшков Ю. Г., Цирлов В. Л. Аппаратура засекречивания телефонных переговоров «Орех-2» / Тр. научно-технической конференции «Информационная безопасность 2002». Приложение к журналу «КомпьюЛог». Москва, 2002. № 5. - С. 30.

2. Горшков Ю. Г., Федотов Г. В. Защита речевой информации на коммутируемых каналах связи // ИНФОРМОСТ. - 2003. - № 3. - С. 4-6.

3. Beker H. J., Piper F. C. Secure Speech Communications. London, U.K.: Academic, 1985.

4. Matsunaga A., Koga K., Ohkawa M. An Analog Speech Scrambling System Using the FFT Technique with High-Level Security // IEEE J. Select. Areas Commun. - 1989. - Vol. 7, No. 4. - P. 540-547.

Статья поступила в редакцию 19.10.2011

i Надоели баннеры? Вы всегда можете отключить рекламу.