Сепарация и маскировка речевых сообщений в многоканальных системах конфиденциальной голосовой связи

Дворянкин Сергей Владимирович; Мишуков Андрей Андреевич

ДВОрянКИн1 Сергей Владимирович, доктор технических наук, профессор мИШуКОВ2 Андрей Андреевич

сепарация и маскировка речевых сообщений в многоканальных системах конфиденциальной голосовой связи

Для обеспечения эффективной защиты речевой информации в многоканальных системах конфиденциальной голосовой связи, целесообразно управлять основным показателем защищенности речевой информации, а именно разборчивостью речи как комплексного речевого сигнала, так и составляющих его речеподобных сигналов через цифровую обработку изображений их графических образов путем процедур сепарации и маскирования. Результаты экспериментального тестирования предложенных организационно-технических моделей по управлению разборчивостью речи для защиты конфиденциальных переговоров в каналах голосовой связи полностью подтвердили их экономичность, эффективность и работоспособность. Ключевые слова: защита речевой информации, разборчивость речи, каналы голосовой связи.

With aims of effective protection of the speech information in multichannel systems of a confidential voice communication, it is offered to operate the basic indicator of security, namely speech legibility, both a complex speech signal and making it similar speech signals, through digital processing of their graphic images by separation and masking procedures. Results of experimental testing offered organizational-technical models of speech legibility management for protection of confidential negotiations in voice communication channels have completely confirmed their profitability, efficiency and working capacity.

Keywords: protection of the speech information, speech legibility, voice communication channels.

Современное состояние проблемы защиты речевой информации (ЗРИ) характеризуется постоянным расширением арсенала методов и средств негласного съема и перехвата акустических (речевых) сигналов, технические характеристики и способы применения которых неуклонно совершенствуются злоумышленниками (ЗЛ) [1, 5].

Это особенно справедливо для систем головой связи, передача речевой информации (РИ) в которых остается одной из самых востребованных пользователями [1].

Характеристики речи

Речевой сигнал - носитель РИ, является сложным акустическим сигналом в небольшом диапазоне частот (70 — 12 000 Гц), который может включать целый спектр элементарных гармонических составляющих, квазистационарных на относительно коротких временных интервалах (до 30 — 40 мс).

Речь может быть охарактеризована тремя группами характеристик:

♦ семантическая или смысловая сторона речи — характеризует смысл тех понятий, которые передаются

1 — Российский новый университет, проректор;

2 — Российский новый университет, аспирант.

при ее помощи, определяет суть передаваемого речевого сообщения и может быть представлена в письменной форме в виде текста;

♦ фонетические характеристики речи

— данные, характеризующие речь с точки зрения ее звукового состава. Основной фонетической характеристикой звукового состава является частота встречаемости в речи различных звуков и их сочетаний;

♦ физические характеристики — величины и зависимости, характеризующие речь как акустический сигнал;

4

Год измерения

Общее количество терминалов и каналов связи на одного человека —■— Терминалы (каналы) сотовой связи + Терминалы (каналы) фиксированной связи А Терминалы (каналы) передачи данных

Рис. 1. Число подключенных терминалов (каналов) голосовой связи на 1 человека в трудоспособном возрасте на территории России

Рис. 2. Традиционная модель связи абонентов (два абонента - одна линия связи)

Абонент «Б»

Линии связи

Рис. 3. Современная модель связи абонентов (два абонента - много линий связи)

♦ индивидуальные характеристики речи — параметры, идентифицирующие личность говорящего.

Особенности современной голосовой связи

Как часть телекоммуникационной информации речевая информация обрабатывается техническими средствами и/или передается по линиям (каналам) связи. Причем под обобщенным термином «обработка информации» понимается совокупность операций сбора, накопления, ввода, вывода, приема, передачи, записи, хранения, регистрации, уничтожения, преобразования и отображения информации.

Сегодня процессы качественного и безопасного приема-передачи РИ по различным каналам телекоммуникаций характеризуются появлением новых особенностей применения, удовлетворяющим все новым запросам пользователей.

Так, в соответствии с данными Федеральной службы государственной статистики, в среднем по России на одного абонента в трудоспособном возрасте населения (для мужчин 16-59 лет, для женщин 16-54 года) уже приходится более 3 каналов голосовой связи, включая системы передачи данных (рис. 1). Абоненты для проведения переговоров имеют возможность соединяться друг с другом посредством различных типов каналов телекоммуникаций: VoIP, проводная и сотовая связь. Пользователь сам выбирает канал голосовой связи, который в данный момент ему наиболее удобен. Таким образом, помимо традиционной модели голосовой связи двух абонентов по одному каналу (рис. 2) сегодня уже используются современные модели голосовой связи абонентов по схеме «два абонента - много линий связи» (рис. 3) и по схеме «много абонентов - много линий связи» для многосторонней связи: совещаний и аудиоконференций (рис. 4).

Заметим, что, помимо собственно аудиоконференций, последняя модель очень часто применяется в ходе проведения различного рода видеоконференций, которые все чаще используются в деловой среде.

В процессе переговоров по указанным схемам речевой сигнал (РС) может неоднократно преобразовываться из ана-

логовой формы представления в цифровую и проходить различные участки и оборудование линий голосовой связи: телефон - телефон; компьютер - компьютер; телефон - компьютер;

компьютер - телефон [1 - 3]. На некоторых участках штатными средствами операторов связи может обеспечиваться защита РС от перехвата и прослушивания, а на некоторых - нет.

проводной ЄвМ смартфон КПК телефон телефон

Абонент «А»

1

проводной ■ ~~-тепефон . V 4Г

телефон , смартфон ^ КПК

Рис. 4. Модель многоточечной аудиоконференции (много абонентов - много линий связи).

Конфиденциальная РИ, угрозы и что защищать?

Такая многозвенность, мультимодальность и многоканальность речевой связи предопределяет право абонентов на выбор наиболее приемлемого канала речевой связи, обуславливает современные тенденции ее развития и новые требования к защите РИ от несанкционированного доступа (НСД) и БОЯ, прежде всего, при организации многосторонних аудио-, видеоконференций и вебинаров, на которых обсуждаются вопросы, связанные с коммерческой, врачебной, служебной и другими видами тайн, относящимися к разряду конфиденциальной информации. Непрекращающийся интерес к защите конфиденциальной РИ в каналах телекоммуникаций обусловлен следующими двумя видами угроз со стороны ЗЛ

- НСД и блокирование канала голосовой связи или отказ в обслуживании

[1 - 5].

В первом случае источником угрозы является либо недобросовестная конкуренция в целях получения подробной информации о конкретных хозяйствующих субъектах, в том числе информации об их интеллектуальной собственности, либо необходимость

получения ЗЛ подробной информации о личной жизни конкретных физических лиц, а также их персональных данных для реализации в последующих противоправных действиях.

Во втором случае — дестабилизация работы конкретных хозяйствующих субъектов, хулиганство в отношении конкретных физических лиц или неограниченного круга лиц.

В любом случае надо исходить из того, что ЗЛ имеет возможность получить доступ к каналу голосовой связи, знает время и место проводимых конфиденциальных переговоров, частично предполагает, кем и о чем будет вестись беседа. Исходя из этого, на первый план речевых характеристик, подлежащих защите, выходит семантическая составляющая речевой информации, определяющая смысловое содержание передаваемого РС и тесно связанная с показателями речевой разборчивости и понятности.

Технологии защиты. Куда идти?

Сегодня известны две основные технологии защиты речевых сообщений, отличающиеся способами передачи по каналам связи речевых сообщений: аналоговое скремблирование и диск-

ретизация речи с последующим шифрованием [3, 4].

Методы аналогового скремблирования успешно используются в тактическом звене военного и государственного управления, а также в коммерческих каналах связи для защиты конфиденциальных речевых сообщений, обеспечивая достаточно приемлемое качество и разборчивость восстановленной речи, пока более высокие, чем у узкополосных цифровых систем защиты, при относительно низкой цене.

Цифровые методы кодирования, при всей своей надежности пока еще не отличаются простотой технической реализации и высоким качеством восстановленной речи при своей еще достаточно высокой стоимости.

К сожалению, эти традиционные технологии обеспечения безопасности речевых сообщений (ОБРС) не в полной мере соответствуют обозначенным особенностям современной многоточечной голосовой связи. Прежде всего, из-за наличия процессов синхронизации в процедурах речевой обработки на обоих концах канала голосовой связи, а также из-за чувствительности алгоритмов закрытия речи к потерям и запаздываниям пакетов аудиоданных. Поэтому указанные технологии применимы только для одного защищен-

ного режима работы и только двух абонентов, работающих только в одном канале связи (рис. 2), с учетом наличия у обоих (или у оператора связи) сложного и достаточно дорогостоящего оборудования защиты РИ.

Появившиеся в последние годы методы и средства аддитивного маскирования РС шумом или другими сложными акустическими сигналами, принудительно введенными в канал голосовой связи в целях затруднения восприятия РС злоумышленником, также ориентированы на традиционную модель голосовой связи (рис. 2) и не всегда пригодны для реализации в многоточечной аудио-видеоконференции с множеством используемых каналов. Тем не менее новые методы маскирования, непосредственно связанные с процессами речепреобразования защищаемых сигналов, могут оказаться весьма перспективными и требуют своего исследования.

На что опереться?

Таким образом, удовлетворить требованиям современных групповых пользователей по защите от НСД и блокирования конфиденциальной РИ, передаваемой по различным общедоступным каналам связи, как-то: проводная телефония, сотовые и компьютерные сети, - можно уже сегодня на основе методов и ПО управления речевой разборчивостью (РР), реализованных на стандартных средствах вычислительной техники. Для этого можно восполь-

зоваться наработанным потенциалом в области защиты РИ, доступной ЗЛ по техническим каналам утечки речевой информации (ТКУРИ) в выделенных помещениях (ВП) проведения конфиденциальных переговоров. Под ними понимаются специальные помещения (служебные кабинеты, актовые залы, конференц-залы и т.д.), которые так и называются выделенными или защищаемыми помещениями, предназначенными для обсуждения информации ограниченного доступа (совещаний, обсуждений, конференций, переговоров и т.п.).

Анализ перехваченной с помощью технических средств акустической (речевой) разведки информации производит человек. Поэтому в качестве нормативного показателя оценки эффективности защиты выделенных помещений от утечки речевой информации по техническим каналам используется словесная разборчивость речи 1У, под которой понимается относительное количество (в процентах) правильно понятых человеком слов, перехваченных (зарегистрированных) средством разведки. Управление речевой разборчивостью в ВП заключается в инструментальном методе ее оценки, сравнении с заданным показателем (нормой) и при необходимости реализации комплекса мер по нейтрализации ТКУРИ путем уменьшения РР до нормированного значения посредством постановки активных акустических помех или реализации комплекса мер по усилению пассивной акустозащиты: установки

заграждающих экранов, звукоизоляционных материалов и т.п. [5]. Содержание и критерии эффективности защиты РИ в технических каналах ее утечки показаны в табл. 1. Указанный подход может быть применим не только к защите конфиденциальных переговоров в выделенных помещениях, но и к защите голосовой связи, современные системы которой, как уже отмечалось, характеризуются многозвенностью, мультимодальностью, многоканальностью и большим числом абонентов, участвующих в переговорах.

Основная идея

В этой связи речевой сигнал каждого из абонентов конфиденциальных переговоров будем рассматривать как совокупность, а иногда и как сумму нескольких речеподобных сигналов, каждый из которых имеет свою РР со значением менее заданного уровня (нормы) и может быть передан другому собеседнику по своему отдельному каналу.

5 () = и ^ ()

к

я о)=Х^ ()

к

Такой отдельный РС, будучи возможно перехваченным в одном из контролируемых каналов связи, уже

Таблица 1. Цель и критерии эффективности защиты РИ в технических каналах ее утечки

Цель защиты Потенциальные технические каналы утечки информации Критерий эффективности защиты

Скрытие факта ведения переговоров в ВП Прямой акустический, акустовибрационный, акустооптичес-кий, акустоэлектрический, акустоэлектромагнитный Шп < 10%

Скрытие предмета переговоров в ВП Прямой акустический, акустовибрационный, акустооптичес-кий, акустоэлектрический, акустоэлектромагнитный Шп < 20%

Скрытие содержания переговоров в ВП Прямой акустический, акустовибрационный, акустооптичес-кий, акустоэлектрический, акустоэлектромагнитный (прослушивание с использованием технических средств) Шп < 30%

Скрытие содержания переговоров в ВП Прямой акустический без применения технических средств (непреднамеренное прослушивание) Шп < 40%

-ft"

А ы

А ы \ А ла-^Н Р«3

А ы „У.

A--)"*

Динамик

Yota

(WiMAX)

GSM-3

Yota

(WiMAX)

ЩЩщрР

Персональный

компьютер

Динамик

Рис. S. Общая схема многоканальной системы маскированной речевой связи

не будет понятен нарушителю. У легального же пользователя на приемном конце все полученные по разным путям элементарные сигналы снова объединяются, «сшиваются» по определенным правилам в один, теперь уже разборчивый сигнал. Организационно-техническая модель такой защищенной голосовой связи для двух человек и одновременно используемых ими 4-х каналов (3 сотовых операторов «большой тройки» плюс канал VoIP) показана на рис. 5. Понятно, что эта модель может быть расширена на большее число абонентов, участников конференции.

Для сохранения конфиденциальности переговоров в ВП считается, что если уровень расчетной словесной разборчивости не превышает 20% (табл. 1), то данный ТКУРИ не требует проведения защитных мероприятий [5]. А если расчетная словесная разборчивость превышает 80% (что соответствует 100% фразовой), то перехватываемая ЗЛ по каналу ТКУРИ речевая информация будет полностью понятна нарушителю. Эти же выводы можно отнести и к телекоммуникационным каналам ре-

чевой связи, защищаемым от НСД. При необходимости в целях достижения еще большего уровня защиты РИ в каждом из используемых каналов можно дополнительно использовать известные и новые алгоритмы речевого маскирования, не требующие синхронизации [4].

Плюс от сеанса к сеансу можно организационно изменять набор участвующих в модели каналов, добавляя каналы новых операторов связи (например фиксированную телефонную связь, другие сервисы VoIP и сотовой связи) и исключая старых.

Какая может быть сепарация?

Класс методов разделения исходного РС на неразборчивые речеподобные составляющие также весьма широк: от полосовой фильтрации по группам равноартикуляционных полос до спектрально-временной обработки фонетической функции (динамической огибающей спектра), определяющей РР. Последние методы, основанные на технологии образного анализа-син-

теза, заключающегося в переходе от волнового представления РС к изображению динамических узкополосных спектрограмм - графическим образам (ГО), их обработке методами цифровой обработки изображений для решения прикладных задач и обратном переходе (синтезе) от нового изображения к новой волновой форме РС, - лучше подходят для организации многоканального асинхронного маскирования РС. Поскольку в них одновременно с преобразованиями фонетической функции могут реализовываться процедуры цифровой «шумоочистки» амплитудных, фазовых и других принудительно введенных канальных искажений, а также искажений, возникающих в процессе финальной «склейки» ГО элементарных составляющих. Процесс управления РР здесь можно представить в виде преобразования или расслоения («слайдирования») исходного ГО на ряд других, мало похожих или совсем непохожих на исходный ГО, по которым синтезируются неразборчивые речеподобные сигналы, передаваемые в свои каналы связи на передающем конце, и сшивку или

Рис. 6. Спектрограммы речевых и речеподобных сигналов с одинаковой ФФ

объединение их ГО с последующим синтезом в новый разборчивый сигнал на приемном.

Фонетическая функция или с чем связана разборчивость

Известно, что смысловое содержание речевого сообщения определяется динамикой перестройки формантной структуры или огибающей спектра. Процесс речеобразования, связанный с динамикой этой огибающей, часто называемой фонетической функцией Пирогова (ФФ), удобно исследовать посредством цифрового спектральновременного анализа спектрограмм. Результаты одного из таких исследований представлены на рис. 6, где показаны спектрограммы разных речевых сигналов, но с одинаковой ФФ и, как следствие, одинаковым смысловым содержанием, выражаемом в одной и той же текстовой форме. На спектрограммах по вертикальной оси отложена частота, по горизонтальной — время. В уровнях серого цвета указана мощность сигнала на данной частоте в данной момент времени. Максимальная мощность отображается черным цветом, минимальная -белым.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В левом нижнем углу рис. 6 представлена сонограмма исходной речи; в правом нижнем — спектрограмма этой же

фразы, сказанная громким шепотом; в правом верхнем — монотонная речь; в левом верхнем — та же фраза, но сказанная с другим эмоциональным выражением.

Таким образом, речь содержит в себе форманты, прием которых определяет ее разборчивость и неформантные составляющие, к которым относятся основные тоны, области частот между формантами и составляющие, зависящие от индивидуальных особенностей говорящих.

Примеры сепарации и маскировки для защиты от НСД

Исходя из этого, речевой сигнал как процесс, развивающийся во времени и по частоте, можно рассматривать как взаимное наложение друг на друга его гармонической и формантной структуры, присутствующее на изображениях узкополосных спектрограмм или ГО РС. Отделяя, изменяя и снова соединяя на изображениях спектрограмм гармоническую и формантную структуры, можно РС делать неразборчивым на передающем конце канала связи и разборчивым после выполнения обратных операций — на приемном.

Результаты выполнения подобных процедур для одного из новых перспективных методов асинхронного мас-

кирования РС в полной полосе частот представлены на рис. 7.

Понятно, что такие же процедуры можно проводить для полосы частот каждого отдельного речеподобного (РП) сигнала, передаваемого по своей отдельной линии связи в многоканальной системе защищенных переговоров. Заметим, что на приемном конце производятся обратные преобразования динамических огибающих спектра каждого РП-сигнала и их сшивка в интегрирующий ГО с последующим синтезом по нему нового восстановленного РС.

Дополнительно для лучшей синхронизации в процессе восстановления РР комплексного РС путем сшивки ГО речеподобных сигналов его составляющих в каждом из них можно применять маскированные пилот-сигналы в виде узкополосных помех, как это показано на рис. 8 для наглядности в полной полосе телефонного канала. Там же показаны и результаты снятия такой маскировки.

Защита от блокирования (отказа в обслуживании -ЭОБ)

Возможности ЗЛ по блокированию каналов голосовой связи также можно и нужно оценивать с учетом комплексного анализа и обработки ГО

Рис. 7. Примеры асинхронного маскирования речи в полной полосе телефонного канала посредством изменения ее формантной структуры: а) графический образ спектра исходного речевого сигнала; б) графический образ спектра исходного РС с инвертированной огибающей; в) графический образ РС с инвертированной огибающей со статическим сдвигом; г) графический образ спектра исходного РС с динамической сдвигом огибающей

акустических (речевых) сигналов, принимаемых с различных линий связи с последующей их постобработкой и шу-моочисткой. Здесь в случае блокирования или отказа одного или нескольких каналов голосовой связи, по которым передается только часть исходной РИ, оставшихся долей РР в действующих каналах должно быть вполне достаточно для полного понимания передаваемого речевого сообщения легитимным пользователем.

Так же, как и раньше, защищаемый речевой сигнал, рассматривается как некоторая совокупность нескольких отдельных речеподобных сигналов, передаваемых по каждому из каналов го-

лосовой связи. Каждый из этих сигналов может иметь свою РР, со значением меньше нормы. Такой отдельный РС, будучи перехваченным в одном из контролируемых каналов, не будет понятен ЗЛ и может быть им заблокирован.

Тем не менее на приемном конце при многоканальной сшивке ГО РС в не-заблокированных каналах в новый ГО и последующим восстановлением по нему нового РС, последний должен иметь уже свою собственную РР, большую, чем РР его составляющих в используемых каналах приема-передачи, и вполне достаточную для понимания абонентом сути ведущихся переговоров.

£ о)=и % (о

з <к

Щ ^ 80%

Для получения еще большей РР информацию о пропущенных (заблокированных) участках на комплексоном ГО РС можно частично восстановить, сочетая известные методы восстановления и реконструкции искаженных изображений с известными механизмами речеобразования, выражающимися в построении гармонической структуры ГО РС.

Как видим, при защите РИ от угрозы блокирования каналов голосовой свя-

Рис. 8. Маскирование речи квазигорманической помехой: слева - постановка мощной квазигармонической помехи в речевом сигнале; справа - снятие помехи из полезной смеси на приемном конце канала связи

зи решается обратная задача по управлению РР в отличие от угрозы НСД. Она заключается в объединении или сшивке ГО речеподобных сигналов с отдельных действующих линий связи в одно новое изображение ГО, для организации последующей процедуры синтеза нового разборчивого сигнала.

Выводы

Таким образом, для обеспечения эффективной защиты РИ в многоканальных системах конфиденциальной голосовой связи, целесообразно управлять основным показателем защищенности речевой информации, а именно РР, как комплексного РС, так и составляющих его речеподобных сигналов через цифровую обработку изображений их графических образов путем процедур сепарации и маскирования.

Результаты экспериментального тестирования предложенных организационно-технических моделей по управлению РР для защиты конфиденциальных

переговоров в каналах голосовой связи полностью подтвердили их экономичность, эффективность и работоспособность.

Литература

1. Петраков А.В., Лагутин В.С. Утечка и защита информации в телефонных каналах. - М.: Энергоатомиздат, 1998. - 317 с.

2. Дворянкин С.В. Компьютерные технологии защиты, речевых сообщений в каналах электросвязи. Учебное пособие. - М.: РИО МТУСИ. 1999. - 52 с.

3. Барсуков В.С., Дворянкин С.В., Шеремет. И.А. Безопасность связи в каналах телекоммуникаций. - М.: Электронные знания, 1992-1993. - 122 с.

4. Дворянкин С.В., Девочкин Д.В. Методы, закрытия, речевых сигналов в телефонных каналах/ Защита информации. Конфидент,1995. -№ 5. - С.45 - 59.

5. Дворянкин С.В., Макаров Ю.К., Хорев А.А. Обоснование критериев эффективности защиты, речевой информации от. утечки по техническим, каналам.. / Защита информации. Инсайд. - № 2 (14). - март-апрель 2007. - С. 18 - 25.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дворянкин Сергей Владимирович, Мишуков Андрей Андреевич

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Дворянкин Сергей Владимирович, Мишуков Андрей Андреевич

Текст научной работы на тему «Сепарация и маскировка речевых сообщений в многоканальных системах конфиденциальной голосовой связи»