Научная статья на тему 'Исследование влияния различий в спектрах речи на результат оценки разборчивости'

Исследование влияния различий в спектрах речи на результат оценки разборчивости Текст научной статьи по специальности «Физика»

CC BY
338
73
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАЩИТА ИНФОРМАЦИИ / РАЗБОРЧИВОСТЬ РЕЧИ / СПЕКТР РЕЧИ / АРТИКУЛЯЦИОННЫЕ ИСПЫТАНИЯ / ФРАЗОВЫЕ ТАБЛИЦЫ

Аннотация научной статьи по физике, автор научной работы — Иванов А.В., Рева И.Л., Шемшетдинова Э.Э.

Рассмотрен вопрос влияния различий в спектрах речи дикторов на результат разборчивости речи. Поставлен эксперимент по определению разницы в спектрах речи дикторов, предварительно рассмотрен вопрос выбора и влияния на результат текстового материала, используемого диктором. Проведен теоретический расчет влияния спектра речи диктора на разборчивость по методике оценки защищенности речевой информации. Посредством артикуляционных испытаний проведено подтверждение влияния спектра речи диктора на разборчивость. Приведены рекомендации по возможному учету данного эффекта

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Исследование влияния различий в спектрах речи на результат оценки разборчивости»

Атака с ограниченным контролем каналов

Ситуация несколько изменяется, если атакующий контролирует лишь часть каналов. В этом случае число поступлений результатов голосований по различным каналам может служить признаком атаки. Так, наличие одинаковых ответов экспертов, использующих для передачи ответа к ЛПР одни и те же каналы или узлы сети, могут приводить к подозрению о действиях атакующего на этих каналах.

Атака с ограниченным числом фиктивных экспертов на многократное голосование, по всем каналам

Рассмотрим ситуацию, когда число действительных экспертов строго не определено, проводятся многочисленные голосования, а результат голосования получается усреднением по всем голосованиям. Этот случай является наиболее сложным для атакующего. В этом случае он не только должен увеличить среднее число экспертов, но и пытаться выдержать закон распределения числа экспертов по числу голосований. В случае ограниченных возможностей атакующего по увеличению числа фиктивных экспертов, сделать это затруднительно. Например, при нормальном законе распределения действительных экспертов необходимо имитировать также нормальный закон распределения всех экспертов, включая фиктивных.

VI. Выводы и заключение

В системах принятия решений, в которых число опрашиваемых экспертов изначально не определено, при достижении критической вероятности изменения результата голосования отдельного эксперта, возможен новый тип атак на систему, связанный с увеличения числа голосующих и направленный на увеличение вероятности принятия ложного решения.

Список литературы

1. Ефимов Б. И. Применение алгоритмов теории графов для решения задач, связанных с обеспечением информационной безопасности в системах принятия решений // Системы управления и информационные технологии. 2009. № 1.3 (35). C. 342-346.

2. Ефимов Б. И. Возможность применения существующих средств анализа рисков в системах принятия решений с привлечением экспертов // Омский научный вестник. 2011. № 3 (103). C. 281-284.

3. Ефимов Б. И., Файзуллин Р. Т. Вероятность принятия ложного решения под воздействием угроз информационной безопасности в системах принятия решений с привлечением экспертов // Доклады Томского государственного университета систем управления и радиоэлектроники. 2013. № 1 (27). C. 69-74.

УДК 004.056

ИССЛЕДОВАНИЕ ВЛИЯНИЯ РАЗЛИЧИЙ В СПЕКТРАХ РЕЧИ НА РЕЗУЛЬТАТ ОЦЕНКИ РАЗБОРЧИВОСТИ

А. В. Иванов, И. Л. Рева, Э. Э. Шемшетдинова

Новосибирский государственный технический университет, г. Новосибирск, Россия

DOI: 10.25206/2310-9793-2017-5-4-65- 70

Аннотация - Рассмотрен вопрос влияния различий в спектрах речи дикторов на результат разборчивости речи. Поставлен эксперимент по определению разницы в спектрах речи дикторов, предварительно рассмотрен вопрос выбора и влияния на результат текстового материала, используемого диктором. Проведен теоретический расчет влияния спектра речи диктора на разборчивость по методике оценки защищенности речевой информации. Посредством артикуляционных испытаний проведено подтверждение влияния спектра речи диктора на разборчивость. Приведены рекомендации по возможному учету данного эффекта.

Ключевые слова: защита информации, разборчивость речи, спектр речи, артикуляционные испытания, фразовые таблицы.

I. Введение

Общепринятым подходом при оценке защищенности речевой информации является методика определения разборчивости речи [1], основанная на экспериментально-расчетном формантном методе Н.Б. Покровского [2]. Данная методика разрабатывалась для условий, существенно отдаленных от задач защиты информации (для

оценки качества линий связи), что в результате привело к ряду существенных недостатков, которые на протяжении последнего времени активно обсуждались многими авторами в попытках найти пути адаптации выбранного подхода к реалиям области информационной безопасности [3-8].

Одним из интересных моментов является то, что методика предполагает использование усредненного спектра речи. Однако известно, что спектры речи у разных людей имеют существенные различия, которые обусловлены особенностями строения речевого тракта каждого человека, не говоря уже о спектрах мужского и женского голосов. Отсюда вытекает ряд вопросов: корректно ли использование усреднённого спектра речи в вопросах оценки разборчивости речи; каким будет разброс значений разборчивости речи при использовании различных спектров дикторов?

Таким образом, задачей данного исследования является выяснить, как отличия в спектрах речи разных людей влияют на результат оценки разборчивости речи.

II. Методика оценки разборчивости речи

Разборчивость речи - это показатель защищённости речевой информации, выражающийся в процентном количестве правильно принятых элементов речи относительно общего числа переданных.

Суть методики [1] заключается в проведении измерений уровней акустического давления (виброускорения) в октавных полосах следующих сигналов:

- тестовый сигнал формируется либо с применением генератора белого шума, либо набором тональных сигналов с частотами, соответствующими среднегеометрическим частотам октавных полос;

- фоновый шум или шум, создаваемый средствами активной защиты, измеряется за ограждающей конструкцией при выключенном генераторе тестового сигнала и включенном средстве активной защиты (при наличии);

- смесь сигнала и шума измеряется за ограждающей конструкцией при включенном генераторе тестового сигнала.

По полученным результатам измерений производится расчет показателя разборчивости речи. Более подробно методика расчета приведена в [1, 2].

Следует обратить внимание, что в качестве тестового сигнала используется сигнал с интегральными уровнями в октавных полосах, соответствующих среднему уровню речи. Для интегрального уровня 70 дБ распределение энергии по спектру описывается интегральными уровнями в октавных полосах, приведенными в табл. 1.

ТАБЛИЦА 1

ОКТАВНЫЕ УРОВНИ АКУСТИЧЕСКОГО ДАВЛЕНИЯ УСРЕДНЕННОГО СПЕКТРА РЕЧИ

Частота, кГц 0,125 0,250 0,5 1 2 4 8

Уровень акустического давления, дБ 53 66 66 61 56 53 49

III. Постановка эксперимента

1. Выбор текстового материала

Проведем эксперимент по определению уровней акустического давления в октавных полосах речи различных дикторов.

Первоначальная проблема, возникающая при постановке данного эксперимента - это выбор текстового материала для дикторов, а также его продолжительности. Для решения поставленной задачи был поставлен небольшой эксперимент. Четырем дикторам (2 мужчины и 2 женщины) было предложено прочитать по два текста:

- фразовые артикуляционные таблицы, представленные в «ГОСТ Р 50840-95 Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости (Приложение Д)» [9];

- отрезок технического текста аналогичной длительности.

Опытным путем была определена достаточная длительность записей в 1 минуту. Речь дикторов была спокойной, четкой, средней громкости, как при разговоре в реальной жизни. Для записи использовался шумомер ZET 110 и микрофон BC501, предварительно откалиброванный по частоте 1 кГц с применением калибратора SVAN SV35. Запись производилась с частотой дискретизации 50 кГц. Также целью этого этапа эксперимента было исследовать повторяемость результатов, поэтому все материалы зачитывались по два раза.

С помощью функционала аудиоредактора Adobe audition были построены спектры звукозаписей, по отсчетам которых возможно произвести расчет интегральных уровней в октавных полосах. Следует отметить, что в

аудиоредакторах уровни оцениваются в dBFS - full scale (дБ по напряжению, но относительно максимального значения АЦП установленного в ПК), то есть 0 dBFS соответствует предельному значению уровня сигнала, выше данного значения будет происходить так называемый «Clipping» (перегрузка). Следовательно, минимальное значение уровня сигнала, фиксируемое АЦП, будет зависеть от его разрядности и составляет, например, для 16 разрядного АЦП -96 dBFS, для 20ти -120 dBFS, для 24х -144 dBFS. Привычные же нам дБ, отражающие уровень акустического давления (относительно 20 мкПа), можно получить только зная разрядность АЦП и чувствительность микрофона/акселерометра, в иностранной литературе и технике обозначаются как dB SPL -sound pressure level. То есть, используя Adobe Audition нельзя оценить абсолютный уровень записи сигнала, но можно сравнивать спектральные характеристики сигналов.

В качестве результатов приведем уровни в октавных полосах для двух записей одного диктора с использованием различных текстовых материалов (табл. 2), а также спектры этих двух записей (рис. 1).

ТАБЛИЦА2

ОКТАВНЫЕ УРОВНИ АКУСТИЧЕСКОГО ДАВЛЕНИЯ ПРИ ИСПОЛЬЗОВАНИИ РАЗЛИЧНЫХ ТЕКСТОВ

Уровни акустического давления для различных типов текста Среднегеометрические частоты октавных полос, Гц

125 250 500 1000 2000 4000 8000

Фразовые артикуляционные таблицы, dBFS -36.69 -34.57 -34.72 -41.52 -45.33 -46.16 -57.01

Отрезок технического текста, dBFS -37.22 -33.65 -33.95 -40.75 -44.94 -46.43 -56.50

Рис. 1. Спектры речи одного и того же диктора при прочтении различных текстовых материалов

Видно, что разница в уровнях акустического давления в октавных полосах при использовании различных текстовых материалов не превышает 1 дБ, что вполне позволяет утверждать, что текстовый материал существенно не влияет на форму спектра речи. Полученное расхождение (до 1 дБ) возникает даже при прочтении одного и того же текста, что говорит о том, что данное расхождение возникает по причине сложности поддержания диктором одного и того же уровня. Постараемся устранить данный эффект усреднением уровней по двум записям.

Таким образом, можно сделать вывод, что текстовый материал не оказывает существенного влияния на форму спектра речи. Для дальнейших экспериментов был сделан выбор в пользу технического текста из практических соображений - он намного ближе к обычной естественной речи людей, нежели специально составленные для испытаний таблицы.

2. Анализ влияния различий в спектрах речи на разборчивость

После определения типа текстового материала можно приступать к набору статистики. Для эксперимента было выбрано 10 дикторов (5 мужчин и 5 женщин) без очевидных дефектов и особенностей речи. Для повышения точности результат уровней в октавных полосах каждого диктора рассчитывается путем усреднения по двум записям. Результаты измерений приведены в табл. 3. Для удобства сопоставления результатов с уровнями усредненного спектра речи приведем все уровни к 70 дБ. На данном этапе нас не интересуют различия в уровнях речи дикторов, это отдельная работа (определение амплитудного состава речи), рассматривалась в [10]. Рассматриваем только формы спектров через уровни в октавных полосах.

ТАБЛИЦА 3 ИТЕГРАЛЬНЫЕ УРОВНИ РЕЧИ ДИКТОРОВ

Частота, кГц Уровни акустического давления в октавных полосах для различных дикторов, дБ

№1 №2 №3 №4 №5 №6 №7 №8 №9 №10 Усредненный

0,125 64,79 59,13 62,01 60,09 60,69 60,67 64,44 65,62 65,30 63,00 53

0,250 66,06 64,34 65,80 65,21 67,82 66,03 66,06 65,00 63,96 66,15 66

0,500 63,03 66,48 65,95 65,85 63,86 66,25 63,77 63,31 65,00 64,44 66

1 55,23 62,02 55,15 62,49 51,47 54,14 56,80 55,82 55,45 56,21 61

2 50,81 57,65 51,92 58,63 49,54 50,91 51,77 53,28 53,05 55,77 56

4 54,75 53,26 47,84 52,24 48,61 51,97 51,45 55,98 54,15 53,89 53

8 50,22 51,73 44,46 52,46 45,57 48,25 45,91 47,56 51,63 48,24 49

Теперь полученные результаты можно подставить в методику [1] в качестве уровней тестового сигнала и проанализировать влияние (исключительно с точки зрения методики) на разборчивость речи (Построим зависимости W от отношения сигнал шум с применением розового шума для всех дикторов (рис. 2).

0.9 0.8 0.7 0.6

^ 0.5 0.4 03 0.2 0.1

-30 -20 - 10 0 10 20 30

Ч. дБ

Рис. 2. Зависимости разборчивости речи W от отношения сигнал/шум q для розового шума при различных

спектрах речи говорящих. На графике: сплошная линия - для усредненного спектра, жирные пунктирные -

кривые с максимальными и минимальными значениями

Из графика видно, что, например, при q = -10дБ, в случае использования усредненного спектра речи разборчивость будет равна 0.22, а при использовании спектров различных дикторов может находиться в пределах от 0.15 до 0.43. Также можно отметить, что графики с большими значениями разборчивости в основном принадлежат мужчинам, соответственно, с меньшими - женщинам.

3. Проверка полученных результатов артикуляционными испытаниями

Для подтверждения полученных результатов проведем небольшие артикуляционные испытания. Артикуляционные испытания - это процесс субъективной оценки разборчивости речи, заключающийся в наложении на исследуемую запись речи шумов с определенными отношениями сигнал/шум, которые в дальнейшем прослушиваются группой аудиторов.

Для анализа выберем записи дикторов, которые показали наихудший и наилучший результат. Такими оказались диктор № 5 (женщина) и диктор № 4 (мужчина) по табл. 2. Напомним, что теоретически, при расчете по методике, разница в показателе разборчивости речи для данных дикторов составила примерно 30%.

Наложение розового шума и его генерацию произведем также в аудиоредакторе. Значение отношения сигнал/шум особой роли не играет, главное, чтобы оно было одинаковым для обоих дикторов. Уровень шума подберем таким, чтобы у диктора № 5, спектр речи которого показал меньшее значение разборчивости речи, различались только некоторые отдельные слова, то есть разборчивость не превышала 0.1-0.15.

На речь диктора № 4, спектр которого показал наилучшее значение разборчивости речи, накладываем такой же шум с таким же уровнем. Для большей достоверности предварительно записи речи данных дикторов также выровняли по уровню, хотя разница и составляла всего 0.3 дБ.

В результате, даже без привлечения большой группы аудиторов, разборчивость диктора №4 оказалась значительно выше, порядка 0.6-0.7. Получается, что практическое влияние формы спектра речи диктора на результат разборчивости оказалось еще сильнее, чем теоретическое. Также следует отметить, что наибольшие различия были достигнуты между мужским и женским голосами.

IV. Обсуждение результатов

Полученные результаты указывают на следующее:

- спектр речи диктора существенно влияет на разборчивости речи, даже если это вопрос рассматривать только с точки зрения методики (разница составляет порядка 30%);

- практическое подтверждение посредствам артикуляционных испытаний показало, что данный эффект проявляется еще сильнее (разница достигает 50-60%);

- также отмечено, что наибольшая разница в разборчивости речи оказалась между диктором мужчиной и диктором женщиной.

Результаты артикуляционных испытаний можно еще также обосновать тем, что разборчивость зависит не только от спектра речи, а в большей части от распределения формант по частотному диапазону, которое будет индивидуальным для каждого диктора, а уж тем более для дикторов разного пола.

V. Выводы и заключение

По полученным результатам можно сделать несколько выводов. Во-первых, спектр речи говорящего оказывает существенное влияние на результат разборчивости речи. Во-вторых, проработан вопрос с выбором текстового материала для получения спектра речи диктора, разница между фразовыми таблицами из ГОСТа и техническим текстом составляет менее 1 дБ.

В результате можно порекомендовать, в случае если перечень дикторов, обсуждающих информацию в помещении, ограничен, то проводить оценку защищенности, опираясь на их спектры речи.

Если подобное невозможно, то необходимо производить оценку защищенности не по усредненному спектру речи, а по тому, который дает наибольшее значение разборчивости речи. Возможно, для получения такого спектра необходимо провести дополнительные артикуляционные испытания с привлечением большего количества дикторов.

Учет данного эффекта при оценке защищенности речевой информации позволит существенно повысить уровень информационной безопасности помещений, предназначенных для переговоров.

Список литературы

1. Железняк В. К., Макаров Ю. К., Хорев А. А. Некоторые методические подходы к оценке эффективности защиты речевой информации // Специальная техника. 2000. № 4. С. 39-45.

2. Покровский Н. Б. Расчет и измерение разборчивости речи. М.: Связьиздат, 1962. 390 с.

3. Авдеев В. Б. О некоторых направлениях совершенствования методических подходов, применяемых при оценке эффективности технической защиты информации // Специальная техника. 2013. № 2. С. 1-10.

4. Дидковский В. С., Дидковский М. Л., Продеус А. Н. Акустическая экспертиза каналов речевой коммуникации. Киев: Имекс-ЛТД, 2008. 420 с.

5. Дидковский В. С., Продеус А. Н., Ладошко О. Н., Самойленко Н. А. Оценка эффективности защитных конструкций по критерию разборчивости речи // Известия высших учебных заведений. Радиоэлектроника. 2014. Т. 57, № 2 (620). С. 55-60.

6. Герасименко В. Г., Лаврухин Ю. Н., Тупота В. И. Методы защиты акустической речевой информации от утечки по техническим каналам. М.: РЦИБ «Факел», 2008. 258 с.

7. Трушин В. А., Рева И. Л., Иванов А. В. Экспериментальная оценка разборчивости речи в задачах защиты информации на основе модифицированных артикуляционных измерений // Актуальные проблемы электронного прибостроения: материалы Х-й Междунар. конф. (АПЭП. 2010). Новосибирск, 2010. Т. 3. С. 133-136.

8. Иванов А. В., Трушин В. А., Береснева А. В., Маркелова Г. В. Экспериментальные исследования защищенности речевой информации от утечки по техническим каналам с учетом эффекта форсирования речи // Актуальные проблемы электронного приборостроения (АПЭП-2014). Новосибирск, 2014. Т. 3. С. 164-170.

9. ГОСТ Р 50840-95. Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости. М.: ИПК Издательство стандартов, 1996. 198 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Иванов А. В., Трушин В. А., Хиценко В. Е. О выборе модели тестового сигнала при оценке защищенно -сти речевой информации от утечки по техническим каналам // Труды СПИИРАН. 2015. № 3 (40). C. 122-133.

УДК 004.056

ПРИМЕНЕНИЕ МЕТОДОВ ШУМООЧИСТКИ ДЛЯ ФИЛЬТРАЦИИ РЕЧЕВОЙ ИНФОРМАЦИИ

А. В. Иванов, И. Л. Рева, П. С. Фазлуктинов

Новосибирский государственный технический университет, г. Новосибирск, Россия

DOI: 10.25206/2310-9793-2017-5-4- 70- 73

Аннотация - Рассмотрена эффективность применения метода адаптивной фильтрации для речевых сигналов, зашумленных широкополосными помехами. Поставлен эксперимент с применением метода адаптивной фильтрации. Выявлено, что даже при низких изначальных значениях разборчивости речи (меньше 0.3) прирост может составлять более 0.1 (в значениях разборчивости речи). Получены зависимости прироста разборчивости речи от отношения сигнал/шум для розового и речеподобного шума. Выявлено, что эффективность шумоочистки также зависит и от спектра используемой помехи. Приведены рекомендации по возможному учету данного эффекта.

Ключевые слова: информационная безопасность, разборчивость речи, адаптивная фильтрация, шумо-очистка.

I. Введение

В настоящее время существует множество объективных подходов к оценке разборчивости речи. Среди отечественных наиболее популярным является формантный подход Н.Б. Покровского [1], адаптированный под задачи защиты информации [2]. Однако, данная методика разрабатывалась под задачи оценки качества линий связи, а реалии области информационной безопасности значительно отличаются, что привело к ряду недостатков, которые на протяжении последнего времени активно обсуждались многими авторами [3 -7]. Одним из таких моментов является то, что методика не учитывает возможность применения методов шумоочистки. Проведем экспериментальное исследование эффективности применения одного из методов шумоочистки - адаптивной фильтрации. Также очевидно, что прирост разборчивости речи после шумоочистки будет зависеть от исходного соотношения сигнал-шум.

II. Адаптивные методы шумоподавления

Методы адаптивного подавления обрабатывают искаженный сигнал и некий опорный сигнал. При этом опорный сигнал не должен коррелировать с шумом, но должен коррелировать с речью или (в большинстве случаев) наоборот. Для начала создается оценка компонента, коррелированного с опорным сигналом, после этого он вычитается из смеси сигнал+шум [8].

Метод адаптивного подавления реализован в двух типах систем. Отличаются эти две системы способом получения сигнала опорного сигнала.

В первом типе систем опорный сигнал формируется из зашумленного с помощью различных преобразований последнего. Эти системы называются одноканальными.

В случае двухканальных систем используются два слабо коррелированных между собой источника смеси сигнала и шума. Такой метод реализуют в режиме стереозаписи с двух микрофонов, которые находятся в разных точках пространства и по-разному ориентированы на источник звука. Двухканальные системы не так просты в реализации, так как порой сложно реализовать запись с двух микрофонов, направленных в определенные выверенные места, однако, при хороших условиях размещения микрофонов и последующей правильной генерации опорного сигнала, двухканальные системы гарантируют восстановление разборчивости крайне зашумленных сигналов [8].

Метод одноканального адаптивного подавления шума является наиболее удобным.

i Надоели баннеры? Вы всегда можете отключить рекламу.