Научная статья на тему 'Принципы формирования тестовых речевых сигналов при оценках эффективности технологий шумоочистки'

Принципы формирования тестовых речевых сигналов при оценках эффективности технологий шумоочистки Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
537
84
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АКУСТИЧЕСКАЯ РЕЧЕВАЯ РАЗВЕДКА / ПОМЕХОУСТОЙЧИВОСТЬ / ФОНЕМЫ / ЗАЩИТА РЕЧЕВОЙ ИНФОРМАЦИИ / РАЗБОРЧИВОСТЬ РЕЧИ / РЕЧЕВОЙ СИГНАЛ / ACOUSTICSPEECHINTELLIGENCE / NOISE-IMMUNITY / PHONEMES / PROTECTIONOFSPEECHINFORMATION / SPEECHINTELLIGIBILITY / SPEECH SIGNAL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Козлачков Сергей Борисович, Дворянкин Сергей Владимирович, Бонч-бруевич Андрей Михайлович

Цель статьи заключается в выявлении определенных несоответствий методов артикуляционных измерений (испытаний), используемых для оценки защищенности акустической речевой информации и в современных способах ведения акустической речевой разведки.Метод: комплексный теоретико-прикладной анализ результатов экспериментов по повышению разборчивости речевых сигналов, искаженных шумами и помехами.Результаты: определены отличительные особенности механизмов формирования потока слитной речи, существенно влияющие на помехоустойчивость речевых сообщений. Выявлены важные аспекты определения эффективности современных технологий шумоочистки, которые могут использоваться наряду с другими инструментами и методами ведения акустической речевой разведки. Дан краткий обзор основных особенностей методов шумопонижения и реконструкции сигналов, применяемые для повышения качества речевых сигналов, искаженных шумами и помехами. Продемонстрированы универсальные принципы обработки сигналов, используемые в процедурах реконструкции искаженных речевых сообщений, и реализуемые в механизмах повышения помехоустойчивости речи. Сформулированы дополнительные требования по адекватному выбору и формированию испытательных речевых тестов и характера их применения. Указаны некоторые принципиальные ограничения действующих ГОСТов в приложениях оценки защищенности акустической речевой информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Козлачков Сергей Борисович, Дворянкин Сергей Владимирович, Бонч-бруевич Андрей Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Principles of Forming Test Speech Signals in Assessing the Efficiency of Noise Reduction Technologies

The purpose of the article is to identify certain inconsistencies in the methods of articulatory measurements (tests) used to evaluate the security of acoustic speech information and in modern methods of conducting acoustic speech reconnaissance. Method: a complex theoretical-applied analysis of the results of experiments to improve the intelligibility of speech signals distorted by noise and interference. Results: Distinctive features of the mechanisms of formation of the stream of merged speech that significantly affect the noise immunity of speech messages are determined. Important aspects of determining the effectiveness of modern noise reduction technologies that can be used along with other instruments and methods of conducting acoustic speech reconnaissance are revealed. A brief review of the main features of noise reduction and signal reconstruction methods used to improve the quality of speech signals distorted by noise and interference is given. The universal principles of signal processing used in the procedures for reconstructing distorted voice messages are demonstrated, and they are realized in mechanisms of increasing noise immunity of speech. Additional requirements for the adequate choice and formation of test speech tests and the nature of their application are formulated. Some basic limitations of existing GOSTs in applications for assessing the security of acoustic speech information are indicated.

Текст научной работы на тему «Принципы формирования тестовых речевых сигналов при оценках эффективности технологий шумоочистки»

I ПРИНЦИПЫ ФОРМИРОВАНИЯ ТЕСТОВЫХ РЕЧЕВЫХ СИГНАЛОВ ПРИ ОЦЕНКАХ ЭФФЕКТИВНОСТИ ТЕХНОЛОГИЙ ШУМООЧИСТКИ

Козлачков С.Б.1, Дворянкин С.В.2, Бонч-Бруевич А.М.3

Цель статьи заключается в выявлении определенных несоответствий методов артикуляционных измерений (испытаний), используемых для оценки защищенности акустической речевой информации и в современных способах ведения акустической речевой разведки.

Метод: комплексный теоретико-прикладной анализ результатов экспериментов по повышению разборчивости речевых сигналов, искаженных шумами и помехами.

Результаты: определены отличительные особенности механизмов формирования потока слитной речи, существенно влияющие на помехоустойчивость речевых сообщений. Выявлены важные аспекты определения эффективности современных технологий шумоочистки, которые могут использоваться наряду с другими инструментами и методами ведения акустической речевой разведки. Дан краткий обзор основных особенностей методов шумопонижения и реконструкции сигналов, применяемые для повышения качества речевых сигналов, искаженных шумами и помехами. Продемонстрированы универсальные принципы обработки сигналов, используемые в процедурах реконструкции искаженных речевых сообщений, и реализуемые в механизмах повышения помехоустойчивости речи. Сформулированы дополнительные требования по адекватному выбору и формированию испытательных речевых тестов и характера их применения. Указаны некоторые принципиальные ограничения действующих ГОСТов в приложениях оценки защищенности акустической речевой информации.

Ключевые слова: акустическая речевая разведка, помехоустойчивость, фонемы, защита речевой информации, разборчивость речи, речевой сигнал.

DOI: 10.21681/2311-3456-2018-3-09-15

Введение

Многократно отмечалось, что одной из проблем оценки защищенности акустической речевой информации (ЗРИ) является сложность объективного учета новых и перспективных технологий и методов ведения акустической речевой разведки (АР-Р) [1-5]. Отдельного внимания заслуживают вопросы оценки эффективности технологий шумоочистки (шумопонижения и реконструкции речевых сообщений). В настоящее время, ввиду отсутствия инструментальных методов, такие оценки выполняются исключительно с использованием артикуляционных методов [6-9]. Следует отметить, что публикации по данной тематике носят эпизодический характер.

Методики оценки ЗРИ основаны на ГОСТ 16600-72 «Передача речи по трактам радиотелефонной связи. Требования к разборчивости речи и методы артикуляционных измерений» и ГОСТ Р 50840-95 «Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости», которые устанавливают требования к оценке разборчивости речи (РР), передаваемой по трактам радиотелефонной связи, нормы качества воспроизведения (передачи) речи, методы артикуляционных измерений и оценки их результатов. При этом для оценок ЗРИ наиболее важным является диапазон малых соотношений сигнал/шум (SNR) в

смеси сигнала с маскирующим шумом, обозначаемый термином «полная неразборчивость связного текста -срыв связи». В то время как в радиосвязи наибольший интерес представляют уровни SNR, оценивающие качество связи от «отлично» до «удовлетворительно».

Таким образом, в каналах связи оценивается приемлемое качество передачи речи, а единственным критерием является РР (слоговая, словесная или фразовая), которая оценивается по результатам субъективных испытаний. Соответствующие методические погрешности артикуляционных измерений имеют значительный разброс в пределах ± 6 дБ, как для речи дикторов, так и для порогов слухового восприятия реципиентов, что дополнительно снижает достоверность оценок РР [10].

В связи с этим, в целях повышения достоверности оценок ЗРИ, возникает необходимость как в адекватном учете возможностей новых технологий и методов ведения АР-Р, в т.ч. методов шумопонижения, реконструкции речевых сообщений (РС), так и в коррекции отдельных положений и требований соответствующих ГОСТов.

Методы шумопонижения

Целью процедур действующих инструментальных методик оценки ЗРИ является определение SNR первичных тестовых сигналов, без непосредственного определения их информационной значимости. В то

1 Козлачков Сергей Борисович, кандидат технических наук, доцент кафедры ИУ-10 МГТУ им. Н.Э. Баумана, г. Москва, Россия. E-mail: [email protected]

2 Дворянкин Сергей Владимирович, доктор технических наук, профессор. Профессор кафедры «Информационная безопасность» Финансового университета при Правительстве Российской Федерации, г. Москва, Россия. E-mail: [email protected]

3 Бонч-Бруевич Андрей Михайлович, кандидат технических наук, доцент кафедры ИУ-10 МГТУ им. Н.Э. Баумана, г Москва, Россия. E-mail: [email protected]

время как для АР-Р именно информационная составляющая, а не столько энергетические показатели РС, представляет наибольшую ценность.

Принципиальными отличиями процедур АР-Р от существующих методов оценки РР, используемых при оценке ЗРИ, являются: использование записанных (вторичных4) речевых сигналов (РС) и соответствующие возможности комплексной обработки речевой информации (РИ) в режиме отложенного анализа. При этом априори предполагается, что в распоряжении злоумышленника (ЗЛ) имеется полный набор инструментов и технологий, позволяющих существенно повысить качество исходного РС в его смеси с шумом, а также база данных с образцами голосов дикторов, субъектов интересов АР-Р. Различные технологии шумоочистки условно можно разделить на методы шумопонижения и методы реконструкции РС [11]. Основная цель шумоочистки - повышение качества и четкости звукового сигнала до степени, обеспечивающей комфортное прослушивание и понимание содержания РС.

Наиболее простыми и распространенными считаются асинхронные (одноканальные) способы шумопонижения: узкополосные фильтры, медианные фильтры, методы спектрального вычитания и др., позволяющие снизить уровни маскирующих шумов. Более сложными в реализации являются методы адаптивной фильтрации и многоканальные синхронные системы шумопонижения [11].

Помехоустойчивость и реконструкция речевых сообщений

Следует учитывать возможность наличия у ЗЛ определенных априорных сведений о тематике ведущихся переговоров, использование соответствующих тематических опорных словарей, а также доступ к образцам голосов дикторов, с учетом характерных особенностей их речи (ритмика, междометия, служебные слова и т.п.). Полный набор таких данных позволяет эффективно использовать сформированные эталоны РС в процедурах реконструкции речи, искаженной шумами и помехами [5, 11].

Опираясь на априорные данные (закономерности формирования) о характеристиках речевых сигналов, методы реконструкции позволяют реализовать в т.ч. высокоэффективные методы адаптивной фильтрации.

В целом традиционный канал речевой коммуникации характеризуется высокой помехоустойчивостью, которая обеспечивается согласованным взаимодействием механизмов речеобразования и слухового восприятия. Методы реконструкции обладают рядом существенных преимуществ перед методами шумопонижения, поскольку, в определенной степени, позволяют использовать некоторые из этих механизмов повышения помехоустойчивости речи.

Так сложная сигнальная структура речевого сигнала, обусловленная амплитудной, частотной и фазовой модуляциями, позволяет в значительной степени повысить его помехоустойчивость: утрата одних значимых модуляционных параметров может быть компенсирована за счет других, не подвергшихся чрезмерному искажению.

4 Вторичный - сигнал, прошедший через

акустоэлектрический тракт, например, системы звукозаписи

Разделение сигналов на вокализованные и консонантные, взрывные и длительные, компактные и диффузные фонемы (за счет своеобразного кодирования сигналов) - обеспечивает дополнительную помехоустойчивость сообщений.

Особо стоит упомянуть о значимости вокализованных фонем, которые являются основными переносчиками РИ, что неоднократно было подтверждено рядом экспериментальных исследований [12-14]. Воспринимаемая синхронизация речи также в основном выполняется по вокализованным фонемам, поскольку они могут лучше всего передать данные о преобладающей скорости изменений значимых признаков и характеристик РС. Кроме того, вокализованные звуки являются первичными носителями ударения, которое характеризуется амплитудой и длительностью изменений. Мелодика частоты основного тона (ЧОТ) вокализованных фонем, характер изменения её обертонов позволяют не только успешно выполнять сегментацию потока слитной речи, выделяя синтагмы, но и формировать интонационные контуры и другие просодические характеристики речи [15]. В целом вклад вокализованных фонем в помехоустойчивость (разборчивость) речевых сообщений в значительной степени превосходит вклад консонантных звуков [14].

Другими важными механизмами повышения помехоустойчивости РС являются: эффект коартикуляции, слитное произношение слогов - дифонов и трифонов, объединяющих изолированные фонемы в фонетические элементы речи; а также локусы вокализованных фонем, позволяющие восстанавливать параметры слабых консонантных фонем по спектральным параметрам примыкающих к ним вокализованных звуков [12, 13, 15]. Все вышеперечисленные (и другие) механизмы повышения помехоустойчивости участвуют в формировании и восприятии потока слитной речи наряду с контекстом сообщения.

При реконструкции РС последовательно выполняются следующие основные операции: анализ спектрограммы и структуры речевого сигнала, восстановление его гармонических составляющих, продление следов (треков) фонообъектов, восстановление формантных (дифонных) переходов сигналов.

На сегодняшний день достаточно эффективным инструментом выделения структуры речевого сигнала по его спектрограмме является узкополосный контурный анализ [11, 16, 17]. На практике получается, если в за-шумленной спектрограмме удается различить хотя бы 3-5 гармоник речевого сигнала, то этот сигнал может быть в принципе восстановлен, т.е. очищен от шумов [11, 16, 17].

На вокализованных участках «чистого» (без шумов и помех) сигнала мужского голоса, спектрограмма которого показана на рисунке 1, в определённые моменты времени различимы от 20 до 30 линий гармоник ЧОТ. На всех последующих рисунках обозначены: по оси абсцисс - время (сек.), по оси ординат - частота (Гц). Уровни сигнала отображаются в насыщенности черного цвета.

Рис. 1. Гармоники ЧОТ на узкополосной спектрограмме РС (показаны стрелками)

Как правило, при наличии помех ВЧ гармоники, как наименее мощные, скрываются под шумом, а несколько мощных первых НЧ гармоник спектра с наибольшей амплитудой еще проявляются на фоне шумов (рис. 2).

По этим оставшимся гармоникам возможно нахождение ЧОТ и восстановление гармонической структуры, затем возможной формантной структуры, и, в конечном итоге, звучания так реконструированного, ранее искаженного РС.

Рис. 3. Сонограмма и линии гармоник ЧОТ (красные) в случае восстановления гармонической структуры зашумленного сигнала по оставшимся «следам».

Также отмечалось, что (при зашумлении РС белым шумом) треки гармоник и восстановленная по ним гармоническая структура находятся корректно даже при отношении сигнал/шум до -12^-16 дБ [14]. При за-шумлении РС естественными помехами гармоническая структура будет корректно восстанавливаться при отношении сигнал/шум до -5.. .-8 дБ.

Далее, в режиме широкополосного анализа с использованием возможностей интерполяционных методов выполняется операция по восстановлению утраченных (при воздействии аддитивных шумов и помех) сегментов формантных переходов РС, как это показано на рисунке 4.

Рис. 2. Сонограмма зашумленного РС (SNR = -12 дБ) и «следы» мощных гармоник в НЧ части спектра

В работе [17] представлены результаты коррекции линий гармоник по вершинам парабол спектральных разверток. После такой коррекции даже ВЧ гармоники являются непрерывными и совпадают с точными значениями. Как показали эксперименты, предложенный метод успешно работает и в случае зашумленного сигнала при условии, что треки нескольких первых гармоник «видны» на фоне шумов (рис. 3) [14].

Рис. 4. Широкополосные сонограммы: А - сигнала с удаленными временными сегментами длительностью по 25...35 мс (пунктиром

показаны восстанавливаемые формантные переходы); Б - исходного сигнала с формантными переходами.

Экспериментально было показано [18], что интеграционные свойства механизма слухового восприятия позволяют восстановить пропущенные фрагменты формантных переходов, если длительность возникающих пауз не превышает 25.35 мс. Таким образом, кроме статических идентификационных признаков (формант) возможно восстановление динамических признаков (формантных переходов), значительно повышающих общую помехоустойчивость речи и ее разборчивость

По таким образом восстановленным спектрограммам производится синтез новой волновой формы реконструированного сигнала, избавленного от маскирующего действия искажающих шумов и помех [11, 16].

Отметим при этом, что многие из вышеперечисленных аспектов помехоустойчивости и восстановления искаженных речевых сигналов, влияющие на РР и оценку ЗРИ, не находят должного отражения в ГОСТе Р 50840-95.

Особенности формирования тестовых сигналов

Прежде всего, необходимо обратить внимание на особенности формирования тестов в виде артикуляционных таблиц неполных слогов, используемых для оценки ЗРИ.

Так, чтение слогов осуществляется дикторами ровным голосом, четко, но без подчеркивания отдельных звуков с постоянным уровнем речи, должен выдерживаться постоянный ритм речи на протяжении чтения

Таблица 1 - Слоги с высокой степенью помехоустойчивости

ба Му на ч'е Л'а па ш'а та ре й'е

ле Ва ло га ше ве ха ч'о лы ры

ра л'и ш'е ну ла ше са й'о це ч'у

й'у Мы ру ш'о Ч'и ву цы ро су ны

мо Вы го ша но ме лу хо ш'и ма

не с'и со ш'у шы й'а ка л'о л'у ко

всей таблицы: 1 слог в (3 ± 0,3) с. В этом случае, из-за чрезмерно длительных пауз, реально отсутствующих в потоке слитной речи, значительно снижается положительное влияние эффектов коартикуляции. Также практически полностью (искусственно) устраняются формантные переходы между смежными слогами и словами (присутствующие в потоке слитной речи), что в итоге существенно снижает помехоустойчивость и разборчивость изолированных слогов. В целом тесты такого вида априори имеют крайне низкую помехоустойчивость, что затрудняет их адекватное сопоставление с фразовыми тестами и, в большей степени, с потоком слитной речи.

Однако, при формировании тестов для оценки ЗРИ особенно важно учитывать помехоустойчивость слогов, отдавая предпочтение самым помехоустойчивым. Так, по результатам проведенных артикуляционных экспериментов [19] было получено 2700 реакций и составлены тестовые таблицы слогов с высокой (табл. 1), средней и низкой помехоустойчивостью. Разборчивость каждого слога рассчитывалась как процент правильного его распознавания от общего количества предъявлений слога в данном режиме.

Ниже (табл. 2) приводится средний интегральный показатель разборчивости по соответствующим тестовым слоговым таблицам с учетом разной степени помехоустойчивости элементов к аддитивному шуму.

Таблица 2 - Средний интегральный показатель разборчивости по слоговым таблицам

Вид шума Слоги с высокой помехоустойчивостью Слоги со средней по-мехоустой-чивостью Слоги с низкой по-мехоустой-чивостью

Без шума 0,98 0,97 0,95

Розовый шум 0,90 0,72 0,47

Белый шум 0,89 0,70 0,48

40%, что следует учитывать при оценках ЗРИ и эффективности применяемых методов шумоочистки, т.к. необходимо ориентироваться на потенциальные (максимальные) возможности средств и методов АР-Р.

Вторым важным аспектом формирования слоговых и фразовых тестов является неоднозначность измерений среднеквадратичной мощности (RMS) сформированных акустических сигналов, что не позволяет с должной точностью определить значения SNR смеси сигнала с шумом.

С использованием звукового редактора «Adobe Audition 1.5» были проведены измерения RMS для тестов (слог и фраза), сформированных в соответствии с требованиями ГОСТ Р 50840-95. По результатам экспериментов (табл. 3) были определены:

значения RMSj -с паузами между слогами (фразами), согласно требованиям ГОСТ;

значения RMS2 - с сокращенными до 80 мс паузами между слогами (фразами), согласно характеристикам потока слитной речи;

разница значений RMS) RMS1 и RMS2.

Таблица 3 - Значения среднеквадратичной энергии (RMS) речевых тестов

Вид Относитель- Относи- Разница

тесто- ные значения тельные значений

вого средней значения средних

сигнала энергии средней энергий

сигнала энергии тестового

(RMS1) сигнала сигнала

с паузами, дБ (RMS2) RMS= RMS1-

после RMS2, дБ

удаления

пауз, дБ

Слова -37.65 -25.61 12,04

Фразы -31.2 -25.32 5,88

По результатам аудитивного тестирования установлено, что слоговая разборчивость разработанных тестов примерно одинакова в отсутствие шумовой помехи и значительно отличается при белом или розовом шуме. В среднем шаг относительной разницы помехоустойчивости испытуемых слогов составил около 20%. Таким образом, разница в значениях разборчивости между высокопомехоустойчивыми и низкопомехоустойчивыми слогами составляет около

На основании полученных результатов можно сделать предварительный вывод, что методическая ошибка в определении значений RMS составляет около: 12 дБ - для односложных слов, и 6 дБ - для фраз.

Для корректного расчета значений SNR, применительно к потоку слитной речи, необходимо вводить соответствующие поправки или лимитировать длительность пауз тестовых сигналов согласно параметрам слитной речи.

Третьим аспектом представляется вопрос адекватного учета контекста (семантики) используемых тестов. Как правило, перед проведением разведывательных меро-

приятий (в т.ч. с использованием методов и средств АР-Р) проводится предварительный сбор первичных сведений об объекте, что позволяет в дальнейшем использовать априорную информацию (опорные словари, эталоны голосов дикторов и т.п.) при формировании базы данных и ее использовании в режиме отложенного анализа [14]. В таком случае можно ожидать существенного повышения РР. Тесты фраз, используемые в ГОСТе Р 50840-95, также содержат определенную семантику, благодаря чему контекст может оказать некоторое влияние на РР.

Уменьшить роль такого (трудноучитываемого) влияния контекста на разборчивость можно путем создания искусственных фраз, формирование которых основано на правилах русского языка, но представляется бессмысленным. Например, широко известная среди лингвистов фраза академика Л. В. Щербы: «Гло'кая куздра ште'ко будланула бо'кра и курдя'чит бокрёнка», -искусственная фраза с морфологией русского языка, в которой все корневые морфемы заменены на бессмысленные сочетания звуков.

Заключение

Поскольку показатели защищенности речевой информации должны учитывать потенциальные (максимальные) возможности средств и методов АР-Р, то исходя из вышеизложенных материалов, можно сформулировать следующие выводы и предложения по формированию тестовых сигналов, используемых для оценки ЗРИ.

Наибольшей помехоустойчивостью и, соответственно, разборчивостью, по сравнению с изолированными слогами и словами, обладают фразы, сформированные в режиме потока слитной речи. Тесты, рекомендуемые в ГОСТе Р 50840-95, не в полной мере отвечают целям и задачам оценки ЗРИ, т.к. в них утрачиваются многие значимые параметры потока слитной речи.

При формировании некоррелированных (или коррелированных) тестовых фраз потока слитной речи целесообразно использовать в качестве исходных слоги с наивысшей помехоустойчивостью.

В целях корректного определения значений RMS и SNR тестовых сигналов рекомендуется лимитировать длительность пауз между словами и фразами в пределах, адекватных характеристикам потока слитной речи.

Снижения влияния контекста на разборчивость можно достичь путем создания и вставки в тестовый сигнал искусственных фраз бессмысленного содержания, построенных на правилах русского языка.

Изложенные принципы формирования тестовых сигналов для оценки защищённости речевой информации могут заложить основы создания новых методик оценки ЗРИ с учетом потенциальных возможностей современной АР-Р.

При реализации вышеуказанных принципов значительно повышается достоверность потенциальной оценки защищенности речевых сообщений, восстанавливаемых методами цифровой шумоочистки.

Рецензент: Цирлов Валентин Леонидович, кандидат технических наук, доцент кафедры ИУ-8 «Информационная безопасность» МГТУим.НЭ.Баумана, г. Москва, Россия. E-mail: [email protected]

Литература

1. Дураковский А. П., Куницын И. В., Лаврухин Ю. Н. Контроль защищенности речевой информации в помещениях. Аттестационные

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

испытания вспомогательных технических средств и систем по требованиям безопасности информации. Учебное пособие. - М.: НИЯУ «МИФИ». - 2015. - 152 с.

2. Дураковский А.П., Куницын И.В. Оценка защищенности речевой информации. Том. Часть 1. Выявление акустических и вибрационных

каналов утечки речевой информации. Учебное пособие. - М.: НИЯУ «МИФИ». - 2015. - 52 с.

3. Сагдеев К.М., Сагдеева Е.К. Рекомендации по оценке защищенности выделенных помещений от утечки речевой информации по

акустическим и виброакустическим каналам // Международный журнал прикладных и фундаментальных исследований. № 8-3. 2015- С. 466-471

4. Куницын И.В. К вопросу оценки отношения «сигнал/шум» в ходе проведения специсследований // Защита информации. INSIDE № 1,

2018 С. 9-13.

5. Козлачков С.Б., Дворянкин С.В., Бонч-Бруевич А.М. Проблемы и перспективы защиты акустической речевой информации //

Специальная техника. 2016. №6 С. 22-29.

6. Гуляев В.П. Экспериментальные исследования и анализ алгоритмов шумоочистки при многоканальном ведении акустической

речевой разведки. Часть 1. // Национальная ассоциация ученых (НАУ) №3 (8), 2015 С. 48-52

7. Гуляев В.П. Экспериментальные исследования и анализ алгоритмов шумоочистки при многоканальном ведении акустической

речевой разведки. Часть 2. // Национальная ассоциация ученых (НАУ) №3 (8), 2015 С. 52-57

8. Лобанова М.А., Сазанов В.В. Программный модуль шумоочистки и повышения разборчивости фонограмм низкого качества //

Речевые технологии. 2013. №3-4 С. 143-149

9. Архипов А., Безымянная Е. Оценка эффективности зашумления речевого сигнала / Александр Архипов, Екатерина Безымянная //

Правове, нормативне та метролопчне забезпечення системи захисту шформацп в Укра!'ш: науково-техшчний збiрник. Вип. 2(28), 2014. С. 37-41.

10. Тупицин Г.С. Предобработка зашумленных речевых сигналов с помощью бинарных масок в задаче идентификации диктора //

Журнал Наукоемкие технологии №11, 2015 г. С. 56-61

11. Столбов М.Б., Зубов Г.Н. Программные средства шумоочистки записей речи // Речевые технологии №1-2, 2014. С. 103-113.

12. Daniel Fogerty and Larry E. Humes (2012). The role of vowel and consonant fundamental frequency, envelope, and temporal fine structure

eues to the intelligibility of words and sentences // J. Acoustical Society of America. 2012. PACS number(s): 43.71.Gv, 43.71.Es [MSS] Pages: 1490-1501

13. Pierre Divenyi (2009). Perception of complete and incomplete formant transitions in vowels // J. Acoustical Society of America. 2009. PACS

number(s): 43.71.Es, 43.66.Lj, 43.71.An [RSN] Pages: 1427-1439

14. Козлачков С.Б., Дворянкин С.В., Бонч-Бруевич А.М. Ограничения формантной теории разборчивости речи в приложениях защиты

речевой информации // Вопросы кибербезопасности №5(18) - 2016, с. 28-35.

15. Потапова Р.К., Потапов В.В. Речевая коммуникация: От звука к высказыванию. - М.: Языки славянских культур, 2012. - 464 с.

16. Дворянкин С.В., Михайлов Д.М., Панфилов Л.А., Козлачков С.Б., Бонч-Бруевич А.М., Насенков И.Г. Интерпретация и контурный анализ

спектрограмм звуковых сигналов в процессе их шумоочистки // Проблемы информационной безопасности. Компьютерные системы. 2015. №3. С. 88-99.

17. Дворянкин С.В., Алюшин В.М. Метод реконструкции гармонической структуры спектральных описаний искаженной шумами и

помехами речи. М: Известия института инженерной физики. 2013. Т. 2. № 28. С. 57-62.

18. Козлачков С.Б., Дворянкин С.В., Бонч-Бруевич А.М., Василевская Н.В., Селенина А.Л. Некоторые особенности формирования акустоэлектрического канала утечки речевой акустической информации // Безопасность информационных технологий. 2017 г., №4 С. 7-18.

19. Крейчи С.А., Кривнова О.Ф., Тихонова Е.А. Помехоустойчивость слоговых таблиц при восприятии речи в шуме // Речевые технологии. 2017. №1-2 С. 25-36

PRINCIPLES OF FORMING TEST SPEECH SIGNALS IN ASSESSING THE EFFICIENCY OF NOISE REDUCTION

TECHNOLOGIES

Kozlachkov S. B.5, Dvoryankin S. V.6, Bonch-Bruevich A. M.7

Abstract.

The purpose of the article is to identify certain inconsistencies in the methods of articulatory measurements (tests) used to evaluate the security of acoustic speech information and in modern methods of conducting acoustic speech reconnaissance. Method: a complex theoretical-applied analysis of the results of experiments to improve the intelligibility of speech signals distorted by noise and interference. Results: Distinctive features of the mechanisms of formation of the stream of merged speech that significantly affect the noise immunity of speech messages are determined. Important aspects of determining the effectiveness of modern noise reduction technologies that can be used along with other instruments and methods of conducting acoustic speech reconnaissance are revealed. A brief review of the main features of noise reduction and signal reconstruction methods used to improve the quality of speech signals distorted by noise and interference is given. The universal principles of signal processing used in the procedures for reconstructing distorted voice messages are demonstrated, and they are realized in mechanisms of increasing noise immunity of speech. Additional requirements for the adequate choice and formation of test speech tests and the nature of their application are formulated. Some basic limitations of existing GOSTs in applications for assessing the security of acoustic speech information are indicated.

Keywords: acoustic speech intelligence, noise immunity, phonemes, protection of speech information, speech intelligibility, speech signal.

References

1. Durakovskii' A. P., Kunitcy'n I. V., Lavruhin lu. N. Kontrol' zashchishchennosti rechevoi' informatcii v pomeshcheniiakh. Attestatcionny'e ispy'taniia vspomogatel'ny'kh tekhnicheskikh sredstv i sistem po trebovaniiam bezopasnosti informatcii. Uchebnoe posobie. - M.: NIIAU «MIFI». - 2015. - 152 s.

2. DurakovskiP A.P., Kunitcy'n I.V. Ocenka zashchishchennosti rechevoP informatcii. Tom. Chast' 1. Vy'iavlenie akusticheskikh i vibratcionny'kh kanalov utechki rechevoi' informatcii. Uchebnoe posobie. - M.: NIIAU «MIFI». - 2015. - 52 s.

3. Sagdeev K.M., Sagdeeva E.K. Rekomendatcii po ocenke zashchishchennosti vy'delenny'kh pomeshchenii' ot utechki rechevoi' informatcii po akusticheskim i vibroakusticheskim kanalam // Mezhdunarodny'i' zhurnal pricladny'kh i fundamental'ny'kh issledovanii'. № 8-3. 2015- S. 466-471

4. Kunitcy'n I.V. K voprosu ocenki otnosheniia «signal/shum» v hode provedeniia spetcissledovanii' // Zashchita informatcii. INSIDE № 1, 2018 S. 9-13.

5. Kozlachkov S.B., Dvoriankin S.V., Bonch-Bruevich A.M. Problemy' i perspektivy' zashchity' akusticheskoi' rechevoi' informatcii // Spetcial'naia tekhnika. 2016. №6 S. 22-29.

6. Guliaev V.P. E'ksperimental'ny'e issledovaniia i analiz algoritmov shumoochistki pri mnogokanal'nom vedenii akusticheskoi' rechevoi' razvedki. Chast' 1. // Natcional'naia assotciatciia ucheny'kh (NAU) №3 (8), 2015 S. 48-52

7. Guliaev V.P. E'ksperimental'ny'e issledovaniia i analiz algoritmov shumoochistki pri mnogokanal'nom vedenii akusticheskoi' rechevoi' razvedki. Chast' 2. // Natcional'naia assotciatciia ucheny'kh (NAU) №3 (8), 2015 S. 52-57

8. Lobanova M.A., Sazanov V.V. Programmny'i' modul' shumoochistki i povy'sheniia razborchivosti fonogramm nizkogo kachestva // Rechevy'e tekhnologii. 2013. №3-4 S. 143-149

9. Arhipov A., Bezy'miannaia E. Ocenka e'ffektivnosti zashumleniia rechevogo signala / Alexander Arhipov, Ekaterina Bezy'miannaia // Pravove, normativne ta metrologichne zabezpechennia sistemi zahistu informatciï v Ukraïni: naukovo-tekhnichnii' zbirnik. Vip. 2(28), 2014. S. 37-41.

5 Sergei Kozlachkov, PhD, Assistant Professor of IU-10 chair BMSTU, Moscow, Russia. E-mail: [email protected]

6 Sergey Dvoryankin, PhD, Professor, professor of the Department "Information Security" Financial University under the Government of

the Russian Federation, Moscow, Russia. E-mail: [email protected]

7 Andrew Bonch-Bruevich, Ph.D., Assistant Professor of IU-10 chair BMSTU, Moscow, Russia. E-mail: [email protected]

10. Tupitcin G.S. Predobrabotka zashumlenny'kh rechevy'kh signalov s pomoshch'iu binarny'kh masok v zadache identifikatcii diktora // Zhurnal Naukoemkie tekhnologii №11, 2015 g. S. 56-61

11. Stolbov M.B., Zubov G.N. Programmny'e sredstva shumoochistki zapisei' rechi // Rechevy'e tekhnologii №1-2, 2014. S. 103-113.

12. Daniel Fogerty and Larry E. Humes (2012). The role of vowel and consonant fundamental frequency, envelope, and temporal fine structure cues to the intelligibility of words and sentences // J. Acoustical Society of America. 2012. PACS number(s): 43.71.Gv, 43.71.Es [MSS] Pages: 1490-1501

13. Pierre Divenyi (2009). Perception of complete and incomplete formant transitions in vowels // J. Acoustical Society of America. 2009. PACS number(s): 43.71.Es, 43.66.Lj, 43.71.An [RSN] Pages: 1427-1439

14. Kozlachkov S.B., Dvoriankin S.V., Bonch-Bruevich A.M. Ogranicheniia formantnoi' teorii razborchivosti rechi v prilozheniiakh zashchity' rechevoi' informatcii // Voprosy' kiberbezopasnosti №5(18) - 2016, s. 28-35.

15. Potapova R.K., Potapov V.V. Rechevaia kommunikatciia: Ot zvuka k vy'skazy'vaniiu. - M.: lazy'ki slavianskikh kul'tur, 2012. - 464 s.

16. Dvoriankin S.V., Mihai'lov D.M., Panfilov L.A., Kozlachkov S.B., Bonch-Bruevich A.M., Nasenkov I.G. Interpretatciia i konturny'i' analiz spektrogramm zvukovy'kh signalov v protcesse ikh shumoochistki // Problemy' informatcionnoi' bezopasnosti. Komp'iuterny'e sistemy'. 2015. №3. S. 88-99.

17. Dvoriankin S.V., Aliushin V.M. Metod rekonstruktcii garmonicheskoi' struktury' spektral'ny'kh opisanii' iskazhennoi' shumami i pomehami rechi. M: Izvestiia instituta inzhenernoi' fiziki. 2013. T. 2. № 28. S. 57-62.

18. Kozlachkov S.B., Dvoriankin S.V., Bonch-Bruevich A.M., Vasilevskaia N.V., Selenina A.L. Nekotory'e osobennosti formirovaniia akustoe'lektricheskogo kanala utechki rechevoi' akusticheskoi' informatcii // Bezopasnost' informatcionny'kh tekhnologii'. 2017 g., №4 S. 7-18.

19. Krei'chi S.A., Krivnova O.F., Tihonova E.A. Pomehoustoi'chivost' slogovy'kh tablitc pri vospriiatii rechi v shume // Rechevy'e tekhnologii. 2017. №1-2 S. 25-36

i Надоели баннеры? Вы всегда можете отключить рекламу.