Научная статья на тему 'Ограничения формантной теории разборчивости речи в приложениях защиты речевой информации'

Ограничения формантной теории разборчивости речи в приложениях защиты речевой информации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
890
179
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АКУСТИЧЕСКАЯ РЕЧЕВАЯ РАЗВЕДКА / ФОРМАНТЫ / ФОНЕМЫ / РЕЧЕВОЙ СИГНАЛ / СЕМАНТИЧЕСКИЙ КОД / ACOUSTIC INTELLIGENCE / FORMANTS / PHONEMES / INFORMATION SECURITY / SPEECH RECOGNITION / SPEECH / SEMANTIC CODE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Козлачков Сергей Борисович, Дворянкин Сергей Владимирович, Бонч-бруевич Андрей Михайлович

В статье рассмотрены актуальные проблемы действующих методик оценки защищенности акустической речевой информации. Перечислены новые и перспективные технологии и методы ведения акустической речевой разведки, использующие достижения компьютерных, речевых и других современных технологий, которые из-за сложности формализованного представления не смогли найти должного отражения в действующих методиках и других руководящих документах. Показаны основные несоответствия и противоречия практического применения современной теории разборчивости речи в приложениях обеспечения защищенности речевой информации, сформулированные отечественными и зарубежными специалистами. Выполнен анализ результатов некоторых экспериментальных исследований, не нашедших адекватных ответов с позиций формантной теории разборчивости речи, рассмотрены парадоксы распознавания речи, выявленные в ходе экспериментов. Перечислены коренные отличия процессов восприятия и распознавания потока слитной речи и печатных текстов. Указаны случаи подмены понятий, используемых в методах оценки защищенности, и вытекающие из этого факта логические ошибки расчета соответствующих весовых коэффициентов. Предложено рассматривать процессы слухового восприятия и речеобразования через критерии повышения помехоустойчивости речевых сообщений и сигналов. В заключении сформулированы предложения по совершенствованию действующих методик оценки защищенности акустической речевой информации и указаны ограничения модуляционных методов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Козлачков Сергей Борисович, Дворянкин Сергей Владимирович, Бонч-бруевич Андрей Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Restrictions Formant Theory of Speech Intelligibility in Speech Applications, Information Security

The article deals with actual problems of existing evaluations of acoustic data protection methods. A number of methods of using the achievements of modern computer technology and speech due to the complexity of formalized representation are not represented in the existing procedures and other governing documents. The article deals the basic contradictions of the practical application of the modern theory of speech intelligibility in applications to ensure data protection. The article made the analysis of experimental results that contradict the theory of formant intelligibility. The article deals the main differences between the processes of perception and speech recognition, and printed texts. Also the cases of substitution of the concepts used in the methods of the security assessment and calculation mistakes weighting factors. The article is proposed to consider the processes of auditory perception and speech production through Criteria improve the noise immunity of voice messages and signals. Finally, the article proposals on improvement of existing methods of acoustic speech information security assessment.

Текст научной работы на тему «Ограничения формантной теории разборчивости речи в приложениях защиты речевой информации»

I ОГРАНИЧЕНИЯ ФОРМАНТНОЙ ТЕОРИИ РАЗБОРЧИВОСТИ РЕЧИ В ПРИЛОЖЕНИЯХ ЗАЩИТЫ РЕЧЕВОЙ ИНФОРМАЦИИ

Козлачков С.Б.1, Дворянкин С.В.2, Бонч-Бруевич А.М.3

В статье рассмотрены актуальные проблемы действующих методик оценки защищенности акустической речевой информации. Перечислены новые и перспективные технологии и методы ведения акустической речевой разведки, использующие достижения компьютерных, речевых и других современных технологий, которые из-за сложности формализованного представления не смогли найти должного отражения в действующих методиках и других руководящих документах. Показаны основные несоответствия и противоречия практического применения современной теории разборчивости речи в приложениях обеспечения защищенности речевой информации, сформулированные отечественными и зарубежными специалистами. Выполнен анализ результатов некоторых экспериментальных исследований, не нашедших адекватных ответов с позиций формантной теории разборчивости речи, рассмотрены парадоксы распознавания речи, выявленные в ходе экспериментов.

Перечислены коренные отличия процессов восприятия и распознавания потока слитной речи и печатных текстов. Указаны случаи подмены понятий, используемых в методах оценки защищенности, и вытекающие из этого факта логические ошибки расчета соответствующих весовых коэффициентов.

Предложено рассматривать процессы слухового восприятия и речеобразования через критерии повышения помехоустойчивости речевых сообщений и сигналов.

В заключении сформулированы предложения по совершенствованию действующих методик оценки защищенности акустической речевой информации и указаны ограничения модуляционных методов.

Ключевые слова: акустическая речевая разведка, форманты, фонемы, речевой сигнал, семантический код.

DOI:10.21581/2311-3456-2016-5-28-35

Введение

В течение многих лет специалисты по защите акустической речевой информации (РИ) обсуждают вопросы и ограничения применения форматной теории разборчивости речи (РР) и соответствующих методик оценки защищенности речевой информации (ЗРИ) [1-8]. При этом некоторые ученые выражают сомнения в адекватности основных положений форматной теории [9-12] и предлагают рассматривать иные математические модели описаний речевых сигналов (РС) и механизмов их восприятия [13]. Сложность использования методик, базирующихся на формантной теории, возникает при оценке ЗРИ в случаях использования злоумышленниками (при несанкционированном доступе к защищаемой информации) современных методов восстановления РС, искаженных шумами и помехами [1, 2].

Одной из основных проблем при оценке ЗРИ является сложность объективного учета новых и перспективных технологий и методов ведения акустической речевой разведки (АРР). Современ-

ные разведывательные технологии, объединенные термином МАСИНТ (MASINT - Measurement And Signature INTelligence), включают в себя комплексный, глобальный, непрерывный характер ведения разведки; измерение и регистрацию сигнатур изучаемых объектов, а также формирование интегрированных баз данных и эталонов. Достижения современных коммуникационных и компьютерных технологий позволяют: получать и использовать априорные данные об изучаемом объекте; создавать базы голосовых данных на основе собранных эталонов РС; осуществлять длительную регистрацию и многократное прослушивание записанных РС; использовать режим отложенного анализа РС и проводить сопоставление с другими данными, полученными из иных источников; применять процедуры восстановления и реконструкции РС, искаженных шумами и помехами (процедуры шумоочистки); формировать тематические словари; проводить лингвистический анализ и контекстное восстановление семантики перехваченных сообщений и т.д.

1 Козлачков Сергей Борисович, кандидат технических наук, МГТУ им.Н.Э.Баумана, [email protected]

2 Дворянкин Сергей Владимирович, доктор технических наук, профессор. Финансовый университет при Правительстве Российской Федерации., [email protected]

3 Бонч-Бруевич Андрей Михайлович, кандидат технических наук, МГТУ им.Н.Э.Баумана, [email protected]

Принципиальным отличием процедур АРР от методик оценки защищенности РИ является использование записанных (вторичных) РС и возможность комплексной обработки РИ, в то время как оценка ЗРИ выполняется непосредственно путем прямого измерения первичных параметров тестовых сигналов, т.е. без учета новых возможностей АРР.

В настоящее время большинство из вышеперечисленных аспектов АРР не формализованы, и не могут найти должного отражения в рамках действующих методик.

К вышеуказанным факторам необходимо также добавить выявленные зарубежными учеными явные несоответствия и ошибки, действующей в настоящее время методики оценки ЗРИ, разработанной Б.Н. Покровским [4-6].

Несоответствия отечественных версий формантного метода определения РР

Так, по результатам ряда работ выявлено, что при определении характера зависимости коэффициента эффективного восприятия формант Р(Е,) от относительного уровня интенсивности формант Б.Н. Покровский для упрощения вычислений предложил пренебречь ее частотной зависимостью [4], а также высказал неподтвержденную гипотезу о том, что функция P(Ei) обладает центральной симметричностью относительно уровня E¡ =0 дБ. В ряде работ [4-6, 14] показано, что наиболее вероятная причина выдвижения гипотезы о центральной симметричности этой функции -неверная организация Б.Н. Покровским экспериментальных исследований. Также зарубежными учеными был выявлен иной характер частотной зависимости Р(Е) в соответствующих i-х октавных полосах [14-16]. Соответственно такая частотная зависимость проявляется и при определении разницы между спектрами РС и формант, что является одним из базовых элементов формантной теории.

Другими проведенными исследованиями установлено, что величина РР значительно возрастает, если реципиенту дается возможность сравнения перехваченных РС с заранее заданным тематическим словарем [17-19], что является одной из характерных особенностей современных технологий АРР.

Несоответствия формантной теории

Значительное количество несоответствий выявлено и при анализе основных положений формантной теории в целом. Так, рядом исследователей отмечено, что само понятие формант является неоднозначным [20]. Некоторые ученые, понимают под формантой полюса (максимумы) коэффи-

циента передачи речеобразующего тракта, который показывает степень затухания звуковой волны на различных частотах, когда колебательная волна проходит через речеобразующий тракт. Другие ученые, в частности профессор Л.В. Злато-устова [20], считают, что частота формант - это частота максимумов спектра речи [21]. В отдельных исследованиях отмечено, что первичной целью в формировании РС скорее является общая форма спектра [10, 11].

Результаты экспериментов по восстановлению искаженной шумами речи, а также ряда других исследований [13, 22] убедительно показывают, что амплитудная спектральная плотность мощности фонем и её соотношение в равноартикуляцион-ных полосах не является единственно определяющим параметром при идентификации информационной составляющей РС. Более того, утверждается, что форманты являются не основным речевым параметром, а только способом реализации совершенного другого рода характеристик речи [10, 11]. При этом ведущим в формировании акустической структуры речи становится уже не процесс речеобразования, а, скорее, механизм речевосприятия [10, 11], что подтверждается высказыванием Н. Винера: «Речь является совместной игрой говорящего и слушающего против сил, вызывающих беспорядок».

Современными исследователями [10, 11, 22] также отмечалось, что: в высокочастотной области распределение вероятности появления максимума в спектре РС имеет практически равномерный характер и выделение формантных областей невозможно; диктор, генерируя звук с фиксированным положением первых трех спектральных максимумов, не контролирует структуру высокочастотной части спектра; в реальном РС зачастую наблюдается появление лишних максимумов спектра, расщепление максимумов на месте расположения форманты в идеальном варианте, а также исчезновение классических формантных максимумов.

На основании этих фактов была сформулирована гипотеза, что целью процесса формирования РС является общая форма его спектра, а форманты служат лишь способом её реализации и являются продуктом акустического механизма процесса ре-чеобразования [10, 11].

Кроме того, с позиций формантной теории трудно найти объяснения следующим общеизвестным фактам. Амплитудные и фазовые нелинейные искажения РС (до 20...30%) практически не влияют на разборчивость слов [22]. Даже пол-

а)

б)

Рис.1. Зависимость: а - слоговой разборчивости 5 от интегрального индекса артикуляции речи Я, б - словесной разборчивости Ж от разборчивости слогов 5.

ное удаление из РС одной либо двух формант влияет только на тембр звука, однако словесная разборчивость остается высокой. Ларингофоны, которые используются на объектах с большим уровнем акустических помех (танки, вертолеты и т.п.), практически исключают передачу формантных максимумов артикуляционного фильтра, но при этом обеспечивают приемлемый уровень разборчивости. С другой стороны, при шёпотной речи, в которой гласные фонемы синтезируются без участия голосовых связок (т.е. без вокализации), в качестве сигнала основного тона (ОТ) выступает турбулентный шум. При этом из процесса речео-бразования исключаются колебания голосовых связок, формирующих амплитудную компоненту РС, но сохраняется почти 100% разборчивость слов [22].

Глубокое клиппирование (амплитудное ограничение) РС влияет на тембр звука и также не приводит к заметному ухудшению разборчивости, а при определенных условиях даже способствует повышению разборчивости [24].

Противоречия формантной теории и результатов экспериментальных исследований

В настоящее время, при оценке ЗРИ, в основном используются различные версии формантного метода, среди которых наибольшее распространение получили версии Н.Б. Покровского и М.А. Сапожкова [4]. Однако результаты измерений по этим методикам не могут объяснить следующий парадокс. В соответствии с методикой Б.Н. Покровского [18], используемой для оценки ЗРИ, определено, что в полосе частот 100...570 Гц содержится не более 10% артикуляционной (R) разборчивости РС. В этом случае, согласно экспериментальным данным, слоговая и словесная разборчивости (W) русской речи составляют менее 10% (см. рис. 1). При этом действующими показателями ЗРИ определено, что при W <10% невозможно определить не только предмет переговоров, но даже сам факт их ведения.

Действительно, в соответствии с положениями формантной теории в заданном диапазоне частот (см. таблицу) в лучшем случае содержится только

Таблица

Канонические значения формантных частот (Fi) гласных звуков, герц

Звук F1, Гц Fl, Гц F3, Гц

А 600 1200 2400

Э 450 1700 2500

О 450 800 2500

У 350 750 2200

Ы 300 1800 2450

И 300 2200 3000

Е 400 1850 2600

Я 450 1500 2450

Рис. 2. Графическая сонограмма фразы «Встречаемость гласных - встречаемость согласных»: 1 - треки вокализованных сегментов РС, 2 - треки невокализованных (шумоподобных) сегментов РС

одна форманта гласных или согласных звуков, что считается явно недостаточным для их успешного распознавания.

Однако экспериментально установлено, при фильтрации РС в вышеуказанной полосе частот, что остаточная словесная РР (Ж) составляет более 60% [25].

В этом случае парадокс заключается в том, что информативность РС сохраняется при остром дефиците основных информативных элементов

- формант. Иллюстрацией этого эффекта служат: рисунок 2, на котором представлена графическая сонограмма фразы: «Встречаемость гласных

- встречаемость согласных»; и рисунок 3 - соно-грамма этой же фразы после ее фильтрации в полосе частот 100.. .570 Гц.

Здесь, и далее на других графических спектрограммах, по оси абсцисс отложено время, по оси ординат - частота. В уровнях серого цвета указана мощность РС на данной частоте в данный момент времени: наибольшие значения показаны - черным цветом, наименьшие - белым.

На сонограмме (рис. 4) можно визуально выделить лишь 3-4 трека (характерные следы фоно-объектов) первой форманты - вокализованные сегменты РС с признаками частотной и амплитудной модуляции. Следует отметить, что в данной полосе частот именно вокализованные сегменты

составляют большую часть объема сообщения.

Совокупность вышеприведенных фактов противоречит базовым положениям принятых теорий, что вызывает обоснованные сомнения в адекватности как действующих методик оценки защищенности РИ, так и отдельных положений формантной теории.

Отличия разборчивости речи и текста.

Одним из основных базисов форматной теории является форматный спектр речи, определяемый в виде дифференциального и интегрального распределений артикуляционных значений. Принято считать, что интегральный индекс артикуляции речи (Л) зависит от вероятности появления формант (к7) в заданной 7-й полосе частот и от уровня эффективного восприятия формант (Р7(Е)):

N

Я = X Е )к

1=\

В таком подходе усматривается подмена понятий: вместо анализа цельных звуков речи (фонем) используются их частные параметры (форманты). Как известно при дешифровке и восстановлении искаженных текстов также используются вероятностные подходы. Например, с помощью статистических методов определяется частота встречаемости знаков, а также их возможных сочетаний. Однако в формантных методах вместо частоты

Рис. 3. Графическая сонограмма фразы «Встречаемость гласных - встречаемость согласных», отфильтрованная в полосе частот 100...570 Гц, 1 - треки вокализованных сегментов РС

Рис. 4. Графическая сонограмма фразы «Мкртчян»

встречаемости фонем (звуков) учитывается встречаемость формант. Всего в русском языке насчитывается 41 (43) фонема: 6 гласных звуков - а, о, у, э, и, ы (встречаемость 42%), сонорные согласные - м, н, л, р (твердые и мягкие), а также звук й (суммарная встречаемость сонорных - около 19%). В целом (по разным источникам) итоговая встречаемость в речи указанных 11-ти вокализованных звуков и специфических вокализованных звукосочетаний - я, е, ё, ю составляет от 48 до 61%. Следовательно, 15 (включая - я, е, ё, ю) вокализованных звуков (36% из общего числа фонем) имеют более высокую встречаемость, чем невокализо-ванные (согласные). Несложно рассчитать, что на 1% вокализованных звуков в среднем приходится 1,3.2% встречаемости, а на 1% невокализован-ных - 0,6.0,8% встречаемости.

Рассмотрим графическую сонограмму фразы «Встречаемость гласных - встречаемость согласных», приведенную на рисунке 4. Визуальный анализ этой сонограммы позволяет сделать следующие выводы: объем вокализованных сегментов РС намного превышает объем невокализованных сегментов РС; большая часть энергетики вокализованных сегментов содержится в низкочастотных областях (200.600 Гц); по мере повышения частоты удельный вес вокализованных сегментов РС снижается, а невокализованных - возрастает.

В связи с этим уместно более детально исследовать влияние вокализованных сегментов на семантику РС. В тексте принято различать гласные и согласные буквы, а информативность содержания определяется согласными, представляющими относительное и абсолютное большинство по сравнению с гласными. Однако, в РС звуки целесообразно делить по их сигнальной структуре: на вокализованные (в т.ч. сонорные), имеющие гар-

моническую структуру, и невокализованные - шу-моподобные. При этом, как было показано выше, удельный информативный вес вокализованных в 2.3 раза превышает информативность невокализованных звуков.

В качестве дополнительной иллюстрации этого эффекта рассмотрим слово «Мкртчян», сонограм-ма которого приведена на рисунке 4.

Анализ текста данного слова показывает, что доля гласного знака («я») составляет около 14% и восстановление текста после удаления согласных - невозможно. Однако, на сонограмме мы наблюдаем отчетливые следы пяти вокализованных сегментов, совокупная доля которых превышает 70% информативности (звучания) слова «Мкртчян», что позволяет успешно провести восстановление даже после удаления невокализованных сегментов.

Следует обратить внимание на еще одну подмену понятий. Формирование полос равной разборчивости основывается на формантных характеристиках РС - частоте встречаемости формант. Поскольку 26 невокализованных фонем (звуков) характеризуются относительно большим числом формант, чем вокализованные, считается, что их удельный вес по данному параметру намного выше, чем у вокализованных. Так невокализованные звуки характеризуются (распознаются) 3.4 формантами, а вокализованные - 1.2 формантами. Этим в частности обусловлены значения весовых коэффициентов к1 соответствующих октавных полос. Так принято считать, что в октаве со среднегеометрической частотой 2000 Гц содержится около 30% информативности РС. Однако, с точки зрения процесса восстановления искаженного сигнала вероятность распознавания вокализованных звуков выше, чем невокализованных, поскольку для этого требуется меньшее количество

формант! В таком случае весовые коэффициенты (кО вокализованных звуков должны быть не меньше, а больше чем у невокализованных.

Сегодня в речевых технологиях используются различные математические модели РС: основанные на линейном или нелинейном предсказании, полигармонические, полигармонические с шумовой составляющей, основанные на модуляционной теории и др. [13, 24]. В приложениях ЗРИ целесообразно рассматривать модели, определяющие семантику РС в условиях воздействия помех. В РС различают три основных типа переносчиков информации: тональный, с помощью которого передаются звонкие звуки речи; шумовой, с помощью которого передаются глухие звуки речи; импульсный, с помощью которого передаются взрывные звуки речи [13, 24]. Передача информации осуществляется путем модуляции определенных параметров каждого из указанных переносчиков [13]. Наибольшим числом видов модуляции, и, как следствие, наибольшей информационной емкостью, обладает тональный переносчик, а наименьшей - импульсный.

При этом экспериментально установлено, что дифференциальные пороги модуляции (ощущаемые слухом минимальные изменения интенсивности звука) для тональных (в т.ч. вокализованных) сигналов в 2.4 раза меньше, чем для шумовых (невокализованных) сигналов [26]. Важным следствием этого свойства тональных (вокализованных) сигналов является их более высокая, по сравнению с шумовыми составляющими, помехоустойчивость, что, несомненно, не может быть проигнорировано при определении соответствующих весовых коэффициентов.

Ввиду представленных выше несоответствий и противоречий представляется закономерным, что один из основоположников формантной теории разборчивости речи [27] утверждал, что

перспективы развития речевых технологий связаны с исследованиями свойств речевого кода (семантического кода речи). Это мнение полностью совпадает и с выводами отечественных ученых, предложивших иную (неформантную) модель РС, основанную на изменениях спектральной огибающей РС [9]. В таком случае приходится признать, что семантика РС (т.е. основной объект защиты РИ) определяется не только соотношением формант, но также иными параметрами речевого кода.

Заключение

Анализ вышеуказанных несоответствий форматных методов оценки ЗРИ, противоречий отдельных положений формантной теории РР и результатов экспериментальных исследований позволяет сделать следующие выводы.

1. Современные методы и способы ведения АРР, основанные на обработке вторичных сигналов, принципиально не могут найти адекватного учета в рамках действующих методик оценки ЗРИ.

2. Действующие методики не обеспечивают должной достоверности оценок ЗРИ. Новые методики оценки ЗРИ должны адекватно учитывать перспективные возможности методов ведения АРР, в т.ч. различные процедуры и алгоритмы обработки записанного (вторичного) РС, повышающие его качество.

3. Формантная теория РР не может далее служить единственной, базовой теоретической основой при разработке новых методик оценок ЗРИ.

4. Для разработки новых методик оценки ЗРИ необходимо исследовать и рассмотреть иные модели и описания РС, учитывающие их помехоустойчивость, в том числе основанные на свойствах фонетической функции [9] и семантического кода речи.

5. При разработке новых методик оценки ЗРИ следует учитывать, что модуляционные методы оценки имеют существенные ограничения по динамическим характеристикам [28].

Рецензент: Цирлов Валентин Леонидович, кандидат технических наук, доцент кафедры ИУ-8 МГТУ им.Н.Э.Баумана, [email protected]

Литература

1. Каргашин В. Л. Совершенствование методических принципов оценки защищенности помещений от утечки речевой информации//Специальная техника, 2001, № 6. С. 43-49.

2. Дворянкин С.В., Алюшин В.М. Восстановление гармонической структуры искаженных речевых вокализмов посредством цифровой обработки изображений динамических спектрограмм. // Безопасность информационных технологий. 2013. № 3. С. 41-49.

3. Моделирование и генерация сигналов речевых вокализмов в приложениях оценки защищенности речевой информации / С.В. Дворянкин [и др.] // Проектирование и технология электронных средств. 2007. №4. С. 33-37.

4. Гавриленко А.В., Дидковский В.С., Продеус А.Н. Сравнительный анализ некоторых методов оценки разборчивости речи // Консонанс-2007: Акустический международный симпозиум. Киев, 2007. С. 54-65.

5. Гавриленко О.В., Дидковский В.С., Продеус А.Н. Расчет и измерение разборчивости речи при малых отношениях сигнал-шум. Часть 1. Корректное измерение функции распределения речевого сигнала // Электроника и связь. 2007. Проблемы электроники, тематический выпуск, ч.1. С. 137-141.

6. Гавриленко О.В., Дидковский В.С., Продеус А.Н. Расчет и измерение разборчивости речи при малых отношениях сигнал-шум. Часть 2. Коррекция коэффициентов восприятия // Электроника и связь. 2007. Проблемы электроники, тематический выпуск, ч.1. С. 142-147.

7. Журавлёв В.Н., Архипова Е.А. Анализ метода расчета параметра эффективности маскирования речи в технических каналах утечки // Радюелектроыка, шформатика, управлЫня. 2007. № 15. С. 57-64.

8. Журавлёв В.Н., Архипова Е.А., Метод экспериментального анализа функции эффективности маскирования речи // Вестник Винницкого политехнического института. 2009. № 1. С. 67-71.

9. А.Ш. Акбулатов, С.П. Баронин, В.И. Куля, Р.Д. Лейтес, В.Е. Муравьев, А.А. Пирогов, Г.С. Слуцкер, В.Н. Соболев, Ю.К. Трофимов Вокодерная телефония. Методы и проблемы. Под ред. А.А. Пирогова. — М., «Связь», 1974, 536 с. с ил.

10. Галунов В.И. Помехоустойчивость как системообразующий фактор речи // Проблемы и методы экспериментально-фонетических исследований. СПб., 2002. С. 205-300.

11. Галунов В.И., Гарбарук В.И. Акустическая теория речеобразования и системы фонетических признаков // 100 лет экспериментальной фонетике в России. Материалы международной конференции. СПб., 2001. С. 58-62.

12. Продеус А.Н. О некоторых особенностях развития объективных методов измерений разборчивости речи // Электроника и связь. 2010. №2. Тематический выпуск Электроника и нанотехнологии. С.217-223.

13. Голубинский А.Н. Методика вычисления информационной составляющей речевого сигнала // Охрана, безопасность и связь - 2009: Сборник материалов Всероссийской научно-практической конференции. Воронеж, 2010. С. 37-41.

14. Дидковский В.С., Продеус А.Н., Рудь Д.П. О точности измерений функции распределения уровней речевого сигнала // Электроника и связь. 2010. №3 (56). С. 152-159. (Тематический выпуск Электроника и нанотехнологии).

15. Гавриленко О.В., Дидковский В.С., Продеус А.Н. Сопоставление версий формантного метода оценки разборчивости речи // Электроника и связь. 2007. Проблемы электроники, тематический выпуск, ч.1. С. 227-230.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

16. Дидковский В.С., Продеус А.Н. Сопоставление формантных свойств украинской и русской речи // Электроника и связь. 2009. №4-5. С. 88-94. (Тематический выпуск Электроника и нанотехнологии, ч. 2,).

17. О достоверности оценки защищенности речевой информации от утечки по техническим каналам / А.П. Бацула [и др.] // Доклады ТУСУРа/2010. № 1 (21), часть 1, июнь. С. 89-92.

18. Покровский Н. Б. Расчет и измерение разборчивости речи. — М.: Связьиздат, 1962. 392 с.

19. Рашевский Я.И., Каргашин В.Л. Обзор зарубежных методов определения разборчивости речи // Специальная техника. 2002. № 4. С. 37-46

20. Михайлов В.Г., Златоустова Л.В. Измерение параметров речи / Под ред. М.А. Сапожкова. — М.: Радио и связь, 1987. 168 с.

21. Григорьев Е.И., Тычинина В.М. Звуки речи и их коммуникативная функция: Учебное пособие для студентов филологических специальностей, аспирантов и преподавателей. Тамбов: ТГУ им. Г.Р. Державина, 2006. 84 с.

22. Журавлев В.Н., Архипова А.Е. Анализ противоречий теорий речеобразования и слуха с позиции идентификации информационных параметров и характеристик речевых сигналов // Информационные технологии и компьютерная инженерия №2(9), Винница, 2007, С. 180-185.

23. Алдошина И.А. Основы психоакустики. Подборка статей с сайта -http://www.625-net.ru.

24. Ролдугин С.В. Голубинский А.Н., Вольская Т.А. Модели речевых сигналов для идентификации личности по голосу // Радиотехника. 2002. № 11. С. 79-81.

25. Мишуков А.А. Моделирование процессов управления речевой разборчивостью в многоканальных системах конфиденциальной голосовой связи: диссертация канд. техн. наук: 05.13.18, 05.13.19 / А.А.Мишуков. - Воронеж, 2012. - с. 152

26. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации. Перевод с немецкого под редакцией Б.Г.Белкина. — М., «Связь», 1971. 255 с. с илл.

27. Фант Г. Полвека в исследованиях фонетики и речи. Фонетика 2000, Шведская встреча по фонетике в Скёвде, 24-26 мая, 2000 г. (расширенная версия, внутренний доклад ТМХ)// Речевые технологии. 2009. № 4. С. 119-128.

28. Козлачков С.Б., Бонч-Бруевич А.М., Дворянкин С.В. Исследование свойств модуляционных параметров речевых сигналов. // Речевые технологии, 2013. № 3-4. С. 135 - 142.

RESTRICTIONS FORMANT THEORY OF SPEECH INTELLIGIBILITY IN SPEECH APPLICATIONS,

INFORMATION SECURITY

KozlachkovS.B.4, Dvoryankin S.V.5, Bonch-Bruevich A.M.6

The article deals with actual problems of existing evaluations of acoustic data protection methods. A number of methods of using the achievements of modern computer technology and speech due to the complexity of formalized representation are not represented in the existing procedures and other governing

4 Sergei Kozlachkov, PhD, BMSTU, [email protected]

5 Sergey Dvoryankin, Financial University under the Government of the Russian Federation, [email protected]

6 Andrew Bonch-Bruevich, Ph.D., BMSTU, [email protected]

documents. The article deals the basic contradictions of the practical application of the modern theory of speech intelligibility in applications to ensure data protection. The article made the analysis of experimental results that contradict the theory of formant intelligibility. The article deals the main differences between the processes of perception and speech recognition, and printed texts. Also the cases of substitution of the concepts used in the methods of the security assessment and calculation mistakes weighting factors. The article is proposed to consider the processes of auditory perception and speech production through Criteria improve the noise immunity of voice messages and signals. Finally, the article proposals on improvement of existing methods of acoustic speech information security assessment.

Keywords: acoustic intelligence, formants, phonemes, information security, speech recognition, speech, semantic code.

References

1. Kargashin V. L. Sovershenstvovanie metodicheskih principov ocenki zashhishhennosti pomeshhenij ot utechki rechevoj ¡nformacii//Special'naja tehnika, 2001, № 6. S. 43-49.

2. Dvorjankin S.V., Aljushin V.M. Vosstanovlenie garmonicheskoj struktury iskazhennyh rechevyh vokalizmov posredstvom cifrovoj obrabotki izobrazhenij dinamicheskih spektrogramm. // Bezopasnost' informacionnyh tehnologij. 2013. № 3. S. 41-49.

3. Modelirovanie i generacija signalov rechevyh vokalizmov v prilozhenijah ocenki zashhishhennosti rechevoj informacii / S.V. Dvorjankin [i dr.] // Proektirovanie i tehnologija jelektronnyh sredstv. 2007. №4. S. 33-37.

4. Gavrilenko A.V., Didkovskij V.S., Prodeus A.N. Sravnitel'nyj analiz nekotoryh metodov ocenki razborchivosti rechi // Konsonans-2007: Akusticheskij mezhdunarodnyj simpozium. Kiev, 2007. S. 54-65.

5. Gavrilenko O.V., Didkovskij V.S., Prodeus A.N. Raschet i izmerenie razborchivosti rechi pri malyh otnoshenijah signal-shum. Chast' 1. Korrektnoe izmerenie funkcii raspredelenija rechevogo signala // Jelektronika i svjaz'. 2007. Problemy jelektroniki, tematicheskij vypusk, ch.1. S. 137-141.

6. Gavrilenko O.V., Didkovskij V.S., Prodeus A.N. Raschet i izmerenie razborchivosti rechi pri malyh otnoshenijah signal-shum. Chast' 2. Korrekcija kojefficientov vosprijatija // Jelektronika i svjaz'. 2007. Problemy jelektroniki, tematicheskij vypusk, ch.1. S. 142-147.

7. Zhuravljov V.N., Arhipova E.A. Analiz metoda rascheta parametra jeffektivnosti maskirovanija rechi v tehnicheskih kanalah utechki // Radioelektronika, informatika, upravlinnja. 2007. № 15. S. 57-64.

8. Zhuravljov V.N., Arhipova E.A., Metod jeksperimental'nogo analiza funkcii jeffektivnosti maskirovanija rechi // Vestnik Vinnickogo politehnicheskogo instituta. 2009. № 1. S. 67-71.

9. A.Sh. Akbulatov, S.P. Baronin, V.I. Kulja, R.D. Lejtes, V.E. Murav'ev, A.A. Pirogov, G.S. Slucker, V.N. Sobolev, Ju.K. Trofimov Vokodernaja telefonija. Metody i problemy. Pod red. A.A. Pirogova. — M., «Svjaz'», 1974, 536 s. s il.

10. Galunov V.I. Pomehoustojchivost' kak sistemoobrazujushhij faktor rechi // Problemy i metody jeksperimental'no-foneticheskih issledovanij. SPb., 2002. S. 205-300.

11. Galunov V.I., Garbaruk V.I. Akusticheskaja teorija recheobrazovanija i sistemy foneticheskih priznakov // 100 let jeksperimental'noj fonetike v Rossii. Materialy mezhdunarodnoj konferencii. SPb., 2001. S. 58-62.

12. Prodeus A.N. O nekotoryh osobennostjah razvitija ob#ektivnyh metodov izmerenij razborchivosti rechi // Jelektronika i svjaz'. 2010. №2. Tematicheskij vypusk Jelektronika i nanotehnologii. S.217-223.

13. Golubinskij A.N. Metodika vychislenija informacionnoj sostavljajushhej rechevogo signala // Ohrana, bezopasnost' i svjaz' -2009: Sbornik materialov Vserossijskoj nauchno-prakticheskoj konferencii. Voronezh, 2010. S. 37-41.

14. Didkovskij V.S., Prodeus A.N., Rud' D.P. O tochnosti izmerenij funkcii raspredelenija urovnej rechevogo signala // Jelektronika i svjaz'. 2010. №3 (56). S. 152-159. (Tematicheskij vypusk Jelektronika i nanotehnologii).

15. Gavrilenko O.V., Didkovskij V.S., Prodeus A.N. Sopostavlenie versij formantnogo metoda ocenki razborchivosti rechi // Jelektronika i svjaz'. 2007. Problemy jelektroniki, tematicheskij vypusk, ch.1. S. 227-230.

16. Didkovskij V.S., Prodeus A.N. Sopostavlenie formantnyh svojstv ukrainskoj i russkoj rechi // Jelektronika i svjaz'. 2009. №4-5. S. 88-94. (Tematicheskij vypusk Jelektronika i nanotehnologii, ch. 2,).

17. O dostovernosti ocenki zashhishhennosti rechevoj informacii ot utechki po tehnicheskim kanalam / A.P. Bacula [i dr.] // Doklady TUSURa/2010. № 1 (21), chast' 1, ijun'. S. 89-92.

18. Pokrovskij N. B. Raschet i izmerenie razborchivosti rechi. — M.: Svjaz'izdat, 1962. 392 s.

19. Rashevskij Ja.I., Kargashin V.L. Obzor zarubezhnyh metodov opredelenija razborchivosti rechi // Special'naja tehnika. 2002. № 4. S. 37-46

20. Mihajlov V.G., Zlatoustova L.V. Izmerenie parametrov rechi / Pod red. M.A. Sapozhkova. — M.: Radio i svjaz', 1987. 168 s.

21. Grigor'ev E.I., Tychinina V.M. Zvuki rechi i ih kommunikativnaja funkcija: Uchebnoe posobie dlja studentov filologicheskih special'nostej, aspirantov i prepodavatelej. Tambov: TGU im. G.R. Derzhavina, 2006. 84 s.

22. Zhuravlev V.N., Arhipova A.E. Analiz protivorechij teorij recheobrazovanija i sluha s pozicii identifikacii informacionnyh parametrov i harakteristik rechevyh signalov // Informacionnye tehnologii i komp'juternaja inzhenerija №2(9), Vinnica, 2007, S. 180-185.

23. Aldoshina I.A. Osnovy psihoakustiki. Podborka statej s sajta -http://www.625-net.ru.

24. Roldugin S.V. Golubinskij A.N., Vol'skaja T.A. Modeli rechevyh signalov dlja identifikacii lichnosti po golosu // Radiotehnika. 2002. № 11. S. 79-81.

25. Mishukov A.A. Modelirovanie processov upravlenija rechevoj razborchivost'ju v mnogokanal'nyh sistemah konfidencial'noj golosovoj svjazi: dissertacija kand. tehn. nauk: 05.13.18, 05.13.19 / A.A.Mishukov. - Voronezh, 2012. - s. 152

26. Cviker Je., Fel'dkeller R. Uho kak priemnik informacii. Perevod s nemeckogo pod redakciej B.G.Belkina. — M., «Svjaz'», 1971. 255 s. s ill.

27. Fant G. Polveka v issledovanijah fonetiki i rechi. Fonetika 2000, Shvedskaja vstrecha po fonetike v Skjovde, 24-26 maja, 2000 g. (rasshirennaja versija, vnutrennij doklad TMH)// Rechevye tehnologii. 2009. № 4. S. 119-128.

28. Kozlachkov S.B., Bonch-Bruevich A.M., Dvorjankin S.V. Issledovanie svojstv moduljacionnyh parametrov rechevyh signalov. // Rechevye tehnologii, 2013. № 3-4. S. 135 - 142.

i Надоели баннеры? Вы всегда можете отключить рекламу.