Научная статья на тему 'ИССЛЕДОВАНИЕ СПЕКТРА ФОРМАНТ ФОРСИРОВАННОЙ РЕЧИ'

ИССЛЕДОВАНИЕ СПЕКТРА ФОРМАНТ ФОРСИРОВАННОЙ РЕЧИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
184
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАЗБОРЧИВОСТЬ РЕЧИ / ФОРСИРОВАНИЕ РЕЧИ / ДЕФОРМАЦИЯ СПЕКТРА ФОРМАНТ / ДЕФОРМАЦИЯ СПЕКТРА РЕЧИ / КЕПСТРАЛЬНЫЙ АНАЛИЗ / МЕТОД ЛИНЕЙНЫХ ПРЕДСКАЗАНИЙ / ФОРМАНТНОЕ РАСПРЕДЕЛЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иванов Андрей Валерьевич, Трушин Виктор Александрович, Маркелова Гузель Викторовна, Рева Иван Леонидович

Существующие методики оценки разборчивости речи не учитывают возможный (и вполне реальный на практике) эффект форсирования речи. Методика, применяемая в задачах защиты речевой информации, основана на формантном методе Н.Б. Покровского и рассматривает только случай спокойной речи. Важно то, что при форсировании происходит не только увеличение общего уровня речи, но и существенно деформируется ее спектр. Изменение спектра формант существенно скажется на оценке разборчивости речи, так как при проведении расчетов производится переход от спектра речи к спектру формант по известной зависимости для спокойной речи. Покровский только предполагает, что данная зависимость будет сохраняться и для форсированной речи. То есть при форсировании будет происходить перераспределение энергии спектра формант в область средних и высоких частот. В данной работе на первом этапе проводится анализ результатов артикуляционных испытаний для обычной и форсированной речи с целью определения степени влияния эффекта форсирования на эффективность маскирующих помех. В результате получен вывод, что при форсировании перераспределение энергии в спектре приводит к снижению разборчивости речи (без учета общего увеличения уровня речи). Также вызывают интерес практически совпадающие зависимости разборчивости речи от отношения сигнал/шум для форсированной и спокойной речи при использовании формантоподобной помехи. Во второй части работы были проведены исследования по определению формант в спектре спокойной и форсированной речи. Кратко рассмотрены два основных метода выявления формант: кепстральный анализ и метод линейных предсказаний. На основе программного обеспечения Praat, реализующего метод линейных предсказаний, проведен анализ записей спокойной и форсированной речи с определением расположения формант в частотной области. В результате было показано, что при форсировании происходит смещение формант в область низких и средних частот, что подтверждает различие зависимостей между спектром речи и спектром формант для спокойной и форсированной речи.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Иванов Андрей Валерьевич, Трушин Виктор Александрович, Маркелова Гузель Викторовна, Рева Иван Леонидович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

RESEARCH ON THE SPECTRUM OF FORCED SPEECH FORMANTS

The existing methods of speech intelligibility assessment do not allow for a possible effect of speech forcing which is quite feasible in practice. The method applied for speech information protection is based on the N.B. Pokrovsky formant method and is suitable only for normal speech cases. It’s important that in the case of speech forcing not only does a general level of speech increase, but its spectrum also becomes significantly deformed. A change of the formant spectrum influences greatly the assessment of speech intelligibility because in calculations a shift from a speech spectrum to a formant spectrum according to the law estimated for normal speech occurs. Pokrovsky only assumes that this dependence will take place for the forced speech too. It means that in cases of speech forcing the redistribution of the formant spectrum energy to the range of medium and high frequencies will occur. In this work at the first stage the results of articulation tests for the normal and forced speech are analyzed in order to identify the degree of a forcing effect influence on the masking interferences. The conclusion is that in the forcing process the energy redistribution in the spectrum leads to a speech intelligibility decrease (despite a general increase in the speech level). Practically similar dependences between speech intelligibility and the signal/noise ratio for the forced and normal speech when a formant noise is used also are of great interest. In the second part of the work research on the identification of formants in normal and forced speech spectrums is conducted. Two main methods of formant identification are considered, namely, a cepstral analysis and a linear-predictive method. Using the "Praat" software which implements the linear-predictive method, an analysis of normal and forced speech records with the identification of the formant location in the frequency range was conducted. Finally, it is revealed that in the case of speech forcing a formant shift to the range of low and medium frequencies occurs, and it proves the difference of dependences between the speech spectrum and the formant spectrum for normal speech and forced speech.

Текст научной работы на тему «ИССЛЕДОВАНИЕ СПЕКТРА ФОРМАНТ ФОРСИРОВАННОЙ РЕЧИ»

ISSN 1814-1196

http://journals.nstu.ru/vestnik Science Bulletin of the NSTU Vol. 61, No. 4, 2015, pp. 63-73

Научный вестник НГТУ том 61, № 4, 2015, с. 63-73

СОВРЕМЕННЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

MODERN INFORMATION TECHNOLOGIES

УДК 004.056

Исследование спектра формант

форсированной речи

А.В. ИВАНОВ1, В.А. ТРУШИН2, Г.В. МАРКЕЛОВА3, И.Л. РЕВА4

1 630073, РФ, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет. Е-таИ: [email protected]

2 630 0 73, РФ, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет, кандидат технических наук, старший научный сотрудник. Е-таИ: [email protected]

3 630 0 73, РФ, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет, аспирант. Е-mail: [email protected]

4 630073, РФ, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет, кандидат технических наук. Е-mail: тт100@ yandex.ru

Существующие методики оценки разборчивости речи не учитывают возможный (и вполне реальный на практике) эффект форсирования речи. Методика, применяемая в задачах защиты речевой информации, основана на формантном методе Н.Б. Покровского и рассматривает только случай спокойной речи. Важно то, что при форсировании происходит не только увеличение общего уровня речи, но и существенно деформируется ее спектр. Изменение спектра формант существенно скажется на оценке разборчивости речи, так как при проведении расчетов производится переход от спектра речи к спектру формант по известной зависимости для спокойной речи. Покровский только предполагает, что данная зависимость будет сохраняться и для форсированной речи. То есть при форсировании будет происходить перераспределение энергии спектра формант в область средних и высоких частот. В данной работе на первом этапе проводится анализ результатов артикуляционных испытаний для обычной и форсированной речи с целью определения степени влияния эффекта форсирования на эффективность маскирующих помех. В результате получен вывод, что при форсировании перераспределение энергии в спектре приводит к снижению разборчивости речи (без учета общего увеличения уровня речи). Также вызывают интерес практически совпадающие зависимости разборчивости речи от отношения сигнал/шум для форсированной и спокойной речи при использовании формантоподобной помехи. Во второй части работы были проведены исследования по определению формант в спектре спокойной и форсированной речи. Кратко рассмотрены два основных метода выявления формант: кепстральный анализ и метод линейных предсказаний. На основе программного обеспечения Praat, реализующего метод линейных предсказаний, проведен анализ записей спокойной и форсированной речи с определением расположения формант в частотной области. В результате было показано, что при форсировании происходит смещение формант в область низких и средних частот, что подтверждает различие зависимостей между спектром речи и спектром формант для спокойной и форсированной речи.

* Статья получена 01 июля 2015 г.

Ключевые слова: форманта, разборчивость речи, форсирование речи, деформация спектра формант, деформация спектра речи, кепстральный анализ, метод линейных предсказаний, формантное распределение

Б01: 10.17212/1814-1196-2015-4-63-73 ВВЕДЕНИЕ

В задачах задачи защиты информации определяющее значение имеет понятие разборчивости речи. Для количественной оценки разборчивости речи используется ряд методов: Покровского Н.Б., Быкова Ю.С., Сапожкова М.А.; а также зарубежные: А1, 8Т1, КА8Т1 [1]. В России наиболее часто используется методика, в основе которой лежит формантный подход Покровского [2]. Суть методики заключается в следующем:

• разбиение всего частотного диапазона на пять октавных полос со среднегеометрическим частотами: 250, 500, 1000, 2000, 4000 Гц. Среднегеометрическая частота:

• fni , (1)

где fв, /щ соответственно верхняя и нижняя границы i-й частотной полосы.

• для каждой i-й полосы измеряется уровень шума и уровень смеси сигнал + шум L(c + ш)- (в дБ относительно порога слышимости = 2 10—5 Па);

• вычисляются уровни сигналов Lci для каждой октавной полосы

Lci = 10 • log |10°л/<с+ш)i - 100Л/ш- J ; (2)

• вычисляются уровни ощущения

Qi = Lci -Аш-М-, (3)

где АЛ- - формантное превышение;

• по известной зависимости P(Q) вычисляются коэффициенты восприятия Р- для каждой октавной полосы;

• вычисляется формантная разборчивость речи

R = lP • gi , (4)

i=1

где gi - вклад i-й октавной полосы в суммарную разборчивость (известно из формантного распределения русской речи);

• по известным зависимостям переходят от формантной разборчивости к словесной.

Данная методика имеет ряд недостатков, отмеченных в работах [3-5]. Неучтенным в данной методике является также эффект форсирования речи.

Под форсированием понимается повышение уровня речи, вызванное усиленным напряжением голосовых связок. По предположению Покровского, помимо повышения общего уровня и суммарной интенсивности спектра речи форсирование сопровождается также перераспределением энергии в пределах спектра в область высоких частот (рис. 1) [2].

ч

г а (о ^

М <

-Форсированная речь

----Спокойная речь

100

1 -10

1 -10

Частота Е, Гц

Рис. 1. Частотный спектр спокойной и форсированной речи

По результатам экспериментальных исследований [6, 7] можно сказать, что деформация спектра речевого сигнала (без учета увеличения интегрального уровня речи) при форсировании приводит к снижению показателя разборчивости речи, что полностью расходится с теоретическими расчетами (рис. 2).

Отдельно нужно отметить, что влияние формантоподобной помехи [810] как на обычную речь, так и на форсированную практически идентично (рис. 2, в). Данный результат позволяет предположить, что в результате форсирования спектр формант не претерпевает существенных изменений, либо спектр формант меняется не так, как предполагает Покровский.

1. ПОСТАНОВКА ЗАДАЧИ И РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТА

Цель исследования - изучение влияния форсирования речи на деформацию частотного спектра формант с точки зрения перераспределения формант по частотному диапазону. Для этого были проведены аудиозаписи спокойной и форсированной речи дикторов.

Форманта - максимум энергии в спектре звука (Физический энциклопедический словарь [11, с. 648]). В работе И.А. Алдошиной под формантами понимаются области спектральных максимумов, соответствующие резонансным частотам органов артикуляции человека [12, 13]. Несмотря на актуальность и большой интерес к области анализа и распознавания речи [14-16], вопросу выделения формант и определения спектра формант, особенно форсированной речи, не уделяется особого внимания.

1

0.9 0.8 0.7 0.6

^ 0.5 0.4 0.3 0.2 0.1

-20-18-16-14-12-10 -8 -6 -4 -2 0

ООП, дБ

а

1

0.9 0.8 0.7 0.6

^ 0.5 0.4 0.3 0.2 0.1

-20-18-16-14-12-10 -8 -б -4 -2 0

СЛИ, дБ

б

1

0.9 0.8 0.7

0.6

^ 0.5 0.4 0.3 0.2 0.1

-20-18-16-14-12-10 -8 -6 -4 -2 0

СЛП, дБ в

Рис. 2. Зависимости словесной разборчивости от соотношения сигнал/шум при использовании стандартного спектра речи и форсированного по результатам артикуляционных испытаний:

а - для белого шума; б - для розового шума; в - для фор-мантоподобного шума

Существует множество методов выявления формант, основным из которых является кепстральный анализ и метод линейных предсказаний.

-Формант, (форс) ----Формант. ' / 1 /

3 У

Г

/ /

J /

г/

Кепстральный анализ является математической основой нелинейных методов выделения сигналов. Кепстр - это математическое преобразование, заключающееся в том, что спектральному преобразованию подвергается спектр функции. Если взять спектр от спектра, то получится сама первоначальная функция. Чтобы был иной результат, имеющий смысл, надо не просто взять спектр от спектра, а предварительно преобразовать этот спектр. В качестве такого преобразования принято логарифмировать спектр. Логарифм можно взять от модуля спектра. При таком преобразовании спектра получается обычный кепстр. Можно взять логарифм от комплексного спектра - получится комплексный кепстр. Таким образом, в основе кепстрального анализа лежит получение кепстра (обратное преобразование Фурье логарифма спектра мощности сигнала):

1 %

Ф) = — i log 2%

X (em)

emmd(a. (5)

-%

В полученном кепстре выявляются гармонические составляющие [17].

Метод линейного предсказания (метод, использующий LPC-коэф-фициенты) заключается в поиске комплексных корней полинома с LPC-коэф-фициентами (коэффициенты фильтра речевого тракта) и дальнейшем преобразовании углов корней в частоты. Частотная характеристика определяется так:

H (eia) =---. (6)

1 -take-iak k=1

Метод линейного предсказания по сравнению с другими имеет определенные преимущества: обладает минимальной сложностью, обеспечивает минимальное время вычисления и максимальную точность оценивания формант.

Данный метод лежит в основе программного обеспечения (ПО) Praat, которое использует метод Burg, являющийся усовершенствованным методом линейного предсказания с использованием окна Гаусса.

ПО Praat является свободно распространяемым приложением с открытым кодом, которое позволяет записывать, импортировать и анализировать файлы в аудиоформате. Пользователю предлагается четыре вида анализа звукового файла: спектральный, тоновый, формантный и анализ интенсивности. Формантный анализ заключается в поиске частот с помощью ЛПР, на которых находятся форманты на небольшом фрагменте речи, на которые автоматически разбивается речевой отрезок. К сожалению, данное ПО не позволяет провести анализ спектра выявленных формант.

Форсирование речи при постановке эксперимента достигается естественным повышением диктором уровня речи в ответ на мешающее воздействие шума. В данном случае во время записи речи диктору через наушники подается шумовой сигнал такого уровня, чтобы ему приходилось повышать голос, чтобы услышать самого себя.

При естественном повышении уровня речи во время записи шум, подаваемый в наушники, может быть как приближенным к спектру речевых сиг-

налов («речевой хор»), так и иметь постоянную спектральную плотность (белый шум). Сравнение различных видов мешающих шумов было проведено в работах [9, 10].

Полученные аудиофайлы открываются в ПО РгаМ в режиме формантно-го и спектрального анализа (рис. 3).

0958822

0 09615

0

-0.02164

-0 08638 5000 Нг

2020 Нг ОНг

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 3. Формантный анализ в ПО Ргаа!

Результатом работы ПО Ргаа! является список первых трех выявленных формант и времени, соответствующий выявлению этих формант. Поиск формант производился с интервалом 0.05 с.

Конечный результат эксперимента представлен в виде графиков, демонстрирующих распределение выявленных формант в частотной области для спокойной и форсированной речи дикторов. Эксперименты проводились с участием двух мужчин и двух женщин. Расчеты по данным записей от всех дикторов показали схожие результаты. На рис. 4 и 5 приведены типовые графики для одного из дикторов, иллюстрирующие результаты эксперимента.

Рис. 4. Распределение выявленных формант по частотному диапазону для речи без форсирования

Рис. 5. Распределение выявленных формант по частотному диапазону для речи в случае форсирования

Из сравнения полученных результатов следует, что при форсировании речи кроме увеличения интенсивности формант и возможной деформации их спектра имеет место перераспределение формант по частотному диапазону в области низких и средних частот. Следовательно, вклад области высоких частот в разборчивость речи снижается, а в области низких и средних частот возрастает. Данный результат противоречит предположению Н.Б. Покровского о том, что спектр формант будет изменяться так же, как и спектр речи при форсировании. Данный результат также подтверждается проведенным ранее исследованием по определению формантного распределения для обычной и форсированной речи [18]. Подобное изменение формантного распределения при форсировании речи указывает на перераспределение вкладов частотных полос в суммарную разборчивость (увеличивается вклад низких и средних частот). Данные распределения приведены на рис. 6.

ю

3 &

1

0.875 0.75 0.625 0.5

0.125

01" 100

-Б'дТ) по Покровскому - ■ - Е.(£) нормальная речь - - • К.® форсированная ре1

Л > *

Ь ✓ / / / у*

* У

/ / у *

г* Н 4

4

£___

1x10

Частота f, Гц

1x10

Рис. 6. Формантное распределение для обычной речи, форсированное и используемое в общепринятой методике

ЗАКЛЮЧЕНИЕ

Полученные результаты подтверждают, что при форсировании происходит перераспределение формант в частотной области, что приводит к изменению вкладов частотных полос в разборчивость речи. Вследствие этого и происходит снижение разборчивости речи при форсировании (уменьшение относительного количества формант в области высоких частот).

Также подтверждается необходимость проведения дальнейших исследований для определения спектра формант форсированной речи с учетом и их расположения, и интенсивности. Полученные результаты позволят существенно скорректировать методику оценки защищенности речевой информации с учетом эффекта форсирования.

СПИСОК ЛИТЕРАТУРЫ

1. Дидковский В.С., Дидковский М.Л., Продеус А.Н. Акустическая экспертиза каналов речевой коммуникации: монография. - Киев: Имекс-ЛТД, 2008. - 420 с.

2. Покровский Н.Б. Расчет и измерение разборчивости речи. - М.: Связьиздат, 1962. -

390 с.

3. Авдеев В.Б. Совершенствование методик оценки и контроля защищенности речевой информации от ее утечки по техническим каналам // Специальная техника. - 2015. - № 5. -С. 46-59.

4. Трушин В.А., Рева И.Л., Иванов А.В. Экспериментальная оценка разборчивости речи в задачах защиты информации на основе модифицированных артикуляционных испытаний // Материалы X Международной конференции «Актуальные проблемы электронного приборостроения»: АПЭП-2010, 22-24 сентября 2010 г.: в 7 т. - Новосибирск: Изд-во НГТУ, 2010. -Т. 7. - С. 133-135.

5. Трушин В.А., Рева И.Л., Иванов А.В. Усовершенствование методики оценки разборчивости речи в задачах защиты информации // Ползуновский вестник. - 2012. - № 3/2. -С. 238-241.

6. Экспериментальные исследования защищенности речевой информации от утечки по техническим каналам с учетом эффекта форсирования речи / А.В. Иванов, В.А. Трушин,

A.В. Береснева, Г.В. Маркелова // Актуальные проблемы электронного приборостроения (АПЭП-2014): материалы XII международной конференции, 2-4 октября 2014 г.: в 7 т. - Новосибирск: Изд-во НГТУ, 2014. - Т. 3. - С. 164-170.

7. Иванов А.В., Трушин В.А. О модели речевого сигнала при оценке защищенности речевой информации от утечки по техническим каналам // Доклады ТУСУР. - 2014. - № 2 (32), ч. 1. - С. 87-90.

8. Региональные аспекты технической и правовой защиты информации: монография /

B.В. Поляков, В.А. Трушин, И. Л. Рева, П.В. Малинин, А.А. Исаев, Т.В. Сидоренко, В.А. Мазуров, А.С. Шатохин, Терновой О.С., Н.Н. Минакова, Ю.Н. Загинайлов, П.В. Плетнев; отв. ред. В.В. Поляков. - Барнаул: Изд-во АлтГУ, 2013. - 176 с.

9. Трушин В.А., Рева И.Л., Иванов А.В. О методических погрешностях оценки словесной разборчивости речи в задачах защиты информации // Доклады ТУСУР. - 2012. - № 1 (25), ч. 2. - С. 180-184.

10. Рева И.Л., Трушин В.А., Иванов А.В. Реализация оптимальной помехи при защите речевой информации от утечки по акустическому и виброакустическому каналу // Научный вестник НГТУ. - 2011. - № 4 (45). - С. 140-145.

11. Физический энциклопедический словарь / гл. ред. А.М. Прохоров. - М.: Советская энциклопедия, 1984. - 944 с.

12. АлдошинаИ.А. Основы психоакустики: сборник статей. - [Б. м.]: [б. и.], 2000. - 154 с.

13. Алдошина И.А., Приттс Р. Музыкальная акустика. - СПб.: Композитор, 2006. -

717 с.

14. Азаров И.С., Петровский А.А. Формирование персональной модели голоса диктора с универсальным фонетическим пространством признаков на основе искусственной нейронной сети // Труды СПИИРАН. - 2014. - Вып. 36. - C. 128-150.

15. Басов О.О., НосовМ.В., ШалагиновВ.А. Исследование характеристик джиттера периода основного тона речевого сигнала // Труды СПИИРАН. - 2014. - Вып. 32. - С. 27-44.

16. Изменение частоты основного тона речевого сигнала на основе гармонической модели с нестационарными параметрами / И.С. Азаров, М.И. Вашкевич, Д.С. Лихачев, А.А. Петровский // Труды СПИИРАН. - 2014. - Вып. 32. - С. 5-26.

17. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов / пер. с англ. под ред. М.В. Назарова, Ю.Н. Прохорова. - М.: Радио и связь, 1981. - 496 с.

18. Иванов А.В., Трушин В.А., Хиценко В.Е. О выборе модели тестового сигнала при оценке защищенности речевой информации от утечки по техническим каналам // Труды СПИИРАН. - 2015. - Вып. 3. - С. 122-133.

Иванов Андрей Валерьевич, старший преподаватель кафедры защиты информации факультета автоматики и вычислительной техники Новосибирского государственного технического университета. Основное направление научных исследований - защита информации. Имеет 25 публикаций. E-mail: [email protected]

Трушин Виктор Александрович, кандидат технических наук, старший научный сотрудник, заведующий кафедрой защиты информации факультета автоматики и вычислительной техники Новосибирского государственного технического университета. Основное направление научных исследований - защита информации. Имеет более 100 публикаций, в том числе одну монографию, 22 патента. E-mail: [email protected]

Маркелова Гузель Викторовна, аспирант кафедры защиты информации факультета автоматики и вычислительной техники Новосибирского государственного технического университета. Основное направление научных исследований - защита информации. Имеет 2 публикации. E-mail: [email protected]

Рева Иван Леонидович, кандидат технических наук, декан факультета автоматики и вычислительной техники Новосибирского государственного технического университета. Основное направление научных исследований - защита информации. Имеет более 25 публикаций. E-mail: [email protected]

Research on the spectrum of forced speech formants*

A.V. IVANOV1, V.A. TRUSHIN2, G.V. MARKELOVA3, I.L. REVA4

1 Novosibirsk State Technical University, 20, K. Marx Prospekt, Novosibirsk, Federation, senior lecturer. Е-mail: [email protected]

2 Novosibirsk State Technical University, 20, K. Marx Prospekt, Novosibirsk, Federation, PhD (Eng.), senior research associate. Е-mail: [email protected]

3 Novosibirsk State Technical University, 20, K. Marx Prospekt, Novosibirsk, Federation, graduate student. Е-mail: [email protected]

4 Novosibirsk State Technical University, 20, K. Marx Prospekt, Novosibirsk, Federation, PhD (Eng.) faculty dean. Е-mail: [email protected]

The existing methods of speech intelligibility assessment do not allow for a possible effect of speech forcing which is quite feasible in practice. The method applied for speech information protection is based on the N.B. Pokrovsky formant method and is suitable only for normal speech cases. It's important that in the case of speech forcing not only does a general level of speech increase, but its spectrum also becomes significantly deformed. A change of the formant spectrum influences greatly the assessment of speech intelligibility because in calculations a shift from a speech spectrum to a formant spectrum according to the law estimated for normal speech occurs. Pokrovsky only assumes that this dependence will take place for the forced speech too. It means that in cases of speech forcing the redistribution of the formant spectrum energy to the range of medium and high frequencies will occur. In this work at the

630073, Russian 630073, Russian 630073, Russian 630073, Russian

* Received 01 July 2015.

first stage the results of articulation tests for the normal and forced speech are analyzed in order to identify the degree of a forcing effect influence on the masking interferences. The conclusion is that in the forcing process the energy redistribution in the spectrum leads to a speech intelligibility decrease (despite a general increase in the speech level). Practically similar dependences between speech intelligibility and the signal/noise ratio for the forced and normal speech when a formant noise is used also are of great interest. In the second part of the work research on the identification of formants in normal and forced speech spectrums is conducted. Two main methods of formant identification are considered, namely, a cepstral analysis and a linear-predictive method. Using the "Praat" software which implements the linear-predictive method, an analysis of normal and forced speech records with the identification of the formant location in the frequency range was conducted. Finally, it is revealed that in the case of speech forcing a formant shift to the range of low and medium frequencies occurs, and it proves the difference of dependences between the speech spectrum and the formant spectrum for normal speech and forced speech.

Keywords: Formant; speech intelligibility; speech forcing; formant spectrum deformation; speech spectrum deformation; cepstral analysis; linear-predictive method; formant distribution

DOI: 10.17212/1814-1196-2015-4-63-73

REFERENCES

1. Didkovskii V.S., Didkovskii M.L., Prodeus A.N. Akusticheskaya ekspertiza kanalov rechevoi kommunikatsii: monografiya [Acoustic speech communication channel expertise: monograph]. Kiev, Imeks Publ., 2008. 420 p.

2. Pokrovskii N.B. Raschet i izmerenie razborchivosti rechi [Calculation and measurement of legibility of the speech]. Moscow, Svyaz'izdat Publ., 1962. 390 p.

3. Avdeev V.B. Sovershenstvovanie metodik otsenki i kontrolya zashchishchennosti rechevoi informatsii ot ee utechki po tekhnicheskim kanalam [Improved methods of evaluation and monitoring of security of voice data from its leakage through technical channels]. Spetsial'naya tekhnika - Special equipment, 2015, no. 5, pp. 46-59.

4. Ivanov A.V., Reva I.L., Trushin V.A. [Experimental assessment of intelligibility of speech in problems of information security on the basis of the modified articulation measurements]. Materialy X Mezhdunarodnoi konferentsii Aktual'nye problemy elektronnogo priborostroeniya, APEP-2010. V 7 t. [Proceedings of 10th International Scientific-Technical Conference on Actual Problems of Electronic Instrument Engineering (APEIE-2010). In 7 vol.], Novosibirsk, 22-24 September 2010, vol. 7, pp. 133-135.

5. Trushin V.A., Reva I.L., Ivanov A.V. Usovershenstvovanie metodiki otsenki razborchivosti rechi v zadachakh zashchity informatsii [Improvement of a technique of an assessment of an intelligibility of the speech in problems of information security]. Polzunovskii vestnik - Polzunov Bulletin, 2012, no. 3/2, pp. 238-241.

6. Ivanov A.V., Trushin V.A., Beresneva A.V., Markelova G.V. [The experimental research of security of speech information of leakage from technical channels with account of forcing speech effect]. Materialy XII Mezhdunarodnoi konferentsii "Aktual'nye problemy elektronnogo priborostroeniya", APEP-2014. V 7 t. [Proceedings of 12th International Scientific-Technical Conference on Actual Problems of Electronic Instrument Engineering (APEIE-2014). In 7 vol.], Novosibirsk, 2-4 October 2014, vol. 3, pp. 164-170.

7. Ivanov A.V., Trushin V.A. O modeli rechevogo signala pri otsenke zashchishchennosti re-chevoi informatsii ot utechki po tekhnicheskim kanalam [About model of a speech signal at an assessment of security of speech information by leaking from technical channels]. Doklady Tomskogo gosudarstvennogo universiteta sistem upravleniya i radioelektroniki - Proceedings of Tomsk State University of Control Systems and Radioelectronics, 2014, no. 2 (32), pt. 1, pp. 87-90.

8. Polyakov V.V., Trushin V.A., Reva I.L., Malinin P.V., Isaev A.A., Sidorenko T.V., Mazurov V.A., Shatokhin A.S., Ternovoi O.S., Minakova N.N., Zaginailov Yu.N., Pletnev P.V. Regional'nye

aspekty tekhnicheskoi i pravovoi zashchity informatsii: monografiya [Regional aspects of technical and legal protection of information: monograph]. Ed. V.V. Polyakov. Barnaul, AltSU Publ., 2013. 176 p.

9. Trushin V.A., Reva I.L., Ivanov A.V. O metodicheskikh pogreshnostyakh otsenki slovesnoi razborchivosti rechi v zadachakh zashchity informatsii [Method errors of estimate of speech intelligibility for information]. Doklady Tomskogo gosudarstvennogo universiteta sistem upravleniya i radi-oelektroniki - Proceedings of Tomsk State University of Control Systems and Radioelectronics, 2012, no. 1 (25), pt. 2, pp. 180-184.

10. Reva I.L., Trushin V.A., Ivanov A.V. Realizatsiya optimal'noi pomekhi pri zashchite re-chevoi informatsii ot utechki po akusticheskomu i vibroakusticheskomu kanalu [Optimum noise detection for voice data protecting from leaking through acoustic and vibroacoustic channels]. Nauchnyi vestnik Novosibirskogo gosudarstvennogo tekhnicheskogo universiteta - Science bulletin of the Novosibirsk state technical university, 2011, no. 4 (45), pp. 140-145.

11. Prokhorov A.M., ed. Fizicheskii entsiklopedicheskii slovar' [Physical encyclopedic dictionary]. Moscow, Sovetskaya entsiklopediya Publ., 1984. 944 p.

12. Aldoshina I.A. Osnovy psihoakustiki: sbornik statei [Bases of psikhoakustik: collection of articles]. 2000. 154 p.

13. Aldoshina I.A., Pritts R. Muzykal'naya akustika [Musical acoustics]. St. Petersburg, Kompozitor Publ., 2006. 717 p.

14. Azarov I.S., Petrovskii A.A. Formirovanie personal'noi modeli golosa diktora s univer-sal'nym foneticheskim prostranstvom priznakov na osnove iskusstvennoi neironnoi seti [Training personal voice model of a speaker with unified phonetic space of features using artificial neural network]. Trudy SPIIRAN-SPIIRASProceedings, 2014, iss. 36, pp. 128-150.

15. Basov O.O., Nosov M.V., Shalaginov V.A. Issledovanie kharakteristik dzhittera perioda os-novnogo tona rechevogo signala [Pitch-jitter analysis of the speech signal]. Trudy SPIIRAN -SPIIRAS Proceedings, 2014, iss. 32, pp. 27-44.

16. Azarov I.S., Vashkevich M.I., Likhachov D.S., Petrovsky A.A. Izmenenie chastoty osnov-nogo tona rechevogo signala na osnove garmonicheskoi modeli s nestatsionarnymi parametrami [Pitch modification of speech signal using harmonic model with time-varying parameters]. Trudy SPIIRAN - SPIIRAS Proceedings, 2014, iss. 32, pp. 5-26.

17. Rabiner L.R, Schafer R.W. Digital processing of speech signals. Englewood Cliffs, New Jersey, Prentice Halll, 1978. 512 p. (Russ. ed.: Rabiner L.R., Shafer R.V. Tsifrovaya obrabotka re-chevykh signalov. Ed. M.V. Nazarov, Yu.N. Prokhorov. Moscow, Radio i svyaz' Publ., 1981. 496 p.).

18. Ivanov A.V., Trushin V.A., Khitsenko V.E. O vybore modeli testovogo signala pri otsenke zashchishchennosti rechevoi informatsii ot utechki po tekhnicheskim kanalam [Choice of model of test signal at an assessment of security of speech information from leakage through technical channels]. Trudy SPIIRAN - SPIIRAS Proceedings, 2015, iss. 3, pp. 122-133.

ISSN 1814-1196, http://journals.nstu.ru/vestnik Science Bulletin of the NSTU Vol. 61, No. 4, 2015, pp. 63-73

i Надоели баннеры? Вы всегда можете отключить рекламу.