http://dx.doi.org/10.35596/1729-7648-2022-20-4-21-28
Оригинальная статья Original paper
УДК 004.934:534.86
РАЗБОРЧИВОСТЬ И УЗНАВАЕМОСТЬ РЕЧИ ДИКТОРА ПРИ ЭЛЕКТРОАКУСТИЧЕСКИХ ПРЕОБРАЗОВАНИЯХ В ТРАНСФОРМАТОРЕ
А.Ю. ШАФРАНОВ, ТВ. БОРБОТЬКО
Белорусский государственный университет информатики и радиоэлектроники (г. Минск, Республика Беларусь)
Поступила в редакцию 25 января 2022
© Белорусский государственный университет информатики и радиоэлектроники, 2022
Аннотация. Целью статьи является изложение порядка проведения и результатов исследования влияния расстояния от источника звука до трансформатора на разборчивость речи и узнаваемость диктора по голосу при электроакустическом преобразовании в трансформаторе. Из всех существующих методов измерения разборчивости речи и узнаваемости голоса диктора использовался объективизированный метод артикуляционных слоговых таблиц. Выбор метода обусловлен тем, что при большом числе продиктованных и соответственно принятых слогов влияние различных факторов усредняется. Усреднение происходит также, если в испытаниях принимают участие различные группы дикторов и аудиторов. В этом и заключается объективизированность артикуляционного метода. Получить объективные результаты также помогает воспроизведение с помощью речи именно звукосочетаний, не имеющих смысловой нагрузки, так как при приеме слов или фраз можно додумать и восстановить искаженные трактом связи элементы речи. Была определена методика проведения эксперимента. Для исследования в качестве электроакустического преобразователя использовался трансформатор, а в качестве контрольно-измерительной аппаратуры - многофункциональный поисковый прибор ST031М «Пиранья». В состав бригады для проведения исследования был выполнен отбор дикторов и аудиторов. Отбор проводился среди мужчин и женщин в возрасте от 18 до 30 лет, не имеющих явных дефектов речи и слуха и являющихся носителями русского языка. Выведены зависимости значений уровня разборчивости речи и узнаваемости голоса диктора от расстояния между источником звука и трансформатором. Определены расстояния от источника звука до трансформатора, при которых разборчивость речи соответствует различным классам качества согласно ГОСТ 16600-72.
Ключевые слова: разборчивость речи, узнаваемость голоса, электроакустическое преобразование, класс качества разборчивости речи, канал утечки информации.
Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.
Для цитирования. Шафранов А.Ю., Борботько Т.В. Разборчивость и узнаваемость речи диктора при электроакустических преобразованиях в трансформаторе. Доклады БГУИР. 2022; 20(4): 21-28.
INTELLIGIBILITY AND RECOGNITION OF ANNOUNCER'S SPEECH DURING ELECTRIC ACOUSTIC CONVERSIONS IN A TRANSFORMER
ALEXANDER Y. SHAFRANOV, TIMOPHEY V. BORBOTKO
Belarusian State University of Informatics and Radioelectronics (Minsk, Republic of Belarus)
Submitted 25 January 2022
© Belarusian State University of Informatics and Radioelectronics, 2022
Abstract. The purpose of the article is to outline the procedure and the results of the study of the influence of the distance from the sound source to the transformer on speech intelligibility and speaker recognition by voice during electro-acoustic conversion in a transformer. Of all the existing methods for measuring speech intelligibility and voice recognition, the objectified method of articulatory syllabary tables was used. The choice of the method is due to the fact that with a large number of dictated and, accordingly, adopted syllables, the influence of various factors is averaged out. Averaging also occurs if different groups of speakers and auditors take part in the tests. This is the objectivity of the articulatory method. Objective results can also be obtained by using speech to precisely reproduce sound combinations that do not have a semantic load, since when receiving words or phrases, it is possible to think out and restore the elements of the speech distorted by the communication path. The experimental procedure was determined. For the study, a transformer was used as an electroacoustic transducer, and a multifunctional search device ST031M "Piranha" was used as a control and measuring equipment. The selection of speakers and auditors was carried out for the research team. The selection was carried out among men and women between the ages of 18 and 30 who had no obvious speech and hearing impairments and were native speakers of the Russian language. The dependences of the values of the level of speech intelligibility and recognition of the speaker's voice on the distance between the sound source and the transformer are derived. The distances from the sound source to the transformer are determined, at which speech intelligibility corresponds to different quality classes according to GOST 16600-72.
Keywords: speech intelligibility, voice recognition, electroacoustic transformation, speech intelligibility quality class, information leakage channel.
Conflict of interests. The authors declare no conflict of interests.
For citation. Shafranov A.Y., Borbotko T.V. Intelligibility and Recognition of Announcer's Speech during Electric Acoustic Conversions in a Transformer. Doklady BGUIR. 2022; 20(4): 21-28.
Введение
Большинство современной электронной техники имеет в своем составе устройства преобразования электрической энергии, такие как трансформаторы, размещаемые во вторичном источнике электропитания [1]. Такие источники, как правило, непосредственно включаются в сеть электропитания, а трансформатор в них является электроакустическим преобразователем ввиду того, что обладает микрофонным эффектом. Указанное выше в целом обусловливает возникновение акустоэлектрического канала утечки речевой информации.
Целью данной работы являлось исследование влияния расстояния от источника звука до трансформатора на разборчивость речи и узнаваемость диктора по голосу при электроакустическом преобразовании в трансформаторе.
Разборчивость речи может быть определена с помощью методов субъективной оценки (с привлечением дикторов и аудиторов) и методов объективной оценки (с помощью исследования физических свойств и физических характеристик объектов) [2]. Из всех существующих методов измерения разборчивости речи и узнаваемости голоса диктора использовался объективизированный метод артикуляционных слоговых таблиц.
Выбор метода обусловлен тем, что при большем числе продиктованных и соответственно принятых слогов влияние различных факторов усредняется. Усреднение происходит также, если в испытаниях принимают участие различные группы дикторов
и аудиторов. В этом и заключается объективизированность артикуляционного метода. Получить объективные результаты также помогает воспроизведение с помощью речи именно звукосочетаний, не имеющих смысловой нагрузки, так как при приеме слов или фраз можно додумать и восстановить искаженные трактом связи элементы речи [3].
Основные достоинства данного метода:
- универсальность (метод применим к любому типу тракта);
- простота подбора дикторов и аудиторов;
- отсутствие требований к наличию специальных технических знаний у организаторов.
Недостатками данного метода являются:
- громоздкость процедуры измерений (требуются значительные затраты временных, материальных и человеческих ресурсов);
- создание артикуляционных таблиц (в случае недостаточности того количества таблиц, которое представлено в ГОСТ Р 50840-95);
- сложность автоматизации процесса;
- влияние на результат особенностей речи и слуха.
Методика проведения эксперимента
Для исследования использовался трансформатор, имеющий шихтованный сердечник броневого типа. Раннее в [4] было показано, что при электрическом сопротивлении обмотки трансформатора менее 500 Ом с помощью применяемой контрольно-измерительной аппаратуры электрический сигнал в ней не регистрируется. Поэтому для проведения исследования был выбран трансформатор с сопротивлением обмотки 659 Ом, что обусловлено наличием соответствующего трансформатора.
В качестве контрольно-измерительной аппаратуры использовался многофункциональный поисковый прибор ST031M «Пиранья», содержащий в комплекте источник звука. Все измерения выполнялись при значении коэффициента усиления многофункционального поискового прибора, составляющем +12 дБ.
Расстояние от источника звука варьировали в пределах от некоторого максимального значения (расстояния, при котором слоговая разборчивость составляет не менее 10 %) до минимального значения (расстояния, при котором не наблюдается увеличение уровня слоговой разборчивости).
Измерения выполняли в режиме, при котором обмотка трансформатора, к которой подключалась контрольно-измерительная аппаратура, работала в режиме холостого хода (без нагрузки). Все измерения проводились при нормальных климатических условиях.
Согласно требованиям ГОСТ 25902-2016 и ГОСТ Р ИСО 9921-2013 для чтения слоговых таблиц следует привлекать профессиональных дикторов (мужчин и женщин). Допускается привлечение профессиональных актеров-чтецов. В то же время данные требования не учитывают реальные (повседневные) условия эксплуатации помещений, в которых циркулирует информация, предоставление и (или) распространение которой ограничено. Поэтому для проведения отбора дикторов и аудиторов руководствовались требованиями ГОСТ 16600-72 и ГОСТ Р 50840-95. Следует подчеркнуть, что для большей достоверности результатов исследования сознательно применялись наиболее жесткие требования из каждого ГОСТ.
Для измерения разборчивости речи и узнаваемости диктора по голосу был выполнен отбор дикторов и аудиторов в состав бригады для проведения исследования. Отбор проводился среди мужчин и женщин в возрасте от 18 до 30 лет, не имеющих явных дефектов речи и слуха [5]. Учитывая тот факт, что снижение разборчивости речи наблюдается при разговоре на неродном языке даже у хорошо владеющих им людей, а также при прослушивании речи на неродном языке, в состав бригады входили только носители русского языка [2].
Дикторы, разборчивость речи которых, и аудиторы, узнаваемость голоса которых имели систематическое отклонение от средних значений по бригаде более чем на величины, указанные в табл. 1, были исключены из бригады [5].
Таблица 1. Величины отклонений от среднего значения, при котором аудиторы и дикторы подлежат
замене или исключению из бригады [5] Table 1. The magnitude of deviations from the mean value at which auditors and speakers are subjects to
replacement or exclusion from the team [5]
Среднее значение разборчивости речи и узнаваемости диктора по голосу по бригаде, % Average value of speech intelligibility and announcer's recognition by voice in the brigade,% Отклонение разборчивости речи и узнаваемости диктора по голосу от среднего значения, % Deviation of speech intelligibility and voice recognition of the speaker from the mean,%
91 и более 5
86-90 6
81-85 7
71-80 8
70 и менее 9
Было отобрано 6 дикторов (четыре мужчины и две женщины) и 16 аудиторов. Перед выполнением артикуляционных исследований с помощью ПЭВМ записаны артикуляционные слоговые таблицы с участием дикторов. Воспроизведение записей обеспечивалось с помощью акустической системы, входящей в комплект ST031M «Пиранья».
Схема электроакустического канала утечки речевой информации представлена на рис. 1.
Источник звука Трансформатор ST031M «Пиранья» Наушники Аудитор
Sound source Transformer "Piranha" Headphones Auditor
Рис. 1. Схема электроакустического канала утечки речевой информации Fig. 1. Diagram of the electroacoustic channel of speech information leakage
Запись фонограммы слоговых таблиц была проведена в заглушенной камере. Технические параметры фонограммы соответствовали параметрам аппаратуры, применяемой для воспроизведения звука.
Измерение разборчивости речи заключалось в передаче серии артикуляционных слоговых таблиц, записи принятых звуков и обработки результатов [6]. Время работы артикуляционной бригады, непосредственно занятой измерениями, с учетом небольших перерывов между измерениями не превышало 3 ч за один день. После приема 5 таблиц объявлялся перерыв 5-10 мин, а примерно через 1,5 ч объявлялся перерыв на 15-20 мин [7]. Общее число таблиц за одно измерение (один рабочий день) не превышало 20.
Измерения проводила бригада аудиторов, прошедшая тренировку, путем прослушивания записей дикторов через наушники, слоговых артикуляционных таблиц, указанных в приложении Б ГОСТ Р 50840-95.
В начале обучения аудиторы и дикторы знакомились со структурой артикуляционных слоговых таблиц, осваивали технику их произношения, а также адаптировались к восприятию речи [5], получаемой посредством электроакустического канала утечки речевой информации.
Перед началом измерений, для подготовки операторов, были проведены пробные передачи произвольно взятых звукосочетаний из артикуляционных таблиц в течение 2-3 мин. Пробные передачи проводились в тех же условиях, как и передачи для измерений [6]. Перед чтением артикуляционных таблиц слогов диктор сообщал аудиторам номер таблицы. При измерениях передача звукосочетаний проводилась со скоростью одна таблица за 2-3 мин, ровным голосом, четко, но без подчеркивания отдельных звуков [6]. Слоги читались в следующем ритме: один слог в 3 с [5].
Одним из основных параметров, влияющих на разборчивость речи, является уровень звукового давления речевого сигнала, который зависит от голосового усилия говорящего. Голосовое усилие определяют с помощью эквивалентного корректированного по А уровня звукового давления, измеренного на расстоянии 1 м от диктора. Связь между голосовым усилием и соответствующим уровнем звукового давления речи приведена в табл. 2 для диктора мужчины [2].
ДокладыБГУИР Doklady BGUIR Т. 20, № 4 (2022)_V. 20, No. 4 (2022)
Таблица 2. Голосовое усилие мужчины и соответствующий корректированный по А уровень звукового давления речи (дБ относительно 20 мкПа), измеренный на расстоянии 1 м от диктора [2] Table 2. Male voice effort and the corresponding A-weighted speech sound pressure level (dB relative to 20 ^Pa), measured at a distance of 1 m from the speaker [2]
Голосовое усилие Voice effort LSam ,ДБ (dB)
Очень громкая речь 78
Громкая речь 72
Речь повышенной громкости 66
Речь нормальной громкости 60
Речь слабой громкости 54
Одним из исходных условий для проведения измерений разборчивости речи организационной группой было определено требование к дикторам говорить с нормальной громкостью. В силу того, что технически дикторам неудобно контролировать постоянный уровень речи нормальной громкости на расстоянии 1 м от диктора, было принято решение, что микрофон ПЭВМ и шумомер будут располагаться на расстоянии 50 см от диктора. Для этого был вычислен уровень звукового давления речи (дБ относительно 20 мкПа), соответствующий нормальной громкости, измеренный на расстоянии 50 см от диктора. На основе уровня звукового давления речи в месте нахождения диктора (LS А1М) может быть аппроксимирован уровень звукового давления речи в месте нахождения технического средства записи информации (микрофона ПЭВМ) (LS AL). Для этого использовали уравнение [2]
f
ls,a,l = ls,a,im -2°lg- (1)
ro
где Ь8 АЬ — эквивалентный непрерывный корректированный по А уровень звукового давления, измеренный рядом с техническим средством записи информации; А1М — эквивалентный непрерывный корректированный по А уровень звукового давления речи, измеренный на расстоянии 1 м напротив рта диктора; г — расстояние между говорящим и слушателем, м; го = 1 м.
Из уравнения (1) следует, что при каждом увеличении расстояния в два раза уровень звукового давления речи снижается на 6 дБ. Это справедливо как для речи в помещении, так и вне помещения на расстоянии до 2 м [2]. Следовательно, речи нормальной громкости соответствует звуковое давление (дБ относительно 20 мкПа), измеренное на расстоянии 50 см от диктора, которое равно 66 дБ.
Перед началом измерений диктор произносил несколько раз испытательную фразу «Не видали мы такого невода» и добивался такой громкости речи [6], при которой шумомер на расстоянии 50 см от диктора показывал уровень 66 дБ. При чтении таблиц поддерживался постоянный уровень и ритм речи, который контролировался шумомером. Дикторы произносили, а аудиторы записывали слоги последовательно по строчкам артикуляционных таблиц слогов.
Запись принятых звукосочетаний производилась на бланке, который разработан специально для проведения исследования, путем компиляции бланков, приведенных в вышеуказанных ГОСТ. Качественная подготовка аудиторов для проведения измерений позволила добиться четкой и разборчивой записи принятых звукосочетаний и исключить написание сходных по графике букв [6]. Когда аудитор не понимал переданного слога, повторение его диктором не допускалось, аудитор прочеркивал соответствующую строку в бланке принятых слогов [5].
Правильность произношения диктором слов контролировалась непосредственно по слоговым таблицам или с помощью контрольной записи на ПЭВМ. В случае когда диктор делал ошибку, для оценки принимали действительно произнесенный слог.
Слог считали принятым правильно, если все звуки в нем соответствовали основному или дополнительному варианту написания, указанному в таблице над основным. Прочеркнутый слог и слог, в котором хотя бы один звук записан неправильно, пропущен или добавлен, считали принятым неправильно, за исключениями, предусмотренными ГОСТ 16600-72.
После окончания передачи определялось значение разборчивости в процентах по каждой таблице. Определение процента правильно принятых звуков производилось проверяющим, ознакомленным с порядком пользования таблицами и правилами проверки, путем сравнения записи с переданной таблицей. Проверка таблицы аудитором исключалась [6].
Результаты и их обсуждение
Оформление результатов измерения разборчивости речи производилась в сводной таблице. При этом в измерении участвовало 16 аудиторов и 6 дикторов. Все аудиторы (расстояние между источником звука и трансформатором 2 см, 4 см, 6 см, 8 см, 10 см, 12 см, 14 см, 16 см, 18 см) слушали по одной таблице каждого диктора, то есть 6 таблиц. Таким образом, каждый аудитор прослушал 6 х 9 = 54 таблицы. Следует отметить, что все 54 таблицы были разные и ни разу не повторились. При этом каждый диктор записал по 9 таблиц. В итоге оформления результатов измерения разборчивости речи было получено девять сводных таблиц, по одной на каждом выбранном значении. Результаты полученных измерений отражены на рис. 2.
Distance, см
Рис. 2. Зависимость уровня разборчивости речи от расстояния между источником звука
и трансформатором
Fig. 2. Dependence of the level of speech intelligibility on the distance between the sound source
and the transformer
На основе анализа данных установлено, что разборчивость речи на расстоянии до 10 см включительно от источника звука до трансформатора составляет более 90 %. С увеличением расстояния более 12 см разборчивость речи составляет менее 10 %.
В соответствии с ГОСТ 16600-72 разборчивость речи свыше 90 % соответствует классу качества I, характеристикой которого является понимание передаваемой речи без малейшего напряжения внимания, а разборчивость речи менее 10 % соответствует классу качества V, характеристикой которого является полная неразборчивость связного текста.
Оформление результатов измерения узнаваемости голоса диктора производилось в сводной таблице. Если аудитор в бланке при ответе на вопрос: «Узнали ли Вы диктора?» выбрал пункт А («Да, узнал») и верно указал фамилию аудитора, то в сводной таблице ставим «+», если пункты Б («Вроде, голос знаком, но не знаю чей точно») и В («Нет, не узнал»), то «-». Порядок и условия проведения измерений узнаваемости голоса диктора был аналогичен порядку проведения измерения разборчивости речи. В итоге оформления результатов измерения узнаваемости диктора по голосу сформировано девять сводных таблиц, по одной на каждом выбранном значении. Результаты полученных измерений отражены на рис. 3.
Узнаваемость
Distance, см
Рис. 3. Зависимость узнаваемость голоса диктора от расстояния между источником звука
и трансформатором
Fig. 3. Dependence of the speaker's voice recognition on the distance between the sound source
and the transformer
На основе анализа данных установлено, что узнаваемость голоса диктора на расстоянии до 10 см включительно от источника звука до трансформатора составляет более 75 %. С увеличением расстояния более 12 см узнаваемость голоса составляет менее 10 %.
Заключение
Перехват информации в акустических каналах ее утечки является актуальной проблемой. Вместе с тем для оценки возможности реализации подобных мероприятий необходимо численно оценить расстояния, которые подобную проблему позволяют решать.
В результате проведенных исследований установлено, что при увеличении расстояния более 12 см от источника звука до трансформатора разборчивость речи составляет менее 10 %, что соответствует классу качества V (ГОСТ 16600-72), характеристикой которого является полная неразборчивость связного текста. Кроме того, указанное увеличение расстояния приводит к одновременному снижению узнаваемости голоса диктора. Такое положение дел накладывает существенные ограничения на перехват информации по электроакустическому каналу ее утечки, где используются индуктивные преобразователи, в частности трансформаторы.
Кроме того, необходимо отметить, что при определенных условиях перехват речевой информации возможен. Поэтому комплекс мер, направленных на специальные проверки средств обработки информации, а также других технических средств и систем, является весьма актуальным.
Список литературы
1. Битюков В.К., Симачков Д.С. Вторичные источники электропитания. Вологда: Инфра-Инженерия; 2017.
2. ГОСТ Р ИСО 9921-2013. Эргономика. Оценка речевой связи. Москва: Стандартинформ; 2014.
3. Рева И.Л. Усовершенствованная методика оценки защищенности речевой информации от утечки по техническим каналам. Новосибирск: МГТУ; 2012.
4. Шафранов А.Ю., Борботько Т.В. Исследование влияния сопротивления нагрузки трансформатора, на значение уровня сигнала, возникающего в его обмотке вследствие электроакустического преобразования. Материалы XXV научно-практической конференции Комплексная защита информации, 15-17 сентября 2020 г. Москва: Медиа Группа «Авангард»; 2020:154-156.
5. ГОСТ Р 50840-95. Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости. Москва: Госстандарт России; 1995.
6. ГОСТ 16600-72. Передача речи по трактам радиотелефонной связи. Требования к разборчивости речи и методы артикуляционных измерений. Москва: Государственный комитет стандартов Совета Министров СССР; 1973.
7. ГОСТ Р 25902-2016. Залы зрительные. Метод определения разборчивости речи. Москва: Стандартинформ; 2017.
References
1. Bityukov V.K., Simachkov D.S. [Secondarypower supplies]. Vologda: Infra-Engineering; 2017. (in Russ.)
2. GOST R ISO 9921-2013. Ergonomics. Assessment of speech communication. Moscow: Standartinform; 2014. (in Russ.)
3. Reva I.L. [Improved methodology for assessing the security of speech information from leakage through technical channels]. Novosibirsk: MSTU; 2012. (in Russ.)
4. Shafranov A.Y., Borbotko T.V. [Investigation of the influence of the load resistance of a transformer on the value of the signal level arising in its winding due to electro-acoustic conversion]. Materials of the XXV Scientific and Practical Conference Complex Information Security, September 15-17, 2020. Moscow: Avangard Media Group; 2020:154-156. (in Russ.)
5. GOST R 50840-95. Transmission of speech over communication paths. Methods for assessing quality, intelligibility and recognition. Moscow: Gosstandart of Russia; 1995. (in Russ.)
6. GOST 16600-72. Voice transmission over radiotelephone communication paths. Speech intelligibility requirements and articulation measurement techniques. Moscow: State Committee for Standards of the Council of Ministers of the USSR; 1973. (in Russ.)
7. GOST R 25902-2016. Auditoriums. A method for determining speech intelligibility. Moscow: Standartinform; 2017. (in Russ.)
Вклад авторов
Все авторы внесли равный вклад в написание статьи.
Authors' contribution
All authors have equally contributed to the writing of the article.
Сведения об авторах
Шафранов А. Ю., студент Белорусского
государственного университета информатики и радиоэлектроники.
Борботько Т.В., д.т.н., профессор, заведующий кафедрой защиты информации Белорусского
государственного университета информатики и радиоэлектроники.
Information about the authors
Shafranov A.Y., Student at the Belarusian State University of Informatics and Radioelectronics.
Borbotko T.V., Dr. of Sci (Tech.), Professor, Head of the Department of Information Security of the Belarusian State University of Informatics and Radioelectronics.
Адрес для корреспонденции
220013, Республика Беларусь,
г. Минск, ул. П. Бровки, 6,
Белорусский государственный университет
информатики и радиоэлектроники;
тел. +375-29-334-18-12;
e-mail: [email protected]
Борботько Тимофей Валентинович
Address for correspondence
220013, Republic of Belarus, Minsk, P. Brovka St., 6, Belarusian State University of Informatics and Radioelectronics; tel. +375-29-334-18-12; e-mail: [email protected] Borbotko Timofey Valentinovich