К вопросу о возможности применения аппаратов «Искусственная гортань» для речевых исследований

Н. Ф. Кучер; В. М. Разин

ИЗВЕСТИЯ

ТОМСКОГО ОРДЕНА ОКТЯБРЬСКОЙ РЕВОЛЮЦИИ И ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ПОЛИТЕХНИЧЕСКОГО ИНСТИТУТА им. С. М. КИРОВА

Том 246 1974

к ВОПРОСУ О ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ АППАРАТОВ «ИСКУССТВЕННАЯ ГОРТАНЬ» ДЛЯ РЕЧЕВЫХ ИССЛЕДОВАНИЙ

Н. Ф. КУЧЕР, В. м. РАЗИН

(Представлена кафедрой вычислительной техники)

Аппараты «Искусственная гортань» (ИГ) были разработаны в качестве протезов для людей, потерявших по какой-либо причине голосовые связки, например, в связи с хирургической операцией. Они позволяют таким людям восстановить возможность общения посредством речевой связи.

В настоящее время имеется несколько разновидностей аппаратов ИГ, которые подразделяются на два класса: вибрационные и звукоизлу-чающие.

Основным элементом вибрационных аппаратов является механический вибратор, колеблющийся с заданной частотой основного тона, который прикладывается к определенному участку шеи и таким образом возбуждает речеобразующий тракт.

В звукоизлучающих аппаратах колебания основного тона генерируются в виде импульсного акустического давления, которое создается специальным звукоизлучающим элементом типа электродинамического или электромагнитного телефона, включенного на выходе импульсного генератора, и по специальному звукопроводу вводятся в речевую полость говорящего.

Создаваемая с помощью аппаратов ИГ искусственная речь по качеству и громкости приближается к естественной.

В Советском Союзе серийно выпускается только один голосообразу-ющий аппарат вибрационного типа—АГ-61, построенный по принципу зуммера. Несмотря на сравнительную простоту аппарата, речь, получаемая с его помощью, обладает хорошим качеством.

Из зарубежных аппаратов вибрационного типа известен аппарат фирмы \УеБСоп (США), описанный в [1]. Вибратор в этом аппарате приводится в действие электронным генератором прямоугольных колебаний, выполненным на транзисторах.

Звукоизлучающих аппаратов Советский Союз серийно в настоящее время не выпускает. Однако имеются разработанные и подготовленные к серийному выпуску аппараты ИГ типа «Голос-15», «Голос-18», «Го-лос-21», которые характеризуются следующими данными:

1. Частота основного тона — 80—150 гц.

2. Длительность импульса основного тона —0,3—0,6 мсек.

3. Средний уровень громкости — 70 дб на расстоянии 1 м.

Кроме того, аппарат «Голос-21» позволяет генерировать шумовые звуки со средним уровнем громкости 50—60 дб.

Рассмотрим процесс образования речи с помощью аппаратов «Искусственная гортань». Согласно акустической теории речеобразова-ния, наиболее полно разработанной Г. Фантом [2], процесс образования звуков речи происходит следующим образом (рис. 1 служит для иллюстрации этого процесса):

Лёгкие Го/юообие Рмеобращнхций

сбозни тоахт

Ряс. 1. Блок-схема, иллюстрирующая процесс образова-ния звуков речи

Легкие посылают постоянный воздушный поток к голосовым связкам, которые в зависимости от вида звука преобразуют этот поток или же в почти периодические колебания, или в белый шум. Колебания, излучаемые голосовыми связками, имеют спектр 50((о). Далее эти колебания поступают в речеобразующий тракт, который является линейным пассивным четырехполюсником, имеющим частотную передаточную функцию /С(со) - На выходе речеобразующего тракта, оканчивающегося губами, возникает речевой сигнал, спектр 5(й>) которого, согласно теории линейных систем, равен

5((о) = 50(о)) - *(©). (1)

Процесс образования звуков речи с помощью апаратов ИГ происходит аналогично описанному (рис. 2).

Колебания «Искусственной гортани» со спектром 5/0((о) воздействуют непосредственно на речеобразующий тракт с передаточной функцией /С(со), на выходе которого образуется «искусственный» речевой сигнал со спектром 5'(со), равным

5'(со) =5'о(©) -ВД- (2)

Искусственный речевой сигнал обладает хорошей разборчивостью и громкостью, почти не уступающим естественной речи, и, кроме того, обладает двумя замечательными свойствами: постоянством частоты основного тона и постоянством спектра 5/0(о>) сигнала возбуждения речеобразующего тракта. Эти свойства являются чрезвычайно важными в задачах распознавания, синтеза и компрессии речевых сообщений.

Таким образом, произнесение речи с помощью аппарата ИГ обеспечивает нормировку речевого сигнала разных дикторов по частоте основного тона и спектру возбуждения, позволяет избавиться при анализе от сложного устройства выделения основного тона, так как сигнал основного тона можно вывести прямо из генератора, входящего в состав ИГ.

Среди большого круга задач, связанных с анализом и синтезом речевых сообщений, выделяются задачи определения передаточных функций речеобразующего тракта человека и определения сигнала возбуждения (импульсов основного тона). Применение аппаратов ИГ позволяет решить эти задачи.

и?куос/п5емиао 5'0(из) Ртодоозуи)- м „

гэотзь'о I — ший тракт

•4 Реио

Рис. 2. Образование «искусственной речи»

•3. Известие ТПИ, т. 246.

33

Рассмотрим выражение (2). Передаточная функция речеобразующе-го тракта К ((о) определяется из него следующим образом:

/Г/ * ^ /ОЧ

= г. (3)

то есть для того, чтобы определить неизвестную передаточную функцию К (а)) у достаточно знать 5'(со)-спектр «Искусственного» речевого сигнала и 57о((о)-спектр колебаний аппарата ИГ, определение которых известными методами не представляет трудностей, так как в отличие от естественной речи есть возможность измерить спектр S'0(ю) сигнала возбуждения на выходе звукопровода ИГ.

Другой метод измерения передаточной функции речеобразующего тракта основан на известном свойстве линейных систем, заключающемся в том, что импульсная переходная функция g(t) линейной системы (функция веса) и частотная передаточная функция /((со) связаны между собой преобразованием Фурье

00

К(<») = jg(t)e~/mtdi. (4)

Считается, что за период Т основного тона переходный процесс (речевой сигнал) в речеообразующем тракте при воздействии на него импульса возбуждения (основного тона) прекращается. Поэтому, если с помощью ИГ сформировать достаточно короткий импульс возбуждения (при периоде основного тона 7=10 мсек достаточно выбрать длительность сигнала возбуждения, равной 100—\Ь0 мкеек), полученный «искусственный» речевой сигнал с достаточной степенью точности можно считать функцией веса речеобразующего тракта, по которой с помощью выражения (4) легко получить искомую функцию /С(ш).

После определения /С (со) из выражения (1) можно определить спектр 50((о) функции естественных голосовых связок человека по формуле

SoH = ТГГТ ' ( '

К П

С помощью обратного преобразования Фурье по спектру S0(to) определяется временная функция возбуждения U(t).

ЛИТЕРАТУРА

1. H. Barnev. Unitarv Transistored Artificial Larynx. IRE Wescon Convention Record, Part 8. August. 1959."

2. Г. Ф a h т. Акустическая теория речеобразования. «Наука», 1964.

К вопросу о возможности применения аппаратов «Искусственная гортань» для речевых исследований Текст научной статьи по специальности «Математика»

Похожие темы научных работ по математике , автор научной работы — Н Ф. Кучер, В М. Разин

Текст научной работы на тему «К вопросу о возможности применения аппаратов «Искусственная гортань» для речевых исследований»