Научная статья на тему 'Сценарий акустических ритмов речи как инструмент исследования работы мозга'

Сценарий акустических ритмов речи как инструмент исследования работы мозга Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
211
62
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Скляров Олег Павлович

В статье показано, что усложнение ритмической структуры речи происходит как под влиянием реципрокных процессов типа торможениевозбуждение, протекающих на разных уровнях иерархии стволово-корковых структур, так и под влиянием реципрокных процессов, протекающих на одном уровне иерархии. В первом случае усложнение ритмов возрастной фонетики идет по мере созревания соответствующих нейронных образований. Во втором случае это усложнение проявляется либо на уровне подкорковых образований в сфере эмоциональных состояний говорящего, либо на уровне межполушарных взаимодействий при формировании силлаботонического ритма, характерного для нормально сформировавшейся речи.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Scenario of the acoustical speech rhythms as a tool for researching of brain functioning

Possible speech rhythms form a set or scenario of rhythms. In this scenario there are both regular rhythms and chaotic rhythms. Regular rhythms correspond both to child speech rhythm and to fluency disorders like repetitions occurring in stuttering speech. Chaotic rhythms correspond to the fluent speech of normal speakers. Each rhythm corresponds to its control parameter in scenario. This control parameter is proportional to the inhibitory activity, i.e. to relative number of inhibitory neurons emitting spikes per second in the given link of neural structures' hierarchy responsible for arising of the given rhythm. Rhythm complication occurs due to the increasing of inhibitory level in neural hierarchy. For example, the first complication of the basic phonetic rhythm occurs due to increasing inhibition from the side of striatum on pallidum. Further rhythms complications, up to chaotic rhythms, have place due to increasing inhibition from the cortex onto subcortical structures of different kind. In addition to the inhibition activity, there is excitatory activity, i.e. relative number of excitatory neurones emitting spikes per second in given neural ensemble concerning the emotion sphere, supposedly. This activity can reveal itself either as interaction between subcortical structures of the same level of neural hierarchy in form of emotional state of speaker, or as hemicerebrum interactions at the shaping of syllabic-synharmonic rhythm typical for the normally organised speech. These features of rhythmic and emotional behaviour of the speaker allow us to establish that the scenario of the acoustical speech rhythms is a tool for researching of brain functioning.

Текст научной работы на тему «Сценарий акустических ритмов речи как инструмент исследования работы мозга»

Электронный журнал «Техническая акустика» http://www .ejta.org

2005, 34

О. П. Скляров

НИИ уха, горла, носа и речи

Россия, 190013, Санкт-Петербург, ул. Бронницкая, 9, e-mail: skljarov@admiral.ru

Сценарий акустических ритмов речи как инструмент исследования работы мозга

В статье показано, что усложнение ритмической структуры речи происходит как под влиянием реципрокных процессов типа «торможение-возбуждение», протекающих на разных уровнях иерархии стволово-корковых структур, так и под влиянием реципрокных процессов, протекающих на одном уровне иерархии. В первом случае усложнение ритмов возрастной фонетики идет по мере созревания соответствующих нейронных образований. Во втором случае это усложнение проявляется либо на уровне подкорковых образований в сфере эмоциональных состояний говорящего, либо на уровне межполушарных взаимодействий при формировании силлабо-тонического ритма, характерного для нормально сформировавшейся речи.

ВВЕДЕНИЕ

В предшествующих работах автора [1-5] было показано, что ритмы вокализаций в речи человека (У-ритмы) образуют на стадии развития фонетики целый набор, или сценарий перехода таких ритмов к хаосу в зависимости от некоторого управляющего параметра. У-ритмом мы называем (регулярное или иррегулярное) чередование длительностей вокализованных сегментов в речи. Физиологическим коррелятом таких сегментов являются эпохи, когда голосовые складки находятся в осциллирующем состоянии. Акустическим коррелятом таких сегментов являются участки непрерывности интонационного контура, то есть зависимости частоты основного тона от времени.

Многочисленные экспериментальные и теоретические обоснования позволили в качестве модели такого сценария принять сценарий ритмов точечного квадратичного отображения логистического типа в зависимости от управляющего параметра в этом отображении:

где 7п — приведенные к единичному отрезку длительности сегментов У-ритма с номером п, г — управляющий параметр.

В качестве сценария, описывающего переход каскада бифуркаций периода 2 к хаосу, фигурирует сценарий Фейгенбаума перехода к хаосу. Зона хаоса в этом сценарии нами соотносилась с ритмом нормальной речи, а левую границу между бифуркациями

Получена 18.10.2005, опубликована 15.11.2005

Tn+i = rTn(l-Tn), n = 1, 2,...

(1)

удвоения периода и хаосом мы рассматривали ответственной за заикание развития в детском возрасте.

Как оказалось, если рассмотреть в сценарии Фейгенбаума не только окрестность критической точки, но всю эволюцию ритмов, от простейших до сложных, переходящих в хаос, то получается картина, весьма схожая с картиной онтогенеза фонетики [6]. Этот факт позволил вскрыть нейрофизиологическую иерархию стволово-подкорково-корковых структур, и связать их взаимное влияние друг на друга со смыслом управляющего параметра в сценарии Фейгенбаума.

Оказалось, что усложнение ритма по мере роста управляющего параметра возможно связать с торможением, которое имеет место в различных звеньях иерархии нейронных структур, задействованных в процессе онтогенеза фонетики (см. рис. 1). Так, первое усложнение ритма возникает вследствие торможения, оказываемого со стороны стриатума на паллидарные подкорковые ядра, которые обеспечивают существование первичного ритма фонетики ребенка [6]. Дальнейшее, все возрастающее влияние коры на стволовые и подкорковые структуры, ведет ко все большему усложнению ритма, приводящего, в конце концов, динамику ритма в иррегулярную область, описывающую фонетику зрелых речевых процессов.

Известна модель для торможения в нейронных образованиях типа коры головного мозга, предложенная в цикле работ В. И. Сбитнева и В. Г. Яхно [7, 8]. В этих работах исследуется распространение областей повышенной импульсной активности в таких нейронных образованиях. В этой модели в качестве одной динамической переменной используется среднее число рт активных волокон, находящихся в «аксонных» деревьях тормозных нейронов, приходящееся на единицу объема и времени, а в качестве другой динамической переменной используется среднее число рв активных волокон, находящихся в «аксонных» деревьях возбуждающих нейронов, приходящееся на единицу объема и времени. Оказалось, что динамика этих динамических переменных такова, что допускает существование различных динамических режимов, которые описывают распространение в нейронной структуре зон повышенной активности в триггерном, ждущем и автоколебательном режиме. В автоколебательном режиме Яхно установил наличие волн как тормозной, так и возбуждающей активности с характерным временным размером в 160-140 мсек [8]. Эта величина хорошо согласуется со средними значениями длительностей элементов У-ритма нормальной речи, установленными автором данной работы экспериментально [1-5]. Динамика тормозной и возбуждающей активностей, определяемых по формулам гт = ртIPт и гв = рв^в, где плотности тормозных Pт и возбуждающих нейронов Pв равны соответственно Pт = 10-7 мкм-3 и Pв = 10-5 мкм-3 [7], была описана с помощью хорошо себя зарекомендовавшей так называемой аппроксимации «среднего поля» [9] для уравнений нейрона Ходжкина-Хаксли [10], или для их упрощенной модели — уравнений ФицХью [11]. Зависимость гт от гв для уравнений ФицХью в приближении «среднего поля» представима в виде предельного цикла, показанного для различных ситуаций на рис. 1. Мы условились называть величину гт уровнем «торможения» в нейронной системе, соответствующей определенному участку в сценарии ритмов, а гв — уровнем «возбуждения» в такой нейронной системе.

2 -

Рис. 1.

Вверху: сценарий возникновения речевого иррегулярного ритма в результате

усложнения регулярных ритмов при росте торможения в системе. По оси абсцисс отложен управляющий параметр гт (активность «торможения» в нейронной системе, порождающей ритм — подробнее см. текст), по оси ординат отложены возможные в теории нормированные на 1 длительности элементов У-ритма. Управляющий параметр Я = 3,57 соответствует границе перехода бифуркаций, ответственных за возникновение регулярных ритмов, в иррегулярный ритм речи. Справа в зоне иррегулярных ритмов видна довольно обширная лакуна, в которой опять возникают бифуркации, но другой природы.

Внизу: в координатах гт (активность «торможения») и гв (активность «возбуждения») представлены предельные циклы, к которым стремится динамика в порождающей ритм нейронной системе. Изображающая точка {гт; гв} движется против часовой стрелки с течением времени. Жирной линией отмечен предельный цикл для речи в норме; пунктирными линиями отмечены предельные циклы для преходящего заикания у детей (слева) и для невротической компоненты стойкого заикания у взрослых (справа). Два цикла вместе символизируют стойкую фазу заикания, представляющего собой смешанную форму дизритмий тоно-клонического типа и дизритмий невротического типа заикания в переходном и взрослом периоде.

0

г

Т

Однако физиологический смысл уровня «возбуждения», в отличие от смысла уровня «торможения» в иерархии нейронных структур, ответственных за возрастную фонетику, оставался неясен.

Здесь следует обратить внимание на то, что вхождение в хаос в сценарии, изображенном на рис. 1, идет по двум полостям, или крыльям:

1) по верхнему крылу, «выросшему» из так называемой фазы «гуления», и приводящему к языкам с сингармоническим ритмом (китайский, японский и т. д.); в нейрофизиологии это тоническое крыло принято ассоциировать с правым полушарием;

2) по нижнему крылу, «выросшему» из фазы криков, соответствует языкам с силлабическим ритмом (практически все европейские языки); такие ритмы принято соотносить с доминантным, обычно левым полушарием.

Очевидно (см. рис. 2а), что ритм полноценной речи в центре зоны хаоса (соответствующий предельный цикл помечен цифрой 1) соответствует силлабо-тоническим ритмам, которые обеспечиваются взаимодействием обоих полушарий. Рис. 2а можно представить себе как результат поворота нижней части рис. 1, на которой изображены предельные циклы «торможение-возбуждение» вокруг оси абсцисс до тех пор, пока они не «лягут» на сценарий Фейгенбаума, изображенный на верхней части рис. 1.

Т

п

1.0-1

К=3.57

а)

Ь)

Рис. 2.

a) Окрестность границы перехода ритма к иррегулярным ритмам в сценарии У-ритмов, соответствующая дизритмиям тоно-клонического типа и изображенная в координатах: управляющий параметр («торможение») по оси абсцисс; нормированные на единицу длительности элементов У-ритма по оси ординат. Здесь же в координатах: «торможение» по оси абсцисс — «возбуждение» по оси ординат представлены различные предельные циклы «торможения-возбуждения». Белый предельный цикл, помеченный цифрой 1, отвечает ритму нормальной речи. Темно-серый предельный цикл (4) отвечает запиночной речи с запинками тоно-клонического типа. Светло-серый верхний предельный цикл (2), переходящий в белый цикл «П», отвечает тоническим (сингармоническим) иррегулярным ритмам; нижний цикл (3), переходящий в белый цикл «Л», отвечает иррегулярным силлабическим ритмам.

b) Экспериментальные результаты У-сегментации. Значения ^ и stdc соответствуют нормальной речи. Точки [I, std}, полученные при чтении у взрослых с нормальной речью, отмечены «пустыми» кружками внутри компактного круга в вершине диаграммы при нормальном темпе, и отмечены «пустыми» кружками на конце третьей ветви — при замедленном «распевном» темпе. Серыми квадратами помечены точки, полученные при чтении у заик в процессе обычного курса коррекции (псевдобифуркационная диаграмма) и в процессе коррекции по методу Е. С. Лопотко (третья ветвь диаграммы). На рисунке приведены результаты за один из месяцев, взятый в период исследований, длившихся на протяжении 1993-2003 годов. Более подробные пояснения даны в тексте; различные размеры серых квадратов отражают различные экспериментальные погрешности при экспериментальном вычислении точек для речи различных пациентов.

Допустимость такой трактовки V-ритмов заставила нас провести дополнительные исследования фонетических проявлений межполушарных взаимодействий. Принято считать, что во время пения «задействовано» только лишь правое, сингармоническое

полушарие. В НИИ ЛОР (г. Санкт-Петербург) широко используется методика

коррекции заикания, предложенная Е. С. Лопотко [12]. Эта методика основана на использовании навыков так называемой «распевной» речи при темпе, несколько замедленным по сравнению с нормой. Такие навыки, как известно, практически целиком редуцируют запинки в речи заикающегося. Наличие такого клинического опыта в институте позволило нам провести сравнительное исследование «распевной» речи с замедленным темпом и речи в обычном темпе как в процессе коррекции речи у заикающихся, так и в контрольной группе лиц без признаков явной речевой патологии.

МЕТОДИКА

Экспериментальную группу составила подгруппа из 22 взрослых заикающихся, успешно прошедших обычный курс коррекции, и подгруппа из 11 взрослых

заикающихся, также успешно прошедших курс коррекции, но по методике

Е. С. Лопотко. Все пациенты проходили курс коррекции заикания на речевой клинике НИИ ЛОР. Контрольная группа состояла из 8 человек, говоривших как в нормальном темпе, так и в темпе, используемом заикающимися. Пациенты читали стандартный текст объемом 120 слогов. Регистрация речи проводилась трижды за месячный курс коррекции: в начале, в середине и в конце курса.

Речь испытуемых фиксировалась на магнитную ленту с помощью электродинамического микрофона. Процедура перевода электрического сигнала с выхода микрофона в цифровое представление описана в работе [15].

С помощью сертифицированной Минздравом РФ программы сегментации [16], мы определяли длительности голосовых (Voice- или V-) и неголосовых (Unvoice- или U-) сегментов в речи испытуемых заикающихся и вычисляли среднее значение длительностей Т и безразмерный коэффициент вариации std указанных длительностей (отношение среднеквадратичного отклонения к среднему). Точка с координатами {T, std} наносилась на планшет с соответствующими координатными осями (см. рис. 2b). На этом планшете предварительно наносилась компактная область точек { T, std}, соответствующая речи лиц без явной речевой патологии, читавших стандартный текст в нормальном темпе. Заметим здесь в скобках, что приведение теоретического сценария Фейгенбаума, изображенного на рис. 2а, к величинам, фиксируемым нами экспериментально (значение длительностей Т и безразмерный коэффициент вариации std указанных длительностей), приводит к картине, изображенной на рис. 2b (см., например, [13, 14]).

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Из рис. 2Ь видно, что точки [T, std}, полученные при обработке речи пациентов, которые успешно прошли обычный курс коррекции, образуют некоторое множество точек. Среднеквадратичная аппроксимация этого множества представима кривой линией, похожей на бифуркационную линию (так называемая «пуля» Марковица). По мере завершения курса коррекции точки приближаются к области нормы, очерченной окружностью. Как видим, точки для здоровых лиц группируются в вершине указанной кривой. Точки, соответствующие речи пациентов, говорящих в нормальном темпе (серые квадраты — 22 человека) разделяются на две ветви. Пунктирными линиями отмечены области 95% доверительной вероятности (при условии нормального распределения экспериментальных данных). Одна ветвь отвечает речи пациентов со средними длительностями У-сегментов Т, несколько большими длительностей сегментов для нормальной речи. Другая ветвь, наоборот, соответствует средним длительностям, меньшим нормы. Случаи больших коэффициентов вариации std соответствовали, как правило, большей «тяжести» заикания, определенной экспертами. Таким образом, при моделировании процесса ритма необходимо учесть, что заикание должно характеризоваться наличием двух типов У-ритма с большими и меньшими средними длительностями Т для У-сегментов по сравнению с нормальной речью. Первый тип соответствует речи заикающихся, изобилующей запинками тонического типа, например, «со. ..о...о...о...о... нце»; второй тип соответствует речи заикающихся, изобилующей запинками клонического типа, например, «ку...ку...ку...ку...сты». Назовем эти два типа сингармоническим или тоническим и силлабическим или клоническим типом соответственно. Как мы отметили выше, принято соотносить сингармонический тип вокализаций с правом полушарием, а силлабический тип — с левым, как правило, доминантным полушарием.

Кроме того, на рис 2Ь, мы видим третью ветвь, полученную в группе, проходившей курс коррекции по методу Лопотко (метод «распевной» речи), причем по мере завершения курса соответствующие точки продвигались к правой оконечности этой ветви. Видим, что эти точки характеризуются средними длительностями У-сегментов, значительно большими, чем в норме, и стремятся, по мере успеха коррекции, к средним значениям длительностей Т для У-сегментов, несколько больших средних значений длительностей Тс для нормы, а соответствующие коэффициенты вариации std к значениям stdс, соответствующим норме. При взгляде на рис. 2а видно, что такая ситуация возможна, когда из сценария Фейгенбаума выключается нижняя, силлабическая ветвь сценария, за которую ответственно левое полушарие. В этом случае речи без запинок соответствует белый предельный цикл «торможение-возбуждение», помеченный буквой «П» — правое полушарие.

Вероятно, в условиях, когда из сценария «выключена» верхняя сингармоническая ветвь, за которую ответственно правое полушарие, речи без запинок будет соответствовать белый предельный цикл «торможение-возбуждение», помеченный буквой «Л» — левое полушарие. «Выключение» верхней ветви сценария соответствует, скорее всего, речи, произносимой шепотом. Такой речи, действительно, соответствуют крошечные «островки» фонации в «море» шума. Из такой речи может развиться

скандированная, силлабическая речь. Как известно, привитие навыков такой речи также резко редуцирует запинки.

И, наконец, ритму нормальной речи соответствует взаимодействие обеих ветвей: «сингармонической» ветви и «силлабической» ветви с синтетическим «силлабо-тоническим» ритмом нормальной речи. В этом случае, при паритетном взаимодействии обоих полушарий, нормальной речи без запинок будет соответствовать на рис. 2а белый предельный цикл «торможение-возбуждение», помеченный цифрой 1.

Соответствующая модель для описания третьей ветви на рис. 2b была предложена автором еще в ранних работах [2, 3, 13, 14]. Эта модель описывала V-ритм как результат конкуренции двух ритмических процессов, описываемых двумя взаимосвязанными логистическими отображениями типа (1), но с разными, вообще говоря, управляющими параметрами, ответственными за процесс «возбуждения» и «торможения» фонации. Компьютерный расчет показал [2, 3, 13], что асимметрия указанных процессов ведет к возникновению третьей ветви, согласующейся с третьей ветвью на экспериментальном графике 2b. Как мы уже указывали, эта третья ветвь, полученная экспериментально, описывает поведение V-ритма в процессе коррекции методом «распевной» речи.

Таким образом, мы получили как экспериментальное, так и теоретическое свидетельство в пользу наличия асимметрии взаимодействия, скорее всего, межполушарного взаимодействия, в процессе формирования V-ритма «распевной» речи.

ЗАКЛЮЧЕНИЕ

Таким образом, мы видим, что разворачивание сценария Фейгенбаума для V-ритмов речи (см. рис. 1 а) как по оси абсцисс, то есть по линии возрастной фонетики, связанной с усложнением ритмической структуры, так и по оси ординат, то есть по линии силлабо-тонического взаимодействия, обусловлено взаимосвязанными реципрокными процессами типа «торможение-возбуждение». Различие лишь в том, что в возрастном аспекте (по оси абсцисс) это торможение обусловлено всей иерархией нейронных структур, и реализуется для каждого участка сценария наиболее высоким представителем иерархии на данной стадии развития по отношению ко всем представителям иерархии, расположенным ниже. Например, первое усложнение ритма возникает в результате торможения, оказываемого стриатумом на паллидарные ядра. Дальнейший переход от регулярных ритмов к иррегулярным ритмам, свойственным, как мы показали ранее в работах [1-5], нормальной речи, происходит в результате торможения со стороны коры на подкорковые структуры и стволовые образования.

Взаимное же влияние нейронных структур при разворачивании сценария Фейгенбаума вдоль оси ординат обеспечивается, по всей видимости, механизмом взаимодействия между структурами одного уровня иерархии. Указанные

взаимодействия проявляются в сфере эмоциональных состояний говорящего, например, на ранних стадиях возрастной фонетики в виде появления мажорных или минорных тембров с возникновением триады Якобсона основных гласных звуков речи [а], [и], [у] [6]. В случае иррегулярных V-ритмов силлабо-тонического типа, характерных для

развитой речи, таким механизмом взаимодействия является, по всей видимости, механизм межполушарных взаимодействий. Рассмотренные нами экспериментальные данные и предложенная трактовка этих данных оставляют нас в убеждении, что исследование V-ритмов речи является доступным и эффективным инструментом исследования нейрофизиологических механизмов работы мозга при нормальной и нарушенной речи.

ЛИТЕРАТУРА

1. Скляров О. П. Нейрофизиологические аспекты рекуррентного функционирования «скрытых» переменных речевого аппарата. Журнал Высшей Нервной Деятельности, 1998, том 48, вып. 5, 827-835.

2. Скляров О. П. Самоорганизационная природа речевого ритма (модель источника голоса). Биофизика, 1998, т. 43, № 1, 152-158.

3. Skljarov O. P. Nonlinear neurodynamics in représentation of a rhythm of speech. Journal of Biological Physics. Kluwer Acad. Publ, 1999, vol. 25, № 2-3, 223-234.

4. Скляров О. П. Биофизические основы принципа универсальности восприятия речи. Биофизика. 2003, т. 48, № 3, 553-557.

5. Скляров О. П. Лагранжева формулировка проблемы самоорганизации нейронного ансамбля при учете нелинейной диссипации энергии. Биофизика, 2003, т. 48, № 4, 701-705.

6. Винарская Е. Н., Богомазов Г. М. Возрастная фонетика. STT, Томск, 2001, 283 с.

7. Сбитнев В. И. Перенос спайков в статистических нейронных ансамблях. III. Фазовый переход в модели поля СА3 гиппокампа. Биофизика, 1977, т. 22, 523-528.

8. Кудряшов А. В., Яхно В. Г. Распространение областей повышенной импульсной

активности в нейронной сети. В сб. «Динамика биологических систем,

Межвузовский сборник, вып. 2, г. Горький, 1978.

9. Brown G. B., Cooke M., Mousett E. Are neural oscillations the substrate of auditory grouping? Proc. of the Workshop on the Auditory Basis of Speech Percept. Keele, 1996. 174-179.

10. Ходжкин А. Нервный импульс. Пер. с англ. М.: Мир, 1965, 125 c.

11. FitzHugh, R. Impulses and physiological states in theoretical models of nerve membrane. Biophysical Journal, 1961, 1, 445-466.

12. Лопотко Е. С., Соколова Л. А. Эффективность лечения заикания в условиях стационара при использовании модифицированной методики логокоррекционной работы. В кн. Механизмы речевого процесса и реабилитация больных с речевыми нарушениями. Под ред. Ю. И. Кузьмина. М., 1989, 107-111.

13. Скляров О. П. Элементы теории ритма речи на основе физической феноменологии его нарушений. Автореф. дис. ... докт. физ.-мат. наук / О.П. Скляров. СПб, СПб Гос. Университет, 1999, 32 с.

14. Скляров О. П. Хаос и ритм речи в норме и при заикании. Изд-во «ЛЭТИ», СПб, 2002.

15. Скляров О. П. V/U-ритм речи при чтении как индикатор состояния функции речевого дыхания у заикающихся. Электронный журнал «Техническая акустика», http://www.ejta.org, 2004, 16.

16. Сертификационное Свидетельство № 26-05/03-00023 от 26 мая 2003 г. на компьютерную программу «Сегментация Речевого Сигнала» (автор программы -Скляров О. П.).

i Надоели баннеры? Вы всегда можете отключить рекламу.