Научная статья на тему 'Сг-коартикуляция и место образования согласного в русском языке. Данные локус уравнений'

Сг-коартикуляция и место образования согласного в русском языке. Данные локус уравнений Текст научной статьи по специальности «Химические науки»

CC BY
131
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФОРМАНТА / ФОРМАНТНЫЕ ТРЕКИ / ФОРМАНТНЫЕ ПЕРЕХОДЫ / ЛИНЕЙНАЯ РЕГРЕССИЯ / ЛОКУС / ЛОКУС УРАВНЕНИЕ / У-ПЕРЕСЕЧЕНИЕ / КОАРТИКУЛЯЦИЯ / FORMANT / FORMANT TRANSITION / LINEAR REGRESSION / LOCUS / LOCUS EQUATION / INTERCEPT / SLOPE / COARTICULATION / FORMANT TRACKS

Аннотация научной статьи по химическим наукам, автор научной работы — Кузнецов В.Б.

В статье рассматривается сложный вопрос исследования количественных характеристик СГ-коартикуляции в русской речи методом локус уравнений. В качестве речевого материала использовались структуры СГСГ (ударение на втором слоге). Согласные были представлены одним и тем же шумным согласным разного способа и места образования. Шесть дикторов мужчин были записаны в студийных условиях. Показано, что в ударном слоге F2 переход различается у твердых согласных и не зависит от способа образования согласных. В безударном слоге наблюдается последовательное противопоставление твердых велярных губным. Не различаются уравнения регрессии только у безударных и ударных велярных. F2 переход мягких согласных, находящихся в ударном и безударном слоге, не зависит от места и способа образования согласного. Установлено, что у без ударных и ударных мягких согласных уравнения регрессии значимо различаются: у безударных мягких у-пересечение более низкое, а наклон линии регрессии более крутой.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CV-COARTICULATION AND CONSONANT PLACEOF ARTICULATION IN RUSSIAN.LOCUS EQUATION DATA

The aim of the present paper is to describe CV-coarticulation in Russian by means of locus equations. The effects of such factors as place and manner of consonant articulation, its palatalization, position in stressed or unstressed syllable on properties of F2 transition were examined. CVCV structures were used as speech material. The second syllable was stressed. The consonants were realized by an identical obstruent consonant having different manner and place of articulation. Six male speakers were recorded in a sound treated room. It was shown that locus equations for nonpalatalized stressed consonants were different. The role of manner of articulation in this case was insignificant. F2 transition of palatalized stop and fricative consonants were adequately described by two regression equations one in stressed syllable and the other for the consonants unstressed syllable.

Текст научной работы на тему «Сг-коартикуляция и место образования согласного в русском языке. Данные локус уравнений»

УДК 81'342.1 В.Б. Кузнецов

кандидат филологических наук, доцент кафедры прикладной и экспериментальной лингвистики факультета английского языка МГЛУ; e-maiL: kuvLad2007@yandex.ru

СГ-КОАРТИКУЛЯЦИЯ И МЕСТО ОБРАЗОВАНИЯ СОГЛАСНОГО В РУССКОМ ЯЗЫКЕ.

ДАННЫЕ ЛОКУС УРАВНЕНИЙ

В статье рассматривается сложный вопрос исследования количественных характеристик СГ-коартикуляции в русской речи методом локус уравнений.

В качестве речевого материала использовались структуры СГСГ (ударение на втором слоге). Согласные были представлены одним и тем же шумным согласным разного способа и места образования. Шесть дикторов мужчин были записаны в студийных условиях.

Показано, что в ударном слоге F2 переход различается у твердых согласных и не зависит от способа образования согласных. В безударном слоге наблюдается последовательное противопоставление твердых велярных губным. Не различаются уравнения регрессии только у безударных и ударных велярных. F2 переход мягких согласных, находящихся в ударном и безударном слоге, не зависит от места и способа образования согласного. Установлено, что у безударных и ударных мягких согласных уравнения регрессии значимо различаются: у безударных мягких у-пересечение более низкое, а наклон линии регрессии более крутой.

Ключевые слова: форманта; формантные треки; формантные переходы; линейная регрессия; локус; локус уравнение; у-пересечение; коартикуляция.

V. B. Kouznetsov

PhD, Chair of appLied and experimental Linguistics, department of English Language, MSLU; e-maiL: kuvLad2007@yandex.ru

CV-COARTICULATION AND CONSONANT PLACE OF ARTICULATION IN RUSSIAN.

LOCUS EQUATION DATA

The aim of the present paper is to describe CV-coarticuLation in Russian by means of Locus equations. The effects of such factors as pLace and manner of consonant articuLation, its paLataLization, position in stressed or unstressed syLLabLe on properties of F2 transition were examined.

CVCV structures were used as speech materiaL. The second syLLabLe was stressed. The consonants were reaLized by an identicaL obstruent consonant having different manner and pLace of articuLation. Six maLe speakers were recorded in a sound treated room.

It was shown that Locus equations for nonpaLataLized stressed consonants were different. The roLe of manner of articuLation in this case was insignificant. F2 transition of paLataLized stop and fricative consonants were adequateLy described by two regression equations - one in stressed syLLabLe and the other for the consonants unstressed syLLabLe.

Key words: formant; formant transition; Linear regression; Locus; Locus equation; intercept; sLope; coarticuLation; formant tracks.

Со времен первых спектрографических исследований речи [Potter, Kopp G., Kopp H. 1947] сложилось представление о том, что формант-ные переходы гласного содержат информацию, в частности о месте образования предшествующего согласного. Анализируя спектрограммы сочетаний взрывных согласных с различными гласными, Поттер и др. [Potter, Kopp G., Kopp H. 1947] высказали предположение, что в качестве инвариантного акустического коррелята места образования согласного (далее - МОБР) может служить частота F^ того гласного, у которого после данного согласного отсутствует формантный переход. Так, для согласных [b] и [d] такими гласными-индикаторами являются гласные [u] и [ж] соответственно.

В пользу предположений Поттера и др. свидетельствовали результаты экспериментов Хаскинских лабораторий [Liberman 1954] по восприятию двухформатных гласных, синтезированных по нарисованным от руки спектрограммам. Было показано, что наилучшее восприятие [b] и [d] достигалось, если F2 переход начинался или «указывал» на частоту 720 Гц и 1800 Гц соответственно. В случае с [g] этот звук воспринимался удовлетворительно только перед незадними гласными при начале F2 с 3000 Гц. Эти характерные частоты авторы назвали локусом (locus) согласного. Последующие эксперименты показали, что МОБР, например, [d] однозначно идентифицируется в контексте различных гласных, если F2 переход только указывает, но не начинается с 1800 Гц [Delattre, Liberman, Cooper 1955].

Однако исследование в последующие годы формантных переходов в реальной речи [Lehiste, Peterson 1961] не подтвердило статус локуса как инвариантной характеристики МОБР согласных. Отмечалась лишь относительная стабильность F2 переходов для альвеолярного [d]. По мнению Л. А. Чистович и В. А. Кожевникова [Чи-стович, Кожевников 1972], понятие виртуального локуса совершенно

1 Характерную для гласных и согласных частоту F2 авторы называли хаб (НШ).

несостоятельно с точки зрения обработки речевого сигнала слуховой системой человека.

В 1990-е гг. Суссман провел серию исследований [Sussman, McCaffrey, Matthews 1991; Sussman, Shore 1996] для изучения информативности формантных переходов, используя так называемые локусные уравнения (locus equations). Идею локус уравнений предложил Б. Линдблом [Lindblom 1963]. Анализируя редукцию гласных, он заметил, что между начальным значением частоты второй форманты гласного и ее значением в момент достижения гласным целевого состояния существует линейная зависимость.

В математической статистике разработан метод парной линейной регрессии, который позволяет по исходным данным (в нашем случае пары значений F2, характеризующих формантный переход) подобрать прямую линию (уравнение прямой линии), которая в некотором смысле наилучшим образом описывает искомую зависимость. Начальные значения F2 откладываются на оси Y (зависимая переменная), целевые значения F2 - на оси X (независимая переменная, предиктор). Соответственно локус уравнение имеет следующий вид для F2:

F2 старт = aF2 центр + c,

где a - угол наклона линии регрессии, c - точка пересечения линии регрессии с осью Y (y-пересечение). Величина угла наклона характеризует степень коартикуляции МОБР согласного с последующим гласным: чем меньше наклон, тем меньше влияет гласный на МОБР согласного.

Принципиальное отличие «виртуального локуса» Хаскинских лабораторий от метрики локус уравнения Суссман видит в том, что в первом случае речь идет об абстрактном фиксированном акустическом корреляте МОБР, не зависящим от последующего гласного, тогда как локус уравнение предназначено отразить систематический характер контекстно-обусловленной взаимосвязи между начальным и целевым значением F2 перехода.

Безошибочное распознавание МОБР [b. d. g] на основе угла наклона и пересечения позволило Суссману [Sussman, McCaffrey, Matthews 1991] заключить, что локус уравнения обладают реляционной (relational) инвариантностью акустического коррелята МОБР взрывных согласных.

Аналитическое описание характеристик формантных переходов русских гласных применялось довольно редко. Так, М. В. Лобанов

установил расчетные формулы для задания формантных переходов в целях синтеза речи по тексту [Лобанов 1982].

В настоящей работе методика локус уравнения используется как способ количественного описания свойств F2 перехода в русской речи в зависимости от таких факторов, как МОБР согласного, его твердость-мягкость, способ образования и ударность-безударность последующего гласного.

Методика

Речевой материал. Характер разработанного речевого материала должен был позволить исследовать влияния на СГ-коартикуляцию таких факторов, как МОБР согласного, его твердость-мягкость, способ образования (взрывной-фрикативный), нахождение в ударном или безударном слоге. Учитывая опыт предшествующих исследований, использовалась бессмысленная структура СГСГ, в которой оба согласных и гласных реализовывались одним и тем же звуком, например [тата], а ударение приходилось на второй слог. В качестве согласных использовались твердые и мягкие взрывные и фрикативные согласные [п, п', т, т', к, к', ф, ф', с, с', х, х'] и в качестве гласных -[а, и, у]. Исследуемые структуры произносились в рамочном предложении «Вырос СГСГ сильным».

Для чтения был составлен список из 108 предложений (12 согласных х 3 гласных х 3 повторения). Предложения были объединены в 18 блоков, в которых использовался один и тот же гласный, и все согласные были тведыми или мягкими. Последовательность блоков была случайной. Подобная организация материала позволила существенно сократить число ошибок при чтении исследуемых структур.

Дикторы и запись речевого материала. Были записаны шесть дикторов мужчин без дефектов речи и диалектных черт. Запись проводилась в безэховом помещении с помощью микрофона Philips SBC MD 110, внешнего АЦП E-MU 0204 и компьютера. Частота дискретизации - 44100 Гц, разрядность - 16 бит.

Измерение формантных частот. До проведения измерений исходная частота дискретизации была снижена до 11025 Гц. Точки измерения частоты F2 определялись по спектрограмме и осциллограмме. Значение F2 на границе согласного с гласным измерялось на спектре, вычисленном на интервале первого полноценного периода колебания голосовых связок. Второе значение F2 измерялось в точке, где траектория F2 стабилизировалась или достигала экстремального значения.

В обоих точках длина окна анализа, задаваемая вручную, совпадала с одним периодом. Спектральные разрезы вычислялись двумя методами: быстрое преобразование Фурье (далее - БПФ) и линейное предиктивное кодирование (далее - ЛПК). Порядок модели ЛПК подбирался таким образом, чтобы добиться максимального совпадения с БПФ спектром. Порядок модели мог принимать значения от 10 до 14. Частота F2 измерялась вручную на ЛПК спектре.

Результаты

Оценивая в целом качество построенных уравнений линейной регрессии, следует сказать, что все уравнения статистически значимы при а = 0,05; коэффициенты всех уравнений достоверно отличны от нуля, за исключением двух случаев: значений пересечения в уравнении для твердых [к, х] в ударном слоге.

Твердые взрывные и фрикативные согласные

Твердые ударные взрывные различаются либо по обоим параметрам (пересечению и углу наклона линии регрессии) соответствующих уравнений, либо по одному из них. Различие состоит в том, что 95 % доверительные интервалы значений сравниваемых параметров не пересекаются. Подобранные линии регрессии и уравнения, представленные на рисунке 1, подтверждают современные представления о СГ коартикуляции. Как известно, велярный согласный легко ко-артикулирует с последующим гласным. Отсюда - наибольший угол наклона линии регрессии. Наименьший угол характерен для губного согласного. Артикуляторному взаимодействию гласных с этим звуком противодействует использование разных артикуляторов: губ и языка. Уравнение регрессии для [п] способно объяснить только 60 % вариативности начального значения F2 перехода. R2 для [т] и [к] составляет 0,85 и 0,90 соответственно.

Способ образования твердых ударных и безударных существенной роли в формировании F2 перехода не играет: уравнения регрессии фрикативных согласных не отличаются от соответствующих взрывных.

Среди безударных твердых последовательно противопоставляются губные велярным. Безударный переднеязычный по некоторым параметрам совпадает с губным или с губным и велярным.

Рис. 1. Диаграммы рассеяния данных с подобранными линиями регрессии и соответствующие уравнения для твердых взрывных в ударном слоге. В уравнении регрессии для [к] значение у-пересечения не отличается от нуля при а=0,05

Сравнение уравнений для твердых ударных и безударных показывает, что только в случае велярных наблюдается четкое совпадение. В тех случаях, когда ударные и безударные различаются, у последних отмечаются более низкие значения пересечения и более крутой наклон линии регрессии.

Мягкие взрывные и фрикативные согласные

Как можно было ожидать, ни у ударных, ни у безударных мягких согласных МОБР согласного и способ его образования не оказывают влияние на начальное значение перехода [Бондарко 1977]. Для ударных и безударных мягких локус уравнения имеет следующий вид:

ударные мягкие: Y=0, 45х + 1118,2 ^2=0, 63);

безударные мягкие: Y=0,74x + 511,5 ^2=0,71).

Можно заметить, что у безударного мягкого согласного начальное значение Б2 перехода в большей степени, чем у ударного, зависит от последующего гласного и существенно ниже.

Наше исследование перцептивной значимости формантных переходов гласного для идентификации МОБР глухих взрывных показало, что по переходу СГ МОБР мягкого согласного распознается на уров-неслучайного угадывания [Кузнецов 1999]. Более высокий результат был характерен для распознавания по ГС переходу. Спектральный анализ Б2 перехода в последовательности ГС свидетельствует о том, что МОБР согласного является вторым по значимости после ряда гласного фактором, определяющим конечное значение Б2 перехода [Кузнецов 1995; Ригсе11 1979].

Выводы

Основные результаты данного исследования следующие:

- продемонстрирована высокая эффективность инструмента ло-кус уравнения при описании явлений коартикуляции;

- установлено, что способ образования согласного не влияет на характеристики Б2 перехода ни у твердых, ни у мягких согласных в ударном или безударном слоге;

- для мягких согласных подтверждено отсутствие влияния МОБР согласного на начальное значение Б2 перехода;

- впервые установлено различие Б2 переходов у мягких согласных, находящихся в ударном и безударном слогах.

СПИСОК ЛИТЕРАТУРЫ

Бондарко Л. В. Звуковой строй современного русского языка. М. : Просвещение. 1977. 176 с.

Кузнецов В. Б. Эффекты коартикуляции при переходе от гласного к мягкому согласному в русской речи // Проблемы фонетики. II. М. : ИРЯ РАН, 1995. С. 84-100.

Кузнецов В. Б. Роль лингвистических и перцептивных факторов в идентификации глухих смычных по вокалическому контексту // Проблемы фонетики. III. М. : ИРЯ РАН, 1999. C. 48-60.

Лобанов Б. М., Марченков М. А. Алгоритм синтеза формантных параметров по тексту: тезисы докладов и сообщений 12-го Всесоюзного семинара «Автоматическое распознавание слуховых образов» (АРСО-12). Киев : Ин-т кибернетики им. В. М. Глушкова, 1982. С. 414-417.

Чистович Л. А., Кожевников В. А. Восприятие речи. // Физиология сенсорных систем. Ч. 2. Гл. 13. Ленинград : Наука. Ленинград. отд., 1972. С. 427-515.

Delattre P. C., Liberman A. M., Cooper F. S. Acoustic loci and transitional cues for consonants // Journal of the Acoustical Society of America. 1955. Vol. 27. P. 769-773.

Lehiste, I., Peterson, G. Transitions, glides, and diphthongs. // Journal of the Acoustical Society of Americal. 1961. Vol. 33. P. 268-277.

Liberman A. M., Delattre P. C., Cooper F. S., Gerstman L. J. The role of consonant-vowel transitions in the perception of the stop and nasal consonants,// Psychological // Monographs, 1954. Vol. 68. P. 1-13.

Lindblom B. On Vowel Reduction // Royal Institute of Technology. 1963. Report # 29. Stockholm.

Potter R. K., Kopp G. A., Green H. C. Visible speech. New York : D. Van Nostrand Co., 1947. 441 p.

Purcell E.T. Formant frequency patterns in Russian VCV utterances // Journal of the Acoustical Society of America. 1979. Vol. 66 (6). P. 1691-1702.

Sussman H. M., McCaffrey H. A. Matthews S. A. An investigation of locus equations as a source of relational invariance for stop place categorization // Journal of the Acoustical Society of America, 1991. Vol. 90. P. 1309-1325.

Sussman H.M., Shore J. Locus equations as phonetic descriptors of consonantal place of articulation // Perception and Psychophysics. 1996. Vol. 58. P. 936946.

i Надоели баннеры? Вы всегда можете отключить рекламу.