УРОВНИ ЯЗЫКА
ФОНЕТИКА. ФОНОЛОГИЯ
2005.03.015. ТЕОРИЯ И ПРАКТИКА РЕЧЕВОЙ КОММУНИКАЦИИ: Ме-ждунар. конф., 7-9 сент. 2004 г, Москва. Тезисы докладов, статьи / МГУ им. М.В. Ломоносова. - М.: МАКС Пресс, 2004. - 176 с.
Издание является сборником статей и тезисов докладов, прочитанных на заседаниях юбилейной (внеочередной) Международной конференции «Теория и практика речевой коммуникации», которая проходила на филологическом факультете Московского государственного университета им. М.В. Ломоносова 7-9 сентября 2004 г. Конференция была посвящена 40-летию лаборатории фонетики и речевой коммуникации филологического факультета МГУ и стала продолжением многолетних традиций Всесоюзного семинара «Автоматическое распознавание слуховых образов», посвященного междисциплинарным исследованиям в области языка и речевой коммуникации. Тематика представленных докладов и сообщений, которые вошли в сборник, затрагивает достаточно широкий круг вопросов. Большая часть материалов освещает актуальные на сегодняшний день фундаментальные проблемы фонетики языка и речи (в том числе для разных языков - русского, украинского, белорусского и др.), а также новейшие результаты прикладных исследований по созданию систем автоматического синтеза и распознавания речи, верификации и идентификации речи говорящего, алгоритмам акустической обработки речевого сигнала и его преобразований. В сборник вошли также работы по исследованию других языковых уровней - см. тезисы и статьи по семантике и прагматике просодического уровня спонтанной речи и т.д.; вместе с тем в книге представлены работы по общей теории речевой коммуникации, физиологии и психологии восприятия речи, психолингвистике, жанровой классификации новых видов современных языковых произведений (Интернет-журналистике), становлению речи в онтогенезе, межъязыковому взаимо-
действию (межъязыковой интерференции), Интернет-дидактике, особенностям строения слухового канала у человека и высших животных (дельфинов) и др. Состав авторов также весьма разнообразен и охватывает академические институты и вузы разных регионов России, Белоруссии и Украины.
Вопросы общей теории речевой коммуникации рассматриваются в работах Л.И. Дмитриевой и Н.В. Чесноковой «Вербальные и невербальные средства общения: Сходство и различие», Р. А. Каримовой «Возможности художественного текста в отражении пограничного состояния субъекта: Модель текста, вариации модели», Т.М. Королевой, И.М. Де-рик «К вопросу о жанровой специфике интерактивных биржевых новостей», И.Б. Морозовой «Грамматический феномен обращения как выражение направленного психологического воздействия на коммуниканта (На материале английского языка)», О.Е. Фроловой «Спонтанный текст: Структура и типология», Г.К. Хамзиной «Бытийная семантика как фактор структурно-семантической организации высказывания».
Закономерности строения речевой просодии (на материале разных языков) нашли отражение в работах Т. А. Бровченко и ее коллег («Просодическая организация функционально-семантических типов информативных и апеллятивных текстов в украинском языке»), Е.И. Григорьева («Оппозиции акустических признаков иллокутивных актов»), Л.В. Злато-устовой («Роль «веса» признаковых параметров в организации просодии текста»), В.В. Олинчук («Лексико-синтаксическая и просодическая аран-дировка монолога как средство экспрессии женских дискурсивных практик (На материале английского языка)»), М.К. Румянцева («К проблеме исследования просодического устройства двусложного и многосложного слова»), Э.Б. Яковлевой («Специфика сегментации спонтанной речи и коммуникативная значимость хезитаций»). Некоторые специфические особенности формирования речевого ритма рассмотрены также в тезисах О.П. Склярова («Силлабические и сингармонические языки и дуальность сценария Фейгенбаума формирования У-ритма речи»).
Результаты перцептивных и психолингвистических исследований речи представлены в статьях и тезисах следующих авторов: В.Г. Александрова («Коммуникативный шум как один из индикаторов возрастных характеристик персонажа»), Е.Г. Васильченко («Перцептивные и акустические характеристики .К-аллофонов в немецкой слитной речи (Исследование речи профессиональных дикторов Германии за период 1923— 2003 гг.)»), К.И. Долотин («К проблеме разработки методов исследования
центральных механизмов порождения речи»), М.Р. Желтухина («Психологические приемы воздействия язь СМИ»), Е.Е. Ляксо, А.Д. Громова, О.В. Фролова, О.А. Романова, И.В. Новикова, А.Д. Куражова, В.И. Галунов («Психофизиологические основы формирования речевой деятельности в онтогенезе»), Н.Ю. Носенко («Особенности реализации моделей звуковых переходов в русских взрывных согласных при восприятии в шумах»).
Разработкам новых и совершенствованию известных моделей автоматического анализа и синтеза речи посвящены статьи С.Н. Кириллова, Д.Ю. Мамушева, А.А.Лоцманова «Нелинейная параметрическая модель анализа и синтеза речевого сигнала», С. Л. Коваля, Н.С. Смирновой, М.В. Хитрова «Проблемы создания лингвистического обеспечения для системы дикторонезависимого автоматического распознавания разговорной русской речи», Б.М. Лобанова, Л.И. Цирульник «Алгоритм персонализированного синтагматического членения текста для ТТ8-систем клонирования речи», Б.В. Поспелова, М.И. Каплуна «Исследование корреляции в микроструктуре гласных», А.А. Рыболов-лева и С.В. Забирника «Классификационные признаки устройств аналого-цифрового преобразования речи, основанных на методе линейного предсказания», Ю.А. Сидоровой «Использование алгоритма С. 4.5 для модели понимания речи», В. В. Филимонова «Словарь дикторозависимой системы распознавания речи для робототехнических и военных приложений на основе фонемного сегментирования».
Прикладные аспекты речеведения нашли отражение в массиве исследований, посвященных разработке подходов к решению проблем автоматической идентификции и верификации голоса диктора (работы А.А. Гноевого, А.А. Коршунова, В.О. Сахарова, К.А. Маковкина «Система верификации и идентификации голоса, работающая в диалоговом режиме», А.Г. Давыдова, В.В. Киселёва, Б.М. Лобанова, Л.И. Цирульник «Система экспресс-идентификации голоса личности методом клонирования акустических характеристик речи», А.Ш. Каганова «Об использовании относительных просодических и спектральных характеристик в задаче криминалистической идентификации личности по звучащей речи», В.О. Кузнецова «Исследование языковой ситуации в Брянской области в криминалистическом аспекте», Н.Б. Кураченковой «Некоторые аспекты подготовки экспертов по криминалистической фонографии», А. Л. Ованнисян («Диагностика признаков межъязыковой интерференции в русской речи дикторов-иностранцев»).
К этим работам примыкают описания новых программных продуктов исследования речевого сигнала, которые расширяют возможности экспериментатора-фонетиста (тезисы И.Л. Иванова «".Ю8Т1РНОКЕ 2.0" Программный продукт исследования голоса и звучащей речи» и «".Ю8Т1РНОКЕ 2.0" Шумоочистка фонограмм»).
Физиология слуха и закономерности перцепции речи рассмотрены в работах Н.Г. Бибикова («Детекторы длительности и скважности в слуховой системе») и М.Н. Сухорученко («Слуховые признаки пар импульсов-щелчков с коротким межимпульсным интервалом у дельфина афалины»).
Некоторые аспекты общей теории коммуникации
В работе Л.И. Дмитриевой и Н.В. Чесноковой рассматривается сходство и различие вербальных и невербальных средств общения. Авторы отмечают, что в коммуникативной системе, имеющей место в человеческом обществе, чаще всего наблюдаются синкретические сообщения т.е. синтез разных знаковых систем и особенно тех, которые воспринимаются посредством зрения и слуха. На материале художественной литературы они изучают вопрос о соотношении разных видов коммуникации (в первую очередь, слуховой и зрительной). Анализ приведенных примеров показал, что вербальные и невербальные сообщения выполняют в речи абсолютно одинаковую функцию: функцию общения. В то же время в ходе коммуникации возможна нейтрализация этих видов общения, когда диалог может целиком строиться на вербально невыраженных сообщениях, но собеседники все же адекватно понимают друг друга. Отмечается, что па-ралингвистический комплекс (невербальная система коммуникации), разрушая вербальную часть высказывания, может заменить практически любой член предложения. Авторы делают вывод, что привлечение паралин-гвистических средств к участию в коммуникации диктуется не ущербностью языковой системы, а лишь обстоятельствами внешнего порядка, связанными с характером коммуникации.
Исследование Р.А. Каримовой посвящено исследованию семантики состояния субъекта связной речи (связного текста) через построение модели текста и ее вариаций; исследование используемых в нем способов актуализации смыслов, связанных с определенным состоянием; взаимосвязи характера языковой картины мира и типа текста (т.е. вопроса о текстовой типологии). В работе используется коммуникативно-структурный анализ;
кроме того, проведен аудитивный анализ ряда текстовых фрагментов, реализованных в прочтении диктором. Основными компонентами разрабатываемой модели являются субъект-носитель состояния, каузатор состояния - проблемная ситуация, которой субъект подведен к пограничному состоянию, и состояние множественности сознания (которое отражается в образах восприятия, включая ментальные), вызванное каузатором. Показано, что в речевой (текстовой) действительности модель представлена различными вариациями, обусловленными экстралингвистическими и лингвистическими причинами - это имплицитная картина мира автора, его эстетические установки; языковая личность автора, типологическая (жанровая) отнесенность речевого произведения.
Украинские лингвисты Т.М. Королева и И.М. Дерик посвятили свое исследование изучению особенностей Интернет-коммуникации. Предметом их исследования явилось сложное и ранее малоизученное явление — дискурс интерактивных биржевых новостей (ИБН). Предметом исследования послужили дистинктивные признаки интерактивных биржевых новостей, которые могут быть рассмотрены как жанрово-составляющие характеристики. Полученные результаты исследования позволяют сделать вывод о специфическом оформлении звучащей речи составителями ИБН с целью придания ей эффекта спонтанности, непроизвольности и максимального приближения к стилю доверительной, непринужденной, дружеской беседы. Авторам удалось также выявить и описать ряд дис-тинктивных признаков этого жанра, перечень этих признаков приведен в тексте статьи.
И.Б. Морозова (Одесский национальный университет, Украина) посвятила свое исследование проблемам изучения такой универсалии коммуникативной ситуации, как феномен адресации, или обращение; рассмотрению его психологического воздействия на коммуниканта. В задачи рассматриваемой работы входило, прежде всего, определение синтаксической роли обращения в предложении и его удельного веса в коммуникативно-различных типах предложения. На основе анализа экспериментального материала (4000 диалогических единств, отобранных методом сплошной выборки из современного англоязычного художественного диалога) делается вывод о том, что синтаксическая роль обращения прямо обусловливается психологическими законами речевой коммуникации, а само наличие обращения в предложении является косвенным индикатором коммуникативного типа предложения.
Исследование О.Е. Фроловой посвящено разработке теоретических принципов изучения спонтанной речи, в частности синтаксической структуры и типологии спонтанного текста. Автор считает, что описание синтаксиса спонтанной речи также должно быть построено на коммуникативных и логико-семантических основаниях. Поскольку спонтанная речь, так же как и подготовленная, характеризуется наличием коммуникативной цели, основные различия в функционировании этих типов речи вносит, по мнению автора, отношение говорящего к денотативной ситуации. Денотативные ситуации неоднородны и различительной характеристикой, определяющей их типологию, можно считать категорию времени. Различное понимание денотативных ситуаций в подготовленной и спонтанной речи влияет на характер речевого произведения с точки зрения его линейности/иерархичности. Таким образом, в теоретическом плане структуру речевого произведения можно, по мнению О.Е. Фроловой, охарактеризовать следующим образом: анализу денотативной ситуации сопутствуют реализуемые в речи способы ее представления, описываемые как модусные характеристики высказывания, отношение высказывания к денотативной выражено в модальных характеристиках высказывания. В статье подробно разбираются маркеры спонтанности и другие ее базовые характеристики.
Просодия речи
Исследователи-фонетисты из Одесского университета (Т.А. Бровченко, В.Г. Волошин, Н.Р. Григорян, Н.В. Петлюченко), представили новые данные в области просодической организации разных функционально-семантических типов украинских звучащих текстов. Объект их исследования - интонационные структуры информативных и апеллятивных типов высказываний в текстах на украинском языке (в сравнении с английским), как цельные структуры для обучения интонации языка с помощью компьютерных обучающих систем. В результате авторы планируют создание обучающей компьютерной программы украинской интонации. Для описания экспериментального речевого материала (интонационной структуры повествования, убеждения, просьбы и приказа) авторы разработали специальные модели получения схематических вербальных и графических тональных портретов соответствующих текстов. Созданная ими методика позволила впервые на материале украинского языка получить интонационные «портреты» перечисленных
функционально-семантических типов текстов и сопоставить полученные результаты с данными английского языка.
В статье, представленной в реферируемом сборнике, профессор Тамбовского университета Е.И. Григорьев продолжает развивать свою методологию фонетико-просодических исследований. Ранее на материале немецкого языка им была сформулирована система иллокутивных актов, состоящая из 16 типов. Смысловой эффект устно реализуемых высказываний создается комбинированием тональных, динамических и временных характеристик, корреляции которых очень подвижны, и их изменения вызывают новое семантическое содержание. В качестве маркеров конкретных речевых актов на просодическом уровне выступают тональные и динамические контрасты релевантных и нерелевантных компонентов высказывания, крутизна подъемов и падений тона, скорость изменения громкости, а также отношение частоты основного тона (ЧОТ) данного иллокутива к среднедикторскому значению ЧОТ. Дифференциация иллокутивов на просодическом уровне осуществляется только путем установления количественных показателей признака больше/меньше. Конкретный тип РА опознается в результате фиксирования контрастов ЧОТ, интенсивности и длительности на разных отрезках фразы. Для описания оппозиций автор выделяет пять высотных и такое же число динамических уровней. На этом основании в соответствии с показаниями испытуемых - носителей немецкого языка для каждого типа иллокутивных актов автором выявлены сходные речевые акты, которые объединяются в оппозитивные группы. Устанавливая тональное и динамическое положения каждой из релевантных точек сопоставляемых иллокутивов, а также учитывая темпоральный фактор слога, были построены оппозиции иллокутивных актов немецкого языка. В статье в качестве образца рассмотрена оппозитивная группа депрецива (негативной оценки события или факта). Е.И. Григорьев приходит к выводу о необходимости учета при распознавании иллокутивного акта не конкретных его зон, но всего тонально-динамического контура в целом.
Экспериментально-фонетическое исследование просодии текста Л.В. Златоустовой посвящено определению роли «веса» признаковых параметров в организации просодии текста, для чего ею были проведены специальные эксперименты на материале прочитанных девятью дикторами текстов публицистического функционального стиля и спонтанных монологических текстов на близкие темы, а также прочитанных через две недели 20 коротких журнальных статей на идентичные темы. В ре-
зультате обработки полученных данных автор приходит к следующим выводам. Оказалось, что у всех дикторов спонтанные тексты имеют большую среднезвуковую длительность, обнаружены также значительные отличия в формировании временной программы синтагм прочитанных и спонтанных текстов, которые частично противоречат сложившемуся ранее мнению об универсальности эффекта замедления конца синтагмы. Показано, что просодия синтагм, составляющих спонтанный текст, отличается особой спецификой употребления мелодических моделей, а интенсивность коррелирует с мелодикой (частотой основного тона в акустическом эксперименте). Таким образом, основными признаковыми параметрами спонтанного теста называются (в порядке значимости): длительность начал и концов синтагм, фразовые выделительные акценты, паузация, мелодические контуры однотипного характера, т.е. все параметры, работающие на основные функции просодии - фокусирующую, сегментирующую, модально-эмоциональную, функцию выражения смысловых отношений.
Выполненная в русле тендерных исследований работа В.В. Олинчук посвящена изучению семантико-синтаксическои и просодической аранжировки женского монолога в составе диалогической речи, зафиксированного в художественных произведениях английских и американских писателей. Целью исследования стали средства экспрессивной речи женщин, их изучение и систематизация, разработка синтаксических и интонационных моделей экспрессивного монолога как односторонней коммуникации. Исследование показало, что экспрессивность женщин связанна с их квалификационно-оценочной деятельностью и является компонентом структуры умственной деятельности. Для изучения выражения различных видов оценок в экспрессивном феминистском монологическом дискурсе, которое достигается соотношением лексических, грамматических и интонационных средств, выступающих в информационной структуре текста зачастую одновременно, иногда при лидирующей роли последних, автором был проведен аудиторский и акустический анализ с последующей математической обработкой его результатов. Результаты этого анализа подробно разбираются и комментируются в тексте статьи.
В статье М.К. Румянцева обсуждаются базовые теоретические вопросы изучения просодии звучащего текста. Отмечается, что традиция не различать просодическое устройство слова как единицы номинативной и слова во фразе, в тексте не может считаться достаточно продуктивной, так как имеет много недостатков. Автор подчеркивает, что исследователю-
фонетисту необходимо четко осознавать, что, изучая просодическое устройство слова в речевом тексте, он изучает, строго говоря, просодическое устройство единицы текста — синтагмы, а не слова. В результате возможного смешения, когда просодия слова изучается через просодию текста, нередко возникает ситуация, когда функции текстовой просодии приписываются функциям просодии слова, что не может быть признано соответствующим действительности. Другими словами, полезно различать просодические признаки, которые создают само слово (например, ударение), и признаки, которые возникают в слове в результате его функционирования в речевом тексте (например, фразовые акценты и т.п.).
Актуальные проблемы сегментации спонтанной речи и коммуникативная значимость хезитаций рассмотрены в фундаментальном исследовании Э.Б. Яковлевой. Так как супрасегментные средства и основные инструменты сегментации речевого континуума на смысловые единицы играют важнейшую роль в реализации коммуникативной стратегии говорящих, она сосредоточивает свое внимание на паузации, являющейся основным средством макросегментации звучащего текста на смысловые единицы. Из всех видов пауз, организующих и оформляющих спонтанную речь, автора особенно интересуют паузы, которые реализуют хези-тационное членение. В статье дано определение понятию «хезитацион-ный период», рассмотрены особенности его семантико-синтаксической структуры, с помощью специально проведенного исследования характера дистрибуции хезитационных периодов в немецких спонтанных диалогических текстах доказан лингвистический статус хезитационных явлений. Показано, что локализация пауз хезитаций в целом ряде случаев обусловлена такими синтаксическими факторами, как полнота/неполнота конструкции, наполняемость/ненаполняемость конструкции плеонастическими элементами, вычленением основного стержня высказывания (неизменяемой части сказуемого). Автор приходит к выводу, что хезита-ционные периоды выполняют функцию многочисленных «опор» для ориентации в речевом потоке как говорящего, планирующего в момент хезитаций свой речевой шаг, так и слушающего, декодирующего услышанное и антиципирующего дальнейшую речевую программу говорящего, тем самым этот элемент просодии является важным компонентом всей ситуации спонтанной речевой коммуникации.
Психолингвистические исследования
Работа В.Г. Александровой посвящена изучению синтаксических особенностей выражения такого компонента дискурса, как коммуникативный шум в речи взрослых и детей (под коммуникативным шумом автор понимает помехи, снижающие эффективность коммуникации и/или способствующие ее прекращению). На материале художественных произведений современной англоязычной литературы (2000 мини-диалогов) автор показал, что соотношение удельного веса коммуникативного шума в речи взрослых коммуникантов и в речи детей существенно различается (54 и 29% соответственно), в то же время у взрослых в шумах преобладают сложные и осложненные синтаксические конструкции над простыми, в то время как в речи детей количество сложных и простых конструкций в выражении вербального шума примерно одинаково. Основной вывод, который делает автор, заключается в том, что, поскольку взрослые коммуниканты более осознанно, чем дети, оперируют речью и могут более умело управлять ходом разговора, появляется возможность определить возраст коммуниканта уже на уровне организации диалога, а именно: по количеству высказываний, выражающих коммуникативный шум, и по их синтаксическому построению.
Исследование К.И. Долотина посвящено изучению психологической природы порождения речи. Автор использует метафору «черного ящика», которая позволяет ему при анализе речи абстрагироваться от акустического анализа речевых единиц и перейти к анализу их функционирования в процессе речевой коммуникации на основе оценки изменений величины кода состояния некоторого «черного ящика», которое меняется в процессе порождения текстов с тем или иным коммуникативным заданием, той или иной интонацией и эмоциональной окраской. Основными показателями работы «черного ящика», на взгляд автора, можно считать квазиритмические структуры, выделяемые из речевого сигнала на основе анализа корреляций акустических параметров речевого сигнала. Посредством алгоритмической обработки измеряемых данных акустического анализа он обнаружил в речевом сигнале порядка 130 квазиритмических структур (КРС), которые коррелируют с кодом состояния «черного ящика», который в первом приближении можно связать с процессами центральных сигнальных переключений при порождении текста с тем или иным коммуникативным заданием. Считается, что величина этого кода косвенным образом характеризует структуру сигнальных
квазипереключений в центральном механизме порождения речи. Распределение нулей по разрядам в двоичной форме этого кода значимо для порождения текста с тем или иным коммуникативным заданием. Таким образом, по мнению автора, появляется возможность проводить исследования речи на основе количественного учета квазипереключений во время процесса порождения речи, абстрагируясь от количественных данных акустического анализа речевого сигнала, т.е. изучать процесс порождения речи на основе оценки величины кода состояния «черного ящика», который в каждом конкретном эксперименте моделирует частные случаи процесса порождения речи: формирование коммуникативного задания текста, его эмоциональной окраски, его интонации и смысла и т.д. Далее в статье приводится пример такого анализа.
Психологические приемы воздействия языка СМИ исследуются в работе М.Р. Желтухиной. В результате проведенного исследования она выделяет основные психолингвистические приемы, среди которых подробно разбираются следующие виды: (1) преувеличение/преуменьшение, (2) негативная проекция, (3) эмоциогенность, (4) многозначность невер-балики, (5) эффект снисходительности, или эфффект Полианны» (Ро11у-аппу), (6) физиогномическая стереотипность, (7) ценностная стереотипность, (8) имиджевая самопрезентация, (9) поэтическая трансформация, (10) упрощенность и повтор, (11) лозунговость, (12) навешивание ярлыка. Все эти виды воздействия на адресата активно используются в современных СМИ.
Формирование речевой деятельности в онтогенезе является предметом изучения группы авторов (Е.Е. Ляксо, А.Д. Громова, О.В. Фролова, О.А. Романова, И.В. Новикова, А.Д. Куражова, В.И. Галунов) из НИИ физиологии им. Ухтомского (Санкт-Петербург). Для изучения становления речи у детей, развивающихся в русскоязычном окружении, авторами проведена аудиозапись и инструментальный анализ вокализаций 60 детей, растущих в условиях семьи и Дома ребенка, в возрасте от одного месяца до шести лет. Осуществлен перцептивный и инструментальный спектрографический анализ звуков детей и проведено их фонетическое описание. Проанализированы факторы, оказывающие влияние на формирование речи у ребенка: время возникновения и параметры материнской речи, обращенной к ребенку, фактор неврологического заболевания ребенка, материнской депривации. Авторам удалось описать последовательность формирования различных категорий звуков на первом году жизни, звукосочетаний и слов - на втором,
высказываний - в более старшем возрасте детей. Выявлены признаки, позволяющие описать звуковые сигналы детей разных возрастов. Показано, что формирование системы признаков, обусловливающих распознавание смысла детского сообщения вне контекста ситуации, происходит на третьем году жизни ребенка. Изучались также особенности формирования речевого навыка в разных условиях (в отсутствие родителей, при наличии ротацизма у одного из родителей и т.д.).
Перцепция звучащей речи
Работа Е.Г. Васильченко основана на использовании комплексного метода изучения звучащей немецкой речи - перцептивного и акустического анализа, который позволил сформулировать основные правила сегментации немецких r-аллофонов из слитной речи, основывающиеся на идентификации дистинктивных признаков самих аллофонов и их консонантно-вокалического окружения. Материалом исследования послужили записи различных немецких новостийных программ за период 1923-2003 гг., т.е. с момента существования радио и телевидения в Германии по настоящее время (Wochenschau Ost/West, NS-Wochenschau, Propagandaton, DDR/BRD -Fernsehdokumentationen). Метод подобного среза за одно столетие позволяет проследить динамику аллофонического варьирования фонемы /г/ в различные периоды кодификации немецкой произносительной нормы, а также выявить причины произошедших модификаций, которые определяются рядом лингвистических и экстралингвистических факторов. Многокомпонентный анализ (перцептивный и акустический) позволил автору решить задачу определения места r-аллофонов в классификации звуков с точки зрения их сонорности (Schallfülle) и их консонантной силы (konsonantische Lautstärke).
Исследование Н.Ю. Носенко является продолжением исследования, посвященного восприятию русских согласных в шумах. Ранее ею были выделены модели, по которым строятся замены согласных разных классов. При этом учитывался и способ перехода (количество и иерархический статус признаков, поражаемых при переходе), и результат замены (переход в другой класс или подкласс, замена внутри класса или подкласса). Было определено количество моделей, по которым строятся звуковые переходы, и количество замен, возможных как для отдельных согласных, так и для классов согласных в целом. На настоящем этапе автор попытался выяснить, как реализуются модели звуковых переходов взрывных согласных при восприятии таблиц односложных псевдослов в шумах и существуют
ли модели, использование которых невозможно даже в таких неестественных условиях. По полученным данным, все взрывные согласные, без учета различий по глухости - звонкости и твердости - мягкости, не реализуют 173 варианта (41%) звуковых замен из 420 возможных. Таким образом, для подкласса взрывных возможно использование 31 модели переходов, но наименее полно реализуются 7 из них. В то же время звонкие взрывные оказались более устойчивы к помехам, чем глухие (нет 71 варианта замен из 210, т.е. 34%), что подтверждается и меньшим спектром использованных моделей переходов. Приведены также данные о возможных типах замен по отношению к признаку твердости/мягкости согласного звука, о неиспользованных или неполно реализованных моделях и т.д.
Физиология слуха
Результаты исследования Н.Г. Бибикова обнаружили сходство между слуховой системой человека и некоторых животных (летучих мышей, амфибий и др.) на уровне нейронов. Наряду с обнаружением специальных нейронов, которые реагируют на сигналы разной длительности (клетки-детекторы малой или большой длительности), высказана гипотеза об основах функционирования так называемых «клеток промежуточной длительности» (для значений длительности сигнала в 30-200 мс.). Автор утверждает, что такие клетки являются скорее детекторами скважности, чем детекторами собственно длительности сигнала, поэтому указанную особенность необходимо учитывать как в электрофизиологических экспериментах по изучению кодирования сложных звуков, так и некоторых психофизических задачах.
Возможные объяснения уникальных эхолокационных способностей дельфинов рассматриваются в тезисах М.Н. Сухорученко. В работе поведенческим методом у дельфина афалины измерялись пороги слышимости одиночной пары равновеликих импульсов-щелчков при действии помехи, состоящей из серии пар таких же импульсов с межимпульсным интервалом в парах тп. Исследовалась зависимость порогов обнаружения тестовой пары от значения тп при фиксированных значениях межимпульсного интервала в тестовой паре. Показано, что характер поведения кривых действия импульсной помехи на пороги обнаружения пары равновеликих им-
пульсов объясняется изменениями слуховых (субъективных) признаков импульсной помехи в континууме значений межимпульсного интервала 20-500 мс.
Автоматический анализ и синтез речи
Группой ученых из Рязанской государствентюй радиотехнической академии (С.Н. Кириллов, Д.Ю. Мамушев, А.А. Лоцманов) предложена оригинальная нелинейная параметрическая модель анализа и синтеза речевого сигнала, для реализации которой они провели исследование идентификационной значимости признакового пространства звучащей речи, построенного на базе разработанных ранее нелинейных параметрических моделей речеобразования, а также сформировали комплексную систему признаков. В тезисах подробно описана нелинейная параметрическая модель речевого сигнала, определенная в виде инерционного амплитудного модулятора с нелинейной модуляционной характеристикой голосового источника. Авторы провели также исследование влияния искажений речевого материала на надежность идентификации (верификации) получаемого сигнала. Основной вывод, который был сделан в результате всех проведенных экспериментов, свидетельствует о том, что применение в устройствах распознавания дикторов системы признаков на основе нелинейной параметрической модели речи в совокупности с рядом других эффективных акустических параметров является целесообразным и обеспечит улучшение качественных характеристик устройств данного класса в зависимости от акустической обстановки и специфических особенностей голоса диктора.
Ученые из Санкт-Петербургского Центра речевых технологий (С.Л. Коваль, Н.С. Смирнова, М.В. Хитров) отмечают, что проблема распознавания речи для славянских языков, и в частности для русского языка, до сих не решена. Они считают, что причина кроется в высокой степени флективности, фузийности, выраженной тенденции к фонетической редукции и в свободном порядке слов. Именно данные особенности делают славянские языки (кроме отчасти болгарского) чрезвычайно «неудобным» материалом для построения статистических языковых моделей, на использовании которых сегодня базируются абсолютно все работоспособные системы распознавания связной речи. Для преодоления этих ограничений авторами предлагается специальный способ эффективного учета произносительной вариативности - с помощью сетевой
организации транскрипционных представлений слова на основе вероятностей фонетических модификаций, установленных в результате экспериментального анализа реальных произнесений. Вероятность той или иной модификации фонемы определяется в связи с вероятностью соответствующего артикуляторного процесса (направление и степень модификации) с учетом частотности и класса слова. Таким образом, вместо увеличения количества словарных статей создается своего рода произносительная модель языка, которая позволяет моделировать все возможные фонетические варианты и модификации для каждого слова и устанавливать их вероятность для реальной речевой реализации. Такой подход позволяет избежать линейного увеличения размера словаря, поскольку возможные варианты произнесения словоформы генерируются с помощью специальных продукционных правил в процессе распознавания, а поиск слова организован иерархически и не требует увеличения вычислительных затрат. Кроме того, данный подход позволяет учитывать и довольно часто возникающие в спонтанной речи так называемые «промежуточные» фонетические реализации, которые однозначно не могут быть приписаны к той или иной фонеме. В то же время проблема вариантности орфографических соответствий решается уже на более высоких лингвистических уровнях и связана с задачей разработки языковой модели. Авторы показывают, что при создании системы распознавания русской связной речи языковая модель не может опираться преимущественно на прямое статистическое моделирование синтагматических связей между соседними словоформами в пределах высказывания, и предлагают свой способ решения этой проблемы.
Специфический вид современного автоматического синтеза речи -«клонирование» речи - обсуждается в работе Б.М. Лобанова и Л.И. Цирульник. Авторы разрабатывают специальный алгоритм персонализированного синтагматического членения текста для ТТ8-систем клонирования речи. В статье описываются результаты экспериментального изучения персональных особенностей синтагматического членения речи телеведущего Ю. Сенкевича в сравнении с особенностями синтагматического членения речи одного из профессиональных дикторов. Структура алгоритма состоит из следующих модулей: (1) разбиение входного текста на слова, (2) частеречная идентификация слов, (3) алгоритм разбиения текста на пары фонетически связанных слов, (4) алгоритм разбиения текста на квазисинтагмы, (5) маркировка потенциального конца синтагмы, (6) верификация полученной последовательности, (7) переход к следую-
щему фрагменту текста, (8) повторяемость процедур пп. 5-7. Разработанная модель успешно прошла испытания на реальном речевом материале, ее работа была продемонстрирована в ходе доклада на заседании конференции.
Работа Б.В. Поспелова и М.И. Каплуна посвящена результатам проводившегося в течение нескольких лет цикла исследований информационной значимости микроструктуры речевого вокализма применительно к возможности использования их результатов в задачах автоматического распознавания и синтеза речи на разных языках. Авторами было проведено несколько специальных исследований, результаты которых в целом подтверждают плодотворность выбранного направления, выявляя вместе с тем новые резервы и возможности. Основные усилия при этом направлялись на решение таких задач, как повышение надежности верификации и переход ее к полной автоматизации. В центре исследования находились статистические параметры, определяющие, в частности, корреляционные отношения в микроструктуре речевого вокализма, а именно - между фрагментами гласного звука, соответствующими отдельному периоду основного тона. Показано, что проверенные корреляционные параметры вокалической микроструктуры реально обладают признаками интрадикторской инвариантности и интердикторской вариативности и могут быть рекомендованы к использованию при разработке верификаторов личности по предъявляемому голосу.
Вопросам аналого-цифрового и цифро-аналогового преобразования звучащей речи, часто обозначаемых терминами «кодирование речи» и «декодирование речи», и в частности актуальным направлениям липре-дерного кодирования, посвящена работа А. А. Рыболовлева и С.В. Забир-ника, которые сосредоточили свои усилия на формировании системы классификации липредеров. Как отмечают авторы, отсутствие такой системы не позволяет полноценно и состоятельно описывать конкретные алгоритмы, проводить их сравнительный анализ, выделять существующие тенденции совершенствования параметрических вокодеров, использующих принцип линейного предсказания речи. Анализ научных публикаций, посвященных речевой тематике, показывает, что в качестве признака классификации липредеров выбирается, как правило, только метод аппроксимации остаточного сигнала на выходе подсистемы анализа, являющейся частью системы кодирования речи. В рассматриваемом докладе предлагается более подробная система классификации, в основу декомпозиции которой положены и другие классификационные признаки.
В разрабатываемой авторами модели использованы этапы кратковременного линейного предсказания, устраняющего избыточность, обусловленную корреляционными связями между соседними отсчетами речевого сигнала формата импульсно-кодовой модуляции (ИКМ), и долговременного линейного предсказания, устраняющего избыточность, обусловленную квазипериодичностью вокализованных сегментов речи.
Система автоматического дикторозависимого распознавания речи, разработку которой начал в свое время Г. Д. Фролов и которая в настоящее время совершенствуется В.В. Филимоновым, распознает цифры от 0 до 10 и десятки от 20 до 100, конкатенации слитно произнесенных команд типа «Пошел_налево», «Пошел_прямо», «Второй_слева_стоп», а также способна распознавать слитно произносимые в среднем темпе цифры, которые воспринимает, как единую команду. Эвристический алгоритм сегментирования, положенный в основу работы системы, опирается на более чем два десятка экспериментально найденных характеристик, описывающих входной сигнал. Как утверждает автор, методы распознавания дают возможность применения системы в технике, авиации и оборонных отраслях, например, для анализа шумов двигателей, управления голосом автопилота самолета или робота и т.п.
Идентификация и верификация голоса диктора
В статье «Система верификации и идентификации голоса, работающая в диалоговом режиме» (авторы А.А. Гноевой, А.А. Коршунов, В.О. Сахаров, К.А. Маковкин, ВЦ РАН) дано описание оригинальной системы верификации и идентификации, основанной на использовании следующих признаков: средняя частота первых трех формант, средняя ширина их полосы, средняя частота основного тона. Усреднение значений производилось на стационарной части гласных звуков, выделение которых осуществлялось на базе функции звонкости, предложенной В.Р. Женило. Основной тон и форманты выделялись по ранее разработанной авторами методике. Сравнение текущей реализации с эталоном осуществлялось в 70-мерном пространстве признаков: три признака амплитуды, три - частоты, три - ширины полос формант, а также основной тон, умноженные на семь гласных. Решение принималось по попаданию евклидова расстояния между реализацией и эталоном в допуск, найденный экспериментально в процессе обучения. Разработаны два варианта функционирования системы: в первом учитывается характеристика ка-
нала связи (расстояние до микрофона и его частотная характеристика и пр.), во втором система работает без использования амплитуды формант, исключая таким образом влияние канала связи.
Белорусские ученые из Национальной академии наук Белоруссии (А.Г. Давыдов, В.В. Киселёв, Б.М. Лобанов, Л.И. Цирульник) представили свою систему экспресс-идентификации личности по речи, которая основана на осуществлении автоматического запроса к специализированным звуковым базам данных (СЗБД) и построена на базе разрабатываемой авторами технологии клонирования голоса. Система состоит из трех подсистем: (1) подсистемы создания наборов персональных цифровых портретов голоса личности (ЦПГЛ), (2) подсистемы оперативного синтеза индивидуальных образцов речи и (3) подсистемы автоматической идентификации личности по предъявленному отрезку речи. Подсистема (1) обеспечивает разметку фонограмм СЗБД на фонетические элементы (слова и аллофоны) и на их основе моделирует цифрой «портрет» говорящего, подсистема (2) обеспечивает создание базы индивидуальных образцов его речи на основе оперативного синтеза индивидуальной реализации заданного текста, на последнем, третьем, этапе формируются многокритериальные оценки и осуществляется принятие вероятностных идентификационных решений. Все три подсистемы представлены в тексте тезисов на соответствующих блок-схемах.
Фундаментальное исследование А.Ш. Каганова посвящено изучению таких важных аспектов инструментальной части комплексного идентификационного исследования, как анализ некоторых относительных просодических и спектральных характеристик речи. К ним относятся: 1) сравнительные характеристики среднего значения частоты основного тона и относительного диапазона изменения основного тона (исследование проведено на примере реальных экспертиз); 2) сравнительные характеристики речи (по признаку соотношения формант Б2/Р1 в разных речевых условиях и в разном эмоциональном состоянии говорящего. Показано, что как идентификационный признак относительный диапазон изменения основного тона обладает большим «весом», чем среднее значение частоты основного тона, однако статистический анализ относительных отклонений среднего значения частоты основного тона речевого материала исходных записей от средней ЧОТ образца, проведенный по результатам четырех отобранных экспертиз, показал, что средневзвешенное относительное отклонение ее среднего значения оказалось близким к предельно допустимой внутридик-торской вариативности. Автор объясняет это большими различиями в ре-
чевой ситуации исходных и сравнительных записей. Относительно соотношения формант оказалось, что положение о том, что акустическое качество звуков определяется именно соотношением уровней сигнала в полосах спектра, получает в статье новое развитие при сопоставлении речи одного и того же говорящего (т.е. при установлении факта наличия (или отсутствия) тождества в криминалистическом понимании). Здесь также можно утверждать, что в качестве идентификационного признака соотношение формант обладает большим «весом», чем абсолютные значения формант. А.Ш. Каганов приходит к выводу, что функционально-динамические комплексы (ФДК) навыков, носителем которых является человек, служат источниками выявления индивидуальных особенностей речи. Они позволяют выявить те устойчивые идентификационные признаки, которые связаны с относительными просодическими и спектральными характеристиками речи.
Лингвистическое исследование как неотъемлемая часть криминалистической экспертизы звукозаписей при идентификации говорящего по его голосу и речи является предметом рассмотрения в статье В. О. Кузнецова. Его исследование проведено на материале языковой ситуации в Брянской области РФ, в которой сложилась достаточно специфическая языковая ситуация, поскольку особое геополитическое положение Брянской области (половина длины границ региона приходится на внешнее межгосударственное пограничье: на западе с республикой Беларусь, на юге - с Украиной) обусловило наличие элементов белорусского и украинского языков в речи населения региона. В ходе лингвистического исследования голоса и речи дикторов, родившихся и проживающих на территории Брянской области, были установлены конкретные фонетические и грамматические особенности, характеризующие языковую ситуацию в регионе и являющиеся идентификационными признаками его жителей.
Методика подготовки профессиональных экспертов-криминалистов находится в центре доклада (и тезисов) Н.Б. Кураченко -вой. Отмечая, что специальные познания эксперта в фонографической экспертизе представляют собой естественнонаучные знания о закономерностях формирования и отражения в речи свойств личности, их устойчивости и индивидуальности, о распределении вероятностей появления названных свойств среди определенных групп населения, а также о возможностях применения в целях идентификации личности научных и специальных методов исследования, автор предлагает программу подготовки специалистов соответствующего профиля, ядро которой составля-
ет гипертекстовая учебная система - электронная энциклопедия по криминалистической фонографии. Дополнив уже существующий гипертекстовый массив сведениями о юридическом аспекте деятельности эксперта, а также фундаментальными знаниями обо всех видах анализа речевого сигнала и базой данных речевых примеров и эталонных образцов, пользователи получат эффективную учебную среду для формирования специалистов-фоноскопистов, потребность в которых в нашем обществе в настоящий момент столь высока.
К проблемам идентификации и верификации примыкают вопросы межъязыковой интерференции - МИ (доклад А. Л. Ованнисян из Киевского НИИ судебных экспертиз). В докладе рассматриваются признаки, позволяющие конкретизировать некоторые закономерности реализации интерференции в устной иноязычной речи дикторов. В частности, Ованнисян определяет комплекс общих и частных признаков МИ, отличающих речь носителя того или иного языка от речи иностранца. С точки зрения криминалистической экспертизы можно выделить три уровня применения исследований по МИ в процессе работы над аудиоматериалом, это: 1) фиксация так называемого «иностранного акцента» в речи диктора, не углубляясь в детальное рассмотрение этого многообразного явления; 2) подробное рассмотрение в речи диктора-иностранца особенностей проявления МИ; 3) при наличии методики исследования конкретных пар языков, а в идеале - знания родного языка диктора-иностранца, максимальная конкретизация признаков МИ в речи, что способствует большей аргументации выводов эксперта в процессе идентификации речевого материала.
С работами по прикладным аспектам речевых исследований тесно связаны описания новых программных продуктов исследования речевого сигнала, которые расширяют возможности экспериментатора-фонетиста (тезисы И.Л. Иванова). Описываемая в них система .Ю8Т1РИОКЕ 2.0 прошла проверку в лаборатории судебной экспертизы видео-и звукозаписей РФЦ СЭ при Минюсте России и рекомендована Научно-методическим советом РФЦСЭ Минюста России по КЭВиЗ для использования в экспертной практике в лабораториях системы экспертных учреждений Минюста России; она включена в состав автоматизированного рабочего места эксперта криминалистической экспертизы звукозаписей (КЭЗ).
Качество каналов передачи речи и модели его оценки являются предметом изучения в работе В.Г. Михайлова «Модель оценки качества передачи». Поскольку оценка качества передачи только по
разборчивости речи явно недостаточна и необходимы методы, позволяющие получить комплексную оценку качества речи с учетом ее разборчивости, узнаваемости, естественности звучания голоса, автор отмечает, что множественность оценок качества передачи, а зачастую их противоречивость и неоднозначность в условиях воздействия акустических шумов и помех в канале связи делают актуальной задачу получения обобщенной интегральной оценки. В статье дано подробное описание соответствующей модели, которая строится на основе показателей разборчивости и качества передачи; рассмотрены также основные методы измерения разборчивости и качества фонетического звучания речи согласно стандарту ГОСТ Р 50840-95.
Г.Е. Кедрова
2005.03.016. КУЛЬТУРА РЕЧИ. ФОНЕТИКА. ФОНОЛОГИЯ // Семиотика. Лингвистика. Поэтика: К столетию со дня рожд. А. А. Реформатского. - М.: Яз. слав, культуры, 2004. - С. 91-210.
Статья Л.А. Вербицкой «Культура речи и языковая культура» представляет собой краткий обзор особенностей современного литературного произношения, сформировавшегося в результате объединения петербургской и московской произносительных норм. 50-70 лет назад между этими вариантами наблюдались довольно существенные различия; теперь региональные особенности почти полностью нивелировались. В нынешней единой норме некоторые черты по происхождению являются московскими (произношение щ как [s':], иканье), некоторые -петербургскими (произношение мягкого [s'] в возвратном постфиксе). Автор проводит разграничение нормы как внутриязыковой категории и кодифицированной нормы, формирующейся на ее основе и фиксируемой в нормативных словарях, а также указывает, что разделение произносительных норм на орфоэпические (нормативный фонемный состав) и ор-фофонические (нормативные реализации фонем) зависит от принадлежности к той или иной фонологической школе. В заключение Л.А. Вербицкая отмечает тенденцию ко все большему проникновению в литературную норму разговорных и просторечных черт, таких как фри-катизация аффрикат (курочка — [kurac'ka] и [kuras'ka]), упрощение групп согласных в конце слов (шесть - [ses't'] и [ses']), делабиализация безударного [u] после твердых и мягких согласных (разума — [razuma] и [razъma], челюсть — [c'el'us't'] и [c'el'is't']).