ПРИКЛАДНЫЕ ИССЛЕДОВАНИЯ И ЭКСПЕРИМЕНТАЛЬНЫЙ МЕТОД ДИАГНОСТИКИ СОЦИОКУЛЬТУРНЫХ ТРАНСФОРМАЦИЙ
УДК 81 '33
Р.К. Потапова1, В.В. Потапов2
ОСНОВЫ МНОГОАСПЕКТНОГО ИССЛЕДОВАНИЯ «ЭЛЕКТРОННОЙ ЛИЧНОСТИ» ПО ГОЛОСУ И РЕЧИ В ИНФОРМАЦИОННО-КОММУНИКАЦИОННОЙ СРЕДЕ ИНТЕРНЕТА
1 Московский государственный лингвистический университет 2 Московский государственный университет им. М.В. Ломоносова Москва, Россия, [email protected]
Речь человека индивидуально организована на базе фонационных и артикуляционных жестов в непосредственной связи с фонологическим представлением высказывания и его лексико-семантическими особенностями. Предлагается проводить экспресс-анализ речевого портрета говорящего с учетом следующих этапов: формирования баз данных акустических коррелятов антропометрических признаков; акустических коррелятов физиологических признаков; акустических коррелятов психологических и эмоционально-психологических признаков; акустических коррелятов интеллектуальных признаков. Разработка данной проблемы приобретает особое значение при исследовании устно-речевой коммуникации с помощью 1Р-телефонии для решения ряда задач криминалистической экспертизы.
Ключевые слова: модели речевой коммуникации; социально-сетевой дискурс; акустические корреляты; идентификация личности.
Поступила: 21.02.2017 Принята к печати: 16.04.2017
R.K. Potapova1), V.V. Potapov2)
Fundamentals of the multi-versatile voice and speech research of the «electronic personality» on the information and communication Internet medium
1 Moscow state linguistic university 2 Lomonosov Moscow state university Moscow, Russia, [email protected]
This reaserch aims at establishing voice and speech personality identification features which predict some phonation and articulation gestures in regard to lexical-semantic, phonological, anthropometrical, acoustical, physiological, psychological, emotional-psychological and intellectual peculiarities of the «electronic personality». This issue is of primary significance for investigations in the domain of speech communication by means of IP-Telephony on Internet and for Forensic sciences as well. It is proposed to undertake special studies on the basis of speech acoustic correlations corpus to find solutions to these problems.
Keywords: speech communication models; social-network discourse; acoustic correlations; personality identification.
Received: 21.02.2017 Accepted: 16.04.2017
1. Введение
Разработка проблемы социально-сетевого дискурса1 (ССД)2 в Интернете, в частности для IP-коммуникации, предполагает изучение механизма зависимости между просодико-семантической интерпретацией речевого высказывания адресантом и характером построения дискурса адресатом с учетом таких факторов, как:
• когнитивно-вербальная база коммуникантов;
• многоуровневая (фонолого-фонетическая, синтактико-семантическая и прагмалингвистическая) структура вербального кодирования и декодирования речевого стимула - речевой реакции коммуникантами;
• паравербальная (эмоциональная, эмоционально-модальная и коннотативная) составляющая речевого стимула - речевой реакции высказывания;
1 Diskursus (лат.) - рассуждение; дискурсивный - рассудочный, обоснованный предшествующими рассуждениям (противопоставляется интуитивному) [Методы анализа, 2009].
2 Социально-сетевой дискурс (ССД) [Ро1ароуа, 2015].
• экстравербальная (ситуативная, индивидуальная - идиосинкразическая, идиолектальная, социолектальная и т.д.) составляющая речевого стимула - речевой реакции высказывания с учетом роли пресуппозиции, а также предыдущего опыта реципиента в той или иной предметной области [Ро1ароуа, Ро1ароу, 2016].
Экспериментальное исследование и моделирование просоди-ко-семантической вариативности дискурса русской речи образует важное направление современной лингвистической вариантологии и требует использования информации о языке и фоновых знаниях о мире [Потапова, 2017; Ро1ароуа, 2015]. Особое значение вышеуказанное направление приобретает в связи с функционированием ССД в информационно-коммуникационном пространстве Интернета [Потапова, 2017; Ро1ароуа, 2015; Ро1ароуа, Ро1ароу, 2016, 2017].
Исследование глубинного механизма просодико-семанти-ческой вариативности вербальной реакции на стимул между коммуникантами в рамках устно-речевого дискурса применительно к ССД требует знаний в различных областях речеведения: в общей, частной и экспериментальной фонетике, когнитивной и коммуникативной лингвистике, акустике речи, слуховой перцепции, математической статистике [Потапова, 2004].
Решение проблемы с учетом многоаспектной вариативности анализируемого объекта включает:
• поиск произносительного инварианта и вариантов просо-до-семантической интерпретации речевого стимула-высказывания в ССД;
• определение взаимодействия различных вышеперечисленных факторов в процессе построения ССД;
• определение степени влияния вышеуказанных факторов на конечный вербальный продукт ССД в акте коммуникации;
• выявление просодико-семантической доминанты в рамках ССД;
• определение допустимого диапазона варьирования про-содико-семантических вариформ - аллопросодосемантов;
Исследование просодико-семантической вариативности многоуровневых вербальных, пара- и экстравербальных компонентов устно-речевого дискурса предполагает использование различных современных методов анализа, синтеза и моделирования звучащей речи: акустического, перцептивно-слухового, ассоциативного, просодико-семантического и т.д. [там же].
2. Концептуальные предпосылки исследования
Речевая деятельность в формате устного социально-сетевого дискурса (ССД), в частности на базе различных современных средств 1Р-телефонии в Интернете1, может быть представлена с учетом следующих поуровневых составляющих:
• побуждающий уровень: внешнее воздействие; мотив; замысел; коммуникативное намерение;
• формирующий уровень: смыслообразующая фаза; глубинное формирование пространственно-понятийной схемы; временная (линейная) развертка пространственно-понятийной схемы высказывания;
• формулирующий уровень: формулирующая фаза (выбор слов); процесс грамматического структурирования;
• реализующий уровень: артикуляционные жесты; голосовые (фонационные) модуляции; коартикуляционные преобразования;
• акустический уровень: преобразование артикуляционных жестов на выходе речеобразующей системы в акустическую волну; слуховое обнаружение, слуховой контроль и распознавание воспринятых акустических стимулов;
• интерпретационный уровень: преобразование акустических стимулов в вербальные образы.
В рамках данной концепции речевая коммуникация обобщенно соответствует двум основным моделям (рис. 1-2) [Михайлов, 2007; Потапова, 2015].
В соответствии с расширенным пониманием объекта исследования в речеведении можно перечислить следующие приемы и методы: когнитивно-коммуникативный анализ текста; проверка моделей и гипотез косвенным путем, например путем изучения речевых ошибок, лингвистических реакций и т. д.; нейрофизиологические методы; биоэлектрические методы; регистрация и анализ артикуляции с помощью, например, компьютерной томографии и др. [Потапова, 2015].
1 Известны исследования в области влияния телефонного тракта на речь (см., например: [Михайлов, 2007; Кише1, 2001]).
Говорящий Довербальный уровень 4 Вербальный уровень (сообщение облечено в лингвистическую форму) 4 Нейронное программирование 4 Психофизиологический уровень (фонационная и артикуляционная моторика) 4
Сообщение
Канал передачи сообщения Акустический уровень (звуковые волны) 4
г Психофизиологический уровень (деятельность слуховой системы) и распознавании акустических образов 4 Нейронная активация и обработка акустических сигналов 4 Вербальный уровень (вербальная семантизация)
Слушающий
Рис. 1.
Традиционное представление модели речевой коммуникации
Изучение реализации и контроля моторных программ должно быть связано с системой обработки информации в центральной и периферийной нервной системе. Вероятно, что в центральной нервной системе не существует функционального центра, который специализировался бы на обработке исключительно вербальной информации. Нейронные сети, которые занимаются обработкой вербальной информации, включают и другие функции.
Говорящий (при обратной связи - слушающий) ▲ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 у Мотивация и целевая установка говорящего 4 Коммуникативное намерение 4 Нейроповеденческие программы (выбор и координация вербальных / невербальных сигналов; планирование моторных программ) 4Т Выполнение программы и контроль 4Т Речевая моторика (фонационные и артикуляционные жесты) 4Т Сообщение 4Т Канал приема сообщения
4Т
Канал передачи сообщения Сообщение Физические сигналы (акустические и оптические)
к 1 4Т
1 Слушающ (при обра связи - го щий) г ий тной воря- Деятельность сенсорных рецепторов 4Т Предкатегориальная рецепция сигналов (слуховые рецепторы: вербальная и паравербальная информация; зрительные рецепторы: экстравербальная информация) 4Т Лингвистическая обработка речевого стимула; фонологическая категоризация 4Т Семантическая интерпретация сообщения 4Т Когнитивная интерпретация мотиваций и целей говорящего
Рис. 2.
Углубленное представление модели речевой коммуникации
3. Анализ ССД с учетом когнитивных функций человека
При слуховой обработке речевого сигнала и дальнейшем восприятии комплекса речевых стимулов в акте устно-речевой
коммуникации (например, в ССД, реализуемом с помощью 1Р-телефонии) можно выделить различные комбинированные формы синтеза ряда коммуникативных компетенций, включающих факторы как вариативности, так и константности, например:
а) вариативные факторы: тема, намерение (интенция), мотивация адресанта, социально-индивидуальная специфика адресата и адресанта;
б) константные факторы: психофизиологические, наследственно-генетические (идиосинкразия), социально-сформированные механизмы поведения адресата и адресанта.
Обычно можно выделить три вида компетенций, присущих коммуникации в ССД: тематическую, социальную и интенциаль-ную. При этом, как правило, главная цель ССД - это возбуждение интереса у адресата и воздействие на адресата, что коммуникативно может быть выражено с помощью следующей схемы: а) ситуация (стимул) ^ первичная реакция на стимул (восприятие «тематического поля») ^ б) вторичная (уточняющая) реакция (восприятие темы ССД) и реакция на тот или иной тип взаимодействия с партнером по коммуникации) ^ третичная реакция (рефлексивная реакция с учетом фактора совзаимодействия с партнером по коммуникации вида «действий по интересу»).
В работах [Потапова, 2015, 2017] впервые обоснована концепция ССД, базирующаяся на его определении как особого электронного макрополилога с учетом целого ряда категорий формы, содержания и функционального веса. Примером может служить одна из категорий формы на базе оппозиции «одновекторность -поливекторность». Данная оппозиция соотносится не только по признаку расположения векторов коммуникативного взаимодействия в Интернете, но также и по конфигурации взаимодействия участников ССД, находящейся в прямой зависимости от числа коммуникантов в Интернете. Геометрически можно было бы изобразить основные виды поливекторного взаимодействия в ССД следующим образом:
а) окружность с последовательным (следующим по окружности) типом ССД-контактов;
б) окружность с внутренним перекрестным (диаметры, хорды и т.д.) типом ССД-контактов;
в) треугольник с исходящей от вершины к основанию треугольника прямой;
г) квадрат с исходящими от каждой из вершин фигуры прямыми с внутренним пересечением последних;
д) прямоугольник с аналогичным типом пересечений прямых, исходящих от каждой из его вершин;
е) эллипс с последовательным и перекрестным типом ССД-контактов.
Могут быть и более сложные конфигурации векторных связей при условии наложения, включения (полного или частичного) и пересечения векторов. От типов поливекторности ССД будут зависеть скорость передачи информации в ССД, точность и надежность передачи информации, эмоциональная оценка передаваемой и обсуждаемой информации, степень воздействия и т.д. Естественно, что применительно к видам ССД можно выделить определенные разновидности ССД (макрополилогов): от болтовни, беседы, уговоров, «вербовки» - до дебатов, призывов, «конфлик-тогенной вербалики» и т.д. Для всех этих видов ССД присущи свои специфические средства просодико-семантической вариативности, связанные с поиском произносительного инварианта и вариантов просодосемантической интерпретации речевого стимула.
Существенную роль при этом играет определение целевой установки функционирования ССД в Интернете: от полного отсутствия этой цели (например, болтовня) - до наличия конкретной цели, что также влияет на все параметры функционирования ССД: дистантность; опосредованность; online - offline; моносемантич-ность - полисемантичность; высокая контекстуальность - низкая контекстуальность и т.д. Свой вклад вносят культурные коды пользователей сети, социолингвистические факторы и индивидуально-психофизиологические характеристики коммуникантов. В процесс разработки модели ССД в Интернете можно было бы дополнительно включить фактор учета тактики, которой придерживаются участники ССД (например, наступательная, оборонительная, сдерживающая, компромиссная и т.д.).
При исследовании речевого поведения говорящего в формате ССД в режиме, например, IP-телефонии мы исходим из следующего постулата: человеческая речь является одновременно симптомом и сигналом по отношению к окружающей действительности: симптомом как непосредственной реакцией психофизиологического характера на внешние раздражители и сигналом как знаковой (языковой) реакцией нейропсихологического харак-
тера на стимулы более сложного поведенческого уровня в акте коммуникации [Buhler, 1965; Potapova, Potapov, 2011]. В связи с этим речь представляется как полиинформативный и полифункциональный феномен.
Разработка данной проблемы приобретает особое значение при исследовании устно-речевой коммуникации с помощью IP-телефонии: для решения ряда задач криминалистической экспертизы. «... Последнее обстоятельство естественным образом привело к тому, что фонограммы разговоров по каналам сотовой связи и сети Internet стали объектами исследования криминалистической экспертизы звукозаписи» [Михайлов, 2007, с. 129].
Произношение говорящего включает совокупность специфических свойств этого индивидуума, проявляемых в образовании посредством речевого аппарата звукового потока и обусловленных особенностями его строения, особенностями произносительно-слухового навыка, спецификой мышления, а также оформления мыслей с помощью языковых средств [Потапова, 2006, 2012; Potapova, Potapov, 2011].
4. ССД и речевой портрет «электронной личности»
Речевой портрет говорящего включает вербальные, паравер-бальные и экстравербальные признаки. Вербальные составляющие относятся к такому аспекту, как используемый в процессе коммуникации язык (родной, неродной, диалект, жаргон, просторечие, социолект и т.д.). Для каждого говорящего характерным является инвентарь устойчивых фонетических признаков: произнесение вариантов фонем, вариантов интонем и т.д. Вербальные речевые признаки дают возможность определить такие компоненты речевого портрета, как национальность, место длительного проживания говорящего, уровень образования, социальный статус, экономический статус, воспитание, уровень владения языковыми средствами, профессию, уровень развития интеллектуальных навыков и т. д.
В лингвокриминалистике принято считать, что экстравербальные признаки соотносятся с такими аспектами, как антропометрический (строение речевого аппарата, масса тела, рост), физиологический (пол, возраст, норма / патология), психологический
(тип высшей нервной деятельности (ВНД) [Шарп, 2008], эмоционально-волевая регуляция), интеллектуальный (специфика мышления, когнитивный уровень). В связи с этим можно выделить в речевом портрете говорящего относительно устойчивые речевые экстравербальные признаки. Как вербальные, так и экстравербальные признаки имеют свои акустические корреляты, позволяющие воссоздать портрет говорящего. Например, пол и возраст могут быть охарактеризованы следующими акустическими параметрами (табл. 1).
_ Таблица 1
Средние значения частоты основного тона (F о) в Гц с учетом возраста испытуемых (по A. Braun)1
Мужчины n говорящих Среднее значение частоты основного тона(Гц) Женщины n говорящих Среднее значение частоты основного тона(Гц)
Возраст Возраст
20-29 175 120 20-29 10 227
30-39 175 112 30-39 10 214
40-49 175 107 40-49 10 214
50-59 175 118 50-59 10 214
60-69 175 112 60-69 10 209
70-79 175 132 70-79 10 206
80-89 175 156 80-89 10 197
Для носителей русского языка имеются различные данные. По нашим наблюдениям, средняя статистическая величина частоты основного тона для мужчин в возрасте от 20 до 80 лет составляет 90-130 Гц. Для женщин разница значения приблизительно в два раза больше: 200-230 Гц. С увеличением возраста у женщин (в отличие от мужчин) имеет место понижение значений частоты основного тона.
Аналогичные акустические корреляты имеют и другие экстравербальные характеристики. Так, антропометрические показатели отражают конституционные особенности морфологии тела человека:
1 Данные получены на материале исследования речи носителей немецкого
языка.
длину туловища, телосложение (атлетическое, пикническое, астеническое), внешние формы тела (окружность груди, бедер), форму головы, размер черепа, степень удлиненности лица (лицевой индекс), жизненную емкость легких, силу мышц. В связи с вышесказанным следует привести некоторые примеры, иллюстрирующие наличие акустических коррелятов: средний спектр в диапазоне 80-5600 Гц (для одной минуты речи); формантные (квазиформантные) области; ширина формант; местонахождение формантных максимумов; суммарная энергия.
В частности, известно, что особенности строения лица (соотношение между высотой и шириной скул) характеризуются такими акустическими параметрами, как ширина второй и третьей формант; объем головы - локализацией второй форманты и т.д. Индекс удлиненности тела имеет значимую положительную корреляцию со средним спектром в области 1500 Гц. Возраст обнаруживает значимую положительную корреляцию с низкочастотной областью частоты основного тона (70-80 Гц) (см., например: [Speaking fundamental frequency, 1991; Ryan, Capadano, Harry, 1978]).
При рассмотрении экстравербальных характеристик, соотносимых с психологическими признаками, выделяют акустические корреляты следующего типа:
• сангвиник (сильный тип нервной системы, уравновешенный, подвижный, энергичный, работоспособный, дисциплинированный) ^ быстрый темп речи, равномерная мелодическая изрезан-ность, равномерное соотношение между ударными и безударными слогами, средний уровень громкости, равномерная паузация, преобладание незаполненных пауз, равномерная энергетическая насыщенность спектра, четкая формантная структура и т.д.;
• холерик (сильный тип нервной системы, неуравновешенный, высокая реактивность) ^ отсутствие постоянного темпа, выражающегося в варьировании среднеслоговой длительности высказывания, среднее значение основного тона сильно варьирует, мелодическая изрезанность высказывания, увеличение частотной дисперсии, неравномерное ритмическое соотношение по длительности между ударными и безударными слогами, варьирование громкости речевого сигнала, формантная структура скомпрессиро-вана и т. д.;
• флегматик (сильный тип нервной системы, уравновешенный, инертный) ^ речь характеризуется замедленным темпом (увеличивается значение среднеслоговой длительности), снижением акустических различий между ударными и безударными слогами, снижением общей энергетической насыщенности спектра, но сохранением четких структурных особенностей формант, увеличением длительности вокализма и т.д.;
• меланхолик (слабый тип нервной системы, повышенная чувствительность, неуверенность) ^ снижение уровня громкости речи, увеличение паузации, увеличение редукции вокализма, концентрация энергии спектра в низкочастотных областях, отсутствие акустических признаков эксплозии для смычных глухих взрывных согласных и замена их на имплозивные, увеличение среднеслого-вой длительности и т. д.
Экстравербальные характеристики психологического плана, связанные с эмоционально-волевой регуляцией, также имеют свои акустические корреляты. И положительные, и отрицательные эмоционально-психологические состояния дифференцируются по принципу «активное состояние» - «пассивное состояние», что связано, в свою очередь, с процессами возбуждения и торможения, ослаблением самоконтроля и подавления реакций [Потапова, Потапов, 2006].
Для гласных, реализованных в потоке речи в состоянии активизации эмоционально-психологического настроя, характерны следующие акустические корреляты: более ярко выраженная гармоническая структура гласных, увеличение спектральной энергии и длительности ударного слога (гласного), расширение частотных областей формант Б2, Б3, Б4, повышение спектральной энергии в формантных областях на 20-30%, появление более высоких фор-мантных частот. Для гласных, реализованных в состоянии деакти-визации, характерны такие акустические корреляты, как снижение общего уровня спектральной энергии, падение спектральной энергии на ударном гласном, уменьшение длительности ударного гласного, сужение частотных областей формант, ослабление уровня интенсивности формант. Специфические акустические корреляты имеются также для консонантизма, т.е. согласных речевого высказывания. Индикативными являются и просодические параметры, образующие целый набор акустических коррелятов супрасегмент-ного уровня.
К речевому портрету говорящего могут быть отнесены также такие личностные характеристики говорящего, как общительность, коммуникабельность, высокий интеллект. В связи с этим к акустическим коррелятам могут быть отнесены показатели первой форманты спектра Бх (до 600 Гц), наиболее тесно связанные с такими факторами, как доминированность, активность. Имеется положительная корреляция между увеличением значений первой форманты Бх и наличием вышеуказанных компонентов интеллектуального портрета говорящего. Наличие низкого интеллекта, тревожности, низкого показателя «я» коррелируют с энергетическими показателями частот в диапазоне третьей форманты Б3 (22002460 Гц). Интеллектуальный портрет связан также с рядом других акустических показателей, позволяющих определить степень эрго-тического напряжения в процессе порождения речи-мысли.
Исходя из основной предпосылки, согласно которой речь человека индивидуально организована на базе фонационных и артикуляционных жестов в непосредственной связи с социально отработанным фонологическим представлением высказывания и его лексико-семантическими особенностями, предлагается проводить экспресс-анализ речевого портрета говорящего с учетом следующих этапов: формирования баз данных акустических коррелятов антропометрических признаков; акустических коррелятов физиологических признаков; акустических коррелятов психологических и эмоционально-психологических признаков; акустических коррелятов интеллектуальных признаков. Таким образом строится аку-стико-лингвистический алгоритм идентификационного анализа говорящего с учетом следующих этапов: акустического; анатомо-физиологического, сориентированного на декодирование речевого сигнала; социопсихологического, сориентированного на декодирование речевого сигнала; интеллектуально-содержательного, декодированного на речевой сигнал.
В связи с этим все решаемые задачи могут быть условно охарактеризованы как задачи составления в конечном счете индивидуального портрета говорящего, к которому следует отнести фонационные (голосовые), артикуляционные сегментные (моторные), просодические (супрасегментные) корреляты речи говорящего. Основой акустико-лингвистического анализа служат итеративные процедуры обработки речевой волны. Целесообразно
разбиение акустико-лингвистических признаков речевого сигнала на первичные и вторичные. К первичным следует отнести:
• фонационные признаки (признаки типологии голосовой мимики, например форсированного или щадящего голосообразо-вания с соотнесением анализируемого речевого сигнала к одному из типов фонации);
• артикуляционные признаки (признаки артикуляционной типологии порождения речевого сигнала, например напряженной или ненапряженной) с отнесением речевого сигнала к одному из типов артикуляции.
Первичные признаки находятся в непосредственной зависимости от специфики анатомо-физиологического характера. Вторичные (просодические) носят условно надстроечный характер относительно первичных и реализуются на их базе. Надсегментная (супрасегментная) реализация вторичных признаков речевого сигнала ведет к образованию своего рода структурно-организованных речевых фигур и их конкатенаций, носящих также строго индивидуальный характер [Potapova, Potapov, 2011].
Согласно современным данным (например, [Brown, 1987]), речевые признаки, характеризующие говорящего и специфику его индивидуального склада (т.е. идиосинкразию), содержат два типа информации: коммуникативную и индивидуальную.
В качестве вербального (языкового по смысловому контенту) сигнала речь включает коммуникативное содержание сообщения, а в качестве экстралингвистического сигнала соотносится с информацией о таких признаках говорящего, как пол, возраст, региональное происхождение и т. д.
В настоящее время предлагаются следующие виды классификации информации, содержащейся в речевом сигнале.
А. Биологическая информация (размеры, физические данные, пол, возраст и составляющие состояния здоровья):
• психологическая информация (характеристика личности);
• социальная информация (интегративная акустическая информация о происхождении, социальном статусе и т.д.).
Б. Групповая информация (региональная, профессиональная и т. д.):
• идиосинкразическая информация (индивидуальная специфика);
• аффективная информация (информация об изменениях в эмоционально-модальном состоянии говорящего) ([Brown, 1987]).
При описании речевого портрета говорящего различают три типа нормы: универсальную, групповую и идиосинкразическую. При этом особая роль принадлежит голосовой информации, декодируемой на уровне слуховой перцепции по следующей схеме:
• описание, соотносящееся с портретом говорящего и его местом в жизни воспринимающего;
• соотнесение воспринимаемого речевого образа с определенным именем говорящего;
• репродукция по речевому образу физических данных говорящего (лица, общего телосложения, жестов, походки и т.д.);
• спецификация акустических характеристик.
Речевые признаки говорящего подразделяются на контролируемые (внешние) и неконтролируемые (внутренние). Некоторые специалисты выделяют потенциально контролируемые признаки. Степень контроля зависит от двух факторов [Brown, 1987]: от способности говорящего использовать слуховые и проприоцептивные формы обратной связи в процессе реализации артикуляторной программы; от его перцептивной способности использовать слуховые формы информации для обнаружения слуховых различий. Оба фактора входят в число таких понятий, как «мастерство контроля».
Факторы, не поддающиеся контролю, обусловлены органо-генетическими признаками говорящего: структурой речевого аппарата, включающего длину голосового тракта, размеры языка, небной занавески, зева, челюсти и всей ротовой полости; формой (конфигурацией) гортанного тракта и объемом носовой полости. Сюда же могут быть отнесены так называемые структурные дефекты (например, наличие расщелины в твердом небе / волчьей пасти, отсутствие зубов и т. д.)
Контролируемые факторы не связаны с органо-генетическими ограничениями и включают изменения в манипуляциях голосовой динамики всех потенциально контролируемых мышц артикуляции, которые характеризуют манипуляционные компоненты качества голоса. Некотролируемые факторы могут рассматриваться как постоянные (перманентные) и переменные (относительно постоянные). Они базируются на анатомии и физиологии говорящего и со-
относятся с его инвариантом - нормой физического плана, свойственного для речевых характеристик говорящего.
Перманентность и неперманентность неконтролируемых признаков связаны с дифференциацией последних на долговременные и кратковременные (примером появления кратковременных неконтролируемых признаков является речепроизводство в период болезни горла, после бега, быстрого подъема по лестнице и т.д.). Однако к числу кратковременных неконтролируемых признаков не могут быть отнесены такие, например, как признаки возрастной ломки голоса в период пубертации. Как контролируемые, так и неконтролируемые признаки могут быть сгруппированы по принципу внутридикторских (интрадикторских) и междикторских (интердикторских) сходств и различий [Brown, 1987; Speaking fundamental frequency, 1991].
Следовательно, информация о говорящем скрыта в речевом сигнале, соотносится с его анатомическими признаками и хранящимися на нейронном уровне мышечными речевыми образцами, коррелирующими с телосложением говорящего [Потапова, Потапов, 2006].
5. Практическая направленность проводимых исследований в области лингвокриминалистики
При разработке автоматизированных систем атрибуции говорящего по речи учитываются следующие условия реализации речевого сигнала:
• речь должна быть естественной;
• речь должна быть варьируемой как можно шире относительно говорящих (интердикторские расхождения), но достаточно однородной относительно каждого говорящего (интрадикторские расхождения);
• на первоначальной стадии разработки речь не должна находиться под влиянием шума, помех и т.д. или не должна включать специальные характеристики передачи по техническому тракту;
• не следует допускать искажения голоса.
Особо информативным для атрибуции говорящего по речи является диапазон частоты основного тона (ÄF0), куда входят прежде всего такие параметры, как ширина диапазона частоты основ-
ного тона (AF0) и его регистр (очень высокий, высокий, средний, низкий, очень низкий), что соотносится со следующими индивидуальными характеристиками говорящего:
• биологической дифференциацией по полу, возрасту и физическим данным (средняя длина голосовых связок у мужчин приблизительно на 1/3 больше, чем у женщин, что составляет приблизительно 23 мм по сравнению с 17 мм; данное распределение ведет к более низкой средней частоте основного тона для мужских голосов; вместе с тем для частоты основного тона женщин характерен более узкий диапазон по сравнению с диапазоном основного тона у мужчин); уплотнение и затвердевание гортанных хрящей начинается с 25 лет, к 65 годам хрящи полностью костенеют и окружающие мышцы полностью утрачивают свою эластичность, что ведет к уменьшению таких параметров, как ширина диапазона частоты основного тона и его регистра относительно обычного, привычного для того или иного говорящего диапазона частоты основного тона;
• перманентными или временными биологическими различиями относительно состояния здоровья говорящего в данный момент времени (например, зауженный диапазон частоты основного тона характерен для больных эпилепсией, заикающихся и т.д.);
• психологическими различиями в поведении говорящего (для состояния воодушевления характерна речь с более широким диапазоном частоты основного тона по сравнению с речью в состоянии безразличия или усталости; расширение диапазона частоты основного тона фиксируется в том случае, когда речь говорящего характеризуется наличием взволнованности; отсутствие настроения индицируется уменьшением диапазона частоты основного тона);
• наличием иностранного акцента (например, при речеоб-разовании на иностранном языке фиксируется смещение диапазона частоты основного тона говорящего в более низкий регистр по сравнению с его речью на родном языке);
• идиосинкразическими (индивидуальными) признаками на биологическом, психологическом и регионально-социальном уровнях [Потапова, 2008; Потапова, Потапов, 2006; Oksaar, 2000; Ryan, Capadano, Harry, 1978].
Индивидуальные признаки говорящего традиционно делят на две группы: приобретенные и неприобретенные. К приобретен-
ным признакам относятся такие речевые специфические признаки, которые образуются под влиянием внешних условий жизни говорящего. К числу последних относится прежде всего процесс овладения языком, а затем его применения в устной и письменной коммуникации. При этом особую роль играет диалект, на котором говорит непосредственное окружение индивидуума, в особенности тогда, когда в период фазы овладения речью, которая соотносится со временем обучения в школе (приблизительно до 18 лет), имеет место длительное пребывание в различных диалектальных и языковых социумах. Сюда же относятся общественные условия, которые определяют так называемый социолект. К приобретенным признакам относятся также речевые признаки, являющиеся результатом воздействия различных вредных факторов, например курения, алкогольной и наркотической интоксикации [Междисци-плинарность в исследовании... 2015; Braun, 1994, 2001].
Неприобретенные признаки соотносятся с органогенетиче-скими данными, базирующимися на анатомических и нейрофизиологических составляющих речевого аппарата. К последним относятся размер и пространственная конфигурация (так называемая полостная конфигурация) шейно-гортанного, носового и глоточного трактов, мобильность и величина языка, и в особенности - число зависящих от голосообразования краевых условий с учетом математического описания, а также возраст и пол.
Данные о поле говорящего не всегда определимы однозначно. В ряде случаев (например, в зависимости от вида и типа звукозаписывающей аппаратуры, при подозрении в попытке фальсификации) необходимы более детальные измерения. По данным Криминалистического центра Германии (BND), вероятность случайного совпадения голосов (при выборке в 100 испытуемых-мужчин) равна 2%. Данные распределения частоты основного тона по категориям возраста для мужчин и женщин представлены ранее в табл. 1.
Существует ряд типов фальсификации голоса [Потапова,
2008].
Тип I. Признаки: искусственное повышение частоты основного тона, в большинстве случаев в интервале от терции до квинты (от 25 до 50% по отношению к частоте основного тона в норме). У мужчин это часто смена грудного регистра на головной регистр
(фальцет). При этом происходит повышение частоты основного тона на октаву (т.е. на 100%).
При искаженном понижении частоты основного тона (F0) как у мужчин, так и у женщин появляется эффект хриплости, зашумленности, сиплости, что хорошо идентифицируется по речевой волне на осцилограмме (в зарубежной специальной литературе имеются соответствующие образцы фальсификации голосов данного типа).
Тип II. Признаки: а) замена по мере возможности диалектальных явлений на литературное произношение; б) усиление диалектальных признаков.
Тип III. Признаки: изменение частоты основного тона и темпа, соотносимых с интонацией. Наиболее типичная фальсификация - искусственная монотония (т.е. ограничение для нормальной речевой ситуации отклонений по частоте основного тона от среднего значения). Характерными признаками являются равная выде-ленность слогов, равная длительность слогов. Возникает эффект так называемой роботообразной речи. Применительно к темпу имеет место либо искусственное замедление, либо искусственное увеличение скорости говорения.
При использовании мелодики голоса в качестве информативной для атрибуции говорящего характеристики опираются на такой параметр частоты основного тона, как среднее стандартное отклонение от среднего значения, что позволяет квалифицировать голос как монотонный, мелодичный, возбужденный, блеклый и т. д. Ввиду того что это соотношение зависит от абсолютной высоты среднего значения (при нормальных условиях для высоких голосов это соотношение больше, чем для низких), при сравнении различных средних значений оптимальным является процентное соотношение между последними. При этом имеется в виду коэффициент вариативности.
Частота основного тона может изменяться в зависимости от таких факторов, как громкое говорение (например, в состоянии возбуждения, на фоне шумов (эффект Ломбара) и т.д.). В этих случаях частота основного тона изменяется в сторону повышения, что должно быть учтено при атрибуции говорящего. На определенных стадиях психических заболеваний голос может быть не только ниже, но также и значительно монотоннее (например, в состоянии депрессии у маниакально-депрессивных больных).
При атрибуции говорящего по речи наряду с вышеуказанными характеристиками огромное значение имеет информация о качестве голоса. В данном случае обнаруживаются специфические для говорящего признаки. В первую очередь следует упомянуть такой качественный часто встречающийся признак, как хриплость (creaky voice). Информативен не этот признак сам по себе, а его распределение в потоке речи: данное явление может возникать там, где голос по семантико-синтаксическим законам вербальной коммуникации понижается, т. е., например, в конце предложений и других синтактических или семантических единств. У ряда говорящих с низким голосом или патологией голоса (например, вследствие воспаления гортани, опухоли или узлов в гортани и т. д.) этот признак может появляться в различных других позициях речевого потока.
При атрибуции говорящего информативным является также темп речеобразования. Средняя скорость говорения равна 4,5-5 слогам за секунду. Экстремальные величины 3,2-7,5 слогов. Большая скорость ведет к неполной артикуляции или полному выпадению звуков, слогов, частично даже целых слов.
Существенное значение имеет такой параметр, как соотношение между артикуляцией и паузацией. При нормальном речепроизводстве доля времени артикуляции составляет 50-60% от общей суммарной длительности всего высказывания; доля пауза-ции, соответственно, 50-40%, что необходимо для очередного вдоха и дальнейшего планирования сообщения.
Распределение дыхания также индикативно для речевого портрета говорящего. Нормальным является совпадение выдоха-вдоха на определенных участках или границах синтактико-семантических единиц. Однако ряд говорящих реализуют выдох-вдох на других участках речевой цепи. Для данного признака переход между индивидуальной нормой и патологией довольно расплывчат. Причинами сверхчастых дыхательных пауз являются прежде всего различного рода заболевания, а также преобладание процесса возбуждения и ряд эмоций.
При акустической обработке речевого сигнала в системах атрибуции говорящего по речи используются наряду с вышеуказанными такие характеристики, как анализ речевой волны, долговременного (суммарного) спектра, мгновенного спектра, изменения частоты основного тона (F0) во времени.
В реестр атрибутивных признаков говорящего обычно включают возраст, пол, эмоциональное состояние в данный момент времени, девиантное состояние (например, алкогольная, медикаментозная или наркотическая интоксикация).
В качестве образца следует привести анкетные требования, характеризующие обликовый портрет говорящего по голосу и речи:
• физические: пол, возраст, рост, вес;
• семейное положение: родители, их родной язык, происхождение, социальный статус и т.д.;
• лингвистические: язык родной / неродной, литературный / нелитературный, региональный / диалектальный варианты;
• образовательные: стаж обучения (начальное, среднее, высшее и т. д.);
• географические: место длительного проживания (если несколько, то указать сроки проживания);
• профессиональные: профессии / не по профессии;
• аудилогические: состояние слуха, наличие / отсутствие патологии;
• медицинские: хронические / нехронические заболевания;
• голосовые: тренированный голос, «поющий», «курящий», напряженный и т.д.;
• музыкальные: музыкальные данные и т. д.;
• хобби: спортивный профиль, музыкальный профиль и др.
Таким образом, в число обликовых характеристик коммуникантов, определяемых по акустическим данным в 1Р-телефонии, в ССД могут быть включены следующие характеристики.
Социальные: по уровню образования; социальному положению; сфере деятельности; физическим характеристикам; эмоциональным характеристикам; региональным характеристикам: по месту рождения; месту длительного проживания; национальности; дополнительным сведениям; психологическим характеристикам: психической патологии; типу ВНД; чертам характера; видам интоксикации (алкогольной, медикаментозной, наркотической); произносительным характеристикам: спонтанной речи; квазиспонтанной речи; подготовленному / неподготовленному чтению текста и др.
6. Заключение
Таким образом, исследование процесса вариативности речи на материале IP-телефонии в Интернете и других видов современной цифровой телефонной коммуникации представляет собой архисложную задачу, связанную, с одной стороны, с артикуляцион-но-акустической спецификой устной речи и ее перцептивно-слуховыми и акустическими коррелятами, с другой стороны, - со спецификой построения любого высказывания с учетом просоди-ко-семантической вариативности самого речевого продукта. При этом передача качественного речевого сигнала применительно к IP-телефонии (точнее, Voiceover IP (VoIP)) в силу специфики кодирования, компрессии и упаковки речевого сигнала в IP-пакеты может быть своего рода препятствием для успешного решения поставленной задачи [Михайлов, 2007; Kunzel, 2001]. Аналоговый голосовой сигнал, оцифрованный, например, методом ИКМ и скомпрессированный с помощью кодеков для устранения избыточности, бесспорно, претерпевает определенные изменения на выходе связи. Как показали результаты предварительного исследования [Potapova, Sobakin, Maslov, 2014], перспективы использования специального программного средства для установления акустической и перцептивно-слуховой эквивалентности речи говорящего с определенной степенью вероятности вполне обнадеживают в области решения задач портретирования «электронной личности» в информационно-коммуникационной среде Интернета. Вышеописанные корреляционные связи между акустическими характеристиками говорящего и его атрибутикой дают возможность развить в должном направлении разработки в области исследования «электронной личности».
Список литературы
1. Междисциплинарность в исследовании речевой полиинформативности / Потапова Р.К., Потапов В.В., Лебедева Н.Н., Агибалова Т.В. - М.: Языки славянской культуры, 2015. - 347 с.
2. Методы анализа текста и дискурса / Тичер С., Мейер М., Водак Р., Веттер Е. / Пер. с англ. - Харьков: Изд-во Гуманитарный Центр, 2009. - 356 с.
3. Михайлов В.Г. Особенности формирования и анализа речевых сигналов, передаваемых средствами IP-телефонии (В помощь эксперту КЭЗ) // Теория и практика судебной экспертизы. - 2007. - № 3(7). - С. 129-140.
4. Потапова Р.К. Лингвистические и паралингвистические функции просодии (К опыту поиска просодо-семантемы) // Язык и речь: Проблемы и решения / Отв. ред. Г.Е. Кедрова, В.В. Потапов. - М.: МАКС Пресс, 2004. - С. 117-137.
5. Потапова Р.К. Депривация как базовый механизм вербального и паравер-бального поведения человека (На материале социально-сетевой коммуникации) // Речевая коммуникация в информационном пространстве / Отв. ред. Р.К. Потапова. - М.: Ленанд, 2017. - С. 17-36.
6. Потапова Р.К. Речь: Коммуникация, информация, кибернетика. - 4-е изд. -М.: Книжный дом «Либроком», 2015. - 600 с.
7. Потапова Р.К. Некоторые наблюдения над искусственно модифицированной речью // Идеи и методы экспериментального изучения речи. - СПб.: Санкт-Петерб. гос. ун-т: Ин-т физиологии им. И.П. Павлова РАН, 2008. - С. 124-135.
8. Потапова Р.К., Потапов В.В. Речевая коммуникация: От звука к высказыванию. - М.: Языки славянских культур, 2012. - 464 с.
9. Потапова Р.К., Потапов В.В. Язык, речь, личность. - М.: Языки славянской культуры, 2006. - 496 с.
10. Шарп Д. Типы личности. Юнговская типологическая модель / Пер. с англ. -М.: Издательский дом «Азбука-классика», 2008. - 288 с.
11. Braun A. Sprechstimmlage und regionale Umgangssprache // Braun A. (ed.) // Beiträge zu Linguistik und Phonetik. Festschrift für Ioachim Göschel zum 70. Geburtstag. - Stuttgart, 2001. - S. 453-463.
12. Braun A. The effect of cigarette smoking on vocal parameters // Proceedings of the ESCA Conference on speaker identification, verification, recognition. - Martigny, 1994. - P. 161-164.
13. Brown R. Auditory speaker recognition. - Hamburg: Helmut Buske Verlag, 1987. -130 p.
14. Bühler K. Sprachtheorie. Die Darstellungsfunktion der Sprache. - Stuttgart: G. Fischer, 1965. - 434 S.
15. KünzelH. Beware of the «telephone effect»: The influence of telephone transmission on the measurement of formant frequencies // Forensic Linguistics. - 2001. -N 8. - P. 80-99.
16. Oksaar E. Idiolekt als Grundlage der variationsorientierten Linguistik // Sociolinguis-tica. - 2000. - N 14. - P. 37-41.
17. Potapova R., Potapov V. Kommunikative Sprechtätigkeit. Russland und Deutschland im Vergleich. - Köln; Weimar; Wien: Böhlau Verlag, 2011. - 312 S.
18. Potapova R., Potapov V. Polybasic attribution of social network discourse / Ronzhin A., Potapova R., Nemeth G. (eds.) // SPECOM 2016. LNCS. - Heidelberg: Springer International Publishing Switzerland, 2016. - Vol. 9811. - P. 208-218.
19. Potapova R., Sobakin A., Maslov A. On the possibility of the Skype channel speaker identification (On the basis of acoustic parameters) / Ronzhin A., Potapova R., Delic V. (eds.) // SPECOM 2014. LNCS. - Heidelberg: Springer International Publishing Switzerland, 2014. - Vol. 8773. - P. 329-336.
20. Potapova R.K. From deprivation to aggression: Verbal and non-verbal social network communication // Materials of the VI International scientific conference «Global science and innovation». - Chicago (USA): Publishing Office Accent Graphics Communications, 2015. - Vol. 1. - P. 129-137.
21. Potapova R.K., Potapov V.V. Pragmaphonetics as a part of pragmalinguistics // Речевая коммуникация в информационном пространстве / Отв. ред. Р.К. Потапова. - М.: Ленанд, 2017. - С. 6-16.
22. Ryan E.B., Capadano I., Harry L. Age perceptions and evaluative reactions toward adult speakers // Journal of Gerontology. - 1978. - N 33. - P. 98-102.
23. Speaking fundamental frequency characteristics as a function of age and professional singing / Brown W.S., Morris R., Hollien H., Howell H.F. // Journal of Voice. - 1991. - N 3. - P. 310-313.
References
1. Mezhdisciplinarnost' v issledovanii rechevoj poliinformativnosti / Potapova R.K., Potapov V.V., Lebedeva N.N., Agibalova T.V. - M.: Jazyki slavjanskoj kul'tury, 2015. - 347 s.
2. Metody analiza teksta i diskursa / Titscher S., Meyer M., Wodak R., Vetter E. / Per. s angl. - Har'kov: Izd-vo Gumanitarnyj Centr, 2009. - 356 s.
3. Mikhailov V.G. Osobennosti formirovanija i analiza rechevyh signalov, peredavae-myh sredstvami IP-telefonii (V pomoshh' jekspertu KJeZ) // Teorija i praktika sudebnoj jekspertizy. - 2007. - № 3 (7). - S. 129-140.
4. Potapova R.K. Lingvisticheskie i paralingvisticheskie funkcii prosodii (K opytu poiska prosodo-semantemy) // Jazyk i rech': Problemy i reshenija / Otv. red. G.E. Kedrova, V.V. Potapov. - M.: MAKS Press, 2004. - S. 117-137.
5. Potapova R.K. Deprivacija kak bazovyj mehanizm verbal'nogo i paraverbal'nogo povedenija cheloveka (Na materiale social'no-setevoj kommunikacii) // Rechevaja kommunikacija v informacionnom prostranstve / Otv. red. R.K. Potapova. - M.: Lenand, 2017. - S. 17-36.
6. Potapova R.K. Rech': Kommunikacija, informacija, kibernetika. - 4-e izd. - M.: Knizhnyj dom «Librokom», 2015. - 600 s.
7. Potapova R.K. Nekotorye nabljudenija nad iskusstvenno modificirovannoj rech'ju // Idei i metody jeksperimental'nogo izuchenija rechi. - SPb.: Sankt-Peterb. gos. un-t; In-t fiziologii im. I.P. Pavlova RAN, 2008. - S. 124-135.
8. PotapovaR.K., Potapov V.V. Rechevaja kommunikacija: Ot zvuka k vy-skazyvaniju. - M.: Jazyki slavjanskih kul'tur, 2012. - 464 s.
9. PotapovaR.K., Potapov V.V. Jazyk, rech', lichnost'. - M.: Jazyki slavjanskoj kul'tury, 2006. - 496 s.
10. Sharp D. Tipy lichnosti. Jungovskaja tipologicheskaja model' / Per. s angl. - M.: Izdatel'skij dom «Azbuka-klassika», 2008. - 288 s.
11. Braun A. Sprechstimmlage und regionale Umgangssprache // Braun A. (ed.). Beiträge zu Linguistik und Phonetik. Festschrift für Ioachim Göschel zum 70. Geburtstag. - Stuttgart, 2001. - S. 453-463.
12. Braun A. The effect of cigarette smoking on vocal parameters // Proceedings of the ESCA Conference on speaker identification, verification, recognition. - Martigny, 1994. - P. 161-164.
13. Brown R. Auditory speaker recognition. - Hamburg: Helmut Buske Verlag, 1987. -130 p.
14. Bühler K. Sprachtheorie. Die Darstellungsfunktion der Sprache. - Stuttgart: G. Fischer, 1965. - 434 S.
15. Künzel H. Beware of the «telephone effect»: The influence of telephone transmission on the measurement of formant frequencies // Forensic Linguistics. - 2001. -N 8. - P. 80-99.
16. Oksaar E. Idiolekt als Grundlage der variationsorientierten Linguistik // Sociolingu-istica. - 2000. - N 14. - P. 37-41.
17. Potapova R., Potapov V. Kommunikative Sprechtätigkeit. Russland und Deutschland im Vergleich. - Köln; Weimar; Wien: Böhlau Verlag, 2011. - 312 S.
18. Potapova R., Potapov V. Polybasic attribution of social network discourse // Ronzhin A., Potapova R., Nemeth G. (eds.) // SPECOM 2016. LNCS. - Heidelberg: Springer International Publishing Switzerland, 2016. - Vol. 9811. - P. 208-218.
19. Potapova R., Sobakin A., Maslov A. On the possibility of the Skype channel speaker identification (On the basis of acoustic parameters) // Ronzhin A., Potapova R., Delic V. (eds.) // SPECOM 2014. LNCS. - Heidelberg: Springer International Publishing Switzerland, 2014. - Vol. 8773. - P. 329-336.
20. Potapova R.K. From deprivation to aggression: Verbal and non-verbal social network communication // Materials of the VI International scientific conference «Global science and innovation». - Chicago (USA): Publishing Office Accent Graphics Communications, 2015. - Vol. I. - P. 129-137.
21. Potapova R.K., Potapov V.V. Pragmaphonetics as a part of pragmalinguistics // Речевая коммуникация в информационном пространстве / Отв. ред. Р.К. Потапова. - М.: Ленанд, 2017. - С. 6-16.
22. Ryan E.B., Capadano I., Harry L. Age perceptions and evaluative reactions toward adult speakers // Journal of Gerontology. - 1978. - N 33. - P. 98-102.
23. Speaking fundamental frequency characteristics as a function of age and professional singing / Brown W.S., Morris R., Hollien H., Howell H.F. // Journal of Voice. - 1991. - N 3. - P. 310-313.