УДК 81'33
Р. К. Потапова, В. В. Потапов
Потапова Р. К., доктор филологических наук, профессор
академик МАИ, директор института прикладной и математической лингвистики, заведующая каф. прикладной и экспериментальной лингвистики факультета английского языка МГЛУ; e-maiL: [email protected] Потапов В. В., доктор филологических наук, главный научный сотрудник НИР кафедры прикладной и экспериментальной лингвистики Института прикладной и математической лингвистики факультета английского языка МГЛУ; ст. научный сотрудник филологического факультета МГУ им. М. В. Ломоносова; e-maiL: [email protected]
ПЕРЦЕПТИВНО-СЛУХОВЫЕ ОСОБЕННОСТИ ИДЕНТИФИКАЦИИ ИНОЯЗЫЧНОГО ГОВОРЯЩЕГО
В настоящее время в судебной фонетике всё чаще возникают случаи, когда эксперту необходимо идентифицировать говорящего на иностранном языке. Однако до сих пор еще не так много известно о влиянии родного языка эксперта на идентификацию говорящего. В ходе криминалистической экспертизы могут решаться различные задачи, которые имеют прямое отношение как к числу участников диалога / полилога, так и к содержанию (теме) диалога, обликовым характеристикам говорящих, их эмоциональным атрибутам, знанию языка.
Ключевые слова: вариативность речи; экспертиза; идентификация диктора; иноязычная речь; перцептивно-слуховой анализ.
R. K. Potapova, V. V. Potapov
Potapova R. K., Doctor of PhiLoLogy (Dr.habiL.), Professor; Director of the Institute of AppLied and MathematicaL Linguistics, MSLU; Head of the Department of AppLied and ExperimentaL Linguistics, MSLU; e-maiL: [email protected]
Potapov V. V., Doctor of PhiLoLogy (Dr.habiL.), PrincipaL Research FeLLow, Department of AppLied and ExperimentaL Linguistics, Institute of AppLied and MathematicaL Linguistics, FacuLty of Humanities and AppLied Sciences, MSLU; PrincipaL Scientific Researcher, FacuLty of PhiLoLogy, Moscow State University e-maiL: [email protected]
PERCEPTUAL-AUDITORY PECULIARITIES OF FOREIGN LANGUAGE SPEAKER IDENTIFICATION
CurrentLy, there are cases in forensic phonetics when the necessity arises for an expert to identify a foreign Language personaLity. However, there is stiLL not much known about the infLuence of the expert's native Language on the speaker identification. During the forensic examination, various tasks can be soLved that can be directLy reLated to the number of participants in the diaLogue / poLyLogue, as weLL
as to the content (topic) of the diaLogue, the speakers' "portrait" characteristics, their emotionaL attributes, and their possession of the Language.
Key words: speech variabiLity; forensic expertise; speaker identification; foreign spoken Language; perceptuaL-auditory anaLysis.
Использование фонограмм для решения задач криминалистики приобрело в нашей стране статус юридически обоснованного акта с начала 90-х гг. ХХ в. В ходе криминалистической экспертизы могут решаться различные задачи, которые имеют прямое отношение как к числу участников диалога / полилога, так и к содержанию (теме) диалога, обликовым характеристикам говорящих, их эмоциональным атрибутам, знанию языка. Таким образом, основная задача фонографической экспертизы заключается в идентификации говорящего по устной речи, а также в реконструкции его «портрета», т. е. атрибутики исследуемой личности [Кураченкова, Бойчаров, Ермакова 2007, с. 15-18].
Объекты, изучаемые в процессе криминалистической идентификации, разделяют на идентифицируемые и идентифицирующие. Идентифицируемые - это те объекты, которые необходимо отождествить. Для случаев идентификации личности устной речи - это говорящий, фонограммы речи которого исследуются. В качестве идентифицирующих объектов выступают использующиеся для отождествления фонограммы устной речи. Идентифицирующими объектами являются спорная фонограмма и фонограммы образцов устной речи подозреваемого лица, которые могут быть свободными и экспериментальными.
Термин «спорная фонограмма» отражает фактические обстоятельства, существенные для дела, которые необходимо проверить с помощью экспертного исследования. Применительно к идентификации человека по его устной речи - это аналогичная цифровая запись речи человека, личность которого необходимо установить. При этом термин «спорная» носит условный характер [Кураченкова, Бойчаров, Ермакова 2007].
Свободные образцы устной речи - это речь человека, зафиксированная на фонограмме, полученной вне связи с назначением фонографической экспертизы. К ним относятся и фонограммы бесед, если анализируемый участник эксперимента во время записи не знал об их использовании при проведении фонографической экспертизы. Таким образом, экспериментальные образцы устной речи - это речь, фиксируемая специально для криминалистического исследования.
Методика проведения криминалистического идентификационного фонографического исследования включает предварительный этап, этап раздельного исследования, этап сравнительного исследования, заключительный этап.
На предварительном этапе изучаются обстоятельства дела, обусловившие назначение экспертизы, проводится ознакомление с поступившими фонограммами и сопроводительными документами. Цель раздельного исследования каждого из поступивших на экспертизу фонографических объектов - выявление их индивидуальных признаков. Раздельное исследование начинается с предварительного прослушивания фонограмм, которое осуществляется для определения разборчивости речи, ее естественности, достаточности объема записи для выявления необходимой совокупности идентификационных признаков. Затем проводится определение технических параметров фонограммы (частотного диапазона речи, частотного диапазона шума, отношения сигнал / шум, длительности звучания речи, возможного изменения скорости при звуковоспроизведении и т. д.) с целью установления ее пригодности для дальнейшей обработки.
Результаты предварительного прослушивания и определения технических параметров фонограммы позволяют выявить факторы, имеющие значение для сравнительного исследования и оценки его результатов. В случае если лингвистические или технические параметры фонограммы устной речи подозреваемого лица окажутся неудовлетворительными, эксперт должен поставить вопрос о получении новых образцов. При неудовлетворительном качестве спорной фонограммы устанавливается, что провести идентификационное исследование не представляется возможным.
Раздельное акустическое исследование представляет собой вычисление признаков, отражающих спектрально-временные параметры исследуемых речевых сигналов. Раздельное лингвистическое исследование заключается в выявлении и описании лингвистических особенностей звучащей речи в каждой из присланных на исследование фонограмм. На этапе сравнительного исследования сопоставляются полученные признаки фонограмм устной речи. Основной целью сравнительной стадии является установление характера отношений, возникающих между признаками сравниваемых объектов, в плане определения степени их совпадения или различия для последующего принятия решения относительно наличия или отсутствия тождества.
Сравнение проводится поэтапно по всем группам признаков. Основным методическим условием проведения сравнительного исследования является сопоставимость исследуемых речевых сигналов в системе признаков, по которым осуществляется сравнение.
Суть заключительного этапа идентификационного фонографического исследования состоит в окончательной систематизации всех полученных на предшествующих стадиях результатов и их совокупной оценке с учетом особенностей сложившейся конкретной экспертной ситуации. Эксперт определяет некоторый набор различий и совпадений признаков речи в каждом конкретном случае и формулирует выводы по результатам исследования [Кураченкова, Бойчаров, Ермакова 2007].
Экспертиза завершается оформлением результатов исследования в форме заключения эксперта.
На качество идентификации могут влиять следующие факторы:
- увеличение количества дикторов;
- анализ шепота вместо обычной речи;
- использование различных речевых материалов;
- наличие различного рода шума и помех.
По итогам различных исследований можно выделить следующее:
I. Факторы, улучшающие результаты идентификации:
1. Некоторые голоса выделяются более контрастно по сравнению с другими.
2. Аудиторы распознают голоса лучше при сравнительно небольшом размере контрольной группы (однако надо иметь в виду, что уменьшение контрольной группы также повышает шанс «угадывания верного ответа»).
3. Анализ спонтанной речи в целом дает лучшие результаты, чем анализ подготовленной речи (чтения).
4. Чем длительнее во времени образец речи, тем правильнее идентификация.
5. Повторное прослушивание образца повышает точность идентификации.
6. Знакомые голоса запоминаются легче, чем незнакомые.
II. Факторы, ухудшающие результаты идентификации:
1. Аудиторы демонстрируют худшие результаты, если голос диктора им незнаком.
2. Точность анализа понижается, если голос подозреваемого не включен в контрольную группу.
3. Использование большого числа голосов в контрольной группе сказывается на оперативной памяти аудитора.
4. Плохие условия записи понижают точность анализа.
5. Любые изменения в голосе подозреваемого между образцом и контрольной группой могут ввести аудитора в заблуждение [Кураченкова, Бойчаров, Ермакова 2007].
Известно еще одно свойство аудиторов - ожидание: аудиторы могут быть убеждены (по каким-либо причинам), что голос подозреваемого находится в контрольной группе, и шанс ложной идентификации достаточно высок [Milroy 1984].
Вариативность речи дикторов является существенной помехой при распознавании речи. Она может быть вызвана следующими несколькими причинами:
- наличие в речи диктора произносительных дефектов, затрагивающих как произнесение отдельных звуков (таких, как /i /, /г/, /s/ и др.), так и «накладывающихся» на всю речь (гнусавость, приводящая к изменению формантной структуры, дисфония и др.) Говорящие с подобного рода нарушениями составляют около 15 % взрослого населения;
- возникновение вариативности, которая может быть связана с несколькими возможными видами произнесения одной и той же языковой единицы. В отличие от дефектов речи, всегда наблюдаемых в речи данного говорящего, колебания в произнесении, лежащие в пределах нормы, могут отмечаться не только у разных людей, но и в речи одного и того же человека;
- дикторская вариативность, вызванная особенностями произнесения согласных и гласных под воздействием диалекта говорящего.
С существенным усилением вариативности сталкиваются при переходе от начитанного текста к спонтанно реализуемому. Спонтанная речь может быть представлена как речь с более «размытыми» характеристиками звуковых единиц [Бондарко 1981]. При этом «размытость» фонетических характеристик, выражающаяся в расширении допустимых пределов варьирования, присуща в спонтанной речи разным лингвистическим единицам - фонеме, слову, синтагме, просодическому контуру и др. Чтение текста отличается большей фонетической упорядоченностью по сравнению со спонтанной речью.
Еще одним фактором, приводящим к возникновению вариативности речевых характеристик, является речевая ситуация. Если ранее речь шла в основном о варьировании речевых характеристик разных говорящих (интердикторская вариативность), либо о варьировании фонетических единиц при разных видах речевой деятельности (чтение - спонтанная речь), то здесь необходимо остановиться на интра-дикторской вариативности, а именно - варьировании характеристик речи одного и того же говорящего в зависимости от речевой ситуации [Кураченкова, Бойчаров, Ермакова 2007].
Сравнение различных типов вариативности показывает, что между ними существуют значительные различия. При наличии дефектов произнесения в речи конкретного говорящего обычно наблюдается незначительное количество типичных произносительных черт, чаще одной, реже - сразу двух, но данная характерная черта реализуется всегда последовательно.
Фонетические признаки спонтанности речи весьма разнообразны и многочисленны, хотя каждая отдельная особенность встречается в небольшом количестве случаев, и регулярность ее проявления проследить очень сложно. То есть напрашивается вывод: пока сложно ответить, каким правилам подчиняется варьирование фонетических характеристик одного и того же человека в разных ситуациях.
В наши дни в судебной фонетике эксперт всё чаще сталкивается со случаями, когда ему нужно идентифицировать речь на иностранном языке. Однако до сих пор еще не так много известно о влиянии родного языка эксперта на идентификацию говорящего. Всемирная Ассоциация Судебной Фонетики и Акустики (далее - IAFPhA)1 советует экспертам быть очень внимательными при работе с языками, которые не являются для них родными. Имеется в виду, что идентификация голоса на иностранном языке более сложна по своей сути, чем на родном. Таким образом, можно сделать вывод, что эксперты не полагаются только на акустическую информацию (частоту основного тона, качество голоса, спектральную информацию и др.), но также и лингвистическую информацию [Потапова 1997; Потапова, Потапов 2006; Яковлев 2003; Potapova, Potapov 2014; Potapova, Potapov 2016].
1 Р. К. Потапова является в течение многих лет членом данной Ассоциации, представителем России.
В качестве примера следует привести некоторые наблюдения. Так, например, А. Гольдштейн с соавторами [8] провел ряд экспериментов. Задача аудиторов заключалась в распознавании говорящих: а) «с или без акцента»; б) на иностранных языках.
В первом эксперименте группа испытуемых, говорящих на General American English, прослушала фонограмму с высказыванием на английском языке, произнесенным китайцем, афроамериканцем и белым американцем, что и являлось объектом эксперимента. Высказывание состояло из 15 слов. В эксперименте по идентификации аудиторы слушали тестовое предложение на английском языке, произнесенное четырьмя дикторами, один из которых и являлся объектом идентификации. Соотношение правильных случаев идентификации существенно не различалось для трех групп аудиторов, т. е. можно было сделать вывод, что идентифицировать голоса с иностранным акцентом не сложнее, чем голоса без акцента. Однако следует отметить некоторую тенденцию худшей идентификации дикторов - носителей китайского языка.
Во втором эксперименте А. Гольдштейн и соавторы [Goldstein, Knight, Bailis, Conover 1981] уменьшили и длительность произносимого материала, что привело к значительному уменьшению общего процента правильной идентификации голосов, особенно в случае с диктором китайцем. Его голос был опознан значительно хуже, чем голоса афроа-мериканца и белого американца. Из этого следует, что уменьшение длительности рабочего материала имеет большее значение для идентификации голосов с акцентом, чем без акцента. Голоса с акцентом являются более сложными для идентификации объектом, чем голоса без акцента.
Интересны также эксперименты, проведенные С. Томпсоном [Thompson 1987]. Для проведения первого эксперимента были приглашены испытуемые, владеющие английским и испанским языками. Для прочтения им было предложено два отрывка из текста. Каждый испытуемый прочитал экспериментальный материал по три раза: первый раз на английском языке, второй - на испанском, третий - на английском, но с сильным испанским акцентом. Тестируемыми были англичане, не говорящие ни на каком языке, кроме английского. Для начала им был представлен первый отрывок текста, соответственно в трех вариантах. Спустя неделю они прослушали второй отрывок, также в трех вариантах, но в этот раз текст был проговорен шестью разными испытуемыми, включая того, опознание которого явилось
целью эксперимента. Задача испытуемых заключалась в опознании голоса определенного говорящего, включенного в группу голосов. Результаты эксперимента показали довольно сильное влияние языка. Если учитывать количество правильных опознаний, то можно сделать следующий вывод: голоса людей, которые говорили на английском языке без испанского акцента, были опознаны чаще, чем голоса с акцентом. Голоса с акцентом были опознаны лучше, чем голоса людей, говорящих на испанском языке. Уровень неправильных опознаний не показал никакой ощутимой разницы между тремя типами презентации данных отрывков текста [там же].
Второй эксперимент можно назвать частичным повторением первого, но на этот раз голос «подозреваемого» (говорящего, чей голос являлся предметом идентификации) отсутствовал в группе, представленной на опознание. В этот раз так же, как и в первом эксперименте, не было замечено особенной разницы в результатах опознания трех типов презентации текста. Однако уровень неправильных опознаний довольно сильно увеличился (до 0,56). Итак, вследствие проведенных экспериментов было установлено, что испытуемые распознают голоса говорящих на их родном языке или диалекте намного лучше, так как в этих условиях они более склонны опознавать типичные отличительные черты речи говорящего (имеется в виду идиосинкразия).
Безотносительно к тому факту, владеет ли аудитор языком, необходимым для аудирования, или нет, возможно возникновение двух проблем: во-первых, существует ли разница в процессе идентификации между аудитором - носителем языка и аудитором, который владеет этим языком в качестве второго; во-вторых, если язык для идентификации не известен слушающему, насколько разница между языками (родным языком слушающего и языком для идентификации) влияет на процесс идентификации (например, для англичанина, не говорящего на японском и французском языках, будет намного легче опознать французский язык, так как английский и французский входят в одну индоевропейскую языковую группу, а также английский язык имеет большой заимствованный лексический пласт романского происхождения).
Известны также результаты некоторых других экспериментов, проведенных позже [Потапова, Потапов 2006]. Для проведения данного исследования экспериментальный материал отбирался из базы
фонограмм Института прикладной и математической лингвистики МГЛУ. Монтаж экспериментального материала включал:
а) перезапись на одну фонограмму материала «подозреваемого» и «контрольной группы» («неизвестный» был включен в контрольную группу»;
б) протоколирование вариантов комбинаторики материала «подозреваемого» и «контрольной группы».
(Например, а - Ь, с, ё;
а - е, Г, g; а - ё, Г, а и т. д.)
Воспроизведение фонограмм тщательно контролировалось:
в) все фонограммы имели одинаковую структуру;
г) все фонограммы были подобраны с одинаковыми техническими характеристиками (например, с одинаковым соотношением «шум - тон»);
д) фонограммы с записью голоса «подозреваемого» и «контрольной группы» имели равную длительность и обладали одинаковыми акустическими качествами.
е) все фонограммы содержали идентичный или похожий материал (чтение - чтение, спонтанная речь - спонтанная речь, ответы на вопросы - ответы на вопросы, пересказ - пересказ и т. д.).
«Контрольная группа» состояла из 5-8 испытуемых одинакового возраста с «подозреваемым», а также говорила на одном и том же языке. Были учтены следующие факторы: уровень образования, социальный и экономический статус испытуемых. Испытуемым была дана инструкция:
1. Прослушать предлагаемый материал необходимое количество раз, сравнить его и определить, есть ли в «контрольной выборке» голос «подозреваемого».
2. Если да, то описать специфические признаки голоса и речи «подозреваемого», благодаря которым удалось «опознать» последнего.
1. Экстралингвистические признаки: Пол (мужской, женский).
Возраст (15-25, 20-30, 25-35, 30-40, 35-45, 40-50, 45-55, 5060, 55-65, 60-70).
Образование (высшее, среднее, без образования).
Социальное положение (по принципу начальник - подчиненный).
2. Индивидуальные признаки голоса и речи:
а) высота голоса: очень низкий, низкий, ниже среднего, средняя, выше среднего, высокий, очень высокий;
б) сила голоса: слабый, ниже среднего, средняя, выше среднего, сильный;
в) тембр (окраскаголоса): звонкий, глухой, хриплый, мягкий, назализованный, сиплый, дребезжащий, светлый, темный, певучий;
г) темп речи: медленный, ниже среднего, средний, выше среднего, быстрый;
д) речевое дыхание: норма, прерывистое, дискомфортное;
е) паузация: паузы очень длинные, длинные, средние, короткие, очень короткие;
ж) артикуляция (произнесение звуков, слогов, слов): небрежная, средняя, отчетливая;
з) заполнение пауз: незаполненные, заполненные звуком типа [э], заполненные звуком типа [м], покашливание в паузах, протяжение во времени слогов, протяжение во времени слов;
и) манера речи: официальная, сдержанная, спокойная, непринужденная, развязная;
к) эмоциональная характеристика: заторможенный, сдержанный, спокойный, вспыльчивый.
Данная инструкция была разработана специально для фоноскопи-ческих экспертиз Р. К. Потаповой.
Для достижения поставленной цели был проведен ряд экспериментов по идентификации говорящего. Аудиторами выступали:
1) аудиторы, не знающие английского языка;
2) аудиторы, знающие английский язык, но не являющиеся его носителями;
3) аудиторы, являющиеся носителями языка (native speakers). Эксперименты проводились по методике, разработанной для проведения экспертиз в специальных криминалистических лабораториях России. Важно также подчеркнуть, что данная методика, предназначенная для работы с русским языком, была впервые использована авторами для работы с иностранными языками.
В таблице 1 приведены результаты экспериментов, где [+] значит верное соответствие, [ - ] - ложное отсутствие соответствий, а [н] - неверное соответствие.
Таблица 1
Результаты проведенного эксперимента
Дикторы Аудиторы
1 2 3 4 5 6 7 8 9 10
В + + + + + + + + + -
D н н + + + + + + - +
F н н + н + - - н + -
А + + + + + + - + + +
[где: 1, 2, 3, 4 - незнающие языка аудиторы, 5, 6 - носители языка и 7, 8, 9, 10 - аудиторы, владеющие иностранным языком].
Согласно полученным результатам, такие характеристики речи дикторов, как высота, сила голоса, манера речи и эмоциональная насыщенность лучше всего идентифицировали аудиторы, не знающие языка, на котором был реализован экспериментальный материал.
Звонкость, хриплость, мягкость, назализованность, сиплость, -все эти характеристики с высшей степенью «попадания в цель» идентифицировались носителями языка. Вместе с тем иногда результаты совпадали с результатами аудиторов, не являющихся носителями иностранного языка.
Полученные данные позволяют сделать вывод о том, что проблема идентификации говорящего по голосу и речи многоаспектна и не имеет однозначного решения, что связано с языковыми особенностями предложенного для идентификации речевого сигнала говорящего, включающего в себя идиосинкразию [Потапова 2016; Potapova, Potapov 2017] артикуляции и восприятия наряду с целым рядом вербальных и невербальных характеристик. Подход к решению данной проблемы требует особых знаний в области дифференциальных голосовых и интегратив-ных речевых особенностей говорящего и зависит от целого ряда имманентных качеств слушающего. Тем более слушающего, перед которым стоит сложная задача реализации своих экспертных знаний.
СПИСОК ЛИТЕРАТУРЫ
Бондарко Л. В. Фонетическое описание языка и фонологическое описание речи. Л. : Изд-во ЛГУ, 1981. 200 с.
Кураченкова Н. Б., Бойчаров Н. В., Ермакова М. А. Идентификация лиц по устной речи на русском языке. Методика «Диалект» : пособие для экспертов. Изд. 2-е, пер. и доп. М. : Ин-т криминалистики, 2007. 136 с.
Потапова Р. К. Речь: коммуникация, информация, кибернетика. М. : Радио и связь, 1997. 528 с.
Потапова Р. К. Перцептивно-слуховая дивергенция в оценке эмоционально-модального состояния иноязычного партнера по коммуникации // События в коммуникации и когниции. М. : ФГБОУ ВПО МГЛУ, 2016. С. 211— 222. (Вестн. Моск. гос. лингвист. ун-та; вып. 7(746). Сер. Языкознание).
Потапова Р. К., Потапов В. В. Язык, речь, личность. М. : Языки славянской культуры, 2006. — 496 с.
Яковлев Ф. И. Лингвистические аспекты идентификации личности по голосу (на материале британского варианта английского языка) : дис. ... канд. филол. наук. — М.: МГЛУ, 2003. — 165 с.
Goldstein A., Knight P., Bailis K., Conover G. Recognition memory for accented and unaccented voices // Bulletin of the Psychonomic Society. 1981. № 17. P. 217—220.
Milroy J. Sociolinguistic methodology and the identification of speakers' voices in legal proceedings // Trudgill P. (ed.). Applied sociolinguistics. London : Academic Press, 1984. P. 51—72.
Potapova R., Potapov V. Associative mechanism of foreign spoken language perception (forensic phonetic aspect) // Ronzhin A., Potapova R., Delic V. (eds.). SPEC0M'2014 : Lecture Notes in Computer Science. 8773 LNAI. Heidelberg : Springer, 2014. P. 113—122.
Potapova R., Potapov V. On individual polyinformativity of speech and voice regarding speakers auditive attribution (forensic phonetic aspect) // Ronzhin A., Potapova R., Nemeth G. (eds.). SPEC0M'2016 : Lecture Notes in Computer Science. — 9811 LNAI. Heidelberg : Springer, 2016. P. 507—514.
Potapova R., Potapov V. Cognitive entropy in the perceptual-auditory evaluation of emotional-modal states of foreign language communication partner (forensic phonetics) // Karpov A., Potapova R., Mporas I. (eds.). SPEC0M'2017 : Lecture Notes in Computer Science. — 10458 LNAI. Heidelberg : Springer, 2016. P. 253—261.
Thompson Ch. P. A language effect in voice identification // Applied Cognitive Psychology. 1987. № 1. P. 121—131.