Обзор состояния судебно-экcпертного исследования обликовых характеристик личности по фонограммам речи

Лебедева А.К.

138

Право

Вестник Нижегородского университета им. Н.И. Лоб ачевского, 2015, № 3, с. 138-142

УДК 34

ОБЗОР СОСТОЯНИЯ СУДЕБНО-ЭКСПЕРТНОГО ИССЛЕДОВАНИЯ ОБЛИКОВЫХ ХАРАКТЕРИСТИК ЛИЧНОСТИ ПО ФОНОГРАММАМ РЕЧИ

Московский государственный юридический университет им. О.Е. Кутафина, Москва

Tonya [email protected]

Поступила в редакцию 22.06.2015

Дается обзор современного состояния судебного экспертного исследования обликовых характеристик личности по фонограммам речи. В работе представлены направления диагностического исследования, в рамках которых развивалась судебная фоноскопическая экспертиза в последнее время, и определяются пути и перспективы развития диагностического исследования обликовых характеристик говорящего.

Ключевые слова: обликовые характеристики говорящего, судебная фоноскопическая экспертиза, диагностические задачи.

В настоящее время при расследовании широкого перечня преступлений и правонарушений назначается судебная фоноскопическая экспертиза для идентификации личности по фонограммам речи. Решение идентификационных задач судебной фоноскопической экспертизы возможно при наличии сопоставимых и пригодных образцов устной речи. Однако особую сложность имеют задачи по исследованию фонограмм устной речи неизвестного диктора, где нет возможности получить образцы для сравнительного исследования. В такой ситуации особое значение приобретают обликовые характеристики диктора, которые позволяют установить взаимосвязь между характеристиками речи и признаками внешнего облика человека. В этом случае производство экспертизы позволит получить ориентирующую информацию, необходимую для успешного розыска проверяемого лица.

Данная задача решается, например, при расследовании преступлений, таких как:

• захват заложника (статья 206 УК РФ);

• заведомо ложное сообщение об акте терроризма (ст. 207 УК РФ);

• похищение человека (статья 126 УК РФ);

• вымогательство (статья 163 УК РФ) и т.д.

К обликовым характеристикам чаще всего

относят региональную принадлежность, пол, возраст, эмоциональное состояние говорящего, уровень образования; некоторые авторы относят к обликовым характеристикам, которые можно диагностировать в процессе судебного фоносопического исследования, также особенности телосложения диктора, прежде всего, такие, как рост, вес, психофизиологические характеристики говорящего (темперамент).

Несмотря на то что судебная фоноскопиче-ская экспертиза в нашей стране проводится на регулярной основе, вопросам диагностики, в частности изучению взаимосвязи внешнего облика человека и его голоса, уделялось недостаточное внимание в специальной литературе. В данной статье мы рассмотрим состояние этого вида судебной фоноскопической экспертизы, какие работы уже имеются в данной сфере, а какие вопросы диагностики обликовых характеристик личности по фонограммам речи следует доработать в будущем.

Исследования в области определения обли-ковых характеристик личности по голосу основаны на изучении связей между обликом говорящего и его речью. Предпосылки этих работ строятся на утверждении, «что речевой аппарат является и частью человеческого тела, и исполнительным органом психической деятельности» [1]. Например, при определении половой принадлежности говорящего акустический анализ основывается на различной анатомии речевого тракта мужчин и женщин.

Некоторые ученые разрабатывают методы автоматизированного определения обликовых характеристик. А.Н. Слепич, например, разрабатывал метод, основанный на анализе статистических характеристик основного тона голоса и формантных статистик [1].

Метод, разрабатываемый А.Н. Слепичем, основывается на двух гипотезах. Первая: «стабильные анатомо-физиологические свойства диктора, размеры и конфигурация органов тела, участвующих в процессе речеобразования, отражаются в свойствах речевого сигнала». Вторая: «любые свойства человека могут отражаться в его поведении, в частности, в специфике

работы мышц, участвующих в процессе речеоб-разования». Известно, что свойства индивидуальности говорящего отражаются в свойствах его речевого тракта, а также в свойствах его голосового источника. Таким образом, в зависимости от того, как изменяется поведение речевого сигнала, изменяются и определенные свойства диктора, отражающие в том числе и его обликовые характеристики.

Одной из задач в рамках диагностики обли-ковых характеристик говорящего является установление половой принадлежности личности. В рамках решения данной задачи также разрабатываются автоматизированные системы для определения половой принадлежности личности по фонограммам речи. Р.К. Потапова в рамках проводимых ею исследований в этой области ввела в теорию фоноскопической экспертизы такое понятие, как «сексолект» [2]. Сексолект -это набор идентифицирующих индивидуальных признаков человека, относящихся к полу лица.

Задача по определению сексолекта голоса в рамках судебной фоноскопической экспертизы решается с двух позиций: с точки зрения акустического анализа голоса и с точки зрения лингвистического анализа.

Путем лингвистического анализа исследуются стиль изложения говорящего, семантическая направленность речи говорящего, лексико-стилистические признаки устных высказываний. Более того, данный вид анализа включает в себя исследование звуковых и просодических средств. Например, в своих работах В.В. Потапов [3] указывает на фонетические гендерные различия:

- «В области вокализма отмечен ряд особенностей в тембральной окраске гласных, связанных с тем, что для многих мужчин характерен меньший раствор рта при артикуляции звуков, чем для женщин, что приводит к образованию более «узких», менее богатых по тембру гласных»;

- «В женской речи в позиции первого предударного слога после твердых согласных на месте [а], [о] часто возможно произнесение широкого открытого [а:], длительность которого равна ударному гласному или даже превышает длительность этого гласного (например, [ръска:залъ])»;

- «Применительно к консонантизму отмечается общая тенденция, свойственная мужскому произношению: меньшая степень напряженности артикуляции согласных».

Акустический анализ в рамках решения вопроса об определении половой принадлежности голоса человека основывается на различной анатомии речевого тракта мужчин и женщин. Как известно, размеры гортани и голосовых

связок у мужчин и женщин существенно отличаются, у мужчин они крупнее, чем у женщин (средняя длина голосовых связок у мужчин приблизительно на 1/3 больше, чем у женщин, что составляет приблизительно 23 мм по сравнению с 17 мм у женщин; чем толще голосовые связки, тем ниже высота голоса. Высота голоса также зависит от частоты основного тона голоса, чем она выше, тем, соответственно, выше голос.

Обычно у мужчин в возрасте от 20 до 80 лет частота основного тона составляет интервал от 110 Гц до 130 Гц, а у женщин - от 200 Гц до 230 Гц. Типичные средние значения частоты основного тона в речи, определённые на группе говорящих, составляют 132 Гц для мужчин и 223 Гц для женщин. Более того, для частоты основного тона женщин характерен более узкий диапазон по сравнению с диапазоном частоты основного тона у мужчин. В то же время стоит отметить, что у женщин с увеличением возраста наблюдается постепенное понижение частоты основного тона. Мужские и женские голоса также можно различать по энергетической насыщенности высокочастотных составляющих спектра гласных звуков, у женщин она, как правило, больше.

Задача по диагностике пола говорящего осложняется случаями намеренного изменения половой принадлежности голоса, например при помощи компьютерно-технических средств (программы: «Voxal Voice Changer», «AV Voice Changer Diamond», «Adobe Audition»). Программы, изменяющие половую принадлежность голоса, базируются на одном и том же алгоритме, в соответствии с которым производится изменение основного тона путём либо растягивания, либо сжатия коротких участков речи. Для сохранения естественного темпа речи в случае понижения тона (растягивания фрагментов) некоторые фрагменты удаляются, в случае повышения тона (сжатия фрагментов) некоторые фрагменты дублируются. Процесс изменения высоты тона звука без изменения его скорости называется «питч-шифтинг» от английского «pitchshiffing» [4], что переводится как «изменение основного тона». Для того чтобы избежать «искусственного» звучания голоса и сделать голос более естественным, применяют алгоритм коррекции формант, который восстанавливает позицию формантных частот после или в момент питч-шифтинга. Таким образом мы изменяем частоту основного тона, но оставляем неизменными формантные частоты.

Интересным фактом является то, что удаление из спектра мужского голоса полосы частот от 100 Гц до 500 Гц приводит к тому, что предъявляемая слушателям фонограмма с измененным

голосом квалифицируется как принадлежащая диктору-женщине [5]. Данная картина может быть объяснена с позиции взаимосвязи и взаимозависимости между параметрами функционирования голосовых связок и надставной трубы.

Несмотря на преимущественное различие женских и мужских голосов по частоте основного тона, возможны случаи, когда мужские и женские голоса совпадают по частоте основного тона. Тем не менее слушающие будут различать голоса по половой принадлежности на уровне слуховой перцепции.

Что касается определения возраста говорящего, то по мере старения человека происходят определенные изменения в речевом аппарате говорящего, например снижается жизненная емкость легких, уменьшается эластичность мышц. В результате в большинстве случаев голос пожилого человека воспринимается как тихий, слабый, нечеткий. Экспериментальными данными подтверждено, что при исследовании речевых фрагментов длительностью около 60 секунд погрешность в определении возраста составила 7.1 года. При увеличении длительности исследуемого фрагмента точность оценок увеличивалась [6].

Недавние работы в области судебной фоно-скопической экспертизы посвящены также диагностике психологических качеств диктора по устной речи, например тип акцентуации личности, темперамент, соционический тип, характерологические черты. В работе А.А. Журавлевой и С.Л. Коваль [7] как раз рассматривается именно этот аспект диагностики обликовых характеристик говорящего. В приведенной работе изложена методика «психологического шкалирования дикторов по устной речи на русском и иных языках». Как указывают авторы, данная методика основывалась на проверке достаточно большого статистического материала и показала высокое соответствие определяемых экспертами психологических характеристик диктора данным типовых психологических тестов.

В то же время некоторые специалисты указывают на низкую степень надежности определения таких характеристик [6]. А.Н. Слепич [1] указывает, что использование психофизиологических характеристик личности для автоматизации определения облика неизвестного диктора будет нецелесообразным, так как проведенная серия экспериментов показала высокую степень погрешности при определении данного признака [1]. Таким образом, вопрос о целесообразности определения психофизиологических признаков пока остается спорным, разрешить данный спор помогут только масштабные экспериментальные исследования.

Помимо описанного выше, изучаются возможности определения эмоционального состояния личности по голосу. В центре внимания специалистов в этой области находится следующий вопрос: влияет ли изменение эмоционального состояния говорящего на изменение признаков речевого сигнала? Как показывают многочисленные исследования, в состоянии даже лёгкого волнения изменяется частота основного тона голоса и нескольких первых формант, изменениям подвергается спектральный состав речи, повышается энергия высокочастотных компонент, увеличиваются громкость и темп речи, появляется вибрация, растягиваются гласные. Как указывает В.И. Галунов [8], громкость речевого сигнала связана со «стенично-стью эмоции. Различия же между состояниями в пределах одной степени стеничности несущественны».

Исследования по изучению влияния изменения эмоционального состояния на речь ведутся достаточно давно. Уже в 1975 году появились работы, посвященные исследованию изменения эмоционального состояния говорящего в зависимости от изменения темпа речи. В работе Н.В. Геладзе [9] утверждается, что при грусти, злорадстве и страхе темп речи в сравнении с нейтральным произнесением будет увеличиваться, а при радости, гневе и раздражении темп речи уменьшается.

В.В. Потапову и Р.К. Потаповой [10] в результате экспериментальных исследований удалось доказать, что наиболее стабильными являются речевые характеристики таких эмоциональных состояний, как «страх»/«тревожность». Изменениям подвергаются такие параметры, как средняя длительность слогов, уровень интенсивности и частота основного тона. Авторами были выявлены следующие перцептивные индикаторы эмоционального состояния «страх»/«тревож-ность»:

- увеличение числа хезитационных пауз;

- увеличение длительности хезитационных пауз;

- увеличение скорости артикуляции (для гласных);

- темпоральное слоговое скандирование;

- ограниченная громкость высказываний;

- «неуверенный» тембр произношения гласных;

- наличие шумовых компонентов в артикуляции гласных;

- нарушения частоты основного тона;

- появление элементов шепота в речевом потоке и др.

Некоторые авторы отмечают все же, что наиболее четко определяются пять эмоциональ-

ных состояний: норма, депрессия, радость, гнев, тревога [6].

Определенные работы [11] посвящены созданию автоматической компьютерной системы, позволяющей определить изменение эмоционального состояния диктора на основе речевого сигнала. Данные системы состоят из двух основных частей: первая - выделяет из речи наиболее информативные характерные признаки, а вторая (классификатор) - на основе выделенных признаков принимает решение об изменениях в эмоциональном состоянии человека. Более того, разрабатываются приложения, которые будут встраиваться в мобильный телефон и позволят в момент разговора определять эмоциональное состояние собеседника.

В.В. Потапов и Р.К. Потапова [5] отмечают различия гласных, реализованных в состоянии активизации и деактивизации эмоционально-психических процессов. В первом случае для гласных характерны следующие акустические признаки: более четко выраженная гармоническая структура гласных, увеличение спектральной энергии и длительности ударного слога (гласного), расширение частотных областей формант F2, F3, F4, повышение общей спектральной энергии во всех формантных областях на 20-30%, появление более высоких формант-ных частот. Гласные, реализованные в состоянии деактивизации эмоционально-психических процессов, отличаются менее четко выраженной гармонической структурой гласных, ослаблением спектральной энергии на ударном слоге (гласном), уменьшением длительности ударного гласного, сужением частотных областей формант F2, F3, ^4), ослаблением общей спектральной энергии формант.

Представляется, что обобщение имеющихся позиций по данному вопросу и систематизация индивидуальных признаков звучащей речи позволит выработать унифицированные методические подходы к решению диагностических задач судебной фоноскопической экспертизы, в частности к установлению обликовых характеристик личности по фонограммам устной речи.

Список литературы

1. Слепич А.Н. Результаты использования речевых технологий для диагностики облика неизвестного диктора по фонограмме // Сб. тр. XVII Междунар. науч. конф. «Информатизация и информационная безопасность правоохранительных органов». Москва, 20-21 мая 2008 г. М.: Акад. упр. МВД России и др., 2008. С. 406-409.

2. Потапова Р.К. Сексолект как комплексное тендерное понятие (об усложненном характере задачи определения сексолекта в судебной фонетике) // Материалы Межд. конф. «Информатизация правоохранительных систем». М.: Акад. МВД РФ, 2001. С. 314.

3. Потапов В.В. Идентификационные гендерные признаки русской речи // Сб. трудов XIII Межд. науч. конф. «Информатизация и информационная безопасность правоохранительных органов». М., 2004. С. 405-407.

4. Bastien P. Pitch shifting and voice transformation techniques (TC Helicon, 2001), p. 3. [Электронный ресурс]. URL: http://dsp-book.narod.ru/Pitch_shifting.pdf

5. Потапова Р.К., Потапов В.В. Язык, речь, личность. М.: Языки славянской культуры, 2006.

6. Викторов А.Б., Остроухов А.В., Лобанова М.А. О возможности создания автоматизированного комплекса диагностирования обликовых признаков // Информатизация и информационная безопасность правоохранительных органов. Сб. трудов XV Международной научной конференции. 23-24 мая 2006 г. М.: Академия управления МВД России, 2006. С. 328-331.

7. Журавлева А.А., Коваль С.Л. Диагностика психологических качеств диктора по устной речи // Труды Международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2007» (Бекасово, 30 мая - 3 июня 2007 г.). С. 183-187.

8. Галунов В.И. О возможности определения эмоционального состояния говорящего по речи // Научно-практический журнал «Речевые технологии». № 1. 2008. С. 60-66.

9. Геладзе Н.В. Модификация интонационной структуры повествовательной фразы под влиянием эмоциональной окраски во французском языке // Сб. науч. тр. Вып. 84. М.: МГПИИЯ им. М. Тореза, 1975.

10. Потапова Р.К., Потапов В.В. Перспективы развития концепции «речевой портрет говорящего» // Сб. трудов XVII Международной научной конференции «Информатизация и информационная безопасность правоохранительных органов». М.: Академия управления МВД России, 2008. С. 125-126.

11. Лукьяница А.А., Шишкин А.Г. Автоматическое определение изменений эмоционального состояния по речевому сигналу // Научно-практический журнал «Речевые технологии». № 3. 2009. С. 60-76.

FORENSIC ANALYSIS OF CHARACTERISTICS OF A PERSON'S APPEARANCE BY MEANS OF PHONOGRAMS: A REVIEW OF MODERN STATE

A.K. Lebedeva

In this article, we give a review of modern state of forensic analysis of characteristics of a person's appearance by means of phonograms. The main areas of diagnostic study of forensic speech analysis are considered, some ways and prospects for development of forensic analysis of speaker's characteristics are proposed.

Keywords: characteristics of speaker's appearance, forensic speech analysis, diagnostic study.

References

1. Slepich A.N. Rezul'taty ispol'zovaniya rechevyh tekhnologij dlya diagnostiki oblika neizvestnogo diktora po fonogramme // Sb. tr. XVII Mezhdunar. nauch. konf. «In-formatizaciya i informacionnaya bezopasnost' pravoohrani-tel'nyh organov». Moskva, 20-21 maya 2008 g. M.: Akad. upr. MVD Rossii i dr., 2008. S. 406-409.

2. Potapova R.K. Seksolekt kak kompleksnoe gender-noe ponyatie (ob uslozhnennom haraktere zadachi oprede-leniya seksolekta v sudebnoj fonetike) // Materialy Mezhd. konf. «Informatizaciya pravoohranitel'nyh sistem». M.: Akad. MVD RF, 2001. S. 314.

3. Potapov V.V. Identifikacionnye gendernye priznaki russkoj rechi // Sb. trudov XIII Mezhd. nauch. konf. «In-formatizaciya i informacionnaya bezopasnost' pravoohrani-tel'nyh organov». Moskva, 2004. S. 405-407.

4. Bastien P. Pitch shifting and voice transformation techniques (TC Helicon, 2001), p. 3. [Ehlektronnyj resurs]. URL: http://dsp-book.narod.ru/Pitch_shifting.pdf.

5. Potapova R.K., Potapov V.V. Yazyk, rech', lichnost'. M.: Yazyki slavyanskoj kul'tury, 2006.

6. Viktorov A.B., Ostrouhov A.V., Lobanova M.A. O vozmozhnosti sozdaniya avtomatizirovannogo kompleksa diagnostirovaniya oblikovyh priznakov // Informatizaciya i informacionnaya bezopasnost' pravoohranitel'nyh organov.

Sb. trudov XV Mezhdunarodnoj nauchnoj konferencii. 2324 maya 2006 g. M.: Akademiya upravleniya MVD Rossii, 2006. S. 328-331.

7. Zhuravleva A.A., Koval' S.L. Diagnostika psihologi-cheskih kachestv diktora po ustnoj rechi // Trudy Mezhdu-narodnoj konferencii po komp'yuternoj lingvistike i intellek-tual'nym tekhnologiyam «Dialog 2007» (Bekasovo, 30 maya - 3 iyunya 2007 g.). S. 183-187.

8. Galunov V.I. O vozmozhnosti opredeleniya ehmo-cional'nogo sostoyaniya govoryashchego po rechi // Nauch-no-prakticheskij zhurnal «Rechevye tekhnologii». № 1. 2008. S. 60-66.

9. Geladze N.V. Modifikaciya intonacionnoj struktury povestvovatel'noj frazy pod vliyaniem ehmocional'noj okraski vo francuzskom yazyke // Sb. nauch. tr. Vyp. 84. M.: MGPIIYA im. M. Toreza, 1975.

10. Potapova R.K., Potapov V.V. Perspektivy razvitiya koncepcii «rechevoj portret govoryashchego», Sb. trudov XVII Mezhdunarodnoj nauchnoj konferencii «Informatiza-ciya i informacionnaya bezopasnost' pravoohranitel'nyh organov». M.: Akademiya upravleniya MVD Rossii, 2008. S. 125-126.

11. Luk'yanica A.A., Shishkin A.G. Avtomaticheskoe opredelenie izmenenij ehmocional'nogo sostoyaniya po rechevomu signalu // Nauchno-prakticheskij zhurnal «Rechevye tekhnologii». № 3. 2009. S. 60-76.

Аннотация научной статьи по прочим медицинским наукам, автор научной работы — Лебедева А. К.

Похожие темы научных работ по прочим медицинским наукам , автор научной работы — Лебедева А. К.

FORENSIC ANALYSIS OF CHARACTERISTICS OF A PERSON’S APPEARANCE BY MEANS OF PHONOGRAMS: A REVIEW OF MODERN STATE

Текст научной работы на тему «Обзор состояния судебно-экcпертного исследования обликовых характеристик личности по фонограммам речи»