МЕЖДИСЦИПЛИНАРНО-КОНВЕРГЕНТНЫЕ ОСНОВЫ РЕЧЕВЕДЕНИЯ
УДК 81'33 Н. А. Забелло
аспирант кафедры прикладной и экспериментальной лингвистики Института прикладной и математической лингвистики факультета английского языка МГЛУ; e-maiL: [email protected]
К ВОПРОСУ О СОЗДАНИИ СПЕЦИАЛИЗИРОВАННОГО РЕЧЕВОГО КОРПУСА
Статья посвящена опыту создания специализированного корпуса образцов устной речи женщин - носителей русского языка, находящихся под воздействием наркотических веществ. В исследовании рассматривается разработка специальной методики аудиофиксации, рассчитанная на условия стационара. Запись фонограмм проводилась как минимум в три сессии в состоянии интоксикации (при поступлении в стационар), абстиненции (в процессе лечения) и трезвости (перед выпиской). Во время каждой сессии записывались разные виды речи: спонтанная (коммуникация), квазиспонтанная (пересказ текста) и чтение. Автор описывает трудности, возникшие при создании речевого корпуса, большинство из которых связано со следующими внешними факторами: нестабильностью эмоционального состояния дикторов, преждевременным отказом от лечения, отказом от подписания «Информированного согласия», отсутствием лечащего врача и / или психолога при записи фонограмм, отсутствием постоянного помещения для записи, появлением посторонних шумов, вызванных медицинским персоналом, на фонограмме. Также в статье предлагаются рекомендации для увеличения объема специализированного речевого корпуса и повышения качества фонограмм и коммуникации с наркозависимыми. Описываются дальнейшие действия по обработке корпуса и его применения.
Ключевые слова: речевой корпус; интоксикация; аудиофиксация.
N. A. Zabello
Postgraduate Student,
Department of AppLied and ExperimentaL Linguistics,
Institute of AppLied and MathematicaL Linguistics, FacuLty of EngLish, MSLU;
е-maiL: [email protected]
ON SPECIALISED SPEECH CORPUS CREATION
The articLe is focused on creation of a corpus of audio recordings of femaLe Russian speakers in different intoxication states. The paper presents the development of speciaL methods designed for hospitaL environment. Audio recording was conducted in at Least three sessions in intoxication (on admission to hospitaL), abstinence (during treatment) and sobriety (before reLease). During each session different kinds of speech were recorded: spontaneous (communication), quasipontaneous (text reteLLing), and reading aLoud. The author describes the difficuLties that have emerged during the creation of speech corpus, most of which are reLated to the foLLowing externaL factors: instabiLity in the emotionaL state of speakers, premature treatment refusaL, refusaL to sign the "Informed consent", the absence of a attending physician and/or psychoLogist in the process of recording, the absence of permanent recording faciLities, the appearance of extraneous noise (caused by medicaL staff) on the audio recording. The articLe aLso offers some recommendations for the increasing of speciaLised speech voLume and the improving the quaLity of audio recordings and communication with drug addicts. In addition, further actions for corpus processing and its depLoyment are described.
Key words: speech corpus; intoxication; audiofixation.
Введение
Речь - явление, которое привлекает внимание языковедов, психологов, психолингвистов и специалистов других областей знаний. В прикладном речеведении к основным направлениям в области теоретических и практических исследований относят: речь в состоянии интоксикации (алкогольной, наркотической, медикаментозной), имитируемую речь, разработку автоматических и автоматизированных систем идентификации и верификации диктора по речи; факторы, модифицирующие речевой сигнал, и т. д. [Богданов, Брухтий, Кривнова, Подрабинович, Строкин 2003, Потапова, Потапов 2006].
Корпусная лингвистика является относительно новым направлением в лингвистической науке, которое позволяет проводить исследования различного рода. На данный момент имеется большой опыт создания корпусов текстов, однако наибольший интерес и сложность представляют речевые корпусы, создание которых главным образом способствует решению задач прикладного речеведения [Кривнова, Захаров, Строкин 2001, Захаров, Богданова 2013].
Статья посвящена опыту создания специализированного речевого корпуса, в который вошли образцы устной речи женщин - носителей русского языка, находящихся под воздействием наркотических веществ.
Методика
В целях создания специализированного корпуса образцов устной речи лиц, находящихся под воздействием наркотических веществ, была разработана специальная методика аудиофиксации. Данная методика рассчитана на условия стационара - аудиозапись в специальных медицинских учреждениях под наблюдением лечащего врача, психотерапевта и с участием специалиста-лингвиста.
Аудиофиксация образцов устной речи женщин - носителей русского языка, находящихся под воздействием наркотических веществ, проводилась на базе Научно-исследовательского института наркологии - филиала ФГБУ «Федеральный медицинский исследовательский центр психиатрии и наркологии имени В. П. Сербского» Минздрава России.
Звукозапись речевой деятельности производилась после письменного согласия пациентов клиники на участие в исследовании и с разрешения лечащего врача (см. табл. 1).
Бланк информированного согласия на участие в исследовании
ИНФОРМИРОВАННОЕ СОГЛАСИЕ
Я,__
даю согласие на участие в исследовании, которое посвящено изучению речи женщин носителей русского языка в состоянии наркотического опьянения.
была осведомлена о следующем:
• целях данного исследования
• тестах, которые будут произведены
Мною в устном виде была получена вышеназванная информация и ответы на все мои вопросы. Я даю согласие на просмотр моей медицинской карты сотрудниками, задействованными в исследовании, при условии сохранения ими профессиональной конфиденциальности. Мною были получены гарантии того, что я имею право прекратить участие в исследовании. Я даю согласие на то, чтобы данные обо мне были занесены в компьютерный файл, а также на обработку этих данных с использованием автоматизированных систем.
Дата «_»___201 __ г.
Подпись___
В связи с условиями содержания наркозависимых пациентов клиники минимальный набор образцов устной речи испытуемых ограничивается тремя сессиями.
После консультации с лечащим врачом и психологом-клиницистом, учитывая возможности испытуемых к речевой деятельности в исследуемых состояниях, для аудиозаписи предлагалось использовать связный текст и отдельные фразы для чтения.
Аудиофиксация образцов устной речи проходится в несколько сеансов (первичным состоянием испытуемой считается то, в котором она поступила в клинику). С учетом условий сбора звучащего материала состояния интоксикации фиксируются в обратном порядке по мере снижения степени опьянения до состояния трезвости. Соответственно планировалось производить запись фонограмм дикторов-женщин в трех разных состояниях, а именно:
- интоксикации;
- абститенции;
- в естественно-нейтральном (трезвом) состоянии.
Таким образом, предполагалось проводить запись каждого диктора в три этапа:
- при поступлении в стационар;
- в процессе лечения;
- перед выпиской.
При этом на каждом этапе планировалось записывать разные виды речи: спонтанную (коммуникацию), квазиспонтанную (пересказ текста) и чтение.
В целях обеспечения статистической значимости было принято решение записывать один вид наркомании - опийной.
Во время первого сеанса коммуникация выстраивалась на основе опроса, необходимого для заполнения персональной анкеты участника исследования. Результаты тестирования и опроса заносились в дикторскую карточку соответствующего испытуемого.
Аудиофиксация речевой деятельности испытуемых должна была проводиться в смотровом кабинете лечащего врача в присутствии клинического психолога, лечащего врача и лингвиста.
В целях снижения возможного «микрофонного эффекта» образцы звучащей речи записываются с помощью цифрового линейного PCM диктофона марки «Olympus LS-11E с контроллером». Частотный
диапазон в режиме РСМ составляет 44,1-96 кГц. Расстояние между микрофоном диктофона и испытуемым составляет 50-70 см.
Сеанс аудиофиксации состоит из трех этапов:
1. Беседа (диалог, полилог) с испытуемой (вид речевой деятельности - коммуникация) проводится на материале анкеты испытуемого («Карточки участника исследования»). Задаются вопросы из анкеты, испытуемый отвечает на них. Затем выбирается одна из тем разговора, которая заинтересовала испытуемую, либо испытуемую спрашивают об эмоциональном и соматическом состоянии в настоящий момент. После этого предлагается перейти к выполнению заданий.
2. Чтение фраз. Испытуемому предлагалось прочитать шесть фраз вслух. Испытуемый может отказаться от выполнения задания.
Пересказ прочтенного про себя текста. Испытуемой в силу ее состояния предлагается текст и дается 5-7 минут на его освоение. Испытуемая может отказаться от выполнения задания.
Ввиду того, что некоторые испытуемые как пациенты клиники отказываются от лечения, они не продолжают участие в исследовании, и образцы устной речи этих испытуемых в определенных состояниях не удается записать.
Сеансы аудиофиксации образцов устной речи испытуемых протоколируются. Каждой фонограмме присваивается имя. В имени фонограммы учитываются следующие данные (слева направо):
- фамилия испытуемой;
- номер сеанса;
- порядковый номер фонограммы в общем объеме фонограмм.
Кроме того, для каждой фонограммы заполняется «Карточка сеанса записи», куда вносится информация о дате проведения сеанса, времени начала, кода фонограммы состояния (интоксикация, абстиненция, трезвость), физическом состоянии на момент осмотра и эмоциональном фоне испытуемой на момент осмотра.
В «Карточку участника исследования» входят следующие пункты:
- Ф.И.О.
- дата рождения
- место рождения
- рост, см
- вес, кг
- телосложение
- дата поступления в стационар
- диагноз по МКБ-10
- психоэмоциональный тип личности (согласно тесту)
- тип употребляемого наркотического вещества
- частота употребления наркотического вещества, количество раз за 100 дней
- длительность злоупотребления наркотическим веществом, коли чество лет
- время после последнего приема наркотического вещества, количество часов
- наличие сопутствующих заболеваний
- родной язык
- образование, профессия, род занятий
- владение иностранными языками
- социальный статус (субъективная оценка)
- дополнительная информация.
Ниже приведены фразы для чтения вслух, предлагаемые испытуемым:
1. Эти жирные сазаны ушли под палубу.
2. Папа потакает Тате и Кате.
3. Мама намыла мою малину.
4. Саша с силой кусал сало.
5. Шушера шуршала в шалаше.
6. Баба забыла бадью в бане.
Далее представлен связный текст для пересказа (так называемый фонетически сбалансированный текст), разработанный Р. К. Потаповой, который предлагался испытуемым:
«Никогда еще ленинградцы не были свидетелями таких интересных происшествий на воде. Широчайшие набережные у речных вокзалов в это июльское лето заполнены людьми: детьми, юными и пожилыми болельщиками. Двадцать лучших скутеристов из шести стран (Англии, Гвинеи, Франции, Германии, Голландии, России), вошедшие в элиту спортсменов-водников, съезжаются к берегам Невы. Трасса пробега сверхмощных скутеров растягивается ни на один километр в длину, слегка расширяясь к устью.
Как вихрь пронесся первый корабль. Не рассчитав усилий, с жутким скрежетом столкнулись английский и французский лидеры. В одно мгновение заядлые гонщики были сброшены в глубь мутных
вод. «Нужна экстренная помощь?», - подумали зрители. Помочь бы им, но без чувства страха они без задержки взбираются на угол оббитой кормы, тщетно пытаясь обмануть безжалостную судьбу.
Над землей угрожающе сгущалась мгла. Небо заволокло тучами. Подтвердился прогноз обсерватории: идет циклон с дождем со Шпицбергена. В третьем пробеге участвовали лишь впятером. Что их ждет? Кто же выиграет? Смог бы худощавый шутник геологоразведчик с поэтическим именем Олег Айвазовский? Но, поддерживая бешеный темп, чтобы партнеров эффектно объехать сбоку, командир, жонглируя рулем, не сориентировался, и экипаж очутился в пучине бушующих волн. Выкарабкавшись из-под затонувшего судна, про-бежчики вплавь направились к шлюпке, поджидавшей их у финишного пункта. Наконец, судья, оценив катастрофическую ситуацию, с сожалением осуществил общее пожелание: закончить эти жесточайшие испытания» [Потапова 2015, с. 312].
Трудности создания корпуса
На данный момент было зафиксировано 40 дикторов-женщин -носителей русского языка, находящихся на лечении в МНПЦ Наркологии в возрасте от 18 до 40 лет. Количество сеансов записи составило от 1 до 6 различной длительности.
В процессе записи фонограмм операторы столкнулись с рядом трудностей. Лечение в стационаре длится 21 день. Однако пациенты вправе уйти раньше указанного срока, написав отказ от лечения, что затрудняет прогнозирование второго и третьего сеанса записи фонограмм.
При поступлении пациентки не всегда находятся в состоянии интоксикации (включая остаточную). Пациенты поступают на лечение стихийно, по понятным причинам операторы не могут физически находиться в приемном отделении круглосуточно, семь дней в неделю в ожидании поступающих женщин. Врачи приемного отделения, в свою очередь, не сообщают операторам о новом поступлении, поэтому в большинстве случаев на момент записи испытуемые уже лечатся.
Учитывая добровольность участия, а также общее состояние пациенток, мы периодически сталкиваемся с негативной реакцией на «Информированное согласие», что, в свою очередь, приводит к отказу от участия в исследовании.
В большинстве случаев сеансы записи фонограмм проводились без участия лечащего врача и / или психолога ввиду их занятости. У операторов в некоторых случаях возникают трудности с определением эмоционального и общего состояния испытуемой на момент записи.
По ряду причин помещение, где проводится аудиофикация речи испытуемых, не всегда одно и то же - кабинет психолога, столовая, коридор отделения. В некоторых фонограммах на фоне появляются посторонние звуки и голоса персонала заведения (медсестры, охранники, санитарки).
Часто сеансы записи фонограмм проходили с разрешения лечащего врача и психолога, но без их участия. Операторы не имеют богатого опыта и навыков общения с наркозависимыми, что иногда приводит к коммуникативной неудаче.
В процессе сбора материала выяснилось, что испытуемые находятся под воздействием центрально действующих препаратов в различных дозировках практически на протяжении всего лечения. Вероятно, один из наилучших моментов получить фонограмму в трезвом состоянии - проводить сеанс записи перед выпиской из стационара. Однако выписка происходит обычно в 9 утра сразу после комиссии, на которой присутствуют пациентка, лечащий врач, психолог и заведующий отделением. После этого пациентки спешат покинуть стены учреждения, они негативно настроены на общение с оператором.
В связи с небольшим количеством женщин, употребляющих наркотики и проходящих лечение в стационаре МНПЦ Наркологии, было принято решение производить запись женщин, страдающих другими видами наркомании помимо опийной, несмотря на то, что подавляющее большинство пациенток употребляют вещества, относящиеся к группе опиатов (героин, метадон, кодеин и т. д.).
В процессе работы с некоторыми испытуемыми наблюдалось, что успешность коммуникации зависит от пола человека, производящего запись фонограммы. Некоторые испытуемые более склонны идти на контакт с мужчиной.
Рекомендации
Для увеличения объема специализированного речевого корпуса и повышения качества коммуникации и фонограмм предлагаются следующие рекомендации.
1. Для получения лучшего качества фонограммы необходимо держать диктофон непосредственно у рта испытуемой, например предлагать им держать диктофон в руках, чтобы избежать возможного дискомфорта со стороны испытуемой. Также рекомендуется производить запись в одном и том же помещении небольшой площади для снижения эффекта реверберации.
2. Необходимо продолжить сбор аудиоматериала, чтобы отобрать фонограммы испытуемых только с опийной наркоманией в целях повышения репрезентативности речевого корпуса.
3. Проводить сеансы аудиофиксации оператором (участником коммуникации) желательно одного пола (мужского) во избежание влияния на речь испытуемых.
4. Необходим более тесный контакт с персоналом медицинского учреждения. Возможно, проводить сеансы записи (по крайней мере первого) следует в приемном отделении или лечащему врачу при поступлении до начала медикаментозного лечения, а не лингвисту. Данное решение также позволит точнее определять эмоциональное состояние испытуемых на момент записи.
5. Следующим этапом создания корпуса станет аннотирование имеющихся фонограмм [Harrington 2010], включая отекстовку, маркирование в записи паралингвистических явлений, сопутствующих речи (паузы, смех, бормотание, кашель и т. д.). В дальнейшем планируется проведение перцептивно-слухового и акустического анализа фонограмм с целью выявить информативные устойчивые акустические и перцептивно-слуховые характеристики, позволяющие установить идентификационные признаки речи в состоянии наркотической интоксикации. Полученные результаты будут полезны при дальнейшей разработке систем автоматического распознавания, а также экспертных систем автоматической и автоматизированной идентификации говорящего и его эмоционального состояния по голосу и речи.
СПИСОК ЛИТЕРАТУРЫ
Богданов Д. С. [и др.]. Технология формирования речевых баз данных // «Организационное управление и искусственный интеллект». М. : Эдито-риал УРСС, 2003. 448 с. Захаров В. П., Богданова С. Ю. Корпусная лингвистика: учебник для студентов направления «Лингвистика». 2-е изд., перераб. и дополн. СПб. : СПбГУ. РИО. Филологический факультет, 2013. 148 с.
Кривнова О. Ф., Захаров Л. М., Строкин Г. С. Речевые корпусы (опыт разработки и использование) // Труды международного семинара «Диалог-2001 по компьютерной лингвистике и ее приложениям» / под ред. А. С. Нариньяни (ред.). Т. 2. М. : Филол. ф-к МГУ, 2001. С. 230-236.
Потапова Р. К., Потапов В. В. Язык, речь, личность. М. : Языки славянской культуры, 2006. 496 с.
Потапова Р. К. Речь. Коммуникация, информация, кибернетика. М. : URSS, 2015. 600 c.
Harrington J. The Phonetic Analysis of Speech Corpora. Institute of Phonetics and Speech Processing, 2010. URL: www.phonetik.uni-muenchen.de/~jmh/ research/pasc010808/pasc.pdf