Научная статья на тему 'ПРАВИЛА ДИСКУРСИВНОЙ ТРАНСКРИПЦИИ ДЛЯ ОПИСАТЕЛЬНЫХ И ДОКУМЕНТАЦИОННЫХ ИССЛЕДОВАНИЙ'

ПРАВИЛА ДИСКУРСИВНОЙ ТРАНСКРИПЦИИ ДЛЯ ОПИСАТЕЛЬНЫХ И ДОКУМЕНТАЦИОННЫХ ИССЛЕДОВАНИЙ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
300
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПИСАТЕЛЬНАЯ ЛИНГВИСТИКА / ДОКУМЕНТАЦИОННАЯ ЛИНГВИСТИКА / ДИСКУРСИВНАЯ ТРАНСКРИПЦИЯ / ЭЛЕМЕНТАРНАЯ ДИСКУРСИВНАЯ ЕДИНИЦА / ПРОСОДИЯ / ДИСКУРСИВНЫЙ АКЦЕНТ / ПУНКТУАЦИЯ / ПАУЗА / РЕЧЕВОЙ СБОЙ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Кибрик Андрей Александрович, Майсак Тимур Анатольевич

В то время как принципы морфологического анализа и глоссирования в современной лингвистике достаточно стандартизированы, не существует общепринятых правил организации самого транскрипта. В статье предлагается стандарт транскрибирования устного дискурса, который может быть применен в описательном или документационном проекте по любому языку. Транскрипт должен быть разделен на строки, соответствующие элементарным дискурсивным единицам. В транскрипте должна содержаться разметка слов, элементов слов, акцентов, тонов в акцентах, других просодических явлений, а также пунктуационные знаки, передающие фазовые и иные дискурсивные смыслы. Транскрипт должен быть верен исходному сигналу, регистрировать все его существенные элементы и избегать артефактов и пост-редактирования. Последовательное транскрибирование дискурса на произвольном языке - это вполне посильная задача, которая достижима уже при небольшой тренировке.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DISCOURSE TRANSCRIPTION RULES FOR DESCRIPTIVE AND DOCUMENTARY STUDIES

Whereas the principles of morphological analysis and glossing are sufficiently standardized in modern linguistics, there are no generally accepted rules for organizing discourse transcript as such. In this paper we propose a standard of transcribing spoken discourse, to be used in a descriptive or documentary project on any language. A transcript must be divided into lines, corresponding to elementary discourse units. A transcript must include an annotation of words, truncated words, pauses, accents, pitch in accents, other prosodic phenomena, as well as punctuation marks conveying phase and other discourse-related meanings. A transcript must be faithful to original signal, register all of its significant elements and avoid artifacts and post-editing. Consistent transcription of discourse in a random language is a manageable task that can be achieved after minimal training.

Текст научной работы на тему «ПРАВИЛА ДИСКУРСИВНОЙ ТРАНСКРИПЦИИ ДЛЯ ОПИСАТЕЛЬНЫХ И ДОКУМЕНТАЦИОННЫХ ИССЛЕДОВАНИЙ»

Rhema. Рема. 2021. № 2 DOI: 10.31862/2500-2953-2021-2-23-45

А.А. Кибрик1, 2, Т.А. Майсак

1, з

1 Институт языкознания Российской академии наук, 125009 г. Москва, Российская Федерация

2 Московский государственный университет имени М.В. Ломоносова, 119991 г. Москва, Российская Федерация

3 Национальный исследовательский университет «Высшая школа экономики»,

105066 г. Москва, Российская Федерация

Правила дискурсивной транскрипции для описательных и документационных исследований

В то время как принципы морфологического анализа и глоссирования в современной лингвистике достаточно стандартизированы, не существует общепринятых правил организации самого транскрипта. В статье предлагается стандарт транскрибирования устного дискурса, который может быть применен в описательном или документационном проекте по любому языку. Транскрипт должен быть разделен на строки, соответствующие элементарным дискурсивным единицам. В транскрипте должна содержаться разметка слов, элементов слов, акцентов, тонов в акцентах, других просодических явлений, а также пунктуационные знаки, передающие фазовые и иные дискурсивные смыслы. Транскрипт должен быть верен исходному сигналу, регистрировать все его существенные элементы и избегать артефактов и пост-редактирования. Последовательное транскрибирование дискурса на произвольном языке - это вполне посильная задача, которая достижима уже при небольшой тренировке.

Ключевые слова: описательная лингвистика, документационная лингвистика, дискурсивная транскрипция, элементарная дискурсивная единица, просодия, дискурсивный акцент, пунктуация, пауза, речевой сбой

Благодарности. Исследование А.А. Кибрика поддержано грантом Российского научного фонда № 17-18-01649.

Авторы благодарят Н.А. Коротаева, В.И. Подлесскую и рецензентов журнала, которые прочитали статью и высказали ряд полезных замечаний.

© Кибрик А.А., Майсак Т.А., 2021

Контент доступен по лицензии Creative Commons Attribution 4.0 international License Ьс^^НЗ^Н The content is licensed under a Creative Commons Attribution 4.0 international License

ДЛЯ ЦИТИРОВАНИЯ: Кибрик А.А., Майсак Т.А. Правила дискурсивной транскрипции для описательных и документационных исследований // Рема. Rhema. 2021. № 2. С. 23-45. DOI: 10.31862/2500-2953-2021-2-23-45

DOI: 10.31862/2500-2953-2021-2-23-45 A.A. Kibrik1 2, T.A. Maisak1 3

1 Institute of Linguistics of the Russian Academy of Sciences, Moscow, 125009, Russian Federation

2 Lomonosov Moscow State University, Moscow, 119991, Russian Federation

3 National Research University Higher School of Economics, Moscow, 105066, Russian Federation

Discourse transcription rules

for descriptive and documentary studies

Whereas the principles of morphological analysis and glossing are sufficiently standardized in modern linguistics, there are no generally accepted rules for organizing discourse transcript as such. In this paper we propose a standard of transcribing spoken discourse, to be used in a descriptive or documentary project on any language. A transcript must be divided into lines, corresponding to elementary discourse units. A transcript must include an annotation of words, truncated words, pauses, accents, pitch in accents, other prosodic phenomena, as well as punctuation marks conveying phase and other discourse-related meanings. A transcript must be faithful to original signal, register all of its significant elements and avoid artifacts and post-editing. Consistent transcription of discourse in a random language is a manageable task that can be achieved after minimal training.

Key words: descriptive linguistics, documentary linguistics, discourse transcription, elementary discourse unit, prosody, discourse accent, punctuation, pause, disfluency

Acknowledgments. Research byA.A. Kibrik was supported by a grant from the Russian Science Foundation No. 17-18-01649.

We thank Nikolay Korotaev, Vera Podlesskaya, and the journal's reviewers who read ^ the paper and suggested a number of improvements.

h

u

m FOR CITATION: Kibrik A.A., Maisak T.A. Discourse transcription rules

H for descriptive and documentary studies. Rhema. 2021. No. 2. Pp. 23-45.

(In Rus.) DOI: 10.31862/2500-2953-2021-2-23-45

1. Введение

В «золотой стандарт» полного описания и/или документации языка входят такие элементы, как медиафайлы, регистрирующие использование языка, их расшифровки («тексты»), словарь и грамматика. В этой статье мы обсудим статус того, что привычно называется «текстами». Как отмечал А.Е. Кибрик, «для бесписьменных языков задача фиксации ... речевого материала ... имеет большое научное значение. В естественных текстах содержится, как правило, важная информация о культуре обслуживаемой данным языком общности, а также о грамматике самого языка. Тексты являются важнейшей "сырьевой базой" для лингвистических исследований, и при полевом изучении языка сбор их составляет существенный компонент исследовательской деятельности» [Кибрик и др., 1977, с. 5].

Необходимо разобраться в том, что представляют собой «тексты» и как можно стандартизировать их представление в описательных и документационных проектах. В разд. 2 дается обзор современного стандарта репрезентации языковых данных. В разд. 3 обсуждается эпистемологический статус текста, а в разд. 4 обосновывается необходимость стандарта в области дискурсивной транскрипции. Разд. 5 содержит сведения о современных требованиях к документации устного дискурса. В разд. 6-9 содержатся наши предложения по стандарту транскрибирования, включая такие вопросы, как: локальная структура дискурса; акценты, фазовые явления и пунктуация; паузация и речевые сбои; другие явления. Разд. 10 содержит выводы исследования.

2. Трехслойный стандарт

В последние десятилетия при описании и документации языков практически полностью утвердился стандарт представления расшифрованных текстов в виде трех слоев - транскрипта, глосс и перевода. Этот же формат используется и для представления отдельных языковых примеров - как в грамматических описаниях языках, так и в работах другого типа.

Эволюцию представления текстов в приложениях к грамматическим описаниям легко наблюдать по работам А.Е. Кибрика и его коллег, изданных по итогам деятельности полевых экспедиций МГУ им. М.В. Ломоносова. В более ранних грамматиках 1970-х гг. (хина-лугской и арчинской) каждое предложение текста приведено в латинской транскрипции и сопровождается буквальным переводом; литературный перевод идет целиком после всего текста [Кибрик и др., 1972, 1977]. В грамматиках, опубликованных во второй половине 1990-х гг.

и в начале 2000-х гг. (годоберинский, цахурский, багвалинский, алюторский языки), мы видим формат представления, близкий к современным стандартам. Первый слой с морфемным членением дан в латинской транскрипции, второй слой содержит поморфемный разбор, изоморфный морфологическому членению первого слоя, в третьем слое дается русский (или английский) перевод [Kibrik, 1996; Кибрик, Тестелец, 1999; Кибрик и др., 2000, 2001]. В этой связи любопытно сравнить тот вид арчинских текстов, который представлен в первой публикации 1977 г., и более позднее «переиздание» некоторых из них в работе [Архипов и др., 2008], ср. (1) и (2). В варианте, опубликованном «тридцать лет спустя», буквальный перевод отсутствует, однако имеется глоссирование, а также дополнительный слой с кириллической записью1.

(1) арчинский [Кибрик и др., 1977, с. 121, 176]

A-1. un dánnasi jo?

B-2. zon duxríqlas.

A-3. duxríql han xabár bi?

A-1. Ты откуда?

B-2. Я из-селения.

A-3. В-селении какие новости есть?

'A-1. Ты откуда?

B-2. Я из аула.

A-3. Что нового в ауле?' (Текст 38, предл. 1-3)

(2) арчинский [Архипов и др., 2008, с. 228-229]

А: - (1) ун даннаши йоо?

В: - (2) зон духрихъ1аш.

А: - (3) духрихъ1 гьан хабар би?

А: - 1. un danna-s-i jo?

ты(№эм,2)2 где-EL-iNTRGALT эй.женщина

В: - 2. zon duxri-qIa-s.

я. nom(2) село-ттЕГ-Е!(4)

1 Последнее обстоятельство связано, в частности, с тем, что коллектив авторов цитируемой работы в начале 2000-х гг. разработал для арчинского языка орфографию фонематического типа на основе привычной арчинцам аварской кириллической графики (до этого арчинский язык практической письменности не имел).

2 Сокращения в глоссах: 1, 2, 3, 4 - род; а, аа - атрибутив; aübl - косвенный атрибу-тив; aür - аорист; conn - соединительный элемент; cüürd - сочинительная частица; dat -датив; deml, demm - демонстративы; el, elat - элатив; em1 - эпистемический маркер; erg -эргатив; ess - эссив; gen - генитив; in - локализация 'внутри'; inter - локализация 'между, в массе'; intrgalt - альтернативное 'или'; lat - латив; nom - номинатив; obl - косвенная основа; ord - порядковое числительное; pf - перфективная основа; pl - множественное число; post - локализация 'сзади'; pst - прошедшее время; ptcl - частица; s - субстантива-тор; sup, super - локализация 'наверху'; tmr - темпоральная форма.

(2) А: - 3. duxri-qI han xabar b-i ?

село-INTER(Ess,4) что новости(№эм,3) 3-быть 'А: - (1) Ты откуда? В: - (2) Я из селения.

А: - (3) Что нового в селении?' (Текст 12, предл. 1-3)

Отсутствие отдельного слоя буквального перевода в грамматиках под редакцией А.Е. Кибрика 1990-2000-х гг. компенсировано дополнительной нагрузкой на третий слой, а именно использованием специальных конвенций со скобочной записью. Так, в цахурской грамматике 1999 г. в круглые скобки заключаются «добавления в русском переводе слов, не представленных, но имеющихся в виду в цахурском оригинале», в квадратные - «слова русского перевода, избыточные с точки зрения русского языка, но имеющиеся в цахурском оригинале», в квадратные со знаком равенства - «буквальный перевод, эквивалентный литературному», а в фигурные - «пояснение смысла оригинала» [Кибрик, Тесте-лец, 1999, с. 902-903], ср. пример использования некоторых из указанных конвенций в (3)3.

(3) цахурский [Кибрик, Тестелец, 1999, с. 799]

i-n-Gw-e Xabar ha-w-?-u wo-b:

этот.Ьа-obl.I-erg рассказ.3 3-делать-РБ быть-3 "balkan-ni Gel-i-l buxaw-í, kuklakY-e a-b-í,

лошадь-Аовь нога-овь-sup колодка-Ем1 замок-iN в-3-ем1 gardan zin^ir-e a-b-í, ic'-u hamasxu-r,

шея.3 цепь-iN в-3-Ем1 1.входить-РБ вот.так-1 acmis-ha-w-?-u, qiKa-w-s-u-na balkan".

открывать-3-делать-РБ 3-вытаскивать-РБ-АА лошадь.3 'Он {т.е. Темраз} рассказывает: "У лошади на ногах колодка была, (колодка) в замке была, и на шее цепь была [= шея в цепи была], (я) вошел таким образом, (все) открыл, вывел лошадь".' (Текст 4, предл. 60)

Во всех упомянутых выше публикациях тексты представляют собой расшифровки устных рассказов. Все они разбиты на пронумерованные предложения, в целом напоминающие предложения письменных текстов. Как правило, в первом слое использованы стандартные знаки пунктуации (точка, запятая, вопросительный и восклицательный знаки, кавычки), однако какая-либо «дискурсивная» разметка, не свойственная письменным текстам, не представлена.

3 В примере (3) незначительно модифицированы глоссы (классно-числовые показатели в оригинале отделялись знаком равенства).

Возвращаясь к современным стандартам представления текстов, резюмируем, какие из элементов можно считать наиболее стандартизированными на сегодня? По-видимому, к ним относятся:

- требование морфемного членения в первом слое - в том числе различение между аффиксальными морфемами (отделяются дефисом), клитиками (отделяются знаком равенства) и автономными словами (отделяются пробелом);

- требование изоморфизма в членении первого и второго слоев (число разделителей в них должно быть одинаковым);

- требование вертикального выравнивания единиц первого слоя (слов, а иногда и морфем) и слоя глосс;

- последовательное различение в слое глосс лексических и грамматических морфем;

- использование для грамматических морфем специальных сокращенных ярлыков.

Наиболее влиятельным руководством по глоссированию являются так называемые «Лейпцигские правила глоссирования» (The Leipzig Glossing Rules), составленные Б. Комри, М. Хаспельматом и Б. Бике-лем и впервые представленные в 2003 г., см. обновленную редакцию [Comrie et al., 2008]. Это сравнительно небольшой документ, включающий предисловие, описание 10 основных правил с примерами и список наиболее употребительных грамматических ярлыков. Авторы подчеркивают, что их система направлена на закрепление тех конвенций, которые уже сложились в лингвистическом сообществе, и является сугубо рекомендательной: в зависимости от требуемой степени детализации и особенностей языкового материала автор может выбрать те конвенции, которые ему кажутся наиболее приемлемыми.

Имеется, однако, целый ряд элементов представления текстов, которые не относятся к поморфемному глоссированию как таковому и на сегодня не имеют рекомендуемого свода конвенций, подобного «Лейпцигским правилам». К этим элементам можно отнести по крайней мере:

- собственно материал, представленный в первом слое (что именно и как транскрибируется?);

- членение материала первого слоя (что именно и сколько помещается в одну графическую строку?)

- установление границ между такими единицами транскрипта, как предложения;

- использование знаков пунктуации в первом слое.

В целом, в публикациях текстов, представляющих собой расшифров-

"4

ки аудиозаписей4, зачастую остается неясно, в каких отношениях транскрипт находится с этой исходной записью.

3. Что такое «текст»?

Хотя существует ряд специализированных работ по транскрибированию дискурса в рамках полевой работы (например, [Jung, Himmelmann, 2011]), во многих описательных и документационных проектах представления об эпистемологическом статусе «текста» остаются несколько наивными. В табл. 1 показаны некоторые такие наивные представления (или фактические практики) и представления, соответствующие идеям современной теории дискурса (см., например, [Chafe, 1994; van Dijk, 1997; Renkema, 2004; Tannen et al., 2015; Kibrik, 2011]).

Таблица 1

Наивные презумпции и соответствующие представления современной теории дискурса [Naive assumptions and the corresponding tenets of modern discourse theory]

Наивные презумпции [Naive assumptions] Представления современной теории дискурса Modern discourse theory]

Носители создают тексты, которые фиксируются лингвистами [Speakers create texts, that are subsequently registered by linguists] Носители языков участвуют в коммуникации, а текст является побочным продуктом, остающимся в качестве следа коммуникативного процесса [Speakers participate in communication, while text is a side product or trace of that process]

Нет большой разницы между устным и письменным использованием языка [There is no crucial difference between spoken and written language] Между устным и письменным дискурсом есть фундаментальные различия. Создание транскриптов устной речи, тем более в случае бесписьменных языков, - специальная аналитическая процедура [There is profound difference between talk and writing. Transcribing spoken discourse, particularly in the case of unwritten languages, is a specialized complex analytical procedure]

4 Для простоты здесь и ниже мы говорим об аудиозаписи. Разумеется, в ходе полевой работы может использоваться и видеозапись - в дополнение к аудиозаписи или вместо нее

.

I _

ISSN 2500-2953 Rhema. Рема. 2021. № 2

Окончание табл. 1

Наивные презумпции [Naive assumptions] Представления современной теории дискурса Modern discourse theory]

Идентификация предложений при транскрибировании аудиозаписи не представляет проблемы [Identification of sentences when transcribing a recording is self-evident] В устной речи не содержится пунктуационных знаков, прямо указывающих на границы предложений. Необходимо разрабатывать специальные принципы идентификации таких границ [There are no punctuation marks in talk that would designate sentence boundaries. Special principles must be developed of how such boundaries can be identified]

Паузы, просодические явления, речевые сбои и другие явления, представленные в устной речи, не очень важны при транскрибировании и могут записываться «по случаю» [Pausing, prosody, disfluen-cies, and other phenomena of spoken language are not important or can be registered in an ad hoc way] Все эти явления являются неотъемлемой структурной частью устной речи, принципиально взаимодействуют с пропозициональным материалом и должны регистрироваться системно [These phenomena are an inherent part of talk and interact strongly with the propositional material. They must be registered in a systematic way]

В результате применения представлений из левой колонки многие опубликованные тексты на малоизученных (и даже хорошо изученных) языках представляют собой некие цепочки слов и выражений, в которых утеряна значительная часть исходного сигнала, содержавшегося в аудиозаписях, и при этом добавлены артефакты, которых в сигнале изначально не было. Основная проблема состоит в том, что отношения между исходным сигналом и публикуемым текстом не прояснены. Тексты сильно отходят от фактического устного феномена, хотя и не превращаются в полностью письменный феномен. Мы имеем дело с неким гибридным феноменом, происхождение тех или иных элементов которого может быть неясно. Эту неясную ситуацию мы и предлагаем исправить.

4. Нужен стандарт дискурсивной транскрипции

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Необходим системный стандарт дискурсивной транскрипции, который может быть использован при работе с любым языком, в том числе в полевых условиях. По аналогии с правилами в [Сотпе et а1., 2008]

мы полагаем, что решения, принимаемые при транскрибировании устной речи, должны быть последовательными и осознанными; кросс-языковой стандарт, обеспечивающий валидность и сравнимость данных, нужен и полезен; этот стандарт должен быть достаточно гибким и допускать вариативность решений в зависимости от особенностей языка, исследовательских задач или индивидуальных предпочтений исследователя.

При создании транскрипта необходимо использовать знания из теории дискурса. Это существенно повышает экологическую валидность транскрипта, в том числе в отношении того, как отражаются локальная структура дискурса и базовые просодические явления. Предлагаемый здесь подход опирается на более ранние разработки, изначально связанные с русским языком [Кибрик, Подлесская, 2009; Kibrik et al., 2020a] и распространенные на ряд других языков (сайт www.spokencorpora.ru, [Kibrik et al., 2020b]).

В последующих разделах мы описываем основные элементы стандарта дискурсивной транскрипции. При этом мы в основном будем опираться на данные двух языков.

- Верхнекускоквимский язык (Upper Kuskokwim, ISO kuu) - атабаскская ветвь семьи на-дене, центральная Аляска, США. Исчезающий язык. Очень сложная глагольная морфология, включая количественную и качественную сложность. Аккузативная ролевая кодировка, SOV. Материал - несколько десятков записей, сделанных Р. Коллинзом и его помощниками в 1960-1990-е гг., а также более 70 записей, сделанных А.А. Кибриком между 1997 и 2019 гг. Жанры: фольклор, этническая история, личные рассказы, комментарии к фильму, бытовой разговор, интервью, проповедь.

- Агульский язык (Agul, ISO agx) - лезгинская ветвь нахско-даге-станской семьи, южный Дагестан, Россия. Около 30 тыс. носителей. Агглютинативная морфология, богатая система падежей и глагольных форм. Эргативная ролевая кодировка, SOV. Материал - около 12 часов записей в с. Хпюк, сделанные Д.С. Ганенковым, Т.А. Май-саком и С.Р. Мердановой в 2000-е гг., а также записи других диалектов. Жанры: личные рассказы, этническая история, сказки, анекдоты о Молле Насреддине, описания обычаев.

5. Формат документации устного дискурса

Конкретный образец дискурса (рассказ о жизни, бытовой разговор, интервью и т.п.) должен быть отражен как в виде аудиозаписи, так и в виде лингвистического анализа. Общий формат минимальной документации дискурса отражен в табл. 2.

Таблица 2

Документация устного дискурса [Documentation of spoken discourse]

I. Запись [Recording] II. Анализ [Analysis]

Ia. Медиафайл [Media file] Ila. Первый слой: Транскрипт [First layer: Transcript]

Ib. Метаданные [Metadata] lib. Второй слой: Глоссы [Second layer: Glosses]

Ilc. Третий слой: Перевод [Third layer: Translation]

Требования к элементам, перечисленным в табл. 2, таковы. Ia. Медиафайл: должен быть сохранен и доступен. Ib. Метаданные - основные элементы:

- время записи;

- место записи;

- имя организатора5 записи;

- имя, возраст, пол носителя языка, чей голос содержится в записи;

- имя лингвиста, производящего документацию;

- имя носителя языка, выступающего в качестве информанта при расшифровке записи;

- свойства аудиофайла, в том числе его длительность, формат (как правило, .wav), частота дискретизации (например, 48 КГц), разрядность (например, 24 bit) и т.д.;

- название дискурса;

- жанр дискурса.

Этот список не является закрытым. IIa. Транскрипт - основные элементы:

- локальная структура дискурса;

- пунктуация и членение на предложения;

- тональные акценты;

- паузы;

- речевые сбои;

- выбор графической системы;

- смешение кодов;

- синхронизация с медиафайлом.

5 Для простоты здесь использовано единственное число. Однако каждая из ролей, представленных в процессе документации, может быть представлена более чем одним человеком: и организатор записи, и записанный носитель, и лингвист, и помогающий ему носитель.

Все эти пункты конкретизируются в разд. 6-9 данной статьи. IIb. Глоссы: должны следовать «Лейпцигским правилам» [Comrie et al., 2008].

IIc. Перевод на язык описания (английский, русский):

- минимальный вариант: идиоматичный перевод;

- более полный вариант - два перевода:

• идиоматичный перевод;

• буквальный перевод.

6. Локальная структура дискурса

Дискурс организован иерархически. На верхнем уровне этой иерархии находится глобальная структура дискурса - членение на крупные блоки, такие как эпизоды рассказа. На самом нижнем уровне иерархии находится локальная структура дискурса - членение на минимальные единицы, относящиеся к дискурсивному уровню. Именно локальная структура непременно должна быть отражена в любом качественном транскрипте дискурса.

Устная речь продвигается вперед не сплошным потоком, а небольшими шагами - синтагмами, интонационными или просодическими единицами (см., например, [Щерба, 1955; Cruttenden, 1986; Chafe, 1994]). Мы пользуемся термином элементарная дискурсивная единица (ЭДЕ) [Кибрик, Подлесская, 2009]. ЭДЕ - это поведенческие акты порождения речи. Они выделяются на просодических основаниях, с учетом следующих критериев:

- паузация: как правило, между ЭДЕ имеется дыхательная пауза, одновременно дающая говорящему возможность запланировать очередную ЭДЕ;

- интегральный тональный контур: типично частота основного тона голоса говорящего в начале находится на некотором среднем уровне, затем достигает пика, ближе к концу часто снижается в зону нижней границы, характерной для данного говорящего;

- главный тональный акцент: как правило, в ЭДЕ бывает один акцентный центр, локализующийся на рематическом компоненте;

- темповый паттерн: как правило, скорость речепорождения бывает выше в начале ЭДЕ и уменьшается к концу;

- громкостный паттерн: как правило, громкость речепорождения бывает выше в начале ЭДЕ и уменьшается к концу.

Рассмотрим пример из верхнекускоквимского языка6.

6 В статье [ЮЬпк, 2019], из которой взят цитируемый верхнекускоквимский материал, содержатся акустические визуализации примеров, к которым читатель может при жела-

нии обратиться.

(4) верхнекускоквимский [Kibrik, 2019, р. 152-153] 38.0 10 •••(0.8) tinh k'its' /'ohighet'a ice on.top they.stayed 'they stayed on top of the ice,' 40.7 11 ««(2.1) hwtl tl'oy /nidiszanh

sled rear I.am.standing 'me standing at the back of the sled,' 45.0 12 ««(4.2) hwtl si'il Ataneghil sled with.me it.is.sinking

ts'eJ,

ts'eJ,

CONN

noygi, down

'the sled was sinking down together with me,'

В примере (4) содержится три ЭДЕ. Каждая из них занимает графическую строку7. Слева, в начале строки, указано время начала ЭДЕ от начала звукового файла (в секундах). Правее указан идентификационный номер ЭДЕ в рамках данного дискурса. Далее следует собственно транскрипт. Что касается просодических характеристик, каждая ЭДЕ начинается с довольно продолжительной пограничной паузы, в целом следует описанному выше интонационному контуру и включает один (главный) тональный акцент. (См. список транскрипционных обозначений в конце статьи.)

ЭДЕ часто, хотя и не обязательно, представляют собой клаузы. Все ЭДЕ в примере (4) являются клаузальными.

Выделение ЭДЕ производится с учетом вышеупомянутых просодических критериев посредством экспертной оценки. После небольшой тренировки однозначность выделения ЭДЕ достигает 2/3 или даже 3/4 случаев. При более длительной тренировке согласованность решений квалифицированных транскрайберов значительно выше и превосходит 90%. Ср. также обсуждение в [Himmelmann et al., 2018].

Членение на ЭДЕ представляет собой важнейший, наиболее фундаментальный компонент дискурсивной транскрипции. Транскрипт, не содержащий в явном виде членения на ЭДЕ, не отражает сущностных характеристик устной речи и не может быть признан удовлетворительным.

7. Акценты, тоны в акцентах, фазовые явления, пунктуация

Центральное просодическое явление, потенциально универсальное, -это дискурсивные акценты. Некоторые слова произносятся с усиленным экспираторным толчком, т.е. несут на себе акцент. Внутри слова акцент локализуется на том или ином слоге. В языках, где имеется лексическое ударение, акцент артикуляторно чаще всего привязывается к ударному

7 Заметим, что графическая строка с одной ЭДЕ может быть длиннее полиграфической строки и, соответственно, полиграфически занимать более одной строки, как в ряде случаев в примерах (6)-(8) ниже.

coNN

слогу. Как правило, дискурсивный акцент является не только силовым, но и тональным: на соответствующем слоге (а иногда также в его окрестностях) происходит значимое движение тона, которое хорошо отождествимо на слух и в программах акустического анализа, таких как Praat. В примере (4) в каждой ЭДЕ имеется один дискурсивный акцент. Наличие акцента обозначается перед словом (например, восходящий акцент /, нисходящий акцент \).

В ЭДЕ может быть более одного акцента, см. ЭДЕ 4 в примере (5) ниже. Как правило, ровно один акцент является главным (рематическим) акцентом ЭДЕ, ответственным за фазовое значение, о котором будет сказано далее. Главный акцент дополнительно обозначается подчеркиванием того слога, на котором он размещается. Например, в ЭДЕ 10 примера (4) это слог ghe.

Фаза (термин из [Кодзасов, 2009]) - это дискурсивно-семантическая категория с абстрактным значением 'завершенность vs. незавершенность'. Различается иллокутивная и внутренняя фаза. Иллокутивная фаза связана с типом иллокутивного акта: самые распространенные типы - это сообщение (завершенность) и вопрос (незавершенность, ожидание продолжения). Как правило, в языках сообщение маркируется нисходящим главным акцентом, а общий вопрос - восходящим главным акцентом. В ЭДЕ 4 примера (5) содержится нисходящий главный акцент. ЭДЕ, содержащая такой главный акцент, интерпретируется в предлагаемой нами системе как завершающая предложение.

Предложение в общем случае представляет собой группу ЭДЕ. В конце ЭДЕ, завершающей предложение, ставится пунктуационный знак, в том числе точка (как в ЭДЕ 4 примера (5)) или вопросительный знак.

(5) верхнекускоквимский [Kibrik, 2019, р. 156]

3 «"(1.0) totis leka /Visdlal tsV,

portage dogs I.did.not.take conn 'and I did not take the dogs to the portage,' 11.2 4 ch'itsan' /\ch'itiy \nichoh ts'eJ.

grass too.much it.is.big conn

'the grass being too tall.'

Таким образом, понятие предложения распространяется на устный дискурс, но не интуитивным, а внятным, семантически прозрачным и просодически мотивированным образом. Предложение представляет собой единицу локальной структуры дискурса, вторичную по отношению к ЭДЕ. Выделение предложений возможно лишь на основе особой просодически-мотивированной процедуры, о которой см. ниже.

По решению транскрайбера предложениям могут быть приписаны особые идентификационные номера.

ЭДЕ, которые не завершают предложения, являтся нефинальными. В этом случае реализуется семантика внутренней фазы. Нефинальные ЭДЕ семантически и просодически (а иногда также синтаксически) характеризуются как незавершенные по отношению к предвосхищаемой финальной ЭДЕ предложения. Обозначаются нефинальные ЭДЕ пунктуационным знаком «запятая», см. примеры (4) и (5) выше. Следует подчеркнуть, что пунктуационный знак всегда должен быть в конце ЭДЕ, а в середине ЭДЕ пунктуационные знаки не ставятся.

Наиболее распространенная просодическая огласовка запятой в предложении-сообщении - восходящий акцент, как в ЭДЕ 10, 11 примера (4). Однако встречаются и другие случаи, как, например, восходяще-нисходящий акцент в ЭДЕ 12 примера (4) и в ЭДЕ 4 примера (5).

Нужно особо отметить часто встречающуюся в разных языках просодию нефинального падения. Так, в примере (6) ЭДЕ 21 является финальной. В ней нисходящее движение в конце направлено в абсолютный низ частотного диапазона, характерного для голоса рассказчика (около 100 Гц). Этой финальной ЭДЕ предшествуют две нефинальных, в которых также имеются нисходящие акценты, но направлены они в более высокий целевой уровень (110 Гц или более), семиотически отличный от абсолютного низа. Это широко распространенная просодическая фигура, являющаяся вариантом «интонации запятой». Понимание нефинального падения необходимо для того, чтобы осмысленно и последовательно выделять границы предложений в транскрипте.

(6) верхнекускоквимский [Kibrik, 2019, р. 157]

77.3

84.5

89.4

19

20

21

•(3.4)

chu'da

PTCL

boze God

k'inodle icon \zikone, the.one.I.have

'But the icon that I had in my bosom,' ••••(2.9) sichot' \ts'anistonh

my.bosom I.took.it.out 'I took it out from my bosom,'

••••(1.5) /yats'in | ««(1.3)

other.side

k'its' \doztonh tsV.

on.top it.is.up CONN

chuJ but

sichot' my.bosom

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

tsV,

CONN

sigona' my.arm

tinh ice

'my other arm being on top of the ice.'

В целом, в предлагаемой транскрипционной системе используются определенные концептуальные элементы, характерные для письменного дискурса, но не очевидные в устном дискурсе. Такой перенос позволяет

единым образом подходить к локальной структуре разных модусов дискурса. В то же время важно подчеркнуть, что этот перенос не должен происходить интуитивным, спонтанным или некритическим образом. Расстановка границ предложений и пунктуационных знаков в транскрипте может и должна производиться на основе ясных просодических и дискурсивно-семантических критериев. В этом отношении предлагаемая система существенно отличается от практики, характерной для многих ныне существующих и создаваемых корпусов речи на различных языках, в которых предложения отождествляются с клаузами или же имеют неясные критерии идентификации.

8. Паузация и речевые сбои

К элементам исходной записи, которые должны отражаться в транскрипте, относятся также паузы и речевые сбои.

Паузы принято разделять на абсолютные и заполненные. В первом случае пауза представляет собой перерыв в вокализации между произносимыми словами. Абсолютные паузы могут обозначаться в транскрипте при помощи поднятых точек (двух, трех или четырех), количество которых зависит от продолжительности паузы. В полном варианте транскрипции продолжительность пауз, кроме того, указывается в явном виде в скобках. Заполненные паузы могут включать нелексические вокальные сегменты типа редуцированного гласного, сонорного носового сегмента, гортанного скрипа. Паузы могут быть как пограничными (между ЭДЕ), так и находиться внутри ЭДЕ. Пример (7) показывает несколько типов пауз, абсолютных и заполненных, во фрагменте спонтанного дискурса на агульском языке.

(7) агульский (хпюкский корпус; текст 1, предл. 1)

0.0

4.0

6.1

1

jarc'wa /?wers=na 9 100=COORD

c'ejri-d-pu /isa, 17-s-ord год(тмг)

•••(0.6) /aKzur=na

1000=COORD ••(0.3) jaq'uq:a-n=na

80-s=cooRD 'В 1997 году,'

•••(0.8) m= mart:i /wazala,

март(сЕи) месяц(тмг) 'в марте месяце,'

••(0.2) zun su-ne ••••(l.l) эээ(0.6)

я уХОДИТЬ.PF-AOR

•••(0.5) /zijarat:i-s •••(0.4) \mak:aji-s.

хадж-DAT Мекка-DAT

'я поехал в паломничество в Мекку.'

2

3

Функция внутренних (а иногда и пограничных) пауз - сигнализировать о хезитации (колебании), т.е. о том, что говорящему требуется дополнительное время на подготовку следующего речевого отрезка. Хезитация, в свою очередь, относится к тому классу явлений, которые обычно объединяют под рубрикой речевые сбои: помимо собственно хезитаций, это также повторы, самоперебивы, обрывы слов, самокоррекции и пр. Все эти типы сбоев желательно отражать в транскрипте.

Покажем на двух примерах, как транскрибирование таких, казалось бы, «лишних» элементов текста, как речевые сбои, может являться не просто способом максимально близкого отражения звучащей речи, но и важным фрагментом описания грамматической (и дискурсивной) структуры языка.

К лексическим сигналам речевого сбоя среди прочих относятся так называемые маркеры препаративной подстановки - своего рода «заместители», которые говорящий временно подставляет на место проектируемого выражения, не найдя удовлетворяющей его в данный момент вербализации (ср. английские термины fillers или placeholders, используемые для описания данного явления). В качестве маркеров препаративной подстановки в языках мира чаще всего используются указательные, вопросительные, универсальные или неопределенные местоимения либо слова, исторически восходящие к местоимениям этих классов, а также существительные с обобщенным значением типа 'вещь', 'дело' [Подлесская, Кибрик, 2007; Podlesskaya, 2010]. В отсутствие достаточно полных транскриптов спонтанного дискурса определить, какое именно средство будет использоваться в качестве маркера препаративной подстановки, невозможно даже для тех языков, морфология и синтаксис которых, казалось бы, неплохо изучены. Так, для нахско-дагестанских языков первые сведения о маркерах препаративной подстановки появились, по-видимому, лишь в 2010 г.: в статье [Ganenkov et al., 2010] описаны две системы таких маркеров для двух языков лезгинской группы, агульского и удинского. При этом оказалось, что, хотя оба языка используют одну и ту же стратегию подстановки, а именно вопросительные местоимения, между языками наблюдается варьирование: если в агульском в качестве слов-заместителей используются как 'кто' (для личных референтов), так и 'что' (для неличных референтов, ср. (8)), в удинском все типы референтов замещаются одним и тем же местоимением 'что'. Однако о границах внутригенетической вариативности в данной области в рамках хотя бы лезгинских языков, не говоря о языках нахско-дагестанской семьи в целом, мы пока четкого представления не имеем.

(8) агульский (хпюкский корпус; текст 27, предл. 33)

136.3

33

•••(0.6) le /Hüri-n ja2ani-£ ?a-ji

DEML Село-GEN СереДИНа-INTER 1шег.6ьпъ^т

fi-p:ur ••••(l.l) \naq'w-ar-ar. 4TO-PL Могила-PL-PL

'там посреди села были эти, кладбище.'

Второе явление можно назвать еще более экзотическим. В недавней работе [Fox et al., 2017] было показано, что в языках различных семей и ареалов засвидетельствована стратегия морфологической, т.е. внутрисловной самокоррекции, при которой исправлению -повтору или замене - подвергается не вся словоформа в целом, а лишь аффикс или клитика. Круг языков, в которых представлено данное явление, вероятно, может быть значительно расширен (в выборке авторов упомянутой работы - десять языков). Так, аналогичная «замена суффикса» была обнаружена во время работы над корпусом спонтанных нарративов на хпюкском говоре агульского языка. Явление морфологического самоисправления не является в этом корпусе частотным, однако представлено как минимум десятками примеров, ср. (9).

В агульском языке, как и в нахско-дагестанских языках в целом, косвенные падежи имени (т.е. все падежи, кроме немаркированного абсолютива/номинатива) образуются от косвенной основы. В примере (9) мы видим, что говорящий начал порождать форму одного из местных падежей от имени dahar 'гора', а именно суперэлатива dahari-l-as (косвенная основа dahari-, показатель локализации 'super' -l и показатель элатива -as). При этом, не договорив эту форму до конца, говорящий изменил свое намерение и решил в качестве более подходящей в данном контексте употребить форму постэлатива dahari-q-as (отличающуюся покателем локализации, -q 'post' вместо -l 'supER'). При этом после обрыва словоформы порождена была не вся «правильная» форма dahariqas целиком, а лишь падежное окончание -qas.

(9) агульский (хпюкский корпус; текст 6, предл. 65)

4.8

3

sadima dahari-l-a= -q-as mi-c

Садима гора-suPER-ELAT -post-elat demm-lat 'сюда через гору Садима'

Очевидно, что точно так же, как и маркеры препаративной подстановки, морфологические самоисправления подвержены типологическому варьированию: в каких-то языках они возможны, в каких-то нет,

может различаться частотность данного типа «сбоев» и те контексты, в которых они допустимы в данном языке. Подобные различия могут быть чувствительны и к характеру морфологической структуры языка, например, к типу агглютинации. Однако без детальной транскрипции спонтанных текстов выявление и анализ данного явления не представляются осуществимыми.

Таким образом, резюмируя, транскрипт каждой ЭДЕ в полном варианте должен включать не только слова, но также части слов и размеченные паузы.

9. Дополнительные замечания

Транскрибирование слов рекомендуется делать на основе имеющейся практической графики. Эта рекомендация связана с тем, что в числе пользователей транскриптов могут быть не только профессиональные лингвисты, но и представители языкового сообщества. Желательно, чтобы они не были полностью отрезаны от создаваемых и публикуемых на их языке ресурсов. В случае значительного несовершенства практической графики можно иметь два изоморфных слоя: в практической графике и в научной транскрипции.

Как отмечалось в разд. 2, первый слой в анализе дискурса (транскрипт) должен соотноситься со вторым слоем (глоссами). Если язык имеет умеренно развитую морфологию, то границы морфем могут быть внесены прямо в первый слой. Если же морфология настолько развитая, что добавление морфемных границ сильно меняет внешний вид записи, то первый слой можно раздробить на два: подслой без морфемного членения и подслой с морфемным членением, соответствующим последующим глоссам.

Большинство языков активно контактируют с другими языками, носители часто являются дву- и многоязычными и используют в своей речи смешение кодов. Необходимы ясные конвенции передачи иноязычных элементов, которые интерпретируются не как заимствования, а как смешение кодов. В частности, нужно принимать решение о том, представляется ли иноязычное слово при помощи фонемной транскрипции основного языка или посредством стандартной графики языка-источника. Так, в [Kibrik, 2019] было реализовано решение представлять английские слова, вкрапляемые в верхнекускоквимский дискурс, в стандартной английской графике заглавными буквами.

При создании электронных корпусов желательна синхронизация элементов транскрипта (предложений, ЭДЕ и даже слов) с соответствующими интервалами медиафайла. Для этого необходимы программы, ориентированные на интеграцию транскрипта и звука, как например ELAN.

В этом кратком очерке мы не смогли коснуться целого ряда других явлений, которые должны регистрироваться при транскрибировании устного дискурса (см. [Kibrik, 2019; Kibrik et al., 2020a]), в том числе:

- отражение вариантов транскрипции;

- отражение прямой речи;

- отражение невербальных вокальных явлений, таких как смех;

- отражение эмфазы (но ср. выделенное полужирным слово ch'itiy в строке 4 примера (5));

- отражение повышенного темпа;

- отражение фрагментов, фонетически сильно редуцированных;

- отражение неразборчивых фрагментов.

Кроме того, мы не затрагивали специфических проблем, связанных с транскрибированием интерактивного дискурса с чередованием говорящих, таких как трактовка пауз и наложения речи одновременно говорящих участников.

Как справедливо отметил один из рецензентов, не все описанные в данной статье конвенции дискурсивной транскрипции воспроизводимы в таких популярных программах, как ELAN или FLEX. Это касается, например, таких привычных в текстовых редакторах приемов форматирования, как подчеркивание. Данную техническую проблему можно обойти, например используя особые слои в программе ELAN, как это сделано для русского дискурса в корпусе «Рассказы и разговоры о грушах» (см. https://multidiscourse.ru/data/ann/pears_vocal%20annotation.pdf).

10. Заключение

Мы предлагаем распространить логику, предложенную в свое время в [Comrie et al., 2008], на транскрибирование устной речи как таковой -на первый слой в стандарте анализа языкового материала. Транскрипт должен быть разделен на строки, соответствующие ЭДЕ. В этом слое должна содержаться разметка слов, элементов слов, пауз, акцентов, тонов в акцентах, других просодических явлений, а также пунктуационных знаков, передающих фазовые и иные дискурсивные смыслы. Согласно накопленным на данный момент знаниям, просодия и другие дискурсивные явления в значительной степени сходны в самых разных языках и поддаются стандартизации.

Каждый проект в области описания или документации языка должен содержать эксплицитные сведения о том, каким образом репрезентируется материал исходного звукового сигнала. Транскрипт должен быть верен исходному сигналу, регистрировать все его существенные элементы и избегать артефактов и пост-редактирования. Последовательное транскрибирование дискурса на произвольном языке - это вполне

посильная задача, которая достижима уже при небольшой тренировке. Этот подход способствует созданию качественных, экологически валидных эмпирических данных.

Настоящая статья является лишь первым наброском более подробного свода правил дискурсивной транскрипции для разноструктурных языков. В дальнейшем мы планируем создание подробной инструкции, которая может быть применена при описании или документации любого языка.

Приложение. Обозначения дискурсивной транскрипции8

Пунктуационные знаки

Иллокутивная фаза (конец предложения) . сообщение ? вопрос ¡ директив @ вокатив ... неполнота Внутренняя фаза

, дефолтная незавершенность

: незавершенность с последующим раскрытием Другое

" " прямая речь Паузы и речевые сбои

•••(0.8) абсолютная пауза, с указанием длительности

ээ(0.4) заполненная пауза (с неопределенным вокалическим

содержанием) = обрыв слова

= = обрыв ЭДЕ

Акценты

/ \ - /\ и т.д. акцент на слове с указанием тона в акценте

подчеркивание главный акцент ЭДЕ (подчеркивается слог, на котором реализуется акцент)

Другое

полужирный шрифт эмфаза курсив ускоренный темп

серый шрифт повышенная степень фонетической редукции

^ 8 В этот список включены и некоторые обозначения, которые не встретились в приве-

1 денных примерах.

<угловые скобки> неточная транскрипция

<7> неясный фрагмент, с примерным указанием

числа слогов

{СМЕХ} (0.9) невербальный материал с указанием дли-

тельности

CHRISTMAS TREE вкрапления иноязычного текста (смешение кода)

[ninh 'ine] наложение реплики другого говорящего

Библиографический список / References

Архипов и др., 2008 - Арчинский язык / Архипов А.В., Даниэль М.А., Кибрик А.Е., Чумакина М.Э. // Малые языки и традиции: существование на грани. Вып. 2. Тексты и словарные материалы / А.Е. Кибрик (ред.). М., 2008. С. 192-231. [Arkhipov A.V., Daniel M.A., Kibrik A.E., Chumakina M.E. Archi. Malye yazyki i traditsii: sushchestvovanie na grani. Vol. 2. Teksty i slovarnye mate-rialy. A.E. Kibrik (ed.). Moscow, 2008. Pp. 192-231. (In Rus.)]

Кибрик, Подлесская, 2009 - Рассказы о сновидениях: корпусное исследование устного русского дискурса / Под ред. А.А. Кибрика, В.И. Подлесской. М., 2009. [Rasskazy o snovideniyakh: korpusnoe issledovanie ustnogo russkogo diskursa [Night dream stories: A corpus study of spoken Russian discourse]. A.A. Kibrik, V.I. Podlesskaya (eds.). Moscow, 2009.]

Кибрик, Тестелец, 1999 - Элементы цахурского языка в типологическом освещении / Под ред. A.E. Кибрика, Я.Г. Тестельца. М., 1999. [Elementy tsakhurskogo yazyka v tipologicheskom osveshchenii [Aspects of Tsakhur from a typological perspective]. A.E. Kibrik, Ya.G. Testelets (eds.). Moscow, 1999.]

Кибрик и др., 1972 - Кибрик А.Е., Кодзасов С.В., Оловянникова И.П. Фрагменты грамматики хиналугского языка. М., 1972. [Kibrik A.E., Kodzasov S.V., Olovyannikova I.P. Fragmenty grammatiki khinalugskogo yazyka [Fragments of Khinalug grammar]. Moscow, 1972.]

Кибрик и др., 1977 - Арчинский язык: тексты и словари / Кибрик А.Е., Кодзасов С.В., Оловянникова И.П., Самедов Д.С. М., 1977. [Kibrik A.E., Kodzasov S.V., Olovyannikova I.P., Samedov D.S. Archinskii yazyk: teksty i slovari [Archi: Texts and dictionaries]. Moscow, 1977.]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Кибрик и др., 2000 - Кибрик А.Е., Кодзасов С.В., Муравьёва И.А. Язык и фольклор алюторцев. М., 2000. [Kibrik A.E., Kodzasov S.V., Murav'eva I.A. Yazyk i folklor alyutortsev [Language and folklore of the Alutor people]. Moscow, 2000.]

Кибрик и др., 2001 - Багвалинский язык: Грамматика, тексты, словари / Под ред. A.E. Кибрика, К.И. Казенина, С.Г. Татевосова, Е.А. Лютиковой. М., 2001. [Bagvalinskii yazyk: Grammatika, teksty, slovari [Bagvalal: Grammar, texts, dictionaries]. A.E. Kibrik, K.I. Kazenin, S.G. Tatevosov, E.A. Lyutikova (eds.). Moscow, 2001.]

Кодзасов, 2009 - Кодзасов С.В. Исследования в области русской просодии. М., 2009. [Kodzasov S.V. Issledovaniya v oblasti russkoi prosodii [Studies in the Russian prosody]. Moscow, 2009.]

Подлесская, Кибрик, 2007 - Подлесская В.И., Кибрик А.А. Самоисправления говорящего и другие типы речевых сбоев как объект аннотирования в корпусах устной речи // Научно-техническая информация. Сер. 2. 2007. № 2. С. 2-23. [Podlesskaya V.I., Kibrik A.A. Speaker's self-repairs and other types of disfluencies in the annotation of spoken corpora. Nauchno-tekhnicheskaya informatsiya. Ser. 2. 2007. No. 2. Pp. 2-23. (In Rus.)]

Щерба, 1955 - Щерба Л.В. Фонетика французского языка. М., 1955. [Shcherba L.V. Fonetika frantsuzskogo yazyka [The phonetics of French]. Moscow, 1955.]

Chafe, 1994 - Chafe W. Discourse, consciousness, and time. The flow and displacement of conscious experience in speaking and writing. Chicago, 1994.

Comrie et al., 2008 - Comrie B., Haspelmath M., Bickel B. The Leipzig Glossing Rules: Conventions for interlinear morpheme-by-morpheme glosses. (Revised version of February 2008). URL: https://www.eva.mpg.de/lingua/resources/glossing-rules. php (date of access: 12.02.2021).

Cruttenden, 1986 - Cruttenden A. Intonation. Cambridge, 1986.

Fox et al., 2017 - Fox B.A., Wouk F., Fincke S. et al. Morphological self-repair: Self-repair within the word. Studies in Language. 2017. Vol. 41. No. 3. Pp. 638-659.

Ganenkov et al., 2010 - Ganenkov D., Lander Yu., Maisak T. From interrogatives to placeholders in Udi and Agul spontaneous narratives. Fillers, pauses, and placeholders. N. Amiridze, B.H. Davis, M. Maclagan (eds.). Amsterdam/Philadelphia, 2010. Pp. 95-118.

Himmelmann et al., 2018 - Himmelmann N., Sandler M., Strunk J., Unterladstet-ter V. On the universality of intonational phrases: A cross-linguistic interrater study. Phonology. 2018. Vol. 35. No. 2. Pp. 207-245.

Jung, Himmelmann, 2011 - Jung D., Himmelmann N.P. Retelling data: Working on transcription. Documenting endangered languages: Achievements and perspectives. G.L.J. Haig, N. Nau, S. Schnell, C. Wegener (eds.). Berlin, 2011. Pp. 201-222.

Kibrik, 1996 - Godoberi. A.E. Kibrik (ed.). München, 1996.

Kibrik, 2011 - Kibrik A.A. Cognitive discourse analysis: Local discourse structure. Slavic linguistics in a cognitive framework. M. Grygiel, L.A. Janda (eds.). Frankfurt/ New York, 2011. Pp. 273-304.

Kibrik, 2019 - Kibrik A.A. Upper Kuskokwim (Athabaskan, Alaska): Elementary discourse units and other aspects of local discourse structure. Anthropological linguistics. 2019. Vol. 61. No. 2. Pp. 141-182.

Kibrik et al., 2020a - Kibrik A.A., Korotaev N.A., Podlesskaya V.I. Russian spoken discourse: Local structure and prosody. In search for a basic unit of spoken language: A corpus-driven approach. H. Mello, T. Raso, A. Panunzi (eds.). Amsterdam, 2020. Pp. 35-76.

Kibrik et al., 2020b - Kibrik A.A., Korotaev N.A., Podlesskaya V.I. The Moscow approach to local discourse structure: An application to English. In search for a basic ™ unit of spoken language: A corpus-driven approach. H. Mello, T. Raso, A. Panunzi h (eds). Amsterdam, 2020. Pp. 367-382.

■§ Podlesskaya, 2010 - Podlesskaya V. Parameters for typological variation

i of placeholders. Fillers, pauses, and placeholders. N. Amiridze, B.H. Davis, M. Maclagan (eds.). Amsterdam/Philadelphia, 2010. Pp. 11-32.

Renkema, 2004 - Renkema J. Introduction to discourse studies. Amsterdam, 2004.

Tannen et al., 2015 - The Handbook of discourse analysis. Second Edition. Vol. 1, 2. D. Tannen, H.E. Hamilton, D. Schiffrin (eds.). Chichester, 2015.

van Dijk, 1997 - Discourse studies: a multidisciplinary introduction. Vol. 1, 2. T.A. van Dijk (ed.). London, 1997.

Статья поступила в редакцию 26.03.2021 The article was received on 26.03.2021

Об авторах / About the authors

Кибрик Андрей Александрович - доктор филологических наук; директор, Институт языкознания Российской академии наук; профессор Отделения теоретической и прикладной лингвистики филологического факультета, Московский государственный университет имени М.В. Ломоносова

Andrey A. Kibrik - Dr. Phil. Hab.; director, Institute of Linguistics of the Russian Academy of Sciences; professor at the Department of Theoretical and Applied Linguistics of the Faculty of Philology, Lomonosov Moscow State University, Moscow, Russian Federation

ORCID: https://orcid.org/0000-0002-3541-7637 E-mail: aakibrik@gmail.com

Майсак Тимур Анатольевич - кандидат филологических наук; старший научный сотрудник отдела кавказских языков, Институт языкознания Российской академии наук; ведущий научный сотрудник Международной лаборатории языковой конвергенции, Национальный исследовательский факультет «Высшая школа экономики», г. Москва

Timur A. Maisak - PhD in Linguistics; Senior Researcher at the Department of Caucasian Languages, Institute of Linguistics of the Russian Academy of Sciences; Leading Researcher at the Linguistic Convergence Laboratory, National Research University Higher School of Economics, Moscow, Russian Federation ORCID: https://orcid.org/0000-0001-6794-0978 E-mail: timur.maisak@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.