КАК ПОПРОЩАТЬСЯ С РОБОТОМ? ИССЛЕДОВАНИЕ ДОСТИЖЕНИЯ РАЗГОВОРНОГО ЗАКРЫТИЯ

Егорова А. И.; Кловайт Н.

ЦИФРОВИЗАЦИЯ

DOI: 10.14515/monitoring.2021.1.1810

А. И. Егорова, Н. Кловайт

КАК ПОПРОЩАТЬСЯ С РОБОТОМ? ИССЛЕДОВАНИЕ ДОСТИЖЕНИЯ РАЗГОВОРНОГО ЗАКРЫТИЯ

Правильная ссылка на статью:

Егорова А. И., Кловайт Н. Как попрощаться с роботом? Исследование достижения разговорного закрытия //Мониторинг общественного мнения: экономические и социальные перемены. 2021. № 1. С. 241—270. https://doi.Org/10.14515/monitoring.2021.1.1810. For citation:

Egorova A. I., Klowait N. (2021) How to Say Good-Bye to a Robot? The Matter of Conversational Closing. Monitoring of Public Opinion: Economic and Social Changes. No. 1. P. 241-270. https://doi.org/10.14515/monitoring.2021.1.1810. (In Russ.)

КАК ПОПРОЩАТЬСЯ С РОБОТОМ? ИССЛЕДОВАНИЕ ДОСТИЖЕНИЯ РАЗГОВОРНОГО ЗАКРЫТИЯ

ЕГОРОВА Анастасия Игоревна — младший специалист департамента сбора данных, группа «Выполнение опросов в Москве и Московской области», Фонд «Общественное мнение», Москва, Россия

E-MAIL: emeraldansa@gmail.com https://orcid.org/0000-0002-8889-6272

КЛОВАЙТ Нильс — научный сотрудник Центра перспективных социальных исследований, Российская академия народного хозяйства и государственной службы при Президенте РФ, Москва, Россия; старший научный сотрудник Международного центра современной социологической теории, Московская высшая школа социальных и экономических наук, Москва, Россия; эксперт, Лаборатория геймификации Сбера, Москва, Россия E-MAIL: nils.klowait@gmail.com https://orcid.org/0000-0002-7347-099X

Аннотация. Разговорные компьютеризированные агенты совершенствуются, развиваются и получают все более широкое распространение в различных сферах жизни. Теперь искусственный интеллект может вести беседу с человеком, используя сложные разговорные приемы и человекоподобные речевые паттерны. Например, Google Duplex, современный голосовой интерфейс, способен автономно выполнять сервисные телефонные звонки таким образом, что собеседнику не удается опознать в нем робота.

С увеличением числа интерактивных коммуникаций человека и компью-

HOW TO SAY GOOD-BYE TO A ROBOT? THE MATTER OF CONVERSATIONAL CLOSING

Anastasia I. EGOROVA1 — Junior Specialist at the Department of Data Collection, Surveys in Moscow and Moscow oblast Division

E-MAIL: emeraldansa@gmail.com https://orcid.org/0000-0002-8889-6272

Nils KLOWAIT234 — Research Fellow at the Center for Innovative Social Research; Senior Research Fellow at the International Center for Contemporary Sociological Theory; Researcher E-MAIL: nils.klowait@gmail.com https://orcid.org/0000-0002-7347-099X

1 Public Opinion Foundation, Moscow, Russia

2 Russian Presidential Academy of National Economy and Public Administration, Moscow, Russia

3 Moscow School of Social and Economic Sciences, Moscow, Russia

4 Sber Gamification Lab, Moscow, Russia

Abstract. Artificial conversational agents are becoming increasingly popular in various spheres of life. Contemporary AI is able to talk to humans using sophisticated conversational techniques and human-like conversational patterns. For instance, Google Duplex, a cutting-edge voice interface, is capable of autonomously making customer service calls that barely register as robotic. With the frequency of human-computer interactions on the rise, there is a growing need to study their features: how misunderstandings are resolved, how conversational aims are achieved. This article is an empirical investigation of the interaction between an advanced conver-

тера становится очевидной необходимость их изучения: каким образом они происходят, как разрешаются недоразумения и достигаются цели разговора. Статья посвящена эмпирическому изучению взаимодействия между продвинутым разговорным агентом и человеком: в рамках эт-нометодологии и конверсационного анализа рассмотрены последовательно разворачивающиеся, естественно возникающие речевые практики собеседников, а также порождаемые ими нормативные структуры.

Материалом для анализа послужила аудиозапись телефонной беседы между Google Duplex и человеком-оператором. Исследовано, в частности, как достигается разговорное закрытие — микроструктура, требующая кооперации собеседников в организации чередования реплик. Показано, что завершение беседы происходит за счет постепенного достижения эпистемического равновесия между говорящими, несмотря на интеракционные проблемы, возникающие из-за неуместного просодического контура робота. Подчеркивается связь между институциональным контекстом взаимодействия и роботизированной природой не-человеческого собеседника.

sational agent and human interactant. Using the framework of ethnomethodol-ogy and conversation analysis, the authors analyze the procedurally unfolding and naturally emerging conversational practices, as well as the normative structures that emerge as a result. The research is based on a recording of a call between Google Duplex and a human operator. We explore how to reach conversational closing — a microstructure that requires cooperation between the speakers. Despite interactional tensions caused by the robot's incongruous prosody, conversational closing is produced by the gradual achievement of epis-temic balance. The authors emphasize the relationship between the institutional context of the interaction and the non-human agent's robotic nature. The results serve as a foundation for future studies in human-robot interaction and provide a deeper understanding of how conversational closings are achieved in liminal cases.

Полученные результаты закладывают основу для дальнейших исследований специфического порядка во взаимодействии человека и робота и способствуют более глубокому пониманию того, как завершается разговор в пограничных случаях.

Ключевые слова: этнометодология, конверсационный анализ, разговор-

Keywords: ethnomethodology, conversation analysis, conversation closing,

Мониторинг общественного мнения: экономические и социальные перемены Monitoring of Public Opinion: Economic and Social Changes

№ 1 (161) январь — февраль 2021 No. 1 January — February 2021

ное закрытие, взаимодействие человека и компьютера, просодический контур, эпистемика

Благодарность. Статья подготовлена в сотрудничестве с Лабораторией гей-мификации Сбера.

Статья подготовлена в рамках гранта, предоставленного Министерством науки и высшего образования Российской Федерации (№ соглашения о предоставлении гранта: 075-152020-908).

human-computer interaction, prosodie contour, epistemics

Acknowledgments. The article is made in collaboration with the Sber (ex. — Sber-bank's) Gamification Laboratory, under a grant from the Ministry of Science and Higher Education of the Russian Federation (contract No. 075-15-2020-908).

Как завершается разговор между собеседниками? Как участники понимают, что один из них сообщил другому достаточно информации для того, чтобы оба повесили трубки? Эти вопросы —предмет интереса этнометодологии и конверсаци-онного анализа (EMCA), где разговор рассматривается как «средство, с помощью которого организуется социальный порядок» [Drew, Heritage, 1992: 12]. Данная теоретическая рамка изучает, как участники разговора, используя различные микроструктуры (например, организация чередования говорящих, последовательностей в разговоре, просодия), локально определяют ситуацию.

А что будет меняться в завершении разговора, если одним из собеседников будет не человек, а робот? Искусственный интеллект активно развивается, роботы становятся интерактивными и человеку даже не всегда удается распознать, что он общается с умной машиной. Однако действия не-человека все еще ограничены по сравнению с действиями человека [Button, 1990: 81], поэтому в данной работе будет рассмотрено, каким образом завершается разговор между человеком и продвинутым разговорным интерфейсом.

Перспектива конверсационного анализа

Согласно допущению конверсационного анализа, каждый отдельный разговор последовательно разворачивается во времени. Организация чередов 1 ("turns") — определяющий элемент последовательного структурирования обычного разговора. Сама последовательность конструируется с помощью различных единиц ("turn-constructional units") [Sacks et al., 1974: 720—721] (например, фраза"Ы, how are you?") через синтаксическое выделение и «производство звуков» [Sacks et.al.., 1974: 180], или просодический контур [Selting, 1996], который включает в себя «заминки, растягивание звука, осечки, вдохи, смех, микропаузы, паузы, ударения и интонации», а также тон, громкость [Couper-Kuhlen, Selting, 2009: 13].

1 Здесь и далее использован термин «черед»/«череды», появившийся в переводе статьи «Простейшая систематика организации очередности в разговоре» [Сакс, Щеглофф, Джефферсон, 2015], сделанном кандидатом социологических наук Андреем Корбутом.

Смена чередов в разговоре тщательно координируется: следующий говорящий, как правило, вступает в момент возможного завершения типовой единицы, который называется «релевантным местом перехода» ("transition-relevance place").

Поскольку в этой статье мы фокусируемся исключительно на закрывающей части беседы, нас будет интересовать, как чередование прерывается и разговор заканчивается. Вместо того, чтобы просто перестать говорить (что может восприниматься как молчание), для завершения взаимодействия участники закрывают саму возможность передачи череда, что обеспечивается терминальной парой смежности ("adjacency pairs") [Sacks et al., 1974: 728]. Пары смежности представляют собой два высказывания, занимающие соседнее расположение и производящиеся различными говорящими. Пример подобных парных типов — обмен прощаниями «пока — пока» [Schegloff, Sacks, 1973: 296]. Это терминальная пара, то есть фактический обмен в заключительной части разговора.

Перед терминальным обменом последовательно инициируется заключительная часть разговора. Когда один из собеседников не претендует на инициацию новой темы, после закрытия предыдущей он вводит первую парную часть в виде возможного предзакрытия ("pre-closing"), например, "We-ell...", "O.K...", "So-oo" [Schegloff, Sacks, 1973: 303]. Затем черед переходит ко второму говорящему, который либо начинает новую тему и тем самым продолжает разговор, либо отвечает на предзакрытие (Пример 1)—тогда возможное предзакрытие становится фактическим, и разговор завершается [Schegloff, Sacks, 1973: 309].

Пример 1 1 A: O.K.

2 B: O.K.

Однако реакцией на предзакрытие может быть не только окончание разговора, но и минимальное или радикальное уклонение от закрытия [Button, Lee, 1987: 109—111]. В обоих случаях разговор переоткрывается, но в первом случае последовательность расширяется ненадолго, а во втором закрытие резко отодвигается во времени.

Таким образом, завершение взаимодействия представляет собой сложный процесс, кооперацию в организации чередования собеседников, а не простое следование желанию прекратить разговор.

Проблематичность завершения разговорного взаимодействия между людьми была изучена в телефонных звонках [Schegloff, Sacks, 1973: 696—735; Button, Lee, 1987: 101—151], устном разговоре лицом к лицу [Broth, Mondada, 2013; Haddington, 2019; Mondada, 2014], компьютерно-опосредованном взаимодействии [Markman, 2006: 138—172], виртуальных играх [Pojanapunya, Jaroenkitboworn, 2011]. Также предпринимались попытки изучать закрытия в симулированном разговоре между человеком и компьютерной системой [Wooffitt, 1997]: при этом человек-участник был убежден, что разговаривает с голосовым неинтерактивным роботом, но роль компьютера играл другой человек. Было обнаружено, что в отличие от разговора между людьми, в котором терминальный обмен значим для собеседников, в симулированном разговоре терминальный компонент, как правило, систематически отсутствует. Маркером того, что говоря-

щему больше нечего сказать, выступает в таком случае прекращение разговора (сброс звонка) без терминальной последовательности.

Однако настоящие разговоры робота с человеком представляют новый объект для изучения закрытий 2. В таком случае форма социальной ситуации меняется, и роботичность начинает влиять на завершение разговора, что будет показано в текущей работе. Таким образом, эта статья вносит вклад в изучение выстраивания специфического порядка взаимодействия в контексте разговора между человеком и не-человеком.

В данной работе изучается, как происходит закрытие разговора во взаимодействии человека и искусственного интеллекта Google Duplex, сложной компьютерной системы, в основе которой лежит рекуррентная нейронная сеть, способная использовать свою внутреннюю память для распознавания речи. Ответ на исследовательский вопрос основан на анализе конкретных эмпирических данных, где Google Duplex эксплицитно демонстрирует способность участвовать в разговоре.

Данные

Рассматривается аудиозапись естественно протекающего телефонного разговора между оператором-человеком и голосовой системой Google Duplex, продолжительность которого составляет 56 секунд. Запись предоставлена компанией Google и находится в открытом доступе 3. Система выступает в качестве клиента, способного делать телефонные звонки исключительно для оформления заказов (например, бронирование столика в ресторане), а человек является оператором, который выполняет эти поручения.

Изучать аудиозапись мы будем на основании методологии конверсационного анализа с помощью детального анализа транскриптов естественно протекающих разговоров [Sacks et.al., 1974: 696—734]. Транскрипт исследуемого разговора, выполненный по системе Гейл Джефферсон [Jefferson, 2004: 14—31] (см. Приложение 1), представлен в Приложении 2.

Для человека беседа протекает в обычном режиме, но в реальности разговорное взаимодействие происходит не между людьми, а между человеком и роботиче-ской системой. Благодаря тому, что в рассматриваемом разговоре один из участников не-человек, можно характеризовать некоторые наблюдаемые особенности его речи как роботические. Иными словами, роботичность разговора превносит определенные отличия во взаимодействие. Если изучать разговор с точки зрения конверсационного анализа [Schegloff, 2009: 370], длинные паузы (более 1,2 сек.), видимое отсутствие реакции и малая вовлеченность (робот только отвечает, не задает вопросы, ничего не уточняет), повышенная громкость, ровный тон, растянутость речи можно отнести к характерным чертам этой компьютерной системы.

Исследуемое взаимодействие отличается от «обычных разговоров» [Drew, Heritage, 1992: 3—6]. Изучаемый нами кейс представляет собой институциональ-

2 Каким образом конверсационный анализ относится к проблеме человеко-компьютерного взаимодействия в контексте развития искусственного интеллекта см. в статье Н. Кловайта и М. Ерофеевой в этом выпуске [Klowait, Erofeeva, 2021].

3 Leviathan Y., Matias Y. Google AI Blog: Google Duplex: An AI System for Accomplishing Real-World Tasks Over the Phone. 2018. 8 May. URL: https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html (accessed: 18.02.2021).

ный разговор [Drew, Heritage, 1992: 21—25], накладывающий определенные ограничения на действия его участников и их интерактивные компетенции [Klowait, 2017: 21—24; Klowait, 2018: 25—26]. Разговор Google Duplex и человека осуществляется в формате сервисного звонка, в котором роли фиксированы [Moore, Arar, 2019: 40]: клиент Duplex запрашивает услугу, а человек предоставляет ее от имени организации. Отметим, что форма смены череда в таком разговоре, а также диапазон возможностей для действий отличаются от повседневного разговора [Drew, Heritage, 1992: 25—27]. Разговор между человеком и системой, как и многие другие институциональные разговорные взаимодействия [Drew, Heritage, 1992: 54], характеризуется последовательностью вопросов-ответов, в которой клерк задает вопросы, а клиент на них отвечает, хотя это ограничение не исключает свободу действий говорящих.

Проблематичное завершение

Разговорное закрытие в текущем кейсе затягивается после того, как оператор (R) получил всю релевантную информацию от робота Google Duplex (D) (35—48):

34 R: Okayt (0.2) I got it!

35 (2.9)

36 R: S:::o. It will be two people at seven o'cloc't 4

37 (1.6)

38 D: YES mmhm=

39^ R: =Mmhm (.) okayt (.) got itUyeh (0.2)

40^ Thank yout

41 (1.9)

42^ D: OK:AY A::WESOME (.) THANKS A LOT!

43 (0.5)

44^ R: >°Thank you have good night°<

45^ (0.2) Bye

46^ (1.2)

47^ D: OKAY (.) BYE-BYE

48 ... End call ...

Несмотря на то, что говорящие ориентируются на закрытие разговора, оно продолжается заметно долго. Сначала инициируются возможные предзакрытия (okay got it yeh) и благодарности (Thank you) (строки 39—40), которые принимаются вторым говорящим (42), а затем происходит терминальный обмен (44—47).

Подобное продолжительное закрытие нехарактерно для институционального разговора, в котором после выполнения запроса разговор последовательно, но быстротечно завершается. Многие институциональные разговоры имеют некую стандартную форму, или этапный порядок [Drew, Heritage, 1992: 43]: открытие — запрос — серия вопросов — ответ—закрытие. Хотя уклонение от закрытий для институциональных разговоров также естественно (например, когда у звонящего появляется новый запрос), но в данном случае Duplex не делает новых запросов, а закрытие все равно является длительным.

4 По методологическим причинам в конверсационно-аналитическом транскрипте обычные правила орфографии или пунктуации намеренным образом исключаются.

В работе мы рассмотрим, каким образом специфика роботического разговора между оператором и Google Duplex влияет на его завершение. Для этого в статье будут рассмотрены два эмпирических вопроса. 1) Каким образом роботические черты связаны с институциональными ролями говорящих? То есть как связаны длинные паузы и видимое отсутствие робота с тем, что он делает запрос, а оператор его выполняет? 2) С помощью каких средств происходит закрытие данного разговора?

Эпистемика как ресурс организации последовательностей в разговоре

Для ответа на вопрос, каким образом осуществляется закрытие разговора в исследуемом кейсе, рассмотрим разговорную последовательность через концепцию эпистемики, которая исследует релевантность информации во взаимодействии. Ресурс эпистемики поможет выявить, каким образом закрываются и открываются последовательности в разговоре, а также в какой момент разговора говорящие ориентируются на его закрытие.

Введение в эпистемику

Согласно данной концепции, говорящие имеют доступ к областям знания, располагающимся на эпистемическом градиенте: говорящий с абсолютным эпистемическим преимуществом, то есть осведомленный о каком-либо предмете, обладает «знанием», K+ (от Knowledge), а получатель, который совершенно не знает предмета, о котором идет речь, не обладает «знанием», K- (менее осведомленный) [Heritage, 2012a: 4—6]. Отметим, что для определения того, обладает говорящий знанием или нет, эпистемические градиенты прослеживаются через соотношение чередов друг с другом, а не по отдельности [Heritage, 2013: 553].

Ключевые компоненты эпистемики: эпистемический статус («epistemic status»), эпистемическая позиция («epistemic stance»), а также взаимодействие между ними. Эпистемический статус включает в себя «не только реальное обладание информацией, но и права на ее обладание и формулирование» [Heritage, 2013: 558]. C одной стороны, говорящие могут занимать разные позиции на эпистемическом градиенте, и даже если они занимают одну позицию, степень «глубины» их знаний может различаться. С другой стороны, участники разговора могут обладать равным объемом информации [Heritage, 2012a: 4—6]. Эпистемический статус определяется во взаимодействии самими участниками, то есть может быть признан или нет.

Эпистемическая позиция «касается последовательного выражения социальных отношений, управляемого посредством конструирования чередов в разговоре» [Heritage, 2013: 558]. Это то, как говорящие позиционируют себя с точки зрения эпистемического статуса в процессе разговора.

Эпистемика необходима для того, чтобы определить одно из фундаментальных различений в конверс-анализе — запрос информации и информирование, и, соответственно, понять, является ли действие запросом информации или ее предоставлением, а также как формируются данные действия [Heritage, 2013: 557].

Запрос информации происходит с помощью трех компонентов: вопросительный морфосинтаксис (грамматическая форма вопроса), просодия (интонационный контур), эпистемика.

Согласно традиционному представлению, утвердительные высказывания, декларативы, (3) в обычном употреблении утверждают информацию ("assert information"), а вопросительные высказывания, интерогативы, (1,2) — запрашивают информацию ("request information") [Heritage, 2012a: 6].

(1) Are you married?

(2) You're married, aren't you?

(3) You're married.

Однако Дж. Херитидж показывает, что именно эпистемика, а не морфосин-таксис или просодический контур играет решающую роль в определении действия как запроса информации или информирования [Heritage, 2012a: 7—23]. Например, в (2) [KR:2] является ли вопрос матери в строке 11 («Знаешь ли ты, кто идет на эту встречу?») запросом информации? Для того чтобы ответить на этот вопрос, необходимо посмотреть на последующие череды. Расс в строке 12 спрашивает: «Кто.», тем самым осуществляя запрос информации, после чего мать отвечает, что не знает (строка 13), что указывает на ее статус К-. Тогда Расс дает ответ (строки 15—16) на запрашиваемую информацию. Следовательно, в данном случае вопрос в строке 11 действительно был запросом информации, хотя он и был сначала проинтерпретирован Рассом как информирование, на что указывает его вопрос «Кто.».

(2) [KR:2][Heritage, 2013: 553]

11 Mom: -> Do you know who's going to that meeting?

12 Rus: Who.

13 Mom: I don't kno:w.

14 (0.2)

15 Rus: .hh Oh::. Prob'ly .h Missiz Mc Owen ('n Dad said)

16 prob'ly Missiz Cadry and some of the teachers.

Информационная асимметрия: Duplex (К+) и оператор (К-)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В нашем кейсе Duplex (D) звонит и декларативно формулирует высказывание, инициируя начало разговора: "Hey, I'm calling to make reservation (.) I'm looking for a table on Friday the fourth". Это высказывание явно попадает в его эпистемическую область (К+), так как последующий черед от оператора (R) представляет собой интеррогатив "This Friday,", после чего D подтверждает информацию (строка 09):

04 D: Hey

05 I:'m calling to make reservation? (.) I'm looking for a table on Friday the fourth!

06 (1.2)

07 R: This Friday,

08 (1.0)

09 D: Yeah

При этом вопросительная формулировка R (строка 07) говорит о том, что необходимая информация находится вне его эпистемической области, то есть R запрашивает информацию, которая в полном объеме ему не доступна. Этот вывод можно сделать на основании того, что, во-первых, после предположения R в седьмой строке D подтверждает его. Во-вторых, из контекста данного разговора

мы знаем, что D делает запрос (бронирует столик), сообщая информацию о себе, доступ к которой есть только у него.

Затем последовательность продолжается в виде цепочки вопросов и ответов, где каждая инициируется через вопрос К- и завершается предоставлением от К+ ответа (1), подтверждающим повторением слова от К- (2), либо подтверждающим токеном5 (3).

В (1), (2), (3) R в вопросительной форме, которая соответствует его эпистемиче-скому статусу (К-), запрашивает релевантные детали ("So how many people,", "For two,", "In what time you will come,", "Can you say name,"). В свою очередь, D сообщает необходимую информацию, используя декларативный синтаксис, соответствующий его области знания ("It's for two people", "At seven pm", "Ehm (0.3) first name is Yaniv (0.5) YA (0.2) NI (.) V"). Таким образом, эпистемический статус участников остается неизменным на протяжении рассмотренных последовательностей разговора. (1)

14 (0.9)

15^ R: S:o how many people, 16 (1.1) 17 R: Fi[ve,

18^ D: [It's fo::r two peoplel

19 (0.4)

20^ R: For two,

21 (1.2)

22^ D: Yes

(2)

23 (0.6)

24^ R: E:n what time you will come,

25 (1.2)

26^ D: At seven pm

27 (0.9) 28^ R: -Seven-

29 (0.9)

(3)

30^ Can you say name,

31 (1.3)

32^ D: E::HM (0.3) FIRST NAME IS YANIV (0.5) Y A (0.2) N I (.) V

33 (2.7)

34^ R: Okayt (0.2) I got itl

35^ (2.9)

36^ R: S:::o. It will be two people at seven o'cloc' t

5 Токен подтверждения — маркер, подтверждающий принятие/понимание предыдущего череда говорящего, после чего открывается следующая последовательность. См. [Jefferson, 1984: 199].

Теперь рассмотрим подведение итога разговора (строки 35—36) с точки зрения эпистемики. R декларативно формулирует "So it will be two people at seven o'clock", получив к этому моменту уже всю информацию от D, однако он произносит это с восходящим просодическим контуром, что все еще является запросом информации. Восходящий просодический контур характерен для запроса информации, даже если морфосинтаксис декларативный [Heritage, 2013: 564].

Таким образом, до строки 34 спикеры занимают разные позиции на эпистеми-ческом градиенте, то есть один более осведомленный, а другой — менее. Статусом К- обладает человек, и в соответствие с этим он запрашивает информацию, а статусом К+ обладает Duplex, в соответствие с чем он делает запрос (бронирование столика) и предоставляет информацию.

Эпистемическое равновесие

как инициирование заключительной части разговора

Когда сокращается эпистемический градиент, то есть информационный дисбаланс признается «уравновешенным для всех практических целей» [Heritage, 2012c: 32], происходит изменение состояния ("change of state") говорящего, который запрашивал информацию: его эпистемический статус меняется с K- на K+. Тогда оба говорящих приобретают эпистемический статус К+ и достигают эпистемического равновесия, которое «подразумевается при закрытии последовательностей, тем и даже целых бесед» [Heritage, 2012b: 390]. В институциональных разговорах при изменении состояния последовательности завершаются с использованием токе-нов подтверждения "okay", "alright", которые регистрируют и принимают ответное действие [Drew, Heritage, 1992: 126], а также признательности ("thank you"), смеха ("haha"), положительной ("great", "excellent") и негативной ("too bad", "oh well") оценок [Moore, Arar, 2019: 142]. Таким образом, при устранении информационного дисбаланса последовательность может быть закрыта, однако это не означает, что новые темы не возникнут.

Токены подтверждения как возможные ресурсы предзакрытия разговора

Токены подтверждения закрывают текущую последовательность и открывают новую. В заключительной же части разговора они представляют собой возможные предзакрытия разговора в целом. Рассмотрим, как работают данные токены в разговоре клерка и Google Duplex и какой из них способствует завершению данной беседы.

В разговоре Duplex и человека R предоставляет токен подтверждения ("Mmhm") в строке 11, который закрывает последовательность, относящуюся к выбору дня недели ("This Friday"), однако еще не может закрыть весь разговор, так как не все детали известны: 07^ R: This Friday, 08 (1.0) 09^ D: Yeah 10 (0.5) 11^ R: °Mmhm°

12 (0-9) -em Let me see°=

Следующий токен, повторяющий ответ D ("seven") в строке 28, также закрывает только одну последовательность, относящуюся к вопросу о времени, и после паузы R инициирует новый черед (Xan you say name"):

24 R: E:n what time you will come,

25 (1.2)

26 D: At seven pm

27 (0.9)

28^ R: -Seven-

29^ (0.9)

30^ Can you say name,

Не очевидно, к чему относятся два подтверждающих токена в строке 34 (первый — "Okay", второй — "I got it"): только ли к предыдущему череду или ко всему предшествующему разговору. Можно заметить, что до и после этого череда возникают длинная заминка [Sacks et al., 1974: 715] 6 (строка 33) и пауза [Sacks et al., 1974: 715] 7 (строка 35) со стороны клерка. Заминку можно объяснить тем, что клерк записывал информацию, которая была ему сообщена в предыдущем череде (32 строка). Пауза же завершается растянутым "so" в начальной позиции череда (turn-initial position), произнесенным слегка понижающимся тоном. Ее можно объяснить тем, что клерк систематизирует (строка 36) раннее полученную от клиента информацию (строки 15—29)—токен "so" указывает на то, что дальше будет высказан итог предшествующего разговора [Raymond, 2004: 186—191]. Во-первых, клерк проверяет, правильно ли он услышал и записал информацию клиента, и во-вторых, в случае правильности — токен "so" после подтверждения закрывает последовательность основной части разговора, после чего говорящий может приступить к его закрытию [Schegloff, Sacks, 1973: 303]:

32^ D: E::HM (0.3) FIRST NAME IS YANIV (0.5) YA (0.2) NI (.) V

33^ (2.7)

34^ R: Okayt (0.2) I got itl

35^ (2.9)

36^ R: S:::o. It will be two people at seven o'cloc't

37 (1.6)

Следовательно, токены "Okay I got it" подтверждают лишь предыдущий черед, так как после подтверждения следует пауза (строка 35) и подводится итог (строка 36) предшествующих последовательностей.

Однако в строке 39 эти же токены ("okay got it") выступают в качестве пред-закрытия, так как информационный дисбаланс был уравновешен, то есть клерк получил достаточную информацию для выполнения запроса (дата, количество человек, время, имя) и изменил свой эпистемический статус с К- на К+:

36 R: S:::o. It will be two people at seven o'cloc't

37 (1.6)

38 D: YES Mmhm=

39^ R: =Mmhm (.) okayt (.) got it ll yeh (0.2)

6 Заминки ("lapses") — продолжительное молчание между чередами говорящих.

7 Пауза — молчание внутри чередов, то есть когда нет смены говорящих.

Прослеживается связь между токенами подтверждения, закрывающими последовательность, и эпистемикой: именно в момент достижения эпистемического баланса возможное предзакрытие становится фактическим.

Мы продемонстрировали, что ресурс эпистемики активно задействован говорящими и становится решающим для понимания, в какой момент разговор должен закончиться. Клерк, запрашивая информацию, инициирует последовательности, в которых он обладает статусом К-, до тех пор, пока говорящие не достигнут эпистемического равновесия. В то же время робот, предоставляя информацию, закрывает некоторые последовательности, после чего человеком инициируются новые. Кроме того, в нашем кейсе последовательности закрываются с помощью токенов подтверждения, занимающих третью позицию (вопрос — ответ — подтверждение), которые исходят от человека и после которых также инициируются новые последовательности. При этом единственные подобные токены (строка 39) являются предзакрытием всего разговора в момент достижения эпистемического баланса, когда все детали запроса стали известны клерку.

Теперь для того чтобы посмотреть, каким образом говорящие подходят к завершению, обратимся к другому теоретическому ресурсу — организации последовательностей в разговоре. Этот ресурс позволит обнаружить особенности перехода к заключительной части по отношению к другим частям разговора.

Организация последовательностей в разговоре

В рамках изучения организации последовательностей ("sequence organisation") рассматривалось, каким образом каждый черед в разговоре либо принимает новое направление, либо сохраняет тот же самый курс действий (приветствия, запрос, серия уточняющих вопросов, закрытие) [Heritage, 1989: 32—34; Couper-Kuhlen, 2004: 335—360; Zellers, 2012: 233—236; Hoey, 2015: 443—448]. Помимо последовательной организации, в разговоре существует тематическая организация ("topic organisation"). Смена или продолжение темы и последовательностей в разговоре взаимосвязаны и могут пересекаться: по концу темы можно определить конец последовательности, но тема может продолжиться, хотя последовательность уже завершена.

Как новые начинания, так и продолжения происходят в местах возможного закрытия последовательности ("at points of possible sequence closure" [Couper-Kuhlen, 2004: 346]). Рассмотрим особенности последовательной организации для выявления средств закрытия разговора в нашем кейсе.

Инициирование новых последовательностей в разговоре

Курс действий может меняться в трех разных частях разговора. Во-первых, когда открывающая часть ("opening section of conversation") подходит к месту возможного закрытия, говорящий может ввести тему своего звонка [Couper-Kuhlen, 2004: 337].

Во-вторых, новый курс действий может быть инициирован в основной части разговора в местах возможного закрытия темы ("at points of possible topic closure in the body of the conversation"), то есть как внутри череда одного говорящего, так и между чередами разных говорящих. Последовательность может закрываться

в третьей позиции ("sequence-closing third"), что предшествует смене темы и инициации новой последовательности [Couper-Kuhlen, 2004: 344—345].

В-третьих, новое начинание может вводиться не как новая тема, а как полный переход от темы разговора к заключительной части ("closing section of conversation") в месте возможного открытия закрывающей секции [Couper-Kuhlen, 2004: 347].

Таким образом, последовательность принимает новое направление либо путем ввода новой темы в качестве причины звонка, либо через инициирование нового курса действий внутри разговора, либо когда происходит открытие заключительной части разговора.

Структура разговора робота и человека: инициирование новых подтем

Из-за того, что в нашем исследовании анализируется институциональный разговор, его общая и единственная тема — исходящий от робота запрос бронирования столика в ресторане. При этом в соответствии с организацией последовательностей можно выделить восемь блоков, подтем, которые на протяжении всего разговора открываются и закрываются.

Первый блок (строки 00—04) представляет собой открытие звонка, в котором говорящие приветствуют друг друга. После этого начинается второй блок, когда звонящий D вводит тему своего запроса, причину звонка, и происходит обсуждение даты (строки 05—11). Таким образом, открывается основная часть разговора. В строке 11 последовательность, относящаяся к обсуждению даты бронирования, подходит к месту возможного закрытия с помощью подтверждающего токена D "Mmhm":

00 ((Ring))

01 (0.3)

02 R: ( )

03 (0.9)

04 D: Hey

05 I:'m calling to make reservation? (.) I'm looking for a table on Friday the fourth!

06 (1.2)

07 R: This Friday,

08 (1.0)

09 D: Yeah

10 (0.5)

11 R: °Mmhm°

Затем курс действий меняется, начиная с фразы "Let me see" производится обработка полученной информации, а "Mmhm" D сигнализирует R, что первый ожидает продолжения разговора с его стороны (строки 12-14):

12 (0-9) -em Let me see° =

13 D: =Mmhm

14 (0.9)

После этого идет четвертый блок, в котором R инициирует новую последовательность и тему—на какое количество человек необходимо забронировать сто-

лик (строки 15—23). Данная подтема подходит к завершению в строках 22—23, когда D подтверждает количество человек, которое обсуждалось в предшествующих чередах:

15 R: S:o how many people,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

16 (1.1)

17 R: Fi[ve,

18 D: [It's fo::r two people!

19 (0.4)

20 R: For two,

21 (1.2)

22 D: Yes

23 (0.6)

В пятом блоке обсуждается новая подтема (строки 24—28), которая инициируется R в месте возможного завершения последовательности внутри основной части разговора (строка 23). Новая подтема касается определения времени; эта последовательность завершается в строке 28 с помощью повтора юнита ("Seven"). Шестой блок (строки 29—34) инициируется R после небольшой паузы (срока 29) и касается выяснения имени звонящего:

24 R: E:n what time you will come,

25 (1.2)

26 D: At seven pm

27 (0.9)

28 R: -Seven-

29 (0.9)

30 Can you say name,

31 (1.3)

32 D: E::HM (0.3) FIRST NAME IS YANIV (0.5) Y A (0.2) N I (.) V

33 (2.7)

34 R: Okayt (0.2) I got it!

После закрытия предыдущей последовательности (строка 34) происходит переход к седьмому блоку, когда после значительной паузы (строка 35) вводится резюме (строка 36) того, что обсуждалось ранее:

35 (2.9)

36 R: S:::o. It will be two people at seven o'cloc't

37 (1.6)

38 D: YES Mmhm=

Наконец, переход в заключительную часть разговора осуществляется в восьмом блоке, в котором говорящие отходят от общей темы разговора с помощью предзакрытия (строка 39). Этот блок включает в себя обмен предзакрытиями — подтверждениями и благодарностями (39—42) — и заключительную последовательность (44-47), после чего звонок заканчивается:

39 R: =Mmhm (.) okayt (.) got it !! yeh (0.2)

40 Thank yout

41 (1.9)

42 D: OK:AY A::WESOME (.) THANKS A LOT!

43 (0.5)

44 R: >°Thank you have good night°<

45 (0.2) Bye

46 (1.2)

47 D: OKAY (.) BYE-BYE

48 ... End call ...

Таким образом, в этом разговоре последовательности поочередно сменяют друг друга, пока тема продолжается. Она заканчивается в момент, когда открывается завершающая последовательность разговора, говорящие обмениваются предзакрытиями, а также вводится заключительная последовательность.

Способы изменения тем и последовательностей

Согласно Э. Купер-Кулен, тема в разговоре может продолжаться, либо принимать новое направление двумя способами: дизъюнктивно или пошагово [Couper-Kuhlen, 2004: 335—352]. В то время как последовательности либо меняются дизъюнктивно, либо продолжаются. Поскольку изменение последовательности часто пересекается со сменой темы [ibid.: 347], то можно рассматривать изменение темы как потенциальный маркер смены последовательностей.

Дизъюнктивный вид смены темы представляет собой доведение темы до конца и инициирование другой. В то время как «пошаговый» способ предполагает постепенные изменения, которые достигаются за счет того, что говорящий увязывает упомянутое раньше с новой темой, поэтому такая смена остается практически незаметной [Zellers, 2012: 235].

Способ изменения/продолжения последовательности или темы маркируется с помощью лексических, грамматических и просодических сигналов в начале нового череда [Couper-Kuhlen, 2004: 371]. Эти ресурсы работают в совокупности, однако в случаях, когда в разговоре не используются первые два ресурса, его участники могут полагаться только на просодию [ibid.: 366—372].

Купер-Кулен определяет следующие характерные черты дизъюнкции и продолжения. Лексические маркеры дизъюнкции — "hey", "oh" и подобные слова, а также обращения [ibid.: 360—371]. В роли грамматических маркеров продолжения последовательности или темы выступают «анафорические формы, указывающие на преемственность» [ibid.: 372] (например, «это», «оно»). Дизъюнктивными маркерами просодического контура могут быть паузы и вдохи, заметное повышение громкости речи и повышение тона в начале единицы конструирования череда, то есть на первом слоге [ibid.: 337—352].

Предзакрытия обычно вводятся дизъюнктивно в местах возможного завершения последовательности и характеризуются паузами и/или вдохами и повышением тона. При этом не обязательно вводится новая тема, потому что, как мы отметили ранее, курс действий может меняться, например, через переход к заключительной части разговора [ibid.: 350].

Таким образом, для того чтобы определить направление курса действий (изменение или продолжение последовательности) и тип смены темы (дизъюнктивный или пошаговый), необходимо анализировать как синтаксические, так и просодические ресурсы.

Пошаговый и дизъюнктивный способы смены темы в разговоре робота и человека

В нашем кейсе первая смена подтемы происходит из начальной части вызова постепенно и вводится с помощью растянутого "I'm", произнесенного ровным тоном (строка 05):

05^ D: I'm calling to make reservation? (.) I'm looking for a table

on Friday the fourth! 06 (1.2)

07 R: This Friday,

08 (1.0)

09 D: Yeah

10 (0.5)

11 R: °Mmhm°

Затем после паузы (строка 12) подтема пошагово сменяется с помощью тихо введенного "em" с ровной интонацией, когда R обрабатывает информацию: 12^ R: (0.9) -em Let me see° =

13 D: =Mmhm

14 (0.9)

Третья смена происходит также пошагово с помощью растянутого "s:o" с ровной интонацией (строка 15):

15^ R: S:o how many people, 16 (1.1)

17 R: Fi[ve,

18 D: [It's fo::r two people!

19 (0.4)

20 R: For two,

21 (1.2) 22 D: Yes 23^ (0.6)

Обсуждение времени начинается после небольшой задержки (строка 23) и вводится с помощью вопроса, который инициируется с растянутой "E::n" (строка 24) без повышения тона на первом слоге: 24^ R: E:n what time you will come,

25 (1.2)

26 D: At seven pm

27 (0.9)

28^ R: "Seven-

Пятая смена подтемы осуществляется после того, как предыдущая последовательность завершается в закрывающей третьей позиции, в которой R повторяет слово "seven" в качестве подтверждения (строка 28). Новая последовательность вводится пошагово после небольшой паузы (строка 29) и инициируется с помощью вопроса, который начинается с "can" и произносится ровным тоном: 29^ (0.9)

30 Can you say name,

31 (1.3)

32 D: E::HM (0.3) FIRST NAME IS YANIV (0.5) Y A (0.2) N I (.) V

33 (2.7)

34^ R: Okayt (0.2) I got it!

Затем резюме вводится постепенно после значительной паузы (строка 35) с помощью растянутого токена "So" со слегка понижающимся тоном (строка 36):

35^ (2.9)

36^ R: S:::o. It will be two people at seven o'cloc't

37 (1.6)

38 D: YES Mmhm=

Данное изменение последовательности отличается от всех предыдущих — пауза длиннее, тон приглушается (35—36). Это может говорить о том, что последовательность будет меняться, то есть вместо уточняющих вопросов будет введен новый курс действий (систематизация информации). Таким образом, инициирование череда R в 36 строке усиливает закрытие разговора, так как после подтверждения информации, возможно, начнется завершение разговора.

Наконец, седьмая смена, переход от темы разговора к заключительной части, осуществляется дизъюнктивно с помощью предзакрытия, которое произносится с повышением тона в месте возможного завершения последовательности (строка 39):

39^ R: =Mmhm (.) okayt (.) got itUyeh (0.2)

40 Thank yout

41 (1.9)

42 D: OK:AY A::WESOME (.) THANKS A LOT!

43 (0.5)

44 R: >°Thank you have good night°<

45 (0.2) Bye

46 (1.2)

47 D: OKAY (.) BYE-BYE

48 ... End call ...

Токены в третьей закрывающей позиции (строка 39) произносятся быстрее по сравнению с предыдущими токенами клерка (строка 34), а также увеличивается их количество. Это может говорить о том, что в заключительной части разговора клерк начинает прилагать больше усилий к его закрытию.

Отметим, что, во-первых, рассмотренные выше смены последовательностей инициируются только человеком в местах их возможного завершения. Занимая статус К-, клерк инициирует новые последовательности до момента достижения эпистемического равновесия, что характерно для подобного институционального разговора [Drew, Heritage, 1992: 54]. Однако робот не меняет тему, не инициирует новую последовательность и не продолжает ее в момент достижения эпистемического баланса, что уже не относится к вопросам эпистемики. Несмотря на то, что ему доступны места потенциального завершения последовательности, в которых может быть открыта новая, робот остается в статусе реципиента, побуждая клерка быть модератором [Müller, 2009: 138]. Например, в строках 34—35 в момент, когда подтверждение от клерка получено и наступает длинная пауза, где было бы уместно роботу вступить в последовательность и инициировать предзакрытие.

Однако он этого не делает, что, возможно, побуждает R мгновенно переходить к предзакрытию в строке 39.

Во-вторых, анализ ожидаемо показал, что первые шесть смен последовательности происходят пошагово, так как разговор на общую тему состоит из связанных между собой подтем. Иными словами, каждая следующая смена подтемы осуществляется постепенно, потому что она отсылает к теме общего запроса.

В-третьих, человек постепенно инициировал новые темы до тех пор, пока не получил все детали, необходимые для выполнения запроса, то есть до момента достижения эпистемического баланса между говорящими. Когда эпистемическое равновесие достигнуто, переход в заключительную часть разговора происходит не последовательно, а дизъюнктивно. Это указывает на доведение темы до конца, а также на готовность клерка закончить разговор.

Фактически разговор не заканчивается в тот момент, когда должно произойти закрытие. Для анализа этой проблематичной ситуации рассмотрим просодический контур говорящих и его влияние на исход завершения разговора.

Заключительная часть разговора: препятствия к завершению

Несмотря на то, что подтверждающие токены ("okay got it yeh") являются пред-закрытием разговора при эпистемическом балансе и вводятся дизъюнктивно, что указывает на готовность клерка заканчивать разговор, его завершению предшествует следующая последовательность (строки 41—42):

36 R: S:::o. It will be two people at seven o'cloc't

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

37 (1.6)

38 D: YES Mmhm=

39^ R: =Mmhm (.) okayt (.) got itUyeh (0.2)

40 Thank yout

41^ (1.9)

42^ D: OK:AY A::WESOME (.) THANKS A LOT!

Робот вступает в разговор в строке 42, но его черед не продвигает завершение, а расширяет его: Duplex заметно задерживается с ответом (строка 41), растягивает первые два слова и говорит громче, чем в предыдущих чередах (строка 42).

Как мы выяснили ранее, робот во всех частях разговора выступает в роли реципиента. Подобная реципиентность легитимна для этого типа сервисного звонка, где инициирует последовательности говорящий с К- статусом. Однако в заключительной части разговора реципиентность робота, которая растягивает закрытие разговора, остается непонятной.

Реципиентность в ситуациях аффилирования и дизаффилирования

Для анализа закрывающей секции разговора рассмотрим две ситуации использования токенов подтверждения реципиентом ("hm", "uh huh", "yeah", "yes", "right" и другие): «аффилирования» ("affiliation") и «дизаффилирования» ("disaffiliation") [Müller, 2009: 138—139].

Аффилирование представляет собой ситуацию, когда модератор подходит к заключительной части разговора — например, запрашивает подтверждение ("requests clarification"), и реципиент подтверждает запрос с помощью соответ-

ствующего токена, который своей синтаксической конструкцией и просодией согласуется с последовательностью говорящего-модератора. Просодически такие токены произносятся с пониженной громкостью, более низким или ровным тоном, при этом речь может быть ускорена. Подобный токен с описанными интонационными характеристиками может закрывать разговор [Müller, 2009: 140—149].

Однако, когда модератор инициирует заключительную часть разговора, а реципиент уклоняется ("moves out") от закрытия и подобное расширение последовательности не поощряется, это характеризует ситуацию дизаффилирования. При этом токены подтверждения могут отсутствовать или звучать «не в тон» ("out of tune"), быть «не на месте» ("out of place"), «вне ритма» ("out of rhythm"). Тогда модератор может управлять сложившейся ситуацией, не позволяя реципиенту задерживать закрытие и сводя к минимуму дальнейшее расширение [Müller, 2009: 149—159].

Реципиентность Duplex: ситуация дизаффилирования

Клерк, который является модератором данного разговора, готов к его закрытию. Как мы выяснили ранее, на это указывает дизъюнктивный ввод предзакры-тия (строка 39), после того как был достигнут эпистемический баланс. Кроме того, на завершенность также указывает просодический контур этого предзакрытия, который характеризуется интонационным спадом. Следующий черед клерка (строка 40)—токен благодарности, произнесенный со слегка повышающейся интонацией,—запрашивает подтверждение закрытия:

36 R: S:::o. It will be two people at seven o'cloc't

37 (1.6)

38 D: YES Mmhm=

39^ R: =Mmhm (.) okayt (.) got it !! yeh (0.2) 40^ Thank yout 41^ (1.9)

42^ D: OK:AY A::WESOME (.) THANKS A LOT!

В то же время Duplex, хотя синтаксически и подтверждает предзакрытие (строка 42), то есть не собирается вводить новую тему, демонстрирует просодические несоответствия заключительной части разговора: делает заметно длинную паузу (строка 41), растягивает слова и говорит громче. Из этого следует, что токены подтверждения ("Okay awesome") и благодарности ("Thanks a lot") робота-реципиента находятся в ситуации дизаффилирования, то есть просодически «не на месте».

Клерк пресекает просодическое расширение заключительной части разговора с помощью ускоренной и тихой речи, а также вводит прощание (строка 45): 44 R:>°Thank you have good night°< 45^ (0.2) Bye

Заключительный черед робота также сопровождается паузой, хоть и меньшей по длительности (строка 46), однако произносится громко и с ровной интонацией (строка 47). Это говорит о том, что робот продолжает совершать терминальный обмен, просодически не соответствуя действиям клерка: 46^ (1.2)

47^ D: OKAY (.) BYE-BYE 48 ... End call ...

Подводя итог: в заключительной части разговора просодия робота находится в ситуации дизаффилирования и затягивает закрытие, вступая в противоречие с намерением и готовностью клерка закончить разговор. Тем самым разговор продолжается, но ничего нового не происходит; прощание задерживается. Это противоречие разрешается быстро, благодаря ограничительным действиям клерка — вступлению в черед с минимальной заминкой, ускоренному темпу высказываний и вводу токена прощания. Подобные действия могут объясняться тем, что «для принимающего вызов это совершенно рутинный, уже десятый звонок, который он получил в этот день» [Drew, Heritage, 1992: 51]. В источнике идет речь о звонке в экстренную службу, но в нашем примере для клерка это столь же привычный, будничный звонок, поэтому он побыстрее хочет его закончить.

Характерные черты Duplex как препятствие к завершению разговора

К рассмотренным речевым чертам робота (повышенная громкость, ровный тон, растянутость речи) добавим, что выявленные продолжительные задержки с ответом (строка 41, 46) в заключительной части разговора ничем не заполняются и никак не маркируются. Их нельзя легитимировать совмещением двух активностей, как в случае с клерком в нашем примере (строки 27 и 33), который одновременно запрашивает и записывает информацию. Таким образом, задержки клиента с ответом в нашем примере можно объяснить только тем, что в качестве говорящего выступает робот. Несмотря на то что разработчики данной системы запрограммировали использование "hmm"s, "uh"s и пр. для того, чтобы сигнализировать собеседнику обработку задачи и нивелировать ожидание8, наш анализ показывает, что у робота не всегда есть подобные маркеры, что создает проблемные моменты в разговоре. В отличие от человека «оправдать» задержки робота в этом кейсе можно только долгой обработкой данных.

Таким образом, препятствуют завершению беседы растянутость, громкость, ровный тон речи и заметно длинные паузы робота в заключительной части разговора, где эти роботические черты неуместны.

Выводы

В данном исследовании был проанализирован разговор между человеком-оператором и роботической системой Google Duplex с точки зрения закрытия данного разговора. Мы рассмотрели, каким образом организуются темы и последовательности в разговоре, с помощью эпистемики выяснили, как достижение эпистемического баланса способствует закрытию разговора, а также выявили присущие роботу черты, которые влияют на данное закрытие.

Мы искали ответы на два ключевых вопроса: 1) как демонстрируемые роботом черты связаны с институциональными ролями говорящих, и 2) с помощью каких средств происходит закрытие данного разговора. Наш анализ показал, что клерк, обладая статусом К-, в течение всего разговора выступает в роле модератора: задает вопросы, контролирует введение тем, инициирует фактическое

8 Leviathan Y., Matias Y. Google AI Blog: Google Duplex: An AI System for Accomplishing Real-World Tasks Over the Phone. 2018. 8 May. URL: https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html (accessed: 18.02.2021).

предзакрытие разговора, а также первую парную часть терминального обмена ("bye"). В то же время клиент-робот, обладая статусом К+, является реципиентом — отвечает клерку. В данном случае институциональная роль говорящего и его эпистемический статус соответствуют друг другу: для говорящего, выступающего в роли профессионала, характерно управлять последовательностями в разговоре и задавать вопросы. Этим профессионалом является оператор со статусом К-, который инициирует вопросы, а также вопросительные декларативы, для того чтобы достичь эпистемического равновесия с собеседником. Равным образом, для говорящего, выступающего в роли клиента, также характерно давать ответы, что совпадает с его эпистемическим статусом К+. Кроме того, в момент достижения эпистемического равновесия оператор инициирует предзакрытие, что тоже характерно для институционального разговора, в котором клерк, выполнив запрос, начинает завершать разговор. При этом инициирование фактического предзакры-тия оператором осуществляется дизъюнктивно, что указывает на его готовность заканчивать разговор. Таким образом, до заключительной части роботические черты не влияют на происходящее взаимодействие.

В заключительной части робот по-прежнему ведет себя как реципиент, однако просодический контур его ответов начинает конфликтовать с намерением клерка завершить разговор и задерживает закрытие. Duplex, с одной стороны, продолжает разговор, а с другой — не говорит ничего нового, его действия не способствуют закрытию. Синтаксически робот поддерживает предзакрытие, а также само прощание, но его просодия противоречива. Именно специфические черты речи робота (заметные задержки с ответом, растянутая речь, высокая громкость, ровная интонация), а не его институциональная роль задерживают разговорное закрытие, так как эти просодические черты находятся «не на месте».

Наблюдаемое уклонение от закрытия решается благодаря институциональной роли оператора. Текущий звонок должен закончиться, когда будет выполнен запрос и если не будут инициированы другие, поэтому проблематичное завершение разговора управляется клерком с помощью речевых ограничений на затянутое прощание, что в конечном итоге приводит к закрытию разговора.

Дискуссия

В данной работе мы проанализировали, как функционирует разговорное закрытие в специфическом кейсе, когда один из говорящих—робот. Полученные результаты закладывают основу для детального исследования организации разговора человека с продвинутым искусственным интеллектом и способствуют более глубокому пониманию того, как завершается разговор в подобных пограничных случаях. Несмотря на то что в данном разговоре собеседники обмениваются предзакрытиями, а затем прощаниями, его успешному завершению препятствует не подходящий для закрывающей части просодический контур робота. При дальнейшем изучении разговоров между человеком и искусственным интеллектом необходимо учитывать просодические особенности робота, так как они влияют на протекание сервисных звонков. В целом просодический контур должен рассматриваться как значимый ресурс для успешного завершения разговора.

Кроме того, в настоящей статье мы предприняли попытку соединить вопросы эпистемики, анализ просодического контура и организацию последовательностей в разговоре. Это дает целостное представление о том, в какой момент разговора собеседники намереваются его закончить, каким образом они этого достигают, какие проблематичные ситуации возникают и как говорящие их решают.

Неисследованным остался вопрос, как роботизированное эпистемическое позиционирование влияет на разговорные результаты и динамику информационной асимметрии между взаимодействующими. В рамках этой статьи робот занимал позицию «знающего», не способного первым завершить разговор, в последующих исследованиях было бы продуктивно изучить влияние «незнания» робота на результаты разговора.

Наконец, наши результаты наглядно демонстрируют, как программирование искусственного интеллекта может привести к неожиданным последствиям для разговора, и задают курс на основанное на эмпирических данных проектирование интерфейсов. Обладая более натуральным звучанием по сравнению с другими роботами, Google Duplex очень похож на человека [O'Leary, 2019]. Несмотря на это, сделанные выводы показывают, что взаимодействие между оператором и роботом не протекает гладко, так как просодия робота не настроена на успешное прощание.

Список литературы

Сакс Х., Щеглофф Э., Джефферсон Г. Простейшая систематика организации очередности в разговоре // Социологическое обозрение. 2015. Т. 14. № 1. С. 142— 202. URL: https://sociologica.hse.ru/2015-14-1/147275640.html (дата обращения: 22.02.2021)

Sacks H., Schegloff E., Jefferson G. (2015) A Simplest Systematics for the Organization of Turn-Taking for Conversation. Sociological Review. Vol. 14. No. 1. P. 142—202. URL: https://sociologica.hse.ru/2015-14-1/147275640.html (accessed: 22.02.2021). (in Russ.)

Broth M., Mondada L. (2013) Walking Away: The Embodied Achievement of Activity Closings in Mobile Interaction. Journal of Pragmatics. Vol. 47. No. 1. P. 41—58. https:// doi.org/10.1016/j.pragma.2012.11.016.

Button G. (1990) Going Up a Blind Alley: Conflating Conversation Analysis and Computational Modelling. In: Luff P., Gilbert N., Fronlich D. Computers and Conversation. London: Academic Press. P. 67—90. https://doi.org/10.1016/b978-0-08-050264-9.50009-9.

Button G., Lee J. R. E. (1987) Talk and Social Organisation. Intercommunication. Vol. 1. Clevedon: Multilingual Matters.

Couper-Kuhlen E. (2004) Prosody and Sequence Organization in English Conversation. In: Couper-Kuhlen E., Ford C. E. (eds.) Sound Patterns in Interaction. Typological Studies in Language. Vol. 62. Amsterdam: John Benjamins Publishing Company. P. 335—376. https://doi.org/10.1075/tsl.62.17cou.

Couper-Kuhlen E., Selting M. (2009) Towards an Interactional Perspective on Prosody and a Prosodic Perspective on Interaction. In: Couper-Kuhlen E., Selting, M. (eds.) Prosody in Conversation. Cambridge: Cambridge University Press. P. 11—56. https:// doi.org/10.1017/cbo9780511597862.003.

Drew P., Heritage J. (1992) Talk at Work: Interaction in Institutional Settings. Studies in Interactional Sociolinguistics. Vol. 8. Cambridge: Cambridge University Press.

Haddington P. (2019) Leave-Taking as Multiactivity: Coordinating Conversational Closings With Driving in Cars. Language & Communication. Vol. 65. P. 58—78. https:// doi.org/10.1016/j.langcom.2018.04.003.

Heritage J. (1989) Current Developments in Conversation Analysis. In: Roger D., Bull P. (eds.) Conversation: An Interdisciplinary Perspective. Clevedon: Multilingual Matters. P. 21—47.

Heritage J. (2012a) Epistemics in Action: Action Formation and Territories of Knowledge. Research on Language and Social Interaction. Vol. 45. No. 1. P. 1—29. https://doi.org/ 10.1080/08351813.2012.646684.

Heritage J. (2012b) Epistemics in Conversation. In: Sidnell J., Stivers, T. (eds.) The Handbook of Conversation Analysis. Chichester: Wiley-Blackwell. P. 370—394. https:// doi.org/10.1002/9781118325001.ch18.

Heritage, J. (2012c) The Epistemic Engine: Sequence Organization and Territories of Knowledge. Research on Language and Social Interaction. Vol. 45. No. 1. P. 30—52. https://doi.org/10.1080/08351813.2012.646685.

Heritage J. (2013) Action Formation and Its Epistemic (and Other) Backgrounds. Discourse Studies. Vol. 15. No. 5. P. 551—578. https://doi.org/10.1177/1461445613501449.

Hoey E. M. (2015) Lapses: How People Arrive at, and Deal With, Discontinuities in Talk, Research on Language and Social Interaction. Vol. 48 No. 4. P. 430—453. https:// doi.org/10.1080/08351813.2015.1090116.

Jefferson G. (1984) Notes on a Systematic Deployment of the Acknowledgement Tokens «Yeah»; and «Mm Hm». Paper in Linguistics. Vol. 17. No. 2. P. 197—216. https://doi.org/ 10.1080/08351818409389201.

Jefferson G. H. (2004) Glossary of Transcript Symbols With an Introduction. In: Lerner G. H. (ed.), Conversation Analysis: Studies From the First Generation. Pragmatics & Beyond New Series. Vol. 125. Amsterdam: John Benjamins Publishing. P. 13—31. https:// doi.org/10.1075/pbns.125.02jef.

Klowait N. (2017) A Conceptual Framework for Researching Emergent Social Orderings in Encounters With Automated Computer-Telephone Interviewing Agents. The International Journal of Communication and Linguistic Studies. Vol. 15. No. 1. P. 19—37. URL: https://cgscholar.com/bookstore/works/a-conceptual-framework-for-research-ing-emergent-social-orderings-in-encounters-with-automated-computertelephone-in-terviewing-ag?category_id=cgrn&path=cgrn%2F228 %2F230 (accessed: 18.02.2021).

Klowait N. (2018) Reflexive Anthropomorphism: Ontological Ignorance, or Ignorant Ontology? Sociological Journal. Vol. 24. No. 1. P. 8—33. https://doi.org/10.19181/ socjour.2018.24.1.5711.

Klowait N., Erofeeva M. A. (2021) The Rise of Interactional Multimodality in HumanComputer Interaction. Monitoring of Public Opinion: Economic and Social Changes. No. 1. P. 46—70.

Markman K. M. (2006) Computer-Mediated Conversation: The Organization of Talk in Chat-Based Virtual Team Meetings, Ph.D. diss... Department of Communication Studies. Austin, TX: The University of Texas at Austin. URL: http://hdl.handle.net/2152/2582 (accessed: 18.02.2021).

Mondada L. (2014) Pointing, Talk, and the Bodies. In: Seyfeddinipur M., Gullberg M., Kendon A. (eds.) From Gesture in Conversation to Visible Action as Utterance: Essays in Honor of Adam Kendon. Amsterdam; Philadelphia, PA: John Benjamins Publishing Company. P. 95—124. https://doi.org/10.1075/z.188.06mon.

Moore R. J., Arar R. (2019) Conversational UX Design: A Practitioner's Guide to the Natural Conversation Framework. New York, NY: ACM Books. https://doi.org/10.1145/ 3304087.

Müller F. E. (2009) Affiliating and Disaffiliating With Continuers: Prosodic Aspects of Recipiency. In: Couper-Kuhlen E., Selting M. (eds.) Prosody in Conversation: Interactional Studies. Cambridge: Cambridge University Press. P. 131—176.

O'Leary D.E. (2019) GOOGLE'S Duplex: Pretending to be Human. Intelligent Systems in Accounting, Finance and Management. Vol. 26. No. 1. P 46—53. https://doi.org/10.1002/ isaf.1443.

Pojanapunya P., Jaroenkitboworn K. (2011) How to Say «Good-Bye» in Second Life. Journal of Pragmatics. Vol. 43. No. 14. P. 3591—3602. https://doi.org/10.1016/ j.pragma.2011.08.010.

Raymond G. (2004) Prompting Action: The Stand-Alone «So» in Ordinary Conversation. Research on Language & Social Interaction. Vol. 37. No. 2. P. 185—218. https://doi.org/ 10.1207/s15327973rlsi3702_4.

Sacks H., Schegloff E. A., Jefferson, G. (1974) A Simplest Systematics for the Organization of Turn-Taking for Conversation. Language. Vol. 50. No. 4. P. 696—735. https:// doi.org/10.1353/lan.1974.0010.

Schegloff E. A. (2009) A Practice for (Re-)Exiting a Sequence: And/But/So + Uh(m) + Silence. In: Turner, K. (ed.) Language in Life, and a Life in Language: Jacob Mey, a Festschrift. Studies in Pragmatics. Bingley: Emerald. P. 365—374. https://doi.org/10.1163/ 9789004253209_047.

Schegloff E. A., Sacks H. (1973) Opening up Closings. Semiotica. Vol. 8. No. 4. P. 289— 327. https://doi.org/10.1515/semi.1973.8.4.289.

Selting M. (1996) On the Interplay of Syntax and Prosody in the Constitution of Turn-Constructional Units and Turns in Conversation. Pragmatics. Vol. 6. No. 3. P. 371—388. https://doi.org/10.1075/prag.6.3.06sel.

Wooffitt R. (1997) Humans, Computers and Wizards: Analysing Human (Simulated) Computer Interactions. London: Routledge.

Zellers M. (2012) Prosodic Variation for Topic Shift and Other Functions in Local Contrasts in Conversation. Phonetica. Vol. 69. No. 4. P. 231—253. https://doi.org/10.1159/ 000353445.

Приложение 1.

Список символов транскрипта:

[ Левая квадратная скобка означает, что на начало речи текущего говорящего накладывается речь другого. R: Fi[ve,

D: [It's fo::r two people!

= Знак равно означает, что нет промежутка между словами. R: °Mmhm° (0.9) °em Let me see° = D: =Mmhm

(0.0) Число в скобках означает истекшее время в десятых долях секунды. R: E:n what time you will come, (1.2)

D: At seven pm

(.) Точка в скобках означает короткий интервал (± одна десятая секунды) в пределах или между высказываниями.

D: I:'m calling to make reservation? (.) I'm looking for a table on Friday the fourthl

: Двоеточие означает продление непосредственно предшествующего звука. Чем больше двоеточий, тем больше удлинение. R: S:o how many people, (1.1) R: Fi[ve,

D: [It's fo::r two peoplel

_Подчеркивание обозначает форму ударения.

R: E:n what time you will come, (1.2)

D: At seven pm

Tl Стрелки означают повышение или понижение тона. D: YES MmhmT=

R: =MmhmT (.) okayT (.) got itllyeh (0.2)

, Запятая означает направление интонации вверх, что обычно соответствует вопросительной форме.

R: S:o how many people, (1.1) R: Fi[ve,

. Точка означает слегка понижающийся тон.

R: S:::o. It will be two people at seven o'cloc'T

? Вопросительный знак связан с вопросительной интонацией. D: Hey, I:'m calling to make reservation? (.) I'm looking for a table on Friday the fourth!

WORD Прописные буквы означают высокую громкость по отношению к окружающему разговору.

D: OK:AY A::WESOME (.) THANKS A LOT! (0.5)

R:>°Thank you have good night°<

(0.2) Bye

(1.2)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

D: OKAY (.) BYE-BYE

°word° Знаки градуса, заключающие высказывание или его часть, означают, что звуки тише, чем окружающий разговор. D: At seven pm (0.9)

R: -Seven- (0-9) Can you say name,

><word Знаки больше и меньше означают повышенную скорость высказывания по отношению к общему темпу разговора. R:>°Thank you have good night°<

( ) Пустые круглые скобки означают невозможность понять, что говорится.

R: (

)

Мониторинг общественного мнения: экономические и социальные перемены Monitoring of Public Opinion: Economic and Social Changes

№ 1 (161) январь — февраль 2021 No. 1 January — February 2021

Приложение 2

Транскрипт

00 ((Ring))

01 (0.3)

02 R: ( )

03 (0.9)

04 D: Hey

05 I:'m calling to make reservation? (.) I'm looking for a table on Friday the fourth!

06 (1.2)

07 R: This Friday,

08 (1.0)

09 D: Yeah

10 (0.5)

11 R: °Mmhm°

12 (0-9) -em Let me see° =

13 D: =Mmhm

14 (0.9)

15 R: S:o how many people,

16 (1.1)

17 R: Fi[ve,

18 D: [It's fo::r two people!

19 (0.4)

20 R: For two,

21 (1.2)

22 D: Yes

23 (0.6)

24 R: E:n what time you will come,

25 (1.2)

26 D: At seven pm

27 (0.9)

28 R: "Seven-

29 (0.9)

30 Can you say name,

31 (1.3)

32 D: E::HM (0.3) FIRST NAME IS YANIV (0.5) Y A (0.2) N I (.) V

33 (2.7)

34 R: OkayT (0.2) I got itl

35 (2.9)

36 R: S:::o. It will be two people at seven o'cloc'T

37 (1.6)

38 D: YES Mmhm=

39 R: =Mmhm (.) okayT (.) got itllyeh (0.2)

40 Thank youT

41 (1.9)

42 D: OK:AY A ::WESOME (.) THANKS A LOT!

43 (0 •5)

44 R: >°Thark you have good right°<

45 (0 .2) Bye

46 (1 •2)

47 D: OKAY (. ) BYE-BYE

48 Erd call

КАК ПОПРОЩАТЬСЯ С РОБОТОМ? ИССЛЕДОВАНИЕ ДОСТИЖЕНИЯ РАЗГОВОРНОГО ЗАКРЫТИЯ Текст научной статьи по специальности «Языкознание и литературоведение»

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Егорова А. И., Кловайт Н.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Егорова А. И., Кловайт Н.

HOW TO SAY GOOD-BYE TO A ROBOT? THE MATTER OF CONVERSATIONAL CLOSING

Текст научной работы на тему «КАК ПОПРОЩАТЬСЯ С РОБОТОМ? ИССЛЕДОВАНИЕ ДОСТИЖЕНИЯ РАЗГОВОРНОГО ЗАКРЫТИЯ»