«Простите, я никак не могу понять»: способы реагирования на непонимание во взаимодействии человека и робота

Корбут Андрей

роститЕ, я никак не могу Понять»:

о

-О

(О

00

о

см

е

о

способы реагирования на непонимание во взаимодействии человека и робота

е

Андрей Корбут

Андрей Корбут - кандидат социологических наук, старший научный сотрудник Центра фундаментальной социологии НИУ ВШЭ. Адрес для переписки: НИУ ВШЭ, ул. Старая Басманная, 21/4, к. А205, Москва, 105066, Россия. [email protected].

В данной работе использованы результаты проекта «Реакция, справедливость и прогресс: социальный порядок в перспективе фронетических социальных наук», реализуемого в рамках Программы фундаментальных исследований НИУ ВШЭ в 2018 году.

Я благодарю Юлию Августис, Николая Белова, Алису Максимову, Кристину Попову, Артема Рейнюка и Александра Широкова, чьи транскрипты я использовал в настоящей статье и с кем обсуждал представленные данные.

В статье рассматриваются способы обращения с непониманием, возникающим в ходе взаимодействия людей с роботами. Основное внимание уделяется тому, как люди реагируют на открытое выражение непонимания со стороны робота, а также на непонимание, которое сам робот не «осознает». Методологической рамкой исследования выступает этнометодологический конверсационный анализ, предполагающий выявление способов производства локального социального порядка в последовательностях действий. Посредством анализа разговоров между абонентами одной из российских справочных служб и роботом показано, что, несмотря на представления о непонимании как негативном феномене, заключающемся в отсутствии понимания, само непонимание является ситуативным и согласованным достижением участников взаимодействия. В статье выделяются два типа условий непонимания между человеком и роботом: институциональные (связанные со специфическим организационным контекстом, в котором протекает взаимодействие и который в нем производится) и интеракционные (связанные с организацией взаимодействия). На основе детального анализа транскриптов записей телефонных разговоров людей с роботами выделяются пять способов реагирования на непонимание: изменение акустических особенностей реплик (повышение громкости голоса, замедление, удлинение пауз и т. д.), расширение первоначального высказывания (например, введение поясняющих слов), сокращение реплики до «ключевых» слов, игнорирование непонимания, добавление объяснений. При этом люди не только

001: 10.25285/2078-1938-2018-10-3-57-78

реагируют на непонимание со стороны робота после его возникновения, но и активно предугадывают его, выстраивая свои реплики так, чтобы они были понятны роботу. Выявленные особенности взаимодействия «человек - робот» позволяют не только более точно описать специфику взаимодействия людей с подобными инте-ракционными агентами, получающими все большее распространение в повседневной жизни, но и показать, что непонимание является не сбоем в понимании, а социальным достижением участников взаимодействия - будь то люди или роботы. Поскольку непонимание должно демонстрироваться и распознаваться в деталях и последовательностях действий, необходимо рассматривать его как самостоятельный интеракционный феномен.

Ключевые слова: человеко-компьютерное взаимодействие; робот; социальное взаимодействие; справочная служба; этнометодология; конверсационный анализ

Распространение технических интеракционных агентов, взаимодействие с которыми предполагает разговор, ставит перед исследователями социальных взаимодействий ряд вопросов, касающихся анализа особенностей организации коммуникации между людьми и этими агентами. Один из основных вопросов: каким образом люди и технические агенты достигают понимания не только друг друга, но и характера самой ситуации взаимодействия? Можно ли рассматривать понимание между человеком и техническим интеракционным агентом (далее я буду называть его «робот» в широком смысле слова, хотя данный термин, безусловно, может иметь и более узкое значение) так же, как мы рассматриваем взаимодействия между людьми? Чтобы ответить на эти вопросы, необходимо решить ряд более мелких, один из которых: каким именно образом демонстрируется понимание во взаимодействии между человеком и роботом? В данной статье я постараюсь прояснить этот вопрос, сфокусировавшись на «темной стороне» понимания - непонимании.

Интерес к непониманию обусловлен в данном случае несколькими причинами. Во-первых, проблема непонимания до сих пор находится в тени проблемы понимания. Понимание рассматривается если не как цель, то как условие любых совместных действий1. Эта идея лежит в основе многих социологических (Шюц 2004; Giddens 2007), социолингвистических (Gumperz 1992) и философских (Га-дамер 1988; Grice 1989; Kvanvig 2003) работ2, в которых исследователи пытаются установить, каким образом люди достигают понимания, как это понимание выражается и какие функции оно выполняет в социальных ситуациях. Соответственно, непонимание воспринимается как отсутствие понимания, то есть как сбой в понимании, вызванный случайными либо систематическими помехами3. Непонимание

1 О доминировании интереса к пониманию в исследованиях коммуникации и необходимости смещения фокуса внимания на непонимание см.: Lawrence (1999).

2 Обзор того, как проблема понимания различным образом связывалась с проблемой языка, можно найти в: Taylor (1992).

3 Эта же логика может распространяться на любые типы взаимодействия, в том числе «человек - робот». Например, Богус и Рудницкий (Bohus and Rudnicky 2008), анализируя непонимание между человеком и компьютером, применяют четырехчленную коммуникативную модель «цель - намерение - сигнал - канал», показывая, почему и каким образом помехи и сбои на каждом из этих уровней вызывают непонимание между человеком и компьютерной системой.

в таком случае представляет собой отклонение от «нормального» хода интерак-ционных событий, возвращение к которому требует устранения непонимания. Такой взгляд предполагает, что исследователь делит все, что происходит в социальном взаимодействии, на две части: «хорошую» и «плохую», первую («хорошее понимание») моделируя исходя из ряда теоретических и повседневных соображений, а вторую («плохое непонимание») рассматривая как негативный отпечаток первой, как неспособность использовать «нормальные» механизмы взаимодействия. Однако если не рассматривать непонимание как сбой в понимании, можно обнаружить, что в основе непонимания тоже лежат «нормальные» механизмы его производства, демонстрации и реагирования на него. В представленной статье будет показано, как непонимание демонстрируется и понимается при взаимодействии с роботом.

Во-вторых, непонимание представляет собой одну из характерных черт взаимодействия с роботами. Безусловно, непонимание составляет горизонт любых социальных взаимодействий, однако при взаимодействии с роботом люди сталкиваются с особым интеракционным агентом, не похожим на хрестоматийных участников ситуаций непонимания - животных и иностранцев. Принципиальное отличие технических интеракционных агентов состоит в том, что они представляют собой полусамостоятельные сущности, которые созданы человеком и выполняют заложенные в них людьми правила, но при этом данная связь не предъявлена, правила «спрятаны» и в качестве партнеров по взаимодействию эти агенты действуют автономно. Роботы оказываются специфически непонятны: люди не понимают, каким образом роботы устроены и по каким принципам действуют. В то же время люди создают проблемы для роботов, с которыми взаимодействуют и которые должен использовать заложенный в них механизм «понимания» людей. Это не то же самое «понимание», что в случае понимания роботов людьми, но на уровне взаимодействия это аналогичная практика: как и люди, роботы должны понимать, что говорит партнер по взаимодействию и как он/она это говорит.

Указанные выше обстоятельства обусловливают необходимость изучения того, как непонимание выражается во взаимодействии с роботом и как участники реагируют на него. Этому и посвящена данная статья. Основной акцент в ней сделан на том, как люди реагируют на возникающее непонимание со стороны робота. При этом я исходил из двух допущений. Во-первых, непонимание не может состоять в отсутствии единодушия или единомыслия по поводу значений слов, жестов и вещей, в которых состоит взаимодействие. Непонимание должно рассматриваться как наглядный результат интеракционной работы, как наблюдаемый ситуационный феномен (относительно ситуационного подхода к пониманию см.: Antaki 2012; Gardner 1998; Hindmarsh, Reynolds, and Dunne 2011; LeBaron and Koschmann 2002; Macbeth 2011; Mondada 2011). Непонимание должно демонстрироваться во взаимодействии. Во-вторых, понимание в таком случае оказывается одним из локальных феноменов взаимодействия, а не главным или единственным его результатом или условием. Понимание не отличается от других интеракционных феноменов (непонимания, смеха, перечислений, шуток, историй и т. д.) по своему

статусу во взаимодействии. Его производят в последовательностях действий и в виде последовательностей действий (Moerman and Sacks 1988).

Исследование опирается на базовые принципы этнометодологического кон-версационного анализа4. Достоинство этого подхода состоит в том, что он позволяет рассматривать интеракционные феномены как конкретные, наблюдаемые вещи, узнаваемость которых является условием и результатом действий самих участников, а также указывает на существование социальной организации, которая заключается в методах производства ситуативного порядка и не может быть сведена ни к мотивам и интенциям участников взаимодействия, ни к более широким социальным структурам (институтам, ролям, рынкам, культурам, смыслам, кодам, полям), якобы предопределяющим характер этих взаимодействий.

В предлагаемой статье я опишу и проанализирую в русле этнометодологического конверсационного анализа некоторые способы реагирования на непонимание во взаимодействии «человек - робот». На материале разговоров между абонентами, звонящими в телефонную справочную службу, и роботом, обрабатывающим их звонки, будет показано, как непонимание выражается роботом и каким образом люди реагируют на него. В результате мы увидим не только, как человек может не понимать робота, но и как робот может не понимать человека, что представляет потенциальную ценность для последующего анализа и моделирования взаимодействий между людьми и роботами.

Я начну рассмотрение с анализа того, каким образом непонимание выражается во взаимодействии между людьми, что позволит более точно указать на специфику непонимания во взаимодействии «человек - робот».

способы выражения непонимания в человеческом взаимодействии

Непонимание составляет привычный элемент повседневных взаимодействий. Хотя мы не сталкиваемся с непониманием постоянно, мы знаем, как оно «выглядит» и что с ним делать. Разумеется, непонимание может никак не выражаться. О том, что это необязательно приводит к распаду взаимодействия, свидетельствует наша способность поддерживать разговор даже в очень шумном месте, когда мы не можем слышать собеседника. Жестов и мимики другого участника или

4 Об этнометодологическом конверсационном анализе см.: Lynch (2000). Для «классического» конверсационного анализа ключевой является работа Сакса, Щеглоффа и Джефферсон (2015), на которую я буду в дальнейшем опираться. Этнометодологический конверсационный анализ можно отделить от «чистого» конверсационного анализа: в первом социальное взаимодействие рассматривается как локальная работа, всегда связанная с той конкретной практикой, в осуществлении которой эта работа заключается. Разговор, соответственно, рассматривается не с точки зрения его «разговорности», то есть его формальных структур как разговора, а с точки зрения практических задач, решаемых в каждый момент разговора. Разумеется, четкое различие здесь провести невозможно, поскольку конверсационный анализ изначально складывался в рамках этн о методологи и. Данное различение носит скорее предупредительный характер - оно призвано указать, что в настоящем тексте анализируется не то, как устроен разговор, а как с помощью определенного устройства разговора осуществляется некоторая работа.

участников взаимодействия достаточно, чтобы смеяться или молчать в «нужные» моменты, хотя при этом мы не понимаем, что говорится.

Соответственно, непонимание можно рассматривать более широко - как непонимание не только слов, но и других особенностей происходящего, и более узко - как непонимание только того, что говорится. Ниже я буду говорить о непонимании в узком смысле слова, прежде всего потому, что данные, которые будут обсуждаться в дальнейшем, - записи телефонных разговоров - предполагают доступ участников только к произносимым словам и сопутствующим звуковым элементам поведения5.

Второе различение, которое необходимо провести, прежде чем обсуждать непонимание, - различение между недопониманием (ошибочным пониманием) и непониманием. Это стандартное различение для исследований интеракционных сбоев6: участник взаимодействия может понимать, что он что-то не понимает, и не понимать этого, то есть может осознавать и не осознавать свое непонимание. Что значит в данном случае «осознавать» и с чьей точки зрения может фиксироваться непонимание - сложные вопросы, к обсуждению которых мы вернемся позже. Есть также промежуточная форма непонимания, когда участник не уверен в том, правильно ли он что-то расслышал или понял. Мы не будем останавливаться на этой форме, поскольку нас будет интересовать «простое» непонимание, однако она является важным средством, при помощи которого может производиться непонимание, поскольку три выделенные формы непонимания могут определенным образом превращаться друг в друга. Например, один из участников взаимодействия может выдавать отсутствие понимания за неуверенное понимание (скажем, в ситуации, когда собеседница упоминает какого-то «Павла» и участник не понимает, о ком идет речь, он может спросить, «не тот ли это Павел, который...», однако при этом он будет спрашивать, не чтобы избавиться от неуверенности относительно того, о том ли «Павле, который.» идет речь, а чтобы вообще выяснить, о каком Павле говорится).

Наконец, можно указать на еще одно различение, которое связано с «авторством» непонимания. Можно выражать как свое непонимание, так и непонимание другого. Второе встречается значительно реже первого, поскольку обычно предполагается, что выражение непонимания - право и, в некоторых случаях, обязанность того, кто не понимает, однако один из участников взаимодействия может считать нужным указать, что другой что-то не понимает. Например, фраза «ты до этого еще не дорос», произносимая во взаимодействии взрослого и ребенка, может «вменять» непонимание собеседнику. В этих случаях один участник взаимодействия может вести себя так, как если бы другой не понимал, даже если другой

5 Эти элементы могут быть достаточно разнообразны и не ограничиваются только тем, что можно делать при помощи речевого аппарата. Люди могут кашлять, чихать, вдыхать и выдыхать, стучать по столу, ронять вещи, и все это может быть доступно другому участнику телефонного разговора и использоваться им для понимания того, что происходит. В этом смысле речь занимает хоть и особое, но лишь одно из мест в целой серии «звуковых действий», составляющих телефонный разговор.

6 См.: Bazzanella and Damiano (1999); Dua (1990); Grimshaw (1980); Young (1999).

не демонстрирует непонимание. Например, если после вопроса собеседник не дает ответа, это может означать, что он не понял, что был задан вопрос (хотя отсутствие второй части в паре вопрос - ответ может, разумеется, иметь и другое значение). В дальнейшем мы будем обсуждать только ситуации выражения своего непонимания.

Впрочем, перечисленные различения не носят строгого характера. Как и любые различения, они укоренены в повседневном языке, определенность которого является ситуационным достижением и обусловливается контекстом произнесения высказываний. В этом отношении дать четкое определение «непонимания» невозможно. При этом мы достаточно устойчиво используем данное слово, не испытывая потребности каждый раз его пояснять. Это означает, что у его употребления есть прагматические ограничители (когда «язык не поворачивается сказать»), каковыми выступают методы производства упорядоченного взаимодействия. Консистентность взаимодействия обеспечивается не упорядоченностью значений слов или жестов, а упорядоченностью контекста их употребления или производства. Поэтому в дальнейшем я буду полагаться на ресурсы обыденного (что не значит - бытового) языка, с помощью которого я буду говорить о непонимании.

Можно выделить следующие способы выражения непонимания в социальных взаимодействиях:

Первый и самый очевидный способ - прямое указание на непонимание. Можно сказать «не понял» либо «что?», «что-что?», «чего?», «ты о чем?», «повтори» и так далее, или указать на непонятный фрагмент предыдущего высказывания («сделать что?»). Использование таких фраз чаще всего предполагает двухчленную последовательность7: сначала один участник произносит определенную реплику, затем другой выражает непонимание. После этого первый говоривший может прояснять, что он имел в виду, исходя из того, в чем, на его взгляд, заключается непонимание. Он может повторить свои слова более громко, если думает, что проблема в громкости, или переформулировать свое высказывание, если думает, что он выразился недостаточно хорошо, или дать пояснение, если полагает, что собеседник не знаком с тем, о чем шла речь.

Другой способ демонстрации непонимания - пауза, которая часто сопровождается невербальной демонстрацией непонимания. Пауза в данном случае может использоваться и чтобы привлечь внимание к возникшей проблеме, и чтобы

7 В случае недопонимания структура трехчленная: сначала реплика первого говорящего, затем реплика второго говорящего, связанная с первой репликой, а потом реплика первого говорящего, указывающая, что второй говорящий понял первую реплику неправильно. См. об этом: SchegLoff (1987). При непонимании третий элемент опциональный. Непонимание может не выражаться, и участник может отказываться от того, чтобы делать непонимание собеседника явным. Если же непонимание выражается, оно чаще всего предполагает ответное исправляющее действие непонятого, поэтому двухчленная структура обычно «расширяется» до трехчленной за счет исправления непонимания (о способах исправления непонимания в разговоре см.: Hirst et aL. 1994). В отличие от недопонимания, исправление непонимания в третьей позиции может осуществляться не только первым говорящим, но и вторым: в некоторых случаях после выражения непонимания участник может продолжать говорить, предлагая какой-то способ понимания непонятого (например: «Что? В полвторого?»).

стимулировать собеседника к инициированию ее решения. Собеседник может, конечно же, не понимать, чем вызвана эта пауза, и тогда может возникать цепочка из двух непониманий: выражения непонимания и непонимания этого выражения непонимания. Невербальные средства выражения непонимания включают недоуменно поднятые брови, вопросительный взгляд, явное замешательство и др.

Третий способ - затягивание престарта, то есть той части реплики, которая предшествует собственно началу высказывания, например, «и-и-и», «э-э-э» или «ну-у-у»8. Если второй говорящий начинает реплику с «э-э-э», это может свидетельствовать не только о том, что он затрудняется с формулированием своего высказывания, но и о том, что он не понял, что было сказано до этого. Наличие растянутого престарта может быть обусловлено необходимостью брать слово в ситуации, когда один из участников не понимает другого, но должен что-то говорить. Например, если был задан вопрос, на который необходимо отвечать, однако содержание вопроса или его наличие осталось непонятным. Вторая ситуация (непонимание того, что был задан вопрос) возможна, когда собеседник перестал следить за разговором, однако по определенным особенностям ситуации понимает, что сейчас его черед говорить (он может понять это, например, по направленным на него взглядам).

Эти способы выражения непонимания (я указал лишь наиболее распространенные; систематическое описание различных способов выражения непонимания в человеческих взаимодействиях - задача отдельного исследования) не указывают, зачем выражается непонимание. Выражение непонимания может исполнять во взаимодействии разные функции9. Наличие этих функций предполагает, что существуют обстоятельства, при которых участники взаимодействия могут воздерживаться от выражения непонимания, когда оно присутствует. Поскольку этнометодологический конверсационный анализ заключается в выявлении механизмов упорядочивания социального взаимодействия, предметом анализа может быть только то, что доступно наблюдению участников. «Наблюдаемое», конечно же, не обязательно означает «произносимое». Наблюдаемым в разговоре являются феномены порядка, а не физические характеристики ситуации. Поэтому наблюдаемые «социальные вещи», хотя они всегда связаны с материальными особенностями происходящего, заключаются в этих особенностях, но не сводятся к ним, поскольку представляют собой способ упорядочивания деталей происходящего. Поэтому непонимание, которое не было выражено, может быть предметом анализа, только если оно некоторым образом выражено как таковое, то есть как невыраженное непонимание. Например, участник взаимодействия в ходе разговора может сообщить, что он не понял что-то сказанное ранее в этом разговоре.

Представленный выше анализ способов выражения непонимания во взаимодействии «человек - человек» важен для анализа взаимодействия «человек - робот» не только потому, что он позволяет более четко указать на специфику по-

8 О престартах см.: Сакс и др. (2015:176).

9 Эти функции во многом аналогичны функциям, выполняемым во взаимодействиях выражениями недопонимания (см.: Young 1995; Robles 2017).

следнего, но и потому, что эти способы выражения непонимания могут встречаться и встречаются и в нем. С одной стороны, люди могут выражать свое непонимание известными способами, потому что сложно изобретать совершенно новые методы организации взаимодействия (по крайней мере, быстро и/или в большом количестве), а также потому, что при взаимодействии с роботом они имеют дело пусть со специфическим, но интеракционным агентом, то есть имеют основания рассматривать происходящее как «нормальное» взаимодействие и применять соответствующие методы его упорядочивания. С другой стороны, разработчики робота используют ресурсы повседневного языка для того, чтобы придавать ему характеристики интеракционного агента, и в этом случае они применяют такие способы демонстрации роботом непонимания собеседника, которые, по мнению разработчиков, будут понятны людям. Например, они могут «заставлять» робота использовать наиболее явный способ выражения непонимания: прямое указание10.

У методов достижения разговорного непонимания между человеком и роботом есть определенные институциональные условия. Поэтому, прежде чем перейти к анализу способов реагирования на непонимание, необходимо остановиться на данных условиях.

условия непонимания во взаимодействии «человек - робот»

Данные, которые будут обсуждаться ниже, представляют собой звонки в одну из справочных служб крупного российского города. Некоторая часть звонков в этой справочной службе, отобранная случайным образом, в порядке тестирования обслуживается роботом. Сразу после звонка абонент слышит вводные слова: «Здравствуйте, Вы позвонили в службу ХХХ. Вас обслуживает робот. В целях контроля качества разговор может быть записан. Пожалуйста, четко сформулируйте свой вопрос и говорите после звукового сигнала. #БИП#». Затем начинается разговор. Поскольку служба дает достаточно обширный круг справок, абоненту не говорят, по какой тематике он должен сформулировать вопрос. В процессе разговора робот пытается распознать запрос абонента, задает уточняющие вопросы и затем либо дает ему нужную справку, либо переключает на оператора-человека.

Нами были получены, транскрибированы при помощи системы Джефферсон (Jefferson 2004)11 и проанализированы записи 103 завершенных разговоров с роботом, то есть разговоров, которые закончились либо предоставлением справки абоненту, либо переводом его на оператора. Размер выборки и отсутствие оборванных разговоров (когда абонент прерывает взаимодействие на каком-либо

10 Сравнение способов реагирования на непонимание человеком и роботом см. в статье: GieseLmann (2006). См. также исследование реакции пожилых людей и людей с легкими когнитивными расстройствами на выражение непонимания роботом: Opfermann and Pitsch (2017).

11 Мы несколько модифицировали систему Джефферсон. Использованные знаки транскрипции приводятся в конце статьи. Все транскрипты были анонимизированы и конфиденциа-лизированы. Все персональные данные, географические названия и адреса были изменены.

этапе звонка), безусловно, накладывают ограничения на наш анализ, однако это не принципиальные ограничения, поскольку, в соответствии с методологическим принципом Харви Сакса, для выявления той или иной части «машинерии» разговора достаточно одной записи (Sacks 1992, 1:11, 483-486, 802; 2:339).

Условия, в которых становится возможным непонимание между человеком и роботом, можно разделить на два типа. Прежде всего - институциональные условия. Робот в нашем случае является представительницей12 определенного института (справочной службы), что позволяет как наделять ее определенными институциональными характеристиками, так и отрицать их, если человеку кажется, что робот не может выступать в данной роли. В качестве иллюстрации рассмотрим следующий фрагмент:

Фрагмент 1

1 #БИП#

2 (3.5)

3 Р пожалуйста не молчите (2.2) говорите

4 (1.5)

5 А н-=не получается оплатить госпошлину=э:: (0.2)

6 э::::н=за выдачу загранпаспорта

7 (4.9)

8 Р ваш звонок переводится на специалиста

В данном фрагменте обращает на себя внимание пауза в строке 2. В имеющихся у нас данных это распространенный феномен. Он связан с тем, что абонент сразу после вводных слов переводится на робота и, предположительно, должен начать формулировать свой вопрос, однако для абонента вводные слова не являются началом разговора. Абонент ждет, когда начнется собственно разговор, то есть робот скажет первую реплику. Для абонента институциональный характер разговора во время звонка в справочную службу заключается в том, что в нем реплики распределяются определенным образом: первая реплика должна быть репликой оператора. (Возможно, некоторые абоненты даже после вводных слов не понимают, что сейчас будут говорить с роботом.) Соответственно, робот, который молчит, потому что ждет высказывания абонентки, и при его отсутствии стимулирует ее фразой «пожалуйста, не молчите», воспринимается звонящей как институциональный агент (оператор), выполняющий определенные функции в организации и соответствующим образом участвующий во взаимодействии.

Другой аспект институциональности во фрагменте 1 связан с фразой робота «пожалуйста, не молчите, говорите». Хотя робот реагирует на отсутствие соответствующих акустических сигналов с той стороны телефонной линии, реплика робота приобретает определенные организационные характеристики как часть разворачивающейся последовательности реплик, а не звуков: просьба говорить в ответ на молчание указывает абонентке, что сейчас ее черед и от нее ожидается опре-

12 Поскольку робот говорит женским голосом, я буду далее говорить о ней в женском роде.

деленного типа реплика. Как видно из строчек 5 и б, абонентка сталкивается с определенными трудностями при формулировании запроса, но при этом она придает своим словам именно характер «запроса»: описывает проблемную ситуацию, для решения которой она позвонила в справочную службу. Таким образом, и робот (способная указать собеседнице на необходимость говорить), и абонентка (способная исполнять предназначенный для нее тип действия) взаимодействуют в определенном институциональном контексте, который они совместно создают и на который они ориентируются.

То, что робот в данной ситуации (в отличие, например, от взаимодействия с бытовыми, промышленными и военными роботами) выступает институциональным агентом, ставит участников разговора в двойственное положение. С одной стороны, робот выступает в роли оператора, выполняя те же функции, что и человек: дает справки. С другой стороны, для отнесения к категории «оператор» недостаточно просто давать справки. Необходимо демонстрировать определенную интеракционную компетенцию, в которой роботу могут изначально или в процессе разговора отказывать. Если робот пытается сделать так, чтобы абонент относился к разговору с ней как к «идеальному» институциональному взаимодействию (то есть взаимодействию, в котором каждый участник выступает только в предписанной институциональной роли, кто бы на самом деле эту роль не выполнял: робот или человек), то абоненты (по крайней мере, некоторые) могут требовать «реального» институционального взаимодействия, в котором всегда есть конкретный исполнитель роли, с которым ведется разговор, а значит имеет значение, робот это или человек. При этом в наших данных13 ситуации полного отказа от взаимодействия с роботом редки. Это говорит о том, что человек не может легко отказаться от взаимодействия с роботом, когда ситуация изначально носит институциональный характер (на который указывают номер, по которому звонят абоненты, и вводные слова). Даже если они не доверяют роботу как оператору, они будут продолжать разговор, поскольку робот «назначен» данным институтом на выполнение определенной функции14.

Второй тип условий непонимания между роботом и человеком имеет инте-ракционный характер. Эти условия связаны с тем, как люди выстраивают такие взаимодействия. Чаще всего абоненты тем или иным образом «подстраиваются» под робота. Эта подстройка связана (что не значит - предопределена) с тем исходным описанием их деятельности, которое предлагается в вводном фрагменте начала разговора. Когда абонентов просят «четко сформулировать свой вопрос», им сообщают, что они столкнутся с особым интеракционным агентом, у которого могут быть «слабые» коммуникативные навыки. Поэтому абоненты часто выстра-

13 Я отсылаю здесь не только к транскрибированным записям, но и к набору (100 записей) пока еще не транскрибированных неотсортированных разговоров с роботом в этой справочной службе.

14 В наших записях есть звонки, в ходе которых после первоначального требования переключить на оператора робот настаивала на продолжении разговора, люди формулировали вопрос - и робот успешно на этот вопрос отвечала.

ивают свою речь так, чтобы она была понятна роботу. Они могут делать это следующими способами:

- говорить громко;

- говорить медленно;

- делать длинные паузы между словами;

- использовать официально-бюрократический язык (впрочем, это происходит и в разговорах с операторами-людьми);

- сокращать реплики, выбрасывая из них «ненужное» (междометия, не относящиеся к делу пояснения, обстоятельства обращения и т. д.) и оставляя «суть».

В результате запросы о справке, которые адресуются роботу, часто напоминают запросы в информационно-поисковую систему или компьютерные команды. Абоненты пытаются сделать свою речь более удобной для интеракционного агента, который может сталкиваться с трудностями не только при понимании, но и при различении сказанного. Таким образом, «четкая формулировка» вопроса может «делаться» двумя способами: путем повышения членораздельности высказываний и путем «конденсации» содержания высказываний.

Робот в свою очередь тоже демонстрирует некоторые характеристики, указывающие абонентам на ее статус во взаимодействии. Во-первых, робот никогда не перебивает абонента. Как только робот фиксирует, что абонент говорит одновременно с ней, она прерывает свою речь. Во-вторых, робот делает довольно длинные паузы в разговоре. Как объяснили разработчики робота, это связано не с тем, что роботу нужно время на распознавание речи абонента и формулирование ответа, а с тем, что робот избегает наложения реплик, и поэтому должна начинать говорить, только когда будет однозначно ясно, что абонент прекратил говорить. В этом смысле робот стремится к минимизации пауз иным образом, нежели человек, поскольку для робота речь собеседника и ее отсутствие являются не потоком организационных феноменов, специфичных для текущего разговора, а набором звуковых частот. В-третьих, робот не избегает повторений. Для робота характерно то, что она может произносить одни и те же фразы идентичным образом, на что люди не только не способны, но чего они стараются избегать, обычно модифицируя свою реплику в случае необходимости повторения сказанного ранее.

Указанные институциональные и интеракционные условия могут служить источниками непонимания между роботом и человеком. Я упоминал выше, какие существуют возможности выражения непонимания в человеческом взаимодействии. Рассматриваемая в данной статье робот тоже оснащена некоторыми инструментами выражения непонимания. Их два. Первый эксплицитен: робот может сказать «возможно, я Вас неправильно поняла» либо «простите, я никак не могу понять», после чего просит повторить вопрос. Поскольку в целом люди не знают, в какой момент роботу что-то может стать непонятно, использование эксплицитной формулировки непонимания является приоритетным способом его демонстрации, хотя при этом люди все равно остаются в неведении, что именно в их словах было непонятно и что нужно сделать после демонстрации непонимания роботом: начать говорить громче? перестроить фразу? что-то еще? Второй спо-

соб - имплицитный: в случае когда робот определяет, что вопрос абонента не попадает ни в одну из тем, по которым она может давать справки, она переключает абонента на оператора-человека. Однако абоненту не сообщают, почему робот переключил его на оператора. Поэтому в случае переключения на оператора-человека абонент, изначально «роботизирущий» свой вопрос, ориентируясь на обладающего «плохой» способностью понимания адресата, может считать причиной этого переключения то, что робот не смогла удовлетворительным образом распознать сказанное абонентом. Абоненты могут приписывать роботу непонимание, которого у нее нет.

Рассмотрим теперь, каким образом достигается непонимание между человеком и роботом в реальном взаимодействии.

СПОСОБЫ РЕАГИРОВАНИЯ НА НЕПОНИМАНИЕ МЕЖДУ ЧЕЛОВЕКОМ И РОБОТОМ

Я проанализирую несколько звонков, каждый из которых, на мой взгляд, представляет собой случай непонимания между человеком и роботом и реагирования на него. Сначала рассмотрим случай «классического» непонимания.

Фрагмент 2

5 Р назовите пожалуйста номер заявления на ХХХ (.)

6 говорите после сигнала

7 (0.4)

8 #БИП#

9 (1.3)

10 А значит (0.2) ОДИН (0.2) ПЯТЬ (0.2) ШЕСТЬ (0.8)

11 СЕМЬ (0.3) ОДИН (0.8) ШЕСТЬ (0.4) ЧЕТЫРЕ (0.3) ТРИ

12 (4.1)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

13 Р возможно я вас неправильно поняла (.) назовите номер

14 еще раз по одной цифре (.) пожалуйста говорите после

15 сигнала

16 (0.4)

17 #БИП#

18 (0.8)

19 А <ОДИН (0.8) ПЯТЬ (0.4) ШЕСТЬ (0.8) СЕМЬ (0.6)

20 ОДИН (0.5) ШЕСТЬ (0.8) ЧЕТЫРЕ (0.4) ¿ТРИ>

Поскольку робот не говорит, что именно она неправильно поняла, в данном случае мы имеем дело скорее не с недопониманием, а с непониманием: «неправильно поняла» означает «не поняла». Это подтверждается для абонента тем, что робот просит его повторить номер, который он только что назвал. Как можно видеть из строчек 19 и 20, человек воспринимает такую демонстрацию непонимания со стороны робота как указание на необходимость скорректировать свое действие. В ответ абонент произносит цифры номера заявления медленнее и делая

более длительные паузы между словами. В данной ситуации человеку необходимо определить, что именно не поняла робот. Единственное указание на предмет непонимания в реплике робота - фраза «назовите номер еще раз по одной цифре», из которой можно сделать вывод, что робот не смогла различить слова, несмотря на то, что, как видно в строках 10 и 11, абонент изначально произносит цифры номера громко и с хорошо слышимыми паузами. В этой ситуации абонент не может просто повторить тот же способ воспроизведения цифр, который он использовал раньше, и вместо этого меняет свою речь таким образом, чтобы она стала более понятна для партнера по взаимодействию. Тем самым он усиливает ее распознаваемость для робота, на которую изначально ориентировался.

Во фрагменте 2 робот (почти) прямо выражает свое непонимание. Однако возможны ситуации, когда непонимание робота заметно человеку, но не самому роботу. Например, в следующей ситуации:

Фрагмент 3

1 #БИП#

2 (0.6)

3 А х: (0.2) >служба ХХХ Свердловского района<

4 (4.2)

5 Р служба ХХХ района=Свердловский находится по Тадресу

6 (0.6) улица=Первомайская Тдом сорок ¿девять (0.7)

7 режим работы (.) с восьми до двадцати часов=без

8 перерыва на обед и выходных (0.5) добраться можно на

9 автобусе (0.6) семь (0.2) на Ттрамвае (0.5)

10 ¿восемнадцать (0.6) двадцать=шесть (0.5) пятьдесят три

11 (.) а двадцать ¿пять (0.5) сорок семь=ка девять=

12 =маршрутным транспортом (0.5) двести двадцать ¿шесть

13 (0.6) Твам повторить? (0.6)

14 #БИП#

15 (3.5)

16 А >соедините пожалуйста< с ХХХ Свердловского района

Робот не поняла, что абонентка не спрашивает адрес конкретного учреждения, а просит соединить с этим учреждением. Это непонимание производится как наблюдаемый феномен в последовательности реплик 3 и 16. Именно реакция на действие робота делает ее высказывания непониманием. Условием этого недопонимания стало то, что абонентка сформулировала свой запрос максимально лаконично, указав только название учреждения. Реакция на действие робота заключается в добавлении к «ключевым» словам (названию учреждения) слова «соедините», указывающего, с одной стороны, на предмет непонимания робота и, с другой - на желаемое действие, которое робот должна совершить.

Из фрагмента 3 следует, что люди могут реагировать на непонимание со стороны робота, расширяя изначальное высказывание, то есть повторяя его с добавлением новых элементов, которые должны предотвратить дальнейшее непонима-

ние и точно указать роботу на то, чего хочет человек. Данная стратегия может быть направлена и в противоположную сторону: люди могут реагировать на непонимание, сокращая высказывание и оставляя только те элементы, которые кажутся необходимыми и достаточными для робота. Рассмотрим следующий фрагмент.

Фрагмент 4

5 А кх (0.6) меня зовут Сергей Васильевич (.) я проживаю

б в ХХХ. дело в том, что я обратился м:: в больТницу (.)

7 где (.) лежал (0.8) с травмой глаза х: и (.) все время

8 ходил к враТчу (.) без всяких проблем (.) она меня

9 контролировала (0.2) а это пошел (0.3) а мне говорят

10 что теперь я должен платить (.) шестьсот пятьдесят

11 рублей чтобы: (.) пройти к врачу (.) раньше этого не

12 было. (1.7) *у меня всё*

13 (2.4)

14 Р простите (.) я никак не могу понять. (0.6) пожалуйста

15 еще раз четко сформулируйте свой вопрос (.) и говорите

1б после звукового сигнала

17 #БИП#

18 (1.1)

19 А ((шуршание 1.8)) В БОЛЬНИЦЕ ГОРОДА [ХХХ-

20 Р [пожалуйста-

21 (1.4)

22 А города ХХХ (0.8) городск- а: районная больница

23 города ХХХ м чтобы обратиться к вр- К ВРАЧУ (.)

24 <БЕРУТ ПЛАТУ>. ЭТО ПРАВИЛЬНО?

В строках 19 и 22-24 абонент «конденсирует» свое первоначальное высказывание, реагируя на выражение непонимания со стороны робота. Эта конденсация представляет собой не просто сокращение реплики до необходимых элементов (название города, указание на обстоятельства вопроса: обращение к врачу, обозначение предмета вопроса: «берут деньги»), но и ее модификацию. Во-первых, абонент произносит громко название города, что связано, вероятно, не столько с ориентацией на способ произнесения им реплики как на причину непонимания, сколько со стремлением подчеркнуть главное в сказанном. Это подтверждается тем, что абонент также акцентирует фразу «к врачу» и последующие слова. Во-вторых, он произносит собственно вопрос («это правильно?»), который отсутствовал в предыдущей реплике (строки 5-12). Тем самым абонент меняет тип действия: вместо рассказа об обстоятельствах звонка, из которого собеседник должен «извлечь» вроде бы очевидный вопрос (рассказ строится по схеме «раньше было так, а теперь стало так», которая предполагает молчаливый вопрос «почему?»), он прямо формулирует вопрос. К этому его побуждает как непонимание со стороны робота, так и прямая просьба последней четко сформулировать вопрос.

Помимо модификации типа действия человеком во взаимодействии «человек - робот» встречаются ситуации, когда робот не понимает тип действия, совершенного человеком. Речь в данном случае идет не столько о том, что робот ошибается в распознавании того, что говорит или делает человек, сколько в том, что выражение непонимания роботом может не иметь предмета, то есть осуществляться в отношении предшествующего действия, которое может дисквалифицироваться действующим в качестве объекта и причины непонимания и, соответственно, повода для прояснения. Это можно показать на следующем примере:

Фрагмент 5

5 Р назовите пожалуйста номер заявления на ХХХ говорите

6 после сигнала

7 (0.6)

8 #БИП#

9 (0.6)

10 А х: та:кщас *секунду*

11 (3.9)

12 Р возможно я вас неправильно поняла назовите номер

13 еще раз по одной цифре пожалуйста говорите после

14 сигнала

15 (0.5)

16 #БИП#

17 (0.3)

18 А а где номер-то. (0.7) х: А. х: НОМЕР БЛАНКА (.) СТО

19 ПЕСЯТ (.) ПЯТЬ (0.4) ДЕВЯНОСТО СЕМЬ (0.4) ДЕВЯТСОТ

20 ПЕСЯТ ДЕВЯТЬ

Реплика абонентки в строке 10 указывает собеседнику, что абонентка, во-первых, пытается сделать то, о чем ее попросили, и, во-вторых, просит подождать ее, поскольку ей еще необходимо найти нужный документ или информацию. Однако для робота, для которой действия собеседника во время телефонного разговора представляют собой последовательность акустических частот, любое действие человека представляет собой в первую очередь систему звуков, и лишь во вторую - организационный феномен разговора. Поэтому робот принимает высказывание абонентки за ответ, который она (робот) не может распознать, то есть неудачное (для робота, не для человека) исполнение просьбы назвать номер заявления. Робот просит абонентку назвать номер еще раз, и в этот раз абонентка, хотя и не сразу, делает это. В данном случае робот принимает одно действие человека за другое и выражает непонимание по отношению не к тому, что сделал человек, а к тому, чего абонентка не делала. Такое «ложное» непонимание, однако, игнорируется человеком, который решает практическую задачу предоставления роботу необходимой информации. Тем самым человек переводит «ложное» непонимание робота в «истинное» непонимание: хотя абонентка не произносила

никакого номера в строке 10, она не сделала то, о чем ее просили, то есть действительно не произнесла номер. В этом смысле мы имеем дело с ситуацией, когда человек при взаимодействии с роботом отдает приоритет организационному контексту демонстрации непонимания со стороны робота, а не устранению причины этого непонимания. Непонимание делается понятным, хотя и не таким образом, который предполагает выражение непонимания роботом15.

Наконец, один из способов реагирования на непонимание собеседника во взаимодействии «человек - робот» может быть описан как «обоснование» непонятого высказывания. Похожие обоснования часто встречаются во взаимодействии между людьми в ответах на уточняющие вопросы собеседника, однако в случае взаимодействия с роботом как сами эти обоснования, так и обстоятельства их использования носят специфический характер. Рассмотрим следующий фрагмент:

Фрагмент 6

1 #БИП#

2 (3.0)

3 А [сегодня я]

4 Р [пожалуй]ста не молчит-

5 (0.9)

6 А сегодня я должна получить (0.6) ПАСПОРТ (1.4) и хочу

7 узнать (.) готов ли он

8 Р уточните готовность какого документа вас интересует

9 (0.7)

10 #БИП#

11 (1.1)

12 А меня интересует общегражданский паспорт Российской

13 Федерации х который у меня был украден (.)

14 и я заказывала (.) две недели назад Тновый ¿паспорт

В строках 12-13 абонентка реагирует на прямую просьбу робота (строка 8), которая демонстрирует, что робот частично не понял реплику в строках 6-7. Робот не просит уточнить, «готовность какого паспорта вас интересует» (поскольку

15 Здесь можно указать на сходства и различия с близкой ситуацией, возникающей при взаимодействии людей. Нередко можно встретить последовательность реплик типа «Что-что? -Ничего». В подобных случаях отвечающий указывает демонстрирующему непонимание, что он не собирается реагировать на выражение непонимания, проясняя его, и что, возможно, для непонимания нет оснований, то есть сказанное ранее (перед репликой «Что-что?») не является «достойным» того, чтобы реагировать на непонимание. В предельном случае непонимание может вообще оказаться беспочвенным (например: «Что-что? - Я ничего не говорил»). В рассмотренном фрагменте 5 складывается похожая ситуация, в том смысле, что демонстрация непонимания отсылает не к тому действию, которое может быть обоснованным предметом данного непонимания. Однако в случае взаимодействия между людьми демонстрацию непонимания гораздо труднее игнорировать, чем в случае взаимодействия «человек - робот».

есть разные типы паспортов). Просьба уточнить «документ» предполагает, что «паспорт», выделенный абоненткой при помощи громкости и пауз, не был распознан роботом в качестве «документа». В ответ на это абонентка указывает, какого типа паспорт ее интересует, и объясняет, почему она обратилась за новым паспортом. О том, что в данном случае мы имеем дело с непониманием роботом абонентки и, главное, что она ориентируется на это непонимание, говорит не только то, что, робот не использует слово «паспорт», заменяя его «документом» (это еще можно было бы, хотя и с трудом, списать на «неточность» людей, запрограммировавших робота), но и то, что абонентка рассказывает об обстоятельствах своего запроса. Такой «обстоятельный» ответ на просьбу уточнить документ может свидетельствовать о том, что абонентка восприняла реплику робота не как просьбу уточнить тип паспорта, а как демонстрацию слабых коммуникативных способностей, то есть она полагает, что робот не поняла, о чем она спрашивает, почему что не знает об обстоятельствах запроса. Имеющиеся у нас данные показывают, что в случае взаимодействия с операторами-людьми абоненты дают дополнительные пояснения касательно обстоятельств запроса в двух случаях: 1) когда после формулирования вопроса абонентом возникает пауза, во время которой оператор не вступает в разговор; 2) когда абоненты не уверены в том, насколько оператор понял, о чем они спрашивают или собираются спросить. В данном фрагменте перед объяснением нет паузы, поэтому, скорее всего16, мы имеем дело со вторым случаем.

ЗАКЛЮЧЕНИЕ

Рассмотренные выше способы реагирования на непонимание во взаимодействии «человек - робот» не только составляют важную часть интеракционной работы, которую совершают участники такого рода взаимодействий и которая требует детального социологического описания, но и указывают на то, что непонимание - не «одномоментный» элемент коммуникации, а последовательность действий, осуществляемых участниками совместно и с ориентацией друг на друга. Непонимание производится, то есть является позитивным феноменом, а не отсутствием понимания. Участники взаимодействия (как люди, так и роботы) изначально ориентируются на возможное непонимание, выражают его определенным образом и реагируют на него исходя из особенностей складывающейся ситуации.

В данной статье предметом внимания были преимущественно способы реагирования людей на непонимание со стороны робота. Это связано как с тем, что во взаимодействии «человек - робот» люди более активны и изобретатель-

16 Я говорю «скорее всего», поскольку у меня все еще остаются сомнения относительно того, имеем ли мы в данном случае дело с непониманием. Я решил оставить этот фрагмент, поскольку даже если предложенный анализ ошибочен по отношению к данному конкретному фрагменту, он указывает на важный феномен, который встречается в других ситуациях взаимодействия с роботом. Введение «объяснений» в ответ на непонимание робота - один из способов реагирования, заслуживающий исследовательского внимания.

ны в осуществлении «работы непонимания», так и с тем, что у рассмотренного робота (как и многих других типов роботов) очень мало способов фиксации и выражения не своего, а чужого непонимания. Способы выражения непонимания людьми роботов и реагирования роботов на это непонимание составляют важный предмет для дальнейших исследований. Как показывает анализ, предпринятый в данной статье, наиболее интересные результаты в такого рода исследованиях можно получить посредством детального изучения реальных взаимодействий людей с роботами, которые в некоторых областях уже стали стандартным элементом повседневных практик. Подобное детальное рассмотрение не только позволит лучше понимать особенности взаимодействия людей с роботами, но и сможет стать принципиальным основанием для переопределения «социального» в социальных взаимодействиях.

Нотация

А Р

ХХХ [

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

]

(0.0) (.)

слово

П . ?

СЛОВО *слово*

х ф

((слово))

Абонент. Робот.

Конфиденциальная информация.

Момент одновременного начала накладывающихся реплик или фрагментов.

Момент одновременного окончания накладывающихся реплик или фрагментов.

Отсутствие паузы там, где она может ожидаться.

Отсутствие паузы между репликами разных говорящих.

Пауза в целых и десятых долях секунды.

Небольшая пауза (± одна десятая секунды) внутри или между

репликами.

Интонационное выделение посредством смены высоты и/или диапазона голоса.

Растягивание звука (длина ряда соответствует длительности растягивания).

Заметное повышение или понижение высоты голоса в последующем фрагменте. Обычная интонация.

Фрагмент, произнесенный громче окружающих его фрагментов. Фрагмент, произнесенный тише окружающих его фрагментов. Вдох. Выдох.

Обрыв реплики или слова.

Фрагмент, произнесенный быстрее окружающих его фрагментов.

Фрагмент, произнесенный медленнее окружающих его фрагментов.

Комментарии транскрибера.

> <

< >

список литературы

Гадамер, Хан-Георг. 1988. Истина и метод: основы философской герменевтики. М.: Прогресс.

Шюц, Альфред. 2004. «Обыденная и научная интерпретация человеческого действия». С. 7-50 в Избранное: Мир, светящийся смыслом. М.: РОССПЭН.

Сакс, Харви, Эмануил А. Щеглофф, и Гейл Джефферсон. 2015. «Простейшая систематика организации очередности в разговоре». Социологическое обозрение 14(1):142-202.

Antaki, Charles. 2012. "Affiliative and Disaffiliative Candidate Understandings." Discourse Studies 14(5):531-547.

Bazzanella, Carla, and Rossana Damiano. 1999. "The Interactional Handling of Misunderstanding in Everyday Conversations." Journal of Pragmatics 31(6):817-836.

Bohus, Dan, and Alexander I. Rudnicky. 2008. "Sorry, I Didn't Catch That!: An Investigation of Non-Understanding Errors and Recovery Strategies." Pp. 123-154 in Recent Trends in Discourse and Dialogue, edited by Laila Dybkj^r and Wolfgang Minker. Berlin: Springer.

Dua, Hans R. 1990. "The Phenomenology of Miscommunication." Pp. 113-139 in Beyond Goffman: Studies on Communication, Institution, and Social Interaction, edited by Stephen H. Riggins. Berlin: Mouton de Gruyter.

Gardner, Rod. 1998. "Between Speaking and Listening: The Vocalisation of Understandings." Applied Linguistics 19(2):204-224.

Giddens, Anthony. 2007. New Rules of Sociological Method: A Positive Critique of Interpretative Sociologies. Cambridge: Polity Press.

Gieselmann, Petra. 2006. "Comparing Error-Handling Strategies in Human-Human and Human-Robot Dialogues." Pp. 24-31 in Proceedings of KONVENS 2006 (Konferenz zur Verarbeitung natürlicher Sprache), Universität Konstanz, edited by Miriam Butt. Konstanz, Germany: Bibliothek der Universität Konstanz.

Grice, Paul. 1989. Studies in the Way of Words. Cambridge, MA: Harvard University Press.

Grimshaw, Allen D. 1980. "Mishearings, Misunderstandings, and Other Nonsuccesses in Talk: A Plea for Redress of Speaker-Oriented Bias." Sociological Inquiry 50(3/4):31-74.

Gumperz, John J. 1992. "Contextualization and Understanding." Pp. 229-252 in Rethinking Context: Language as an Interactive Phenomenon, edited by Alessandro Duranti and Charles Goodwin. New York: Cambridge University Press.

Hindmarsh, Jon, Patricia Reynolds, and Stephen Dunne. 2011. "Exhibiting Understanding: The Body in Apprenticeship." Journal of Pragmatics 43(2):489-503.

Hirst, Graeme, Susan McRoy, Peter Heeman, Philip Edmonds, and Diane Horton. 1994. "Repairing Conversational Misunderstandings and Non-Understandings." Speech Communication 15(3):213-229.

Jefferson, Gail. 2004. "Glossary of Transcript Symbols with an Introduction." Pp. 13-31 in Conversation Analysis: Studies from the First Generation, edited by Gene H. Lerner. Amsterdam: John Benjamins.

Kvanvig, Jonathan L. 2003. The Value of Knowledge and the Pursuit of Understanding. New York: Cambridge University Press.

Lawrence, Samuel G. 1999. "The Preoccupation with Problems of Understanding in Communication Research." Communication Theory 9(3):265-291.

LeBaron, Curtis D., and Timothy Koschmann. 2002. "Gesture and the Transparency of Understanding." Pp. 119-132 in Studies in Language and Social Interaction: In Honor of Robert Hopper, edited by Phillip Glenn, Curtis D. LeBaron, and Jenny Mandelbaum. Mahweh, NJ: Lawrence Erlbaum.

Lynch, Michael. 2000. "The Ethnomethodological Foundations of Conversation Analysis." Text 20(4):517-532.

Macbeth, Douglas. 2011. "Understanding Understanding as an Instructional Matter." Journal of Pragmatics 43(2):438-451.

Moerman, Michael, and Harvey Sacks. 1988. "Appendix B: On 'Understanding' in the Analysis of Natural Conversation." Pp. 180-186 in Talking Culture: Ethnography and Conversational Analysis, by Michael Moerman. Philadelphia: University of Pennsylvania Press.

Mondada, Lorenza. 2011. "Understanding as an Embodied, Situated and Sequential Achievement in Interaction." Journal of Pragmatics 43(2):542-552.

Opfermann, Christiane, and Karola Pitsch. 2017. "Reprompts as Error Handling Strategy in HumanAgent-Dialog? User Responses to a System's Display of Non-Understanding." Pp. 310-316 in Proceedings of the 26th IEEE International Symposium on Robot and Human Interactive Communication (RO-MAN 2017). Piscataway, NJ: IEEE.

Robles, Jessica S. 2017. "Misunderstanding as a Resource in Interaction." Pragmatics 27(1):57-86.

Sacks, Harvey. 1992. Lectures on Conversation. 2 vols. Oxford: Blackwell.

Schegloff, Emanuel A. 1987. "Some Sources of Misunderstanding in Talk-in-Interaction." Linguistics 25(1):201-218.

Taylor, Talbot J. 1992. Mutual Misunderstanding: Scepticism and the Theorizing of Language and Interpretation. Durham, NC: Duke University Press Books.

Young, Robert L. 1995. "Misunderstandings as Accounts." Sociological Inquiry 65(3/4):251-264.

Young, Robert L. 1999. Understanding Misunderstandings: A Practical Guide to More Successful Human Interaction. Austin: University of Texas Press.

ii qorry, i cannot understand": Sways of dealing with non-understanding in human-robot interaction

Andrei Korbut

Andrei Korbut holds a Candidate of Sciences degree and is a Senior Research Fellow at the Centre for Fundamental Sociology, National Research University Higher School of Economics. Address for correspondence: Staraia Basmannaia ul., 21/4, Office A205, Moscow, 105066, Russia. [email protected].

The article discusses how the non-understanding that arises during human-robot interaction is managed. The focus is on the ways humans respond to the open expression of non-understanding by robots, as well as of non-understanding that the robot itself does not "realize." The methodological framework of the research is an ethnomethodological conversation analysis that presupposes the identification of the ways of producing local social order in the sequences of actions. By analyzing the conversations between callers and robot (it is actually a chatbot, but official term for it is "robot") in a Russian telephone information service, I show that, instead of non-understanding being a negative phenomenon consisting in lack of understanding, non-understanding is a situational and coordinated achievement of the participants in the interaction. The article identifies two types of conditions of non-understanding between human and robot: institutional (related to the specific organizational context in which the interaction takes place and which is produced in it) and interactional (related to the organization of interaction). Based on a detailed analysis of transcripts of human-robot telephone conversations, five ways of responding to non-understandings are distinguished: changes in

the acoustic characteristics of utterances (raising the voice level, slowing down, expanding pauses, etc.); expanding the initial statement (for example, by introducing explanatory words); reducing utterances to "key" words; ignoring non-understanding; and adding explanations. At the same time, people not only react to the non-understanding by the robot after its occurrence but also actively anticipate it, building their turns in a way understandable to the robot. The identified features of human-robot interaction provide a more accurate description of human interaction with technical interactional agents, which are becoming increasingly common in everyday life, and also show that non-understanding is not a failure in understanding but a social achievement of the participants in interaction, whether humans or robots. Because non-understanding should be demonstrated and recognized in details and sequences of actions, it is necessary to consider it as an independent interactive phenomenon.

Keywords: Human-Computer Interaction; Chatbot; Artificial Intelligence; Social Interaction; Call Centers; Ethnomethodology; Conversation Analysis

references

Antaki, Charles. 2012. "Affiliative and Disaffiliative Candidate Understandings." Discourse Studies 14(5):531-547.

Bazzanella, Carla, and Rossana Damiano. 1999. "The Interactional Handling of Misunderstanding in Everyday Conversations." Journal of Pragmatics 31(6):817-836.

Bohus, Dan, and Alexander I. Rudnicky. 2008. "Sorry, I Didn't Catch That!: An Investigation of Non-Understanding Errors and Recovery Strategies." Pp. 123-154 in Recent Trends in Discourse and Dialogue, edited by Laila Dybkj^r and Wolfgang Minker. Berlin: Springer.

Dua, Hans R. 1990. "The Phenomenology of Miscommunication." Pp. 113-139 in Beyond Goffman: Studies on Communication, Institution, and Social Interaction, edited by Stephen H. Riggins. Berlin: Mouton de Gruyter.

Gadamer, Hans-Georg. 1988. Istina i metod: Osnovy filosofskoigermenevtiki. Moscow: Progress.

Gardner, Rod. 1998. "Between Speaking and Listening: The Vocalisation of Understandings." Applied Linguistics 19(2):204-224.

Giddens, Anthony. 2007. New Rules of Sociological Method: A Positive Critique of Interpretative Sociologies. Cambridge: Polity Press.

Gieselmann, Petra. 2006. "Comparing Error-Handling Strategies in Human-Human and Human-Robot Dialogues." Pp. 24-31 in Proceedings of KONVENS 2006 (Konferenz zur Verarbeitung natürlicher Sprache), Universität Konstanz, edited by Miriam Butt. Konstanz, Germany: Bibliothek der Universität Konstanz.

Grice, Paul. 1989. Studies in the Way of Words. Cambridge, MA: Harvard University Press.

Grimshaw, Allen D. 1980. "Mishearings, Misunderstandings, and Other Nonsuccesses in Talk: A Plea for Redress of Speaker-Oriented Bias." Sociological Inquiry 50(3 -4):31-74.