Научная статья на тему 'Голосовые боты: вопросы и ответы'

Голосовые боты: вопросы и ответы Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
7
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
• голосовые боты • голосовые ассистенты • искусственный интеллект • распознавание речи • синтез речи • разговорные системы • диалоговые системы / • voice bots • voice assistants • artificial intelligence • AI • ASR • TTS / conversational systems • dialog systems

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Киселёв В. В.

В статье рассматривается проблематика современных голосовых ботов, сильные и слабые стороны с точки зрения бизнеса. Статья построена в виде виртуального интервьюирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

VOICE BOTS: QUESTIONS AND ANSWERS

The article discusses the problems of modern voice bots, strong and weaknesses from the business point of view. The article is organized in the form of virtual interviewing.

Текст научной работы на тему «Голосовые боты: вопросы и ответы»

Голосовые боты: вопросы и ответы

Киселёв В. В., директор ООО «Речевые технологии», Минск, Республика Беларусь, info@speech.by

В статье рассматривается проблематика современных голосовых ботов, сильные и слабые стороны с точки зрения бизнеса. Статья построена в виде виртуального интервьюирования.

• голосовые боты • голосовые ассистенты • искусственный интеллект • распознавание речи • синтез речи • разговорные системы • диалоговые системы

ЧТО ЭТО — ГОЛОСОВЫЕ БОТЫ?

На сегодняшний день голосовые боты — это уже повседневная реальность, внедрившееся в большинство сфер жизнедеятельности. Однако за кажущейся простотой реализации и внедрения таких ботов скрывается множество подводных камней, сложностей эффективного проектирования и получения обратной связи бизнеса. Ведущий разработчик речевых технологий — компания «Речевые системы» предлагает виртуальное интервью с вопросами и ответами на тему голосовых ботов.

Под голосовыми ботами мы понимаем технологию разговорного искусственного интеллекта, позволяющую вести диалог на естественном языке при помощи голоса и речи. По-другому, эта диалоговая система между человеком и техникой. В разные времена и в разных сферах такие технологии назывались по-разному, например: виртуальный помощник, виртуальный бот, диалоговые системы, голосовой робот, голосовой бот, агенты, системы голосового самообслуживания. Не будем сейчас детализировать, кто из них кто, просто далее по тексту будем использовать голосовые боты (ГА). Также их всех связало наличие двух основных компонентов — это научно-исследовательские разработки и технические средства внедрения. Под научными разработками мы понимаем технологии распознавания речи, технологию синтеза речи, технологию обработки языка (текстовые сообщения, диалоговые сценарии). Технические средства — это различные коммуникационные каналы, такие как телефонный канал, микрофонный, социальные сети, мессенд-жеры, технические стандарты и протоколы. Многие современные производители сосредотачиваются лишь в одной плоскости, например научной, кооперируясь с другими вендорами для предоставления готовых решений бизнес-сообществу. Компания «Речевые системы» занимается голосовыми ботами на основе интеллектуального программного обеспечения, которое может интегрироваться в любые аппаратные средства.

КАК РАБОТАЕТ ГОЛОСОВОЙ БОТ?

Голосовой бот — это сложно организованная многокомпонентная система. В качестве ввода информации используется система распознавания речи. Распознавание речи преобразует входной речевой сигнал в текстовое сообщение. Далее система обработки и понимания естественного языка анализирует текстовые сообщения,

выделяет наиболее значимые высказывания и генерирует текстовый ответ. При помощи системы генерации синтезированной речи текстовый ответ преобразуется в звучащую речь. Это самое общее описание, как работает голосовой бот изнутри. Таким образом, когда пользователь общается с голосовым ботом, высказывание проходит несколько уровней обработки. В голосовых ботах есть сценарии ведения диалогов, логика обработки, вопросно-ответные алгоритмы, всё это скрыто от пользователя. И пользователь лишь получает сухой ответ на свой запрос. В технической части голосовой бот интегрируется с различными информационными системами по общепринятым протоколам. Например, в крупных колл-центрах существуют международные интеграционные стандарты, через которые и происходит взаимодействие.

Эффективность голосовых ботов зависит от множества факторов. Поскольку это сложно организованная система, состоящая из нескольких компонент, можно измерять эффективность каждого компонента отдельно, затем в целом голосового бота. Автоматическая система распознавания речи в составе голосового бота должна выдать высокую степень распознавания. Допустимый уровень получаемого текста на выходе распознавания должен быть не менее 96 % правильности высказывания, в зависимости от входного канала. Система обработки естественно языка при существующих подходах должна 100 %% выделять сущности и интенты из полученного текста. И, конечно, «лицо» любого голосового бота — это его синтезированный голос, который должен быть приятный, естественный, «живой» и эмоциональный.

В целом основной критерий голосового бота — это его интеллектуальность. Он не должен вызывать ассоциации с роботизированной системой, работающей по шаблону. Он должен «понимать», что ему говорят и что на это нужно ответить. Он не должен циклично повторять, что он чего-то там не понимает. Он должен менять фразы, уметь уточнять, быть дружелюбным к собеседнику и стремиться к построению интеллектуального живого диалога.

Голосовые помощники хорошо работают в определённой доменной зоне. Например, помощник, который может заказать железнодорожные билеты в своём тематическом окружении, но никак не может знать о существовании медицинских специальностей или лекарственных препаратов. С одной стороны, это не очень существенное слабое место, ведь человек не будет спрашивать в железнодорожной кассе, как записаться к врачу, но он может спросить, где ближайшая аптека или поликлиника, и это уже более вероятно. Голосовой помощник в таких ситуациях более ограничен своей предметной областью. Самообучаемость

КАК ИЗМЕРИТЬ ЭФФЕКТИВНОСТЬ ГОЛОСОВЫХ БОТОВ?

ГДЕ СЛАБЫЕ МЕСТА У ГОЛОСОВЫХ БОТОВ? ЕСТЬ ЛИ «АНТИКЕЙСЫ»?

112

в какой-то мере у роботов присутствует. Все диалоги записываются, затем анализируются, тюнятся алгоритмы. Но это не самоорганизуемая и самообучаемая система. Что касается масштабируемости голосовых ботов, то это лишь зависит от мощностей аппаратно-программных комплексов. Чем больше нужно обрабатывать входящие, исходящие каналы, тем мощнее нужны технические характеристики. «Антикейсов» в таких помощниках априори не должно существовать, на то они и помощники. А вот очень плохо сконструированный сценарий, сложность запросов, некачественное распознавание и роботизированная речь могут сделать любой успешный кейс «антикейсом». Никто не будет пользоваться помощником, если его, например, нельзя перебить или он бесконечно долго не понимает, что от него хотят. И ключевое слово тут — «понимает», ведь распознавание речи это не вовсе понимание. Проблема распознавания речи решена уже достаточно хорошо, то есть робот хорошо распознает, но плохо понимает. И эти проблемы решаются разработчиками голосовых помощников.

КАК МОНЕТИЗИРУЮТСЯ ГОЛОСОВЫЕ БОТЫ?

С точки зрения монетизации каждый производитель работает по своему вектору. Кто-то привязывается к входному, выходному каналу, кто-то — к количеству диалогов, фраз, реплик или единиц времени разговора. Тут единого стандарта нет. Понятно, что чем сложнее сценарий ведения диалога, тем сложнее правильно сконструировать голосового помощника, и соответственно это будет дороже. Немаловажное место в монетизации занимает сам процесс создания голосового бота, то есть сценария ведения диалога. Это процесс очень важный, требующий значительных усилий специалистов для создания успешно работающего сценария.

ЧЕМ ПОЛЕЗНЫ ГОЛОСОВЫЕ БОТЫ В РАБОТЕ КОМПАНИИ?

Голосовые боты могут внедряться и внедряются практически в любые сферы деятельности. Они могут быть на службе внутренних потребностей компании, а также предоставлять сервисы внешнего взаимодействия.

Рассмотрим пример внедрения голосового бота в HR-отдел и помощи во внутрикорпоративной коммуникации. Такой сервис может улучшить при решении оперативных вопросов, например сотрудник может узнать, сколько отпускных дней у него осталась, какие законодательные нормы рабочих и праздничных дней, как правильно оформить заявления, корпоративные документы, получить консультации по программе лояльности или подготовки к аттестации. Всё это ускоряет взаимодействие между подразделениями и экономит время работников служб персонала. Сотрудники HR-службы, в свою очередь, могут сделать голосовые запросы в информационные системы компании для поиска нужных кандидатов по резюме, получить дополнительные сведения о сотруднике, о движении его рабочего времени, бонусов и привилегий. Правильно конструированный голосовой бот может напоминать или обзванивать потенциальных кандидатов, приглашать на собеседование, проводить первичное анкетирование или даже тестирование. Внутри команды такой бот может собирать обратную связь от сотрудников и рабочего процесса, рекомендовать литературу и делать поиск в корпоративной библиотеке, напоминать о ближайших важных событиях и ряд других полезных функций. Всё это сказывается

положительным образом для достижения эффективности и нужных КР1 показателей отдела кадров.

Внешние голосовые боты помогают бизнесу в автоматизации многих компонентов колл-центра. Приём потока входящих обращений, обработка первичных звонков, выдача стандартных сообщений и ряд других действий — всё это можно поручить голосовому боту. В корпоративном бизнесе такие боты также называются системами голосового самообслуживания, голосовыми ботами, что для нас является тождественными понятиями.

ПЕРСПЕКТИВЫ РОСТА, НАД КАКИМИ ОШИБКАМИ ПРИДЁТСЯ ПОРАБОТАТЬ?

При конструировании голосовых ботов нужно учитывать следующие моменты:

• диалоги должны быть простыми;

• сценарии должны быть несложными;

• реплики и высказывания робота не должны быть очень длинными;

• составлять диалоги таким образом, чтобы роботу было удобно общаться и понимать;

• иметь в штате дизайнеров голосовых интерфейсов.

Ошибки, допущенные при конструировании голосового бота, очень сильно могут сказаться на репутации самого бота и компании в целом. Поэтому нужно тщательно подходить к созданию сценариев, обучению робота и обязательно сопровождать его первое время после внедрения.

КАК СКОРО АЛГОРИТМЫ СМОГУТ ПОДСТРАИВАТЬСЯ ПОД КОНКРЕТНОГО ПОЛЬЗОВАТЕЛЯ? ЕСТЬ ЛИ ТУТ ЭФФЕКТ «ЗЛОВЕШЕЙ ДОЛИНЫ»?

Тут существует несколько проблем, и всё зависит от кейса внедрения. Действительно, нам как разработчикам голосовых интерфейсов немного проще, чем в эффекте «зловещей долины», поскольку мы работаем с одним телекоммуникационным каналом — голосовым и речевым. Качество синтетической речи на сегодняшний день уже очень высоко и мало отличимо от естественной речи, что особенно касается диалоговых систем. Кроме того, есть успешные кейсы предзаписанных речевых фрагментов, где действительно говорит человек. Поэтому вывод, то есть как он говорит, это небольшая проблема. А вот что он говорит — это относится к проблеме понимания и интеллектуализации роботов — то, о чём мы говорили в предыдущем разделе. В коротких диалогах, да ещё и с записанными фразами, вы вовсе можете не отличить (люди

114

и не отличают), что разговариваете с роботом. Что касается подстраиваний под конкретного пользователя, то мы этим сейчас не занимаемся. Есть общепринятые коммуникативные нормы, мы ими больше руководствуемся. Хотя, безусловно, индивидуализация — это интересный психологических аспект ведения диалога.

ЧТО ЕЩЁ МОЖЕТ ПОДТОЛКНУТЬ РЫНОК, КРОМЕ РАСПРОСТРАНЕНИЯ КОРОНАВИРУСА, ТО ЕСТЬ ЛОКДАУНА?

Не совсем так. Голосовое и речевое направление развивается уже очень давно. Ещё более 20 лет назад в Америке уже можно было заказывать билеты, бронировать отели, путешествия и прочее через голосовых помощников. Понятно, что себе могли позволить внедрить такие новшества только очень крупные корпорации, но услуги гражданскому населению в такой форме они оказывали. Также проблема общения на естественно-языковом интерфейсе давно уже существовала с появлением вычислительной техники и отдельно находилась в области исследований по искусственному интеллекту. Огромный прорыв в развитии этой отрасти оказали вычислительные мощности на центральных и графических процессорах, когда давно уже известные нейросети начали обучаться на больших данных быстро и качественно. Достаточно выбрать правильную нейронную модель, обучающую выборку, и задача частично решена. Во время локдаунов этими технологиями стали чаще пользоваться, соответственно отдавая бизнесу обратную связь от технологий. И, имея такой колоссальный обратный эффект за столь маленький промежуток времени, производители имеют уникальную возможность тюнинга своих помощников, конструирования и «захват» новых ниш, ведь общество само подсказывает, где и чего им не хватает.

СЛОЖНО ЛИ ГОЛОСОВОМУ БОТУ ВЫПОЛНЯТЬ ФУНКЦИИ ТЕХПОДДЕРЖКИ?

Кейс использования голосового бота в технической поддержке очень популярный и востребованный. Однако в большинстве случаев бот эффективен на первой линии поддержки. Например, он может консультировать по простым задачам, давать ответы на часто задаваемые вопросы, предоставлять стандартные инструкции, производить первичную диагностику. С первого уровня поддержки бот может переводить запрос на более глубокие линии и передавать звонок оператору. Сложные функции голосовой бот в технической поддержке выполняет не так эффективно. Например, он не справится с неплановыми работами через удалённый рабочий стол по звонку клиента, не сможет вступить в сложно-технический диалог. В таком случае боту следует перевести звонок на компетентного специалиста. При этом голосовые боты должны сами предложить в подходящий момент сделать перевод на оператора и не пробовать «выискивать» ответы на сложные запросы и раздражать клиента.

КАК ОЦЕНИТЬ, СПРАВЛЯЕТСЯ РОБОТ ИЛИ НЕТ?

Оценить работу голосового бота при взаимодействии с потребителями можно несколькими способами: техническими средствами, речевой аналитикой, удовлетворённостью клиентов, достижением показателей эффективности компании или подразделения.

115

Технические средства оценки в этом случае наиболее простые. Тут мы оцениваем, сумел ли бот вовремя поднять трубку или дозвониться, провёл ли он весь разговор, не было ли обрывов, хорошее ли качество связи, слышит ли его клиент, не прервал ли он внезапно разговор и прочие технические параметры. Тренд речевой аналитики как одного из следствий удовлетворённости клиентов показывает, что это эффективный метод оценки операторов колл-центра или диалога в целом. При помощи такого механизма можно оценивать и голосового бота (вместо оператора), и его диалог с клиентами. Мы сможем получить в результате такие параметры, как справился ли бот со всеми вопросами, дал ли он должные ответы, остался ли доволен клиент или, наоборот, он прервал разговор и положил трубку, сумел ли бот перевести на оператора по требованию, перебивал ли клиент бота, и другие разговорно-тематические выводы. По всем этим параметрам можно сделать выводы о работе голосового бота. Что касается показателей эффективности, то в современных информационных системах они также легко измеряются и фиксируются на каждом этапе. Например, положительная тенденция возврата клиентов или повторное обращение характеризует тот или иной показатель КР1, который может быть «привязан» к оценке внедрения голосового бота. Или, например, служба технической поддержки совместно с голосовым ботом стала быстрей и качественней отрабатывать первичные запросы, очередь ожидания сократилась до минимума — это также может положительно сказаться на оценке голосового бота.

ОТВЕЧАЮТ ЛИ ЛЮДИ РОБОТУ ПРИ АНКЕТИРОВАНИИ ИЛИ НА КОММЕРЧЕСКОЕ ПРЕДЛОЖЕНИЕ?

Если робот обзванивает с коммерческим предложением, его чаще всего даже не слушают. Тут играют роль несколько факторов, сам по себе холодный звонок уходит в прошлое, и это уже малоэффективное средство продажи; во-вторых, грамотно составленное коммерческое предложение и правильно поданное может найти свою аудиторию. Достаточно много практических примеров, когда люди не сразу догадываются, что общаются с роботами и даже, может, не с первого звонка. Поэтому в таком кейсе просто обязана быть интеллектуализация, сделаны правильные выводы уже после первого автоматизированного обращения. Огромный акцент должен уделяться психологии конструирования продающих диалогов, социализации и возрастной категории пользователей таких диалогов. Что касается анкетирования, тут немного проще. Та часть людей, которая проходит анкетирование с людьми, видит, что будет проходить анкетирование и с голосовыми ботами. И тут общие подходы к составлению анкет как при опросе человеком, так и ботом.

МОЖЕТ БЫТЬ, НА РОБОТА НУЖНО ПЕРЕКЛЮЧАТЬ ПОСЛЕ ОБШЕНИЯ С ОПЕРАТОРОМ?

Да, такие кейсы существуют на рынке. Голосовой бот в этом случае является помощником и дополнительной возможностью. Эта функциональность может быть использована при часто повторяющихся запросах,

116

информационных сообщениях, нормативных и законодательных документах или при оценке разговора и качества обслуживания. При этом желательно, чтобы оператор предупредил или поинтересовался, хочет ли клиент переключиться на голосового бота.

КАК ЛЮДИ РЕАГИРУЮТ НА ГОЛОСОВЫХ БОТОВ, НАПРИМЕР ПРИ ИСХОДЯЩЕМ ОБЗВОНЕ?

Голосовые боты популярны как при входящем обзвоне, так и при исходящем. Последние годы исходящий обзвон внедряли представители малого и среднего бизнеса. В то время как входящий обзвон концентрировался на больших колл-центрах крупных представителей бизнеса. Средние и малые компании, агентства, социологические институты являются первопроходцами генерации исходящего трафика для реальных кейсов. Хотя сама идея не нова, уже очень давно существовали многоканальные системы телефонного обзвона (ещё 40 лет назад можно было встретить автоматизированные системы, которые звонили на домашний телефон и говорили о задолженности). Такие системы модифицировались, улучшались, переходили с аналоговых линий на цифровые, GSM, IP-телефонию, но, по сути, они работали по одному и тому же принципу. Однако, в отличие от голосовых ботов, такие технологии не могли получать обратную связь от потребителя или в очень ограниченном варианте. Диалог вёлся односторонне, то есть система звонила и что-то говорила и информировала, клиент не мог перебить систему, вступить в дискуссию. Голосовой бот в исходящем трафике — новый уровень обзвона с интеллектуальной составляющей. Это полноценный диалог системы с клиентом при помощи естественной речи. Голосовой бот что-то спрашивает — пользователь отвечает, задаёт свои вопросы, бот даёт свои пояснения и так далее. Это действительно удобно. При грамотном построенном сценарии, безупречном распознавании речи, натуральном звучании синтеза речи, интеллектуальной обработке реплик клиента потребитель может даже не заметить, что общается с роботом. Только и только эти факторы принесут ожидаемый эффект от внедрения. Речь не идёт о простых «звонилках», с заранее записанных фраз диктора, с невозможностью перебить и вести с ним разговор, или в очень ограниченном режиме — такое можно назвать «хорошо забытое старое». По сути, лицом, а вернее, голосом, в голосовом боте является качество синтезированного голоса, и чем он лучше, натуральнее и естественнее, тем проще будет клиенту общаться с системой на широкие или вариационные темы. В отличие, когда у нас есть заранее записанные фразы, которые имеют ограниченный объём. Люди хорошо реагируют на голосовых ботов, с которыми можно поговорить и выяснить более детальные вопросы. Возможно, даже в будущем система синтеза речи сможет подстроиться на конкретный психотип собеседника. Простые «звонилки» после ограниченного набора фраз максимум что могут предложить — это перевод на оператора. Можно предположить, что есть свой рынок таких простых систем, например два-три стандартных вопроса, и все, «спасибо, до свидания». Но люди, как правило, относятся скептически, и если назойливый робот будет часто о себе напоминать, проще догадаться, что это какой-то голосовой спам, и заблокировать входящего абонента. О каких-то конкретных исследованиях, как люди относятся к подобным различным системам, нам не известно. Конечно, в записанных фразах есть свой плюс — говорит живой человек, и собеседник не сразу догадывается, что это робот. Например, на американском континенте такой робот держал в заблуждении целых 20-30

мин. Но там была психологическая уловка в том, что записанный диктор пожилой человек, и он постоянно переспрашивал, не понимал, просил переформулировать и так далее, но большого смысла в таком нет. А вот грамотный составленный голосовой бот может решить реально поставленные задачи.

ГОЛОСОВЫЕ БОТЫ И ГОЛОСОВЫЕ ПОМОЩНИКИ В БЫТУ ТАКИЕ, КАК УМНЫЕ УСТРОЙСТВА, В ЧЁМ РАЗНИЦА?

В нашем понимании и практике голосовые боты больше направлены на бизнес, работают больше в корпоративном коммерческом сегменте. Голосовые помощники, или даже виртуальные помощники, — это умные колонки, устройства, всевозможные встроенные функции в бытовую аппаратуру. Они позволяют улучшить быт и повседневную жизнь человека. Они помогают по дому, заказывают еду, помогают организовать досуг и прочее. Умная колонка не работает в первой линии колл-центра, точно так же, как и голосовой бот не сможет помочь по дому. Граница, конечно, тут очень тонкая, технологии работают схожие, но области применения совершенно разные. Умные устройства «знают» о мире более широко, они поддерживают множество навыков и умений, достаточно на них переключиться, и ты из одной предметной области переходишь в другую. Конечно, голосовой бот тоже может этому научиться, но для решения конкретного бизнес-кейса это не нужно.

ЧТО ЦЕНЯТ ПОЛЬЗОВАТЕЛИ В ГОЛОСОВЫХ БОТАХ?

Хорошо работающий голосовой бот экономит время как пользователя, так и владельцев бизнеса. Пользователь, зная, что общается с голосовым роботом, может узнать информацию более шире и глубже (если у робота предусмотрен такой сценарий). Боты не поддаются эмоциям или неугодным высказываниям. Они держат одну манеру общения с клиентом. Они могут находить информацию гораздо быстрее, чем оператор, используя различные информационные системы. К тому же они работают круглосуточно, и пользователь может получить ответы в любое время.

ОТЛИЧАЕТСЯ ЛИ ОТНОШЕНИЕ К ГОЛОСОВЫМ БОТАМ В ЗАВИСИМОСТИ ОТ ВОЗРАСТА?

Если говорить о голосовых ботах, которые встроены в смартфоны, умные устройства и прочие девайсы, то, конечно, активнее такой возможностью пользуются люди более молодого и среднего возраста. Это обусловлено не столько самой функцией, сколько развитием информационных технологий и аппаратных решений в сочетании с активным использованием людей более старшего поколения.

118

Если говорить о голосовых ботах в ракурсе нашего ведения бизнеса, то есть помощника в колл-центрах, электронном секретаре, информационно-программных комплексах и других интеграционных модулях, то большой разницы отношений возрастного контингента мы бы не отмечали. Более возрастное население не сразу может догадаться, что имеет дело с роботом, и будет пытаться обсуждать и задавать вопросы, так как оно привыкло делать в обычном общении. Также такие люди более раздражительно и эмоционально относятся к тому, что их не понимают, задают одни и те же вопросы («как заведённые»), переспрашивают, а они пытаются по-своему всё объяснить. Молодое поколение позитивно относится, что ведут разговор с голосовым помощником, и то, что они внедряются всё больше и больше в нашу повседневную жизнь. Поэтому очередной раз можно акцентировать внимание, что чем лучше будет сделан голосовой бот, приближен к естественному диалогу, тем менее нивелированное будет отношение между поколениями его пользователей.

ЧТО СЕЙЧАС ТОРМОЗИТ РАЗВИТИЕ ГОЛОСОВЫХ БОТОВ?

Не думаю, что что-то тормозит развитие голосовых ботов. За всю историю отрасли всегда были проблемы, задачи, гипотезы, исследования. Все они решались с более или менее успешной вероятностью. Поскольку бизнес уже очень давно понял, что это перспективные коммерческие вложения, и заниматься этим интересно. Большинство маркетинговых прогнозов и исследования за последние 30 лет сбываются, и это все коммерциализируется и монетизируется. Мы штатно работаем над всеми исследовательскими и коммерческими проектами.

ПОЧЕМУ ЛУЧШЕ ОБРАЩАТЬСЯ К НАМ, А НЕ К КОРОБОЧНОМУ ПРОДУКТУ, НАСТРАИВАТЬ СИЛАМИ ПОКУПАТЕЛЯ?

Коробочный продукт — это скорее всего к бытовым нуждам. Упакованный кейс — это всегда некоторый шаблон, который может не подходить под нужды бизнеса. Кроме того, корпоративным клиентам необходимы разрабатываемые проекты, гибко модифицируемые, подстраиваемые под бизнес-среду потребителя. Все это способствует разработке уникальных кейсов голосовых ботов. Для эффективного решения таких задач коробочные варианты не подходят, и нужно разрабатывать заказной проект и обращаться к производителям технологий и услуг. В проекте понадобятся хорошие лингвисты-сценаристы для составления умных сценариев, тюнинг-систем распознавания речи (например, на специальные термины, названия продуктов или диалектические особенности речи), настройки систем синтеза речи или даже разработки уникального, синтезированного голоса. Интеграторы или посредники самостоятельно все это сделать не смогут, поэтому тут необходимо работать в плотной связке — производитель, интегратор, клиент. В компании есть весь научно-технический потенциал разработки любых голосовых ботов, собственные технологии синтеза и распознавания речи под любые лингвистические и акустические модели. А также накопленный опыт создания голосовых и чат-ботов позволяет разработать современный голосовой бот в любой коммерческой области.

ikiii..,......

'Ijiffrr

VOICE BOTS: QUESTIONS AND ANSWERS

Kiselev V.V., CEO «Speech Technology Ltd», Minsk, Belarus,

The article discusses the problems of modern voice bots, strong and weaknesses from the business point of view. The article is organized in the form of virtual interviewing.

• voice bots • voice assistants • artificial intelligence • AI • ASR • TTS, conversational systems • dialog systems

info@speech.by

120

i Надоели баннеры? Вы всегда можете отключить рекламу.