Система голосового обслуживания для оптимизации работы колл-центра

Д.Р. Романова; В.В. Подколзин

Рисунок 5. Печать чека

Библиографический список

1. Товарный чек [Электронный ресурс] https://www.freshdoc-.ru/buhgalteria/tovamyiy_chek/ - Режим доступа: свободный. (дата обращения 15.12.2019).

2. Вендеров, А.М. Практикум по проектированию программного обеспечения экономических информационных систем: учеб. пособие / А.М. Вендеров. - М.: Финансы и статистика, 2004. - 192 с.

3. Проектирование информационных систем: учеб. пособие / В.И. Грекул, Г.Н. Денищенко, Н.Л. Коровкина. - 2-е изд., испр. - С.: Интернет-Университет Информационных технологий; БИНОМ. Лаборатория знаний, 2008. - 300 с.

4. Диго, С.М. Базы данных: проектирование и использование: учебник / С.М. Диго. - М.: Финансы и статистика, 2005. - 592 с.

СИСТЕМА ГОЛОСОВОГО ОБСЛУЖИВАНИЯ ДЛЯ ОПТИМИЗАЦИИ РАБОТЫ КОЛЛ-ЦЕНТРА

Д.Р. Романова, В.В. Подколзин

Кубанский государственный университет ул. Ставропольская 149, 350040, г. Краснодар, Россия

Ключевые слова: распознавание речи, аналитика речи, системы голосового обслуживания.

Аннотация

В статье рассматривается задача распознавания и анализа речи на основе разговоров операторов колл-центра с клиентами с целью

оптимизации работы операторов контактных центров и последующего повышения эффективности работы, обучения, а также автоматизации этого процесса.

В настоящее время можно выделить следующие основные направления развития речевых технологий:

1. Синтез речи (перевод текста в речь).

2. Голосовая биометрия (поиск и подтверждение личности по голосу).

3. Анализ речи.

4. Распознавание речи (перевод речи в текст).

Распознавание речи - это самая распространенная речевая

технология, в первую очередь - благодаря мобильным устройствам и всевозможным гаджетам.

Существует несколько основных векторов развития технологии распознавание речи:

- распознавание естественного языка;

- аналитика переговоров (анализ большого количества аудио записей в целях поиска каких-либо трендов);

- анализ эмоций (чаще всего рассматривается как дополнение к вышеуказанным пунктам для решения каких-либо конкретных задач).

Одними из важнейших задач на основе технологии распознавания речи являются оптимизация и автоматизация работы операторов, а также сокращение времени на их обучение (при большом количестве разнообразных тематик обращений обучение одного компетентного сотрудника, которого можно допускать к работе на линии, может достигать нескольких месяцев), повышение эффективности их работы.

В качестве способа решения данной проблемы можно рассматривать внедрение систем голосового обслуживания. Рассмотрим концепцию данного подхода, схема которой изображена на рисунке 1.

Поступивший звонок абонента колл-центра переводится на голосовую платформу с IVR (interactive voice response) меню -ПО для обработки логики диалога абонента с системой.

Следующим этапом является преобразование речи человека в текст, которое происходит в модуле распознавания речи.

Рисунок 1. Схема системы голосового обслуживания

Существует несколько способов реализации данного этапа.

1. Распознавание по закрытым грамматикам.

В систему закладывается определенная конечная база слов, в которой будет производиться поиск по слову или фразе. Для этого система должна поставить абоненту вопрос с однозначным ответом.

2. Распознавание по встроенным грамматикам.

Этот метод - разновидность закрытых грамматик. Система уже содержит грамматики, которые способны распознавать конкретные тематические фразы абонента. При составлении сценария диалога необходимо сослаться на определенную встроенную грамматику.

3. Распознавание по открытым грамматикам.

Абонент произносит всю фразу целиком, тем самым задавая открытый вопрос в свободной формулировке. Распознается каждое слово в ответе абонента и выявляется общий смысл сказанного.

Распознавание слитной речи дает системе больше возможностей для автоматизации процесса диалога с абонентом, возрастает скорость и удобство пользования системой. Реализация таких систем является нетривиальной задачей, поэтому, если подразумеваются односложные ответы абонента, лучше применять закрытые грамматики [1].

Данный этап реализуется программно на языке Python с использованием библиотеки распознавания речи SpeechRecognition. Она предоставляет доступ к нескольким открытым API, наиболее удобным и простым из которых является Google Cloud Speech API - позволяет конвертировать

аудио в текст, применяя мощные модели нейронных сетей на основе машинного обучения Google. Среди его преимуществ можно выделить следующие: автоматически определяет и распознает более 120 языков; обрабатывает шумы в канале, не требуя дополнительного шумоподавления; автоматически расставляет пунктуацию; может обрабатывать как ранее записанные, так и потоковые аудио-файлы в режиме реального времени; мультиканальное распознавание речи (например, для телефонного звонка с двумя каналами функция преобразования речи в текст распознает каждый канал отдельно и комментирует записи так, чтобы они следовали в соответствующем порядке).

На следующем этапе полученный размеченный текст попадает в модуль распознавания семантики текста и классификации запросов, где полученные слова анализируются на предмет тематики высказывания, и запрос соотносится к определенной категории.

Для реализации данного этапа используется язык программирования Python, открытая библиотека для глубинного машинного обучения TensorFlow и Keras, высокоуровневый API для построения и обучения моделей в TensorFlow. На выходе программы известна тема заданного вопроса, а значит, может быть выбран соответствующей шаблонный ответ.

Однако категория обращения может быть не установлена, потому возможны следующие варианты действий.

1. Если в речи абонента содержатся все необходимые данные для того, чтобы классификатор определил тему и был найден соответствующий шаблон ответа, тогда этот ответ можно синтезировать в речь с использованием Google Text-to-Speech. Это библиотека языка программирования Python и инструмент для взаимодействия с API преобразования текста в речь Google Translate. Далее запись может быть воспроизведена через голосовую платформу.

2. Если же эти данные неполны и классификатор не может определить тему сообщения, то звонок будет перенаправлен на оператора.

К преимуществам данного метода относится:

- повышение эффективности работы операторов. Поскольку

оператор заранее знает тему запроса, он сможет обработать его быстрее;

- сбор данных и составление шаблонов ответов на запросы. Этот процесс в дальнейшем можно автоматизировать, исключив «живых» операторов из цепочки ответа, тем самым сокращая нагрузку на сотрудников, увеличить объем услуг, при этом не расширяя штаб;

- сокращение времени обучения операторов. Для вывода сотрудников на «боевые» линии, понадобится меньше времени: оператору не придется изучать все возможные тематики -достаточно иметь компетенции в одной или нескольких, а система будет переводить на оператора звонки только по

определенным категориям;

оценка уровня удовлетворенности клиента. Эти

показатели можно использовать для введения КР! для

сотрудников, что в дальнейшем поможет производить контроль. Так, если значение одного из показателей отклоняется в «плохую» сторону, это может служить индикатором того, что оператор плохо разбирается тематиках. Также можно выявлять лучшие практики и методики, а на основании этой информации корректировать существующие механизмы ответов на вопросы и даже обучение.

В качестве следующего этапа разработки системы рассматривается задача определения эмоциональной окраски речи абонента.

Существует ряд проблем, которые могут возникнуть при реализации данной системы.

При обработке вопроса абонента точность поиска по одному конкретному слову будет достаточно высокой при минимуме ложных срабатываний, но при больших

сложносформулированных эмоциональных вопросах

правильность определения категории может сильно снижаться с увеличением ложных срабатываний. Также погрешности могут зависеть от следующих факторов:

- помехи на линии и другие фоновые звуки;

- точность постановки задач для нечёткого поиска;

- слабая типизация русского языка (опираться на состав

предложения для построения гипотез не всегда возможно);

- определение семантики, контекста и интонации;

- разные ударения и произношения слов, акценты и другое.

Внедрять подобные системы имеет смысл, когда

контактный центр имеет большое количество операторов и объем поступающих звонков, иначе - проще и дешевле обрабатывать их вручную.

Предложенный в данной статье метод решения задачи оптимизации работы контактного центра позволяет автоматизировать обработку обращений абонентов, сократить время отклика. Автоматизация включает в себя сбор данных и классификацию тематик обращения, что дает возможность уменьшить время обучения операторов, а также выявить наилучшие практики ответов на запросы клиентов колл-центра и применить их в качестве шаблонных.

Библиографический список

1. Речевые технологии. Распознавание слитной речи на примере IVR систем [Электронный ресурс]. - Режим доступа: https://habr.com/ru/company/speechpro/blog/184832 (дата обращения: 12.03.2020).

АВТОМАТИЗАЦИЯ СИСТЕМЫ ПОДГОТОВКИ ИСКОВОГО ЗАЯВЛЕНИЯ О ВЗЫСКАНИИ АЛИМЕНТОВ

НА РЕБЕНКА

С.А. Ханфенова, А.М. Узденова

Карачаево-Черкесский государственный университет имени У.Д. Алиева ул. Ленина 29, 369202, г. Карачаевск, Россия

Ключевые слова: автоматизированные информационные системы, функционально-ориентированное проектирование, проектирование баз данных, диаграмма «сущность-связь».

Аннотация

В данной статье рассмотрен процесс создания автоматизированной системы для подготовки искового заявления о взыскании алиментов на ребенка. Проектирование системы выполнено на основе функционально-

Система голосового обслуживания для оптимизации работы колл-центра Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Д.Р. Романова, В.В. Подколзин

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Д.Р. Романова, В.В. Подколзин

Текст научной работы на тему «Система голосового обслуживания для оптимизации работы колл-центра»