УДК 004.5
ПОПУЛЯРНЫЕ ГОЛОСОВЫЕ ПОМОЩНИКИ: ВОЗМОЖНОСТИ И ТЕНДЕНЦИИ РАЗВИТИЯ
Наталия Владимировна Пчелинцева
старший преподаватель [email protected] Сергей Александрович Пчелинцев кандидат экономических наук, доцент [email protected] Мария Александровна Скрипкина
студент
[email protected] Мичуринский государственный аграрный университет
г. Мичуринск, Россия
Аннотация. В данной статье раскрывается тема использования голосовых помощников, разработанных отечественными и зарубежными компаниями, проведен сравнительный анализ голосовых помощников.
Ключевые слова: голосовой помощник, искусственный интеллект, виртуальные ассистенты.
Голосовой помощник - это бот искусственного интеллекта, который работает на механизме распознавании речи, в ответ на голосовые команды такие помощники могут выполнить самые разнообразные команды.
Впервые подобие голосового помощника изобрел немецкий инженер Христиан Кратценштайн в 1779 году. Он создал аппарат, который мог воспроизводить всего несколько гласных звуков. К сожалению, его разработки до наших дней не дошли.
В 1937 году в американской лаборатории был изобретен первый синтезатор речи. Аппарат Voder мог воспроизводить одно имя, но с разной интонацией.
Задачей советского физика Льва Мясникова была не имитация речи, а научить машину распознавать человеческую речь. В 1942 году несмотря на войну он сумел защитить свой проект, и показать аппарат умеющий распознавать несколько гласных и согласных звуков.
В 1952 году в лаборатории Bell был представлен первый распознаватель чисел от 1 до 5. Происходило все с помощью телефона. В трубку произносилось число, а система распознавала звук как электронный сигнал и сопоставляла его с загруженными в эту систему фразами.
В 1962 году компания IBM представила технологию распознавания речи -Shoebox. Система распознавала 16 слов, 6 цифр и 10 математических команд.
В 1980 году инженеры научились использовать скрытую модель Маркова. По своей сути это описание вероятностей перехода объекта из одного состояния в другое. Это матричная система генерации случайных событий в рамках заданного аргумента. Как раз эту систему использовали в детских «говорящих куклах».
В 1990-х появилась много систем распознавания речи. Одной из них была Dragon Dictate, где пользователь мог писать текст наговаривая его в микрофон. Но программа допускала ошибки, и уже в 1997 году вышла обновленная версия этой программы, она могла распознавать до 100 слов в минуту.
В 2001 году Microsoft интегрировал технологию распознавания речи в офисный пакет Office XP.
В 2005-2006 году Apple ввел систему Voice over. Эту программу мог использовать кто угодно, и обучать ее определенному голосу не требовалось. Microsoft решил не отставать и интегрировал голосовое управление в Windows Vista [1, 3, 5].
В октябре 2011 года появляется голосовой помощник Siri от Apple на iPhone. Позже в мае 2012 года Google представляет голосовой помощник Google Assistance.
Рассмотрим разнообразие голосовых помощников. Голосовые помощники обладают примерно одинаковым функционалом. К ним можно отнести: записи в календарь, управление сообщениями и звонками, включение музыки, фильмов, отображение прогноза погоды, поиск нужной информации.
Голосовые помощники можно разделить на несколько видов:
Для компьютеров. Предусматривает поиск различной информации в браузере. Открывает различные программы.
Для смартфонов. Система может набирать указанные номера, управлять некоторыми функциями смартфона.
Для дома. Предназначен для системы умный дом. Имеют вид компактных колонок достаточно мобильны. Легко размещаются в доме.
Самыми популярными голосовыми помощниками являются: Google Assistant от компании Google; Siri от компании Apple; Alexa от компании Amazon; Алиса от компании Yandex.
Голосовой помощник Алиса. Наверно самый популярный русскоязычный помощник. Может рассказывать различные истории, давать рекомендации, обладает высокой скоростью поиска, может запускать различные приложения. Из минусов урезанный функционал на мобильных операционных системах.
Голосовой помощник Siri. Разработан специально для устройства Apple. Способен набирать и отвечать на звонки, писать и отправлять сообщения, может искать информацию в браузере. Максимально качественный русский язык,
встраивается в транспортные средства. Недостатком является то, что помощник предназначен только для Apple техники.
Голосовой помощник Google Assistant. К функциональным особенностям можно отнести прослушивание вставок автоответчиков. Есть возможность поиска различных адресов используя карты. Помощник может заказать билеты, осуществлять покупки в интернет-магазинах. Плохо адаптирован для русскоязычных пользователей.
Голосовой помощник Alexa. Изначально этот помощник был разработан для портативных колонок. Позже перешел в использование мобильными устройствами. Может свободно управлять любой техникой. Широчайший набор функций, постоянное самосовершенствование.
Большинство людей используют голосовые помощники, когда у них заняты руки. Еще одна причина заключается в том, что мы говорим намного быстрее, чем печатаем. Так же голосовые помощники удобны для людей с ограниченными возможностями [2].
Голосовые помощники еще не достигли своего предела и в ближайшее время будут дальше развиваться в других направлениях. Рассмотрим этот вопрос более подробно.
Очеловечивание. Ботам нужны эмоции и для этого разработчики стараются синтезировать голос близкий к человеческому. В скором времени они научаться использовать междометия и сленг.
Развитие визуала. Помощники обретут лицо в виде экранов. Будут оценивать, консультировать и помогать с выбором покупателям.
Обучаемость. Бот не всегда справляется с ответами пользователя, поэтому благодаря шаблонным ответам менеджера бот обучается.
Кастомизация. На данном этапе голосовые помощники могут распознавать небольшой спектр эмоций и пол собеседника. Разработчики думают над тем как создать гаджеты, которые могли бы подстраиваться под настроение собеседника [2, 4, 5].
Подводя итог можно сказать, что голосовыми помощниками уже сейчас пользуется большое количество людей в абсолютно разных сферах. И хоть голосовые помощники еще только развиваются, в ближайшее время мы увидим усовершенствованную технологию распознавания голоса и интеграцию ботов с визуальными технологиями.
Список литературы:
1. Магулаев А.Э. Популярные голосовые помощники: возможности и тенденции в развитии // Инструменты и механизмы современного инновационного развития: сборник статей Международной научно-практической конференции. Волгоград. 29 июня 2018 года. Волгоград. 2018. С. 41-43.
2. Чепраков И.В., Пчелинцева Н.В., Гущина А.А. Искусственный интеллект, его проблемы и перспективы // Наука и Образование. 2022. Т. 5. № 2.
3. Гущина А.А., Пчелинцева Н.В., Шацкий В.А. Применение искусственного интеллекта в обеспечении безопасности данных // В сборнике: Инженерное обеспечение инновационных технологий в АПК. Материалы Международной научно-практической конференции. Мичуринск-наукоград РФ. 2021. С. 79-81.
4. Пчелинцева Н.В., Гущина А.А. Компьютерная революция: положительное и отрицательное влияние на общество // Наука и образование: актуальные вопросы теории и практики: материалы Международной научно-методической конференции. Оренбург. 2021. С. 57-58.
5. Пчелинцева Н.В., Маркова Е.С., Кувардин С.Р. Цифровые технологии в образовании // Наука и Образование. 2022. Т. 5. № 2.
UDC 004.5
POPULAR VOICE ASSISTANTS: OPPORTUNITIES AND DEVELOPMENT TRENDS
Natalia V. Pchelintseva
senior lecturer [email protected] Sergey A. Pchelintsev
candidate of economic sciences, associate professor
[email protected] Maria A. Skripkina student
[email protected] Michurinsk State Agrarian University Michurinsk, Russia
Annotation. This article reveals the topic of using voice assistants developed bydomestic and foreign companies, a comparative analysis of voice assistants is carried out.
Keywords: voice assistant, artificial intelligence, virtual assistants.
Статья поступила в редакцию 16.02.2023; одобрена после рецензирования 20.03.2022; принята к публикации 30.03.2023.
The article was submitted 16.02.2023; approved after reviewing 20.03.2022; accepted for publication 30.03.2023.