Научная статья на тему 'Голосовой помощник как технология обработки данных'

Голосовой помощник как технология обработки данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
3964
469
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГОЛОСОВОЙ АССИСТЕНТ / ГОЛОСОВОЙ ПОМОЩНИК / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / ALISA / GOOGLE ASSISTANT / SIRI / VOICE ASSISTANT / ARTIFICIAL INTELLIGENCE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Поначугин Александр Викторович, Пичужкина Дарья Юрьевна, Смекалова Екатерина Сергеевна

Для решения большинства задач, связанных с работой в интернете или запуском программных приложений, сегодня нет необходимости набирать запрос. С такими запросами легко справляются голосовые помощники, созданные при помощи встроенного или облачного искусственного интеллекта. В данной статье раскрывается тема использования голосовых помощников, разработанных отечественными и зарубежными компаниями, в современном мире на примере их появления на рынке, принципа и функционала работы, рассматривается диаграмма деятельности подсистемы идентификации, а также проводится анализ статистики наиболее популярных голосовых ассистентов и анализ использования голосовых помощников за календарный год. На основе анализа основных функций сформулированы тезисы о работе наиболее распространённых голосовых помощников. Рассмотрены перспективы и тенденции развития данной технологии.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

VOICE ASSISTANT AS A DATA PROCESSING TECHNOLOGY

To solve most of the problems associated with working on the Internet or launching software applications, today there is no need to type a request. Such requests are easily handled by voice assistants created using built-in or cloud artificial intelligence. This article reveals the topic of using voice assistants developed by domestic and foreign companies in the modern world by the example of their appearance on the market, the principle and functionality of work, examines the diagram of the identification subsystem, and analyzes the statistics of the most popular voice assistants and analyzes the use of voice assistants for the calendar year. Based on the analysis of the main functions, theses on the work of the most common voice assistants are formulated. The prospects and development trends of this technology are considered.

Текст научной работы на тему «Голосовой помощник как технология обработки данных»

УДК 004.8

ГОЛОСОВОЙ ПОМОЩНИК КАК ТЕХНОЛОГИЯ ОБРАБОТКИ ДАННЫХ

Поначугин Александр Викторович, кандидат экономических наук, доцент, Пичужкина Дарья Юрьевна, студент, Смекалова Екатерина Сергеевна, студент; НГПУ им. К. Минина, Нижний Новгород, Российская Федерация

Аннотация: Для решения большинства задач, связанных с работой в интернете или запуском программных приложений, сегодня нет необходимости набирать запрос. С такими запросами легко справляются голосовые помощники, созданные при помощи встроенного или облачного искусственного интеллекта. В данной статье раскрывается тема использования голосовых помощников, разработанных отечественными и зарубежными компаниями, в современном мире на примере их появления на рынке, принципа и функционала работы, рассматривается диаграмма деятельности подсистемы идентификации, а также проводится анализ статистики наиболее популярных голосовых ассистентов и анализ использования голосовых помощников за календарный год. На основе анализа основных функций сформулированы тезисы о работе наиболее распространённых голосовых помощников. Рассмотрены перспективы и тенденции развития данной технологии.

Ключевые слова: голосовой ассистент; голосовой помощник; искусственный интеллект; Alisa; Google Assistant; Siri.

VOICE ASSISTANT AS A DATA PROCESSING TECHNOLOGY

Ponachugin Alexander Viktorovich, Candidate of Economic Sciences, Associate Professor,

Pichuzhkina Daria Yuryevna, student, Smekalova Ekaterina Sergeevna, student; Minin University, Nizhny Novgorod, Russia

Abstract: To solve most of the problems associated with working on the Internet or launching software applications, today there is no need to type a request. Such requests are easily handled by voice assistants created using built-in or cloud artificial intelligence. This article reveals the topic of using voice assistants developed by domestic and foreign companies in the modern world by the example of their appearance on the market, the principle and functionality of work, examines the diagram of the identification subsystem, and analyzes the statistics of the most popular voice assistants and analyzes the use of voice assistants for the calendar year. Based on the analysis of the main functions, theses on the work of the most common voice assistants are formulated. The prospects and development trends of this technology are considered.

Keywords: voice assistant; voice assistant; artificial intelligence; Alisa; Google Assistant;

Для цитирования: Поначугин, А. В. Голосовой помощник как технология обработки данных / А. В. Поначугин, Д. Ю. Пичужкина, Е. С. Смекалова. - Текст : электронный // Наука без границ. - 2020. - № 6 (46). - С. 96-100. - URL: https://nauka-bez-granic.ru/No-6-46-2020/6-46-2020/

For citation: Ponachugin A.V., Pichuzhkina D.Yu., Smekalova E.S. Voice assistant as a data processing technology // Scince without borders, 2020, no. 6 (46), pp. 96-100.

Важным аспектом развития государства являются информационные технологии, так как они формируют новую интернет-экономику, которая основывается на знаниях, а не на расширяющемся потреблении невоспроизводимых ресурсов [2].

Использование голосовых помощников является актуальной темой в современном мире, поскольку максимально сильно упрощает жизнь человека.

Голосовые помощники - это боты, которые работают на искусственном интеллекте при помощи распознавания голоса и обработке естественного языка, чтобы отвечать на вопросы, вести разговоры, осуществлять запуск простых задач. С появлением такой опции, выполнять многие запросы стало намного удобнее. Голосовые помощники построены на искусственном интеллекте (ИИ), технологиях машинного обучения и распознавания голоса [4].

История развития информационных технологий берет свое начало с 60-х гг. ХХ в. И на сегодняшний день информационные технологии стали неотъемлемой частью нашей жизни.

Попытки распознать голос при помощи технологий, начались ещё в 1930 г. Тогда учёные старались запрограммировать машину на распознавание одночленных звуков, а сейчас наши смартфоны и компьютеры понимают целые предложения. Данный скачок возник в результате развития машинного обучения, которое заставляет нейронные сети самостоятельно анализировать контекст и эффективно определять основной источник звука. Однако разработчикам потребовалось на это около 80 лет подготовительных работ [3].

Принцип работы голосовых помощников также прост, как и их использование:

1. Пассивное считывание звука, при помощи активации функции со встроенным кодовым словом;

2. Фильтрация сигнала - этап устранения шума и помех, возникающих при записи голосового запроса;

3. Оцифровка звука - происходит преобразование звукового сигнала в цифровой вид, понятный компьютеру;

4. Анализ сигнала - выделяются участки с речью, происходит оценивание параметров, таких, как часть речи, форма слова, связь в один запрос;

5. Поиск шаблонных данных - искусственный интеллект собирает разные произношения слова, сравнивает с шаблонами и выдаёт результат.

Голосовой ассистент можно написать практически при помощи любого языка программирования, но наиболее популярным на 2020 г. является Python. Для написания программного кода понадобится знание языка, умение работать с подключением различных библиотек, и четкая формулировка входных и выходных данных.

Артозей Е.А. в своей статье «Разработка алгоритмов идентификации голосовых команд для управления бортовой системой автомобиля» пишет, что «для визуального представления процессов ввода и дальнейшего распознавания голосовых команд системой голосового управления используется диаграмма деятельности подсистемы идентификации.

Деятельность подсистемы берет свое начало с ввода голосовой команды. Полученный сигнал преобразуется в цифровой вид и проходит процедуру фильтрации внешних шумов. Далее, преобразованный сигнал по-

падает с подсистему идентификации. В данной подсистеме для распознавания команды сперва подается запрос к базе данных сигналов. При совпадении входного и сохраненного сигналов распознавание проходит успешно, и команда передается на исполнительное устройство, выполняющее определенное действие. Если голосовая команда не распозналась, то система возвращается к началу - вводу голосовой команды, и алгоритм действий повторяется снова, пока не будет достигнут положительный результат, то есть до тех пор, пока голосовая команда не распознается» [1].

Функциональность использования голосовых помощников строится на

Проанализировав её данные, можно сформулировать следующие тезисы:

решении простых ежедневных задач (построение маршрута, звонок лицу из контактных данных, установка оповещения, поддержка разговора и другие). В результате частого использования голосовой ассистент запоминает наиболее часто используемые функции пользователя данного устройства, и старается облегчить дальнейшие запросы. Так как все голосовые помощники обладают искусственным интеллектом, то при общении они учитывают изменение местоположения, время суток, дни недели, историю поисковых запросов, различные предыдущие заказы и многое другое.

В таблице приведено несколько голосовых помощников и их функции.

1. В данной таблице представлены самые популярные в использование

Таблица

Голосовые помощники и их функции

Голосовой помощник Siri Google Assistant Alisa

Производитель Apple Google Яндекс

Код активации «Привет, Siri» «О'кей, Google» «Привет, Алиса»

Задачи Управление умными устройствами; Поиск информации; Цифровая няня. Управление умными устройствами; Поиск информации; Справочник. Обработка голосового запроса; Управление медиа устройствами; Поиск информации; Имеется ряд игр и различных встроенных навыков, упрощающих жизнь человека.

Интеграция с социальными сетями Да Нет Да

Понимание произвольной речи и команд Да Да Да

Мобильные приложения Android, iOS Android, iOS и браузер Chrome Android, iOS и браузер Яндекс

голосовые ассистенты;

2. Данные голосовые помощники поддерживаются на всех устройствах, начиная с портативного компьютера, при помощи веб-браузера, заканчивая переносными устройствами, такими как смартфоны, планшеты, музыкальные колонки;

3. Интеграцию с социальными сетями поддерживают Siri и Alisa, что невозможно сказать про Google Assistant;

4. Siri, Alisa и Google Assistant обладают функции понимания произ-

вольной речи, а также определённого набора команд;

5. Основные задачи дачи данных голосовых ассистентов - это обработка голосовых помощников, управление умными устройствами, а также поиск информации в глобальной сети Интернет.

Сравнительный анализ использования голосовых помощников за последний год показывает, насколько востребованы виртуальные ассистенты от компаний Apple, Яндекс и Google среди российских пользователей.

АНАЛИЗ ИСПОЛЬЗОВАНИЯ ГОЛОСОВЫХ ПОМОЩНИКОВ ЗА год

Рисунок - Анализ использования голосовых помощников за год

На диаграмме видно, что наибольшую долю запросов пользователей среди голосовых помощников занимает «Алиса», созданный компанией Яндекс. Популярность «Алисы» в российском сегменте обусловлена спецификой ее целевой аудитории и особенностями технической разработки.

Российский помощник лучше аналогов благодаря отечественному производству. «Алиса» великолепно распознает русский язык и понимает невнятную речь (нечёткую русскую речь Siri или Google Assistant распознают с огромными проблемами), а также «Алиса» в отличие от своих кон-

курентов может поддерживать диалог с пользователем, например, рассказать анекдот или историю.

Опираясь на мнение различных 1Т -и бизнес - аналитиков, можно прийти к выводу, что голосовые помощники хоть и развиваются достаточно быстро, но на 2020 г. не находятся на пике популярности и развития своих возможностей. Стоит отметить также тот факт, что в будущем при использовании голосовых ассистентов планируется покорять космос и выполнять простые медицинские операции. Получается, что возможности голосового помощника распространятся с решения про-

стых пользовательских требований, до решения более сложных технически затратных задач, на реализацию кото-

рых потребуется длительное обучение искусственного интеллекта.

СПИСОК ЛИТЕРАТУРЫ

1. Артозей, Е. А. Разработка алгоритмов идентификации голосовых команд для управления бортовой системой автомобиля / Е. А. Артозей. - Текст : электронный // Современная техника и технологии, 2015. - № 9. - URL: http://technology.snauka. ru/2015/09/7903.

2. Поначугин, А. В. Компьютерные сети в России и становление интернет-экономики / А. В. Поначугин - Текст : непосредственный // Вестник Мининского университета, 2015. - № 4 (12). - С. 20.

3. Смыслова, Л. В. Чат-бот как современное средство интернет-коммуникаций / Л. В. Смыслова. - Текст: непосредственный // Молодой ученый. - 2018. - № 9 (195).

- С. 36-39.

4. Хлопенкова, А. Ю. Методы обработки естественного языка в виртуальных голосовых помощниках / А. Ю. Хлопенкова, Ю. С. Белов - Текст: непосредственный // E - Scio.

- 2019. - № 11 (38). - С. 167-173.

REFERENCES

1. Artozey E.A. Razrabotka algoritmov identifikacii golosovyh komand dlya upravleniya bortovoj sistemoj avtomobilya [Development of voice command identification algorithms for controlling an on-board vehicle system]. Modern equipment and technologies, 2015, no. 9. Available at: http://technology.snauka.ru/2015/09/7903.

2. Ponachugin A.V. Komp'yuternye seti v Rossii i stanovlenie internet-ekonomiki [Computer networks to Kussia and formation of internet economy]. Vestnik of Minin University, 2015, no. 4 (12), P. 20.

3. Smyslova L.V. Cрat-bot kak sovremennoe sredstvo internet-kommunikacij [Chatbot as a modern means of Internet communications]. Young scientist, 2018, № 9 (195), pp. 36-39.

4. Khlopenkova A.Yu., Belov Yu.S. Metody obrabotki estestvennogo yazyka v virtual'nyh golosovyh pomoshchnikah [Natural language processing methods in virtual voice assistants]. E-Scio, 2019, no. 11 (38), pp. 167-173.

Материал поступил в редакцию 11.06.2020 © Поначугин А.В., Пичужкина Д.Ю., Смекалова Е.С., 2020

i Надоели баннеры? Вы всегда можете отключить рекламу.