Научная статья на тему 'АНАЛИЗ АЛГОРИТМОВ ГОЛОСОВЫХ ПОМОЩНИКОВ'

АНАЛИЗ АЛГОРИТМОВ ГОЛОСОВЫХ ПОМОЩНИКОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
426
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГОЛОСОВЫЕ ОПОВЕЩЕНИЯ / СИСТЕМЫ МОНИТОРИНГА / ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ / ГОЛОСОВЫЕ ПОМОЩНИКИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Карибов А. Ю.

Рассматривается понятие «голосовые помощники», подробно описываются технологии, которые могли бы быть применены в различных сферах. Они могут быть внедрены во множество интеллектуальных систем и улучшать удобство коммуникации человека и ПК. В данной статье описываются принципы функционирования и действия голосового ассистента

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «АНАЛИЗ АЛГОРИТМОВ ГОЛОСОВЫХ ПОМОЩНИКОВ»

УДК 1

Карибов А.Ю.

Астраханский государственный университет (АГУ), Россия, г. Астрахань АНАЛИЗ АЛГОРИТМОВ ГОЛОСОВЫХ ПОМОЩНИКОВ

Аннотация: рассматривается понятие «голосовые помощники», подробно описываются технологии, которые могли бы быть применены в различных сферах. Они могут быть внедрены во множество интеллектуальных систем и улучшать удобство коммуникации человека и ПК. В данной статье описываются принципы функционирования и действия голосового ассистента.

Ключевые слова: голосовые оповещения, системы мониторинга, информационные технологии, голосовые помощники.

Введение

Уже сейчас «голосовые ассистенты» и умные помощники, наглядно показывают нам, на что именно будут способны персональные роботы в ближайшем будущем. Во -первых, голосовой интерфейс будет основным для взаимодействий со множеством функций персонального робота. Во-вторых, ваш персональный робот будет подключен к различным онлайн-сервисам, таким как календарь, новостной портал, интернет-магазин и так далее.

Появление интеллектуальных персональных программных агентов, таких как: Siri, Cortana, Google Now во многом связано с тем, что большинство людей вообще не привыкли скачивать и использовать отдельные приложения для решения своих задач , все больше программ станут поддерживать поиск по своему контенту через внешние сервисы и для этого их даже не придется устанавливать. Ключевой фактор роста популярности интеллектуальных помощников возможность искать по контенту приложений. В свою очередь те будут использовать свои поисковые алгоритмы, чтобы забирать контент из приложений так, что пользователю даже не придется устанавливать их на свой телефон.

Алгоритм действий голосовых помощников

Поскольку рекуррентные сети имеют «память» о прошлых состояниях, стало

возможным хранить долговременные связи в распознаваемой речи, то есть, контекст.

Теперь нейронная сеть может предсказывать результат на основе целых предложений,

что расширило возможности обучения, и позволило в качестве обучающей базы данных

использовать обычную человеческую речь. Поскольку нейронные сети достаточно

точны, действительно серьёзной проблемой остаётся лишь повышение качества записи

в агрессивных шумовых средах. После переработки речи из звукового сигнала в

удобный для работы программы формат, голосовой помощник может приступить к

алгоритмам обработки запроса. Более простые помощники, которые могут быть

настроены практически любым пользователем, при наличии специального

программного обеспечения, строятся на довольно простых алгоритмах. Пользователь

собирает ключевые фразы и указывает реакцию (действия программы) на них, после

чего, в активной фазе, помощник проверяет голосовые команды на соответствие

ключам. Выявляется вероятность, с которой команда удовлетворяет каждому из

ключей. Если для определённой команды вероятность удовлетворительна и

максимальна среди всех остальных, то ключ активирует привязанное к нему действие.

Более интересны продвинутые помощники, работающие на нескольких связанных

нейронных сетях. Выходные данные для каждой предыдущей сети, являются входными

для следующей. Они способны начиная с этапа распознавания речи, так же

проанализировать её, определить тематику запроса, выделять ключевые моменты и

самостоятельно синтезировать ответ на запрос. Мощные системы, использующие

немалое количество технологий. Поскольку, что результатом работы нейронной сети

является предсказывание наиболее вероятного результата, а не однозначный ответ,

данная система является достаточно гибкой для поддержки и возможного

переобучения. Поэтому, подобным помощникам оставляют функцию обучения даже в

режиме работы, чтобы их поведение грамотно корректировалось под нужды

пользователей. К сожалению, идеалы машинного понимания данные агенты не

реализуют. Возможности данных ресурсов довольно сильно ограничены рамками, в

которых они были обучены действовать. Чем абстрактнее и больше рамки, тем больший

493

набор проблем они способны решать, однако, чем рамки конкретнее, тем лучше и полнее будет решение. Поэтому и необходима модульность, при которой запросы анализируются, и решаются отвечающими за конкретную проблему фрагментами системы. Этот принцип характерен для программирования в целом. Пожалуй, единственной преградой на данном этапе, осталась лишь «разумность» ресурса. Для речевых агентов на данном этапе важна лишь поддержка со стороны разработчиков -чем больше модулей будет разработано, тем большими возможностями будет обладать ресурс. Соответственно, на данном этапе единственным возможным кардинальным прорывом будет являться не что иное, как полноценный искусственный интеллект, с возможностью самообучения, что, пока что, невозможно, в виду недостаточного развития технологий и непригодных архитектур, на которых строятся современные ЭВМ. Однако, пожалуй, искусственный интеллект как ассистент человека, скорее всего, и есть финальный этап эволюции речевых агентов.

Заключение

По мере развития «виртуальных ассистентов» и «умных помощников», -следующим логическим этапом их развития будет интеграция с аппаратной частью. Их базы знаний, будут дополнены элементами естественной речи, позволяя нам искать во все возрастающих объемах информации с меньшей затратой по времени и в более человеческой манере - разговаривая с системой.

Во многие гаджеты сегодня уже «поселили» умных голосовых помощников. В будущем именно голос человека станет основой интерфейса большинства приложений.

Библиографический список

1) Поляков Е.В. Исследование методов машинного обучения для анализа и принятия решений на основе данных интернета вещей // В кн.: Межвузовская научно-техническая конференция студентов, аспирантов и молодых специалистов им. Е.В. Армейского / Под общ. ред.: А.Н. Тихонов, С.А. Аксенов, У.В. Аристова, Л.С. Восков, А.А. Елизаров, М.В. Карасев, В.П. Кулагин, Ю.Л. Леохин, А.Б. Лось, И.С. Смирнов, Н С. Титкова. - М.: МИЭМ НИУ ВШЭ, 2017. - С. 66-68.

2) Восков Л.С. Социальные сети WEBa вещей // В кн.: XXI Международная студенческая школа-семинар «Новые информационные технологии». Тезисы докладов / Отв. ред.: А.Н. Тихонов, В Н. Азаров, Ю.Л. Леохин, Н С. Титкова, С.С. Фомин. - М.: МИЭМ НИУ ВШЭ, 2013. - С. 53-58.

3) Восков Л.С. Интернет вещей // В кн.: Новые информационные технологии. Тезисы докладов XX международной студенческой конференции-школы-семинара / Науч. ред.: В.Н. Азаров, С.А. Митрофанов, Ю.Л. Леохин, Н.С. Титкова. - М.: МИЭМ, 2012. - С. 89-94.

4) Ролич А.Ю., Мартюкова Е.С., Арзамасова А.И. Интернет вещей: актуальность, решения, проблематика // В кн.: Научно-техническая конференция студентов, аспирантов и молодых специалистов НИУ ВШЭ им. Е.В. Арменского. Материалы конференции / Под общ. ред.: А.Н. Тихонов, В.Н. Азаров, У.В. Аристова, М.В. Карасев, В.П. Кулагин, Ю.Л. Леохин, Б.Г. Львов, Н.С. Титкова, С.У. Увайсов. - М.: МИЭМ НИУ ВШЭ, 2015. - С. 140-142.

5) Dvornikov A. et al. QoS Metrics Measurement in Long Range IoT Networks //Business Informatics (CBI), 2017 IEEE 19th Conference on. - IEEE, 2017. - Т. 2. - С. 15-20.

6) Dempsey P. The teardown: Google Home personal assistant //Engineering & Technology. - 2017. - Т. 12. - № 3. - С. 80-81.

7) Chung H. et al. Alexa, Can I Trust You? //Computer. - 2017. - Т. 50. - № 9. - С. 100-104.

8) López G., Quesada L., Guerrero L. A. Alexa vs. Siri vs. Cortana vs. Google Assistant: A Comparison of Speech-Based Natural User Interfaces //International Conference on Applied Human Factors and Ergonomics. - Springer, Cham, 2017. - С. 241-250.

9) Arriany A.A., Musbah M.S. Applying voice recognition technology for smart home networks //Engineering & MIS (ICEMIS), International Conference on. - IEEE, 2016. - С. 1-6.

10) Caranica A. et al. Speech recognition results for voice-controlled assistive applications //Speech Technology and Human-Computer Dialogue (SpeD), 2017 International Conference on. - IEEE, 2017. - С. 18.

i Надоели баннеры? Вы всегда можете отключить рекламу.