Вестник РУДН. Серия: Экономика
2020 Vol. 28 No. 3 547-555
http://journals.rudn.ru/economics
DOI 10.22363/2313-2329-2020-28-3-547-555 УДК 330:334:338
Научная статья
Цифровая экономика: коммуникации с использованием нейронных сетей в международном общении
М.А. Стренина
ООО «Трансинк»
Российская Федерация, 107014, Москва, ул. 1-я Боевская, д. 2/12, стр. 4
Аннотация. В статье рассматриваются теоретические и практические вопросы разработки, реализации и совершенствования технологических решений для голосовой коммуникации людей, говорящих на иностранных языках с применением синхронного машинного перевода, а также потенциальные направления развития данных программ для проведения международных конференций, семинаров, бизнес-встреч, образования в зарубежных вузах. Описан конкретный опыт реализации научно-технологического проекта по созданию программного обеспечения и приложений, осуществляемый в рамках инновационного проекта российского Фонда развития инноваций. Проанализированы перспективы данного вида технологий и продуктов в России в условиях создания цифровой экономики.
Ключевые слова: алгоритм, программное обеспечение, база данных, хранение информации, сервер, аудиоданные, распознавание языка, перевод на иностранный язык, голосовой отрезок, программный код, cloud platform, нейронные сети
Сегодня в мире и в России существуют различные средства коммуникации и передачи информации. Ключевой необходимостью для развития цифровой экономики и бизнеса является коммуникация с партнерами в ближнем и дальнем зарубежье. В условиях жесткой конкуренции на рынках многие компании, банки и предприниматели используют в основном английский язык при работе с партнерами или зарубежными клиентами. Однако существует большое количество стран, где предпочитают коммуницировать на родном языке, и немногие владеют английским языком или несколькими иностранными языками (Китай, Индия, страны Латинской Америки, Италия, Испания, Турция, Греция, страны Средней Азии и т. д.). Для российских компаний и банков также очень важно расширить свои возможности выхода на новые рынки, быстро и доступно осуществлять связи и общение со своими иностранными клиентами, партнерами либо осваивать новый внешний рынок.
© Стреннна M.A., 2020
(gv q I This work is licensed under a Creative Commons Attribution 4.0 International License https://creativecomn10ns.0rg/licenses/by/4.O/
Введение
Имеющиеся на мировом рынке технологии пока не применяют передачу звука, его распознавание и перевод в телекоммуникационных сетях. Частично можно отнести к такой связи Skype, но он работает только при наличии установленного одноименного приложения, мало используется в бизнесе и имеет ряд ограничений в различных регионах мира. Передачи голоса с синхронным переводом на иностранный язык в ГР-телефонии пока не осуществляется.
Разработка программных продуктов и приложений различного направления применения с машинным голосовым переводом (на базе нейронных сетей) является актуальной и необходимой в новых условиях развития мировой экономики и сферы коммуникации в целом.
Обзор литературы
Развитие технологий и создание приложений и платформ, которые позволяют охватывать большую целевую аудиторию и также более специализированные потребительские группы, рассматриваются в научной литературе уже достаточно долгое время. Так, в своих научных публикациях А.Н. Жуковская и А.С. Заушицина анализируют решения для создания специализированных кроссплатформенных мобильных приложений по отображению работы станков на заводе для сотрудников отделов автоматизации. А.В. Чер-ниченко создал модель системы, которая позволяет в дальнейшем адаптировать разрабатываемые платформы для коммуникации для различных внешних устройств. То есть создавая мобильное приложение, либо алгоритм ПО для платформы текстового или голосового перевода, либо мобильное приложение, при дальнейшей разработке новых продуктов и услуг по коммуникации с прямым переводом ядро ПО не нужно переделывать или разрабатывать новое ПО для новых устройств, новых модификаций устройств, которые имеются или появляются на рынке коммуникаций. Данный принцип был взят за основу при разработке алгоритма Тга^упс - программы коммуникации, поскольку, на наш взгляд, это является оптимальным решением для развития различных продуктов и подключения в дальнейшем новых внешних компонентов.
О возможностях и способах синхронизации передачи голосового и текстового потока с одновременной передачей и распознаванием иностранного языка написано много. В частности, К.А. Оськина в своей работе «Мульти-языковая типология семантем концепта "Новейшие информационные технологии"» подробно рассмотрела и предложила варианты решения применения различных языковых баз перевода и их соединения с машинным переводом.
В отдельной статье проанализировать все, что написано и разработано наукой в области коммуникации и голосового машинного перевода, не представляется возможным. Это подчеркивает тот факт, что на протяжении не менее пятнадцати лет в России ведутся научные и технологические разработки по созданию различных систем, платформ, мобильных приложений, которые позволяют выполнять узкоспециализированые и широкие задачи в области как экономики в целом, так и коммуникации.
Объем рынка цифровых коммуникаций РФ: анализ современного состояния и перспектив развития отрасли цифровой коммуникации
Согласно данным международных статистических агентств Discovery Research Group, J'son & Partners и TelecomDaily1, на конец 2017 - начало 2018 г. объем рынка IP-телефонии в России оценивается в 7,9 млрд руб. В начале 2017 г. объем сегмента виртуальных АТС составил 3,8 млрд руб., а среднегодовой темп роста зафиксирован на уровне 30 %. По данным Discovery Research Group, рост рынка виртуальных АТС в России продолжится до 2021 г. и достигнет 9,7 млрд руб., тогда как рынок IP-телефонии в целом к 2021 г. вырастет до 14,2 млрд руб. Как отмечают аналитики, российский рынок IP-телефонии, хотя и отстает от мирового (по оценкам экспертов на 1-3 года), развивается в рамках глобальных тенденций. Лидерами по количеству клиентов на российском рынке виртуальных АТС стали «Манго Телеком» (25 % от доли рынка) и МТС (16 %). На третьем месте разместилась компания UIScom (11 %). За ней следуют «Телфин» и «Зебра Телеком» (по 10 % от рынка), МТТ (9,8 %), MCN Telecom (4,7 %). У новичка сегмента -«Яндекс.Телефонии» - 4,5 %. Прочие компании занимают 7,4 % от рынка. Рост рынка виртуальных АТС будет происходить на фоне снижения рынка фиксированной телефонии в сегменте B2B. Падение доходов в этом сегменте на протяжении рассматриваемого периода, согласно оценкам J'son & Partners, ожидается со среднегодовым темпом около 2 %.
Динамично развивающийся рынок виртуальных АТС, который показывает рост за последние годы, привлекает внимание новых игроков и мобилизует работу ведущих компаний. Основными участниками рынка виртуальных АТС Москвы являются специализированные игроки: «Манго Телеком», «Телфин», UIScom, YouMagic (МТТ), «Яндекс.Телефония», Zebra Telecom, Octo-line и «Гравител». Также свои услуги по части виртуальных/облачных АТС предлагают крупные операторы услуг корпоративной телефонии: «Билайн. Бизнес», МТС, «Мегафон» и «Ростелеком», но, как правило, в комплексе с основными услугами. Рынок услуг виртуальной АТС в Москве достаточно хорошо развит, здесь присутствуют и специализированные игроки, и федеральные операторы телеком-услуг, но первые предоставляют более комплексное предложение, позволяя пакетом выбирать как тарифы на аренду АТС, так и виртуальные номера. По удобству и простоте начала работы специализированные операторы также предстают в более выгодном свете, так как ряд компаний, например Mango Office, Zebra Telecom, «Яндекс.Телефония», Oc-toline и «Гравител», позволяют начать использовать услуги сразу после простой регистрации и пополнения счета (иногда оно не требуется). Все провайдеры предлагают широкий спектр возможностей оплаты услуг: по умолчанию это электронные деньги, банковские карты и безналичные переводы. Максимальное количество способов оплаты предлагает «Телфин». В корпо-
1 Обзор телекоммуникационных, облачных и ИТ-рынков в сегменте B2B в России, 2014-2018 гг., прогноз до 2022 г. URL: https://json.tv/ict_telecom_analytics (дата обращения: 15.05.2020).
ративном сегменте основную долю доходов занимают услуги междугородной и международной связи в IP-сетях, на услуги виртуальных АТС пришлось 45 % рынка. Более 90 % российского рынка виртуальных АТС в 2017 г. было сосредоточено в двух крупнейших городах - Москве и Санкт-Петербурге. Действующее регулирование отрасли связи в России имеет ярко выраженный «телефонный характер», что заставляет операторов строить сети по правилам телефонной иерархии. Это противоречит идее развития IP-сетей, одноранговых по своей природе. А интересы бизнеса и пользователей диктуют операторам необходимость развития IP-сетей, IP-технологий и IP-сервисов, в том числе и IP-телефонии.
Число пользователей интернета в России достигло к 2020 г. 86,7 млн чел. Согласно международной статистике, Россия входит в десятку стран с самым недорогим широкополосным интернетом в мире и занимает третье место в списке. Большинство операторов связи переориентируются на корпоративный сегмент. Для предприятий и организаций пока еще не представляется возможным отказаться от городского номера. Учитывая, что в новые строящиеся офисы телефонный кабель прокладывают опционально, а сеть передачи данных в обязательном порядке, развитие корпоративного сектора IP-телефонии будет продолжаться и дальше.
Крупнейшими разработчиками и поставщиками продуктов с прямым машинным переводом (в основном мобильные приложения для голосовых звонков и текстовых сообщений) являются:
1) Google - новая версия переводчика Translate. Приложение позволяет переводить меню и объявления, а также живую речь в режиме реального времени. Доступен моментальный перевод с английского на русский, французский, немецкий, итальянский, португальский и испанский языки, а также с этих языков на английский. Возможен перевод разговоров, для чего нужно переключить приложение в режим голосового перевода. Всего в базе приложения - 38 языков, включая русский. Недостатки: необходимость наличия программы переводчика в мобильном телефоне, перевод только при личном общении говорящих, ограниченное количество языков, невозможность звонков на стационарные телефоны;
2) DROTR - мобильное приложение для чата, звонков на мобильную связь с переводом. Звонки доступны только при наличии данного мобильного приложения. Ограничение по количеству языков перевода - 44 иностранных языка. Звонки на IP-телефоны не выполняются. Нет платформы звонков только для стационарных телефонов;
3) переводчик Skype - голосовые звонки с поддержкой только 8 языков. Доступ на устройствах с Windows 7 и выше. Перевод чата на 50 языков. Недостатки: необходимость обязательного наличия Skype у собеседников, небольшое количество языков перевода, ограниченное использование у корпоративных клиентов для проведения деловых встреч, переговоров.
Основной сегмент потребительского рынка в РФ - корпоративные клиенты, использующие коммуникацию через виртуальные АТС, и абоненты, имеющие обычный телефонный аппарат, который подключен по технологии ADSL или FTTB, с роутером со встроенным VoIP шлюзом. В случае если у
абонента технология FTTB, то достаточно наличия телефонного аппарата SIP. Основные корпоративные пользователи коммуникационных услуг ведущих провайдеров в Москве и регионах - Мегафон (МультифонБизнес, виртуальная АТС), МТС (SIP телефония для офисов), Ростелеком. Основные корпоративные сегменты потребителей: компании-экспортеры и посредники во внешнеэкономической деятельности, филиалы иностранных компаний, банки (для своих корпоративных клиентов), отели, университеты (в первую очередь университеты - участники Проекта 5-100).
Рынок потребления в РФ выглядит следующим образом: объем рынка IP-телефонии составил 7,9 млрд руб. на 2017 г., объем сегмента виртуальных АТС (ВАТС) достиг 3,8 млрд руб., а среднегодовой темп роста зафиксирован на уровне 30 %. Лидерами по количеству клиентов на российском рынке виртуальных АТС стали «Манго Телеком» - 25 % и МТС (ПАО «Мобильные ТелеСистемы») - 16 %. Объем российского рынка виртуальных АТС по итогам 2017 г. равен 4,4 млрд руб. В 2018 г. рынок вырос на 10 % (официальная оценка спроса ГК «Финам»)2.
Программный продукт и разработка платформы для голосовой коммуникации с синхронным машинным переводом на иностранный язык
Развитие и распространение мобильных платформ и эволюция их возможностей в мире и в РФ позволяет разрабатывать новые программные продукты и технологии, дающие широкий спектр возможностей для общения людей в разных точках мира и на разных языках.
В рамках российской инновационной программы была начата разработка алгоритма программного обеспечения и внедрение технологии передачи голоса с синхронным переводом на базе нейронных сетей для мобильных платформ IOS и Android. Программный продукт Transync позволяет создать не только мобильное приложение для прямого телефонного диалога людей, говорящих на разных языках, но и предполагает в дальнейшем подготовку различных видов продуктов для широкого спектра коммуникаций в бизнесе, образовании, медицине, культуре. Разрабатываются архитектура программного обеспечения и базы данных для хранения голосовых звонков на мобильную связь, текстовых сообщений и данных пользователей, а также программный код, позволяющий распределять потоки звонков и сообщений на сервер. Программное обеспечение дает возможность осуществлять распознавание голоса, его одновременный перевод на иностранный язык и передачу голосового потока через сервер на принимающие клиентские устройства.
Алгоритм ПО с использованием машинного перевода позволяет пользователю каждый раз улучшать качество получаемого перевода, так как голос и особенности произношения запоминаются и распознаются машиной, которая, в свою очередь, самообучается и совершенствует перевод данного пользователя на иностранный язык.
2 Официальный сайт информационно-аналитического портала «Финам». URL: www.fLnam.ru ИННОВАЦИИ В СОВРЕМЕННОЙ ЭКОНОМИКЕ 551
Распознавание голоса и его передача на принимающее устройство с одновременным переводом на иностранный язык осуществляется по следующей схеме (см. рисунок):
1) аудиопоток отправляется на медиасервер с установленным ПО Wowza Streaming Engine;
2) аудио/видеоданные отправляются на устройство вызываемого абонента и одновременно с этим аудиопоток дублируется на основной сервер для дальнейшего распознавания и перевода;
3) основной сервер передает полученный аудиопоток в Google Cloud Platform, посредством Speech API происходит распознавание речи, после чего распознанный текст возвращается на основной сервер;
4) выполняется перевод распознанного текста на язык вызываемого абонента с помощью Google Cloud Platform Translate API;
5) основной сервер сохраняет данные о переводе в базу данных Firebase Realtime Datebase;
6) устройство вызываемого абонента получает данные о переводе и произносит речь абоненту, используя встроенный возможности iOS и Android устройства.
Рисунок. Схема передачи голосового потока с синхронным переводом с одного мобильного устройства на другое с использованием алгоритма ПО Transyc [Figure. Voice stream transmission scheme with simultaneous translation from one mobile device to another using the Transyc software algorithm]
Источник: составлено на основе авторских разработок ООО «Трансинк», 2019. Официальный сайт Фонда содействия инновациям - www.fasie.ru
Была спроектирована база данных для хранения сведений о пользователях, чатах и телефонных разговорах, основанная на сервисе Firebase Realtime Database. Выбор данного сервиса обусловлен опцией получения информации об изменениях в базе данных в режиме реального времени серверным и клиентскими приложениями.
Возможности, которые дает данный алгоритм для дальнейшей разработки различный продуктов и подключения внешних платформ:
- мобильное приложение для широкого круга пользователей, осуществляющих звонки за рубеж, деловое и частное общение с иностранцами;
- система «одного устройства», позволяющая вести прямой диалог через наушники во время путешествий и деловых поездок в различные страны;
- платформы и облачные АТС для звонков с мобильного телефона на IP-телефоны для бизнес-общения;
- специализированные платформы для проведения деловых переговоров, конференций, бизнес-семинаров, выставок с использованием голосового машинного перевода;
- специализированные платформы для проведения профессиональных коммуникаций и деловых контактов в области медицины и здравоохранения с разработкой собственной базы перевода с узким направлением, которого нет на сегодняшний день в глобальном переводчике Google;
- специализированные платформы для дистанционного обучения и повышения квалификации в российских и зарубежных вузах, также с синхронным голосовым переводом на базе нейронной сети.
Таким образом, как в России, так и в мире имеются емкий рынок и потенциал развития продуктов на основе коммуникации с использованием машинного голосового перевода в различных сферах.
Заключение
В условиях развития цифрового направления мировой экономики, широкого использования потребителями мобильной связи, IP-телефонии, с учетом текущего санитарного кризиса можно сделать вывод, что развитие средств и технологий коммуникации, которые позволяют обычным людям, компаниям, научным группам, университетам существенно расширить свои профессиональные, деловые и культурные контакты независимо от условий функционирования мирового рынка и осуществлять общение без каких-либо ограничений, является востребованным и перспективным.
Список литературы
Аналитические обзоры ГК «Финам». 2018-2019. URL: www.finam.ru (дата обращения: 15.05.2020).
Жуковская А.Н., Заушицина А. С. Особенности разработки кроссплатформенных мобильных приложений // Решетневские чтения. 2017. Т. 2. С. 330-331. Научно-технические материалы инновационной компании ООО «Трансинк» - Фонд содействия инновациям. М., 2019-2020. URL: http://fasie.ru (дата обращения: 15.05.2020).
Обзор телекоммуникационных, облачных и ИТ-рынков в сегменте B2B в России, 2014-2018 гг., прогноз до 2022 г. URL: https://json.tv/ict_telecom_analytics_view/ obzor-telekommunikatsionnyh-oblachnyh-i-it-rynkov-v-segmente-b2b-v-rossii-2014-2018-gg-prognoz-do-2022-g-20200415041014 (дата обращения: 15.05.2020). Оськина Н.А. Мультиязыковая типология семантем концепта «новейшие информационные технологии: дис. ... канд. филол. наук. М.: Московский государственный лингвистический университет, 2017. С. 172.
Русанова И.В. Анализ платформ для разработки гибридного мобильного приложения для систем iOS и Android // Актуальные проблемы авиации и космонавтики. 2017. Т. 3. № 13. С.1100-1102.
Самойлов А.Г. Перспективные технологии в средствах передачи информации // Материалы 13-й Научно-технической конференции ПТСПИ - 2019 / Владимирский гос. университет: в 2 т. Т. 2. Владимир: ВлГУ, 2019. Чередниченко А.В. Технологии создания адаптируемых систем обработки информации // Программные продукты и системы. 2010. № 3. С. 82-85.
История статьи:
Дата поступления в редакцию: 17 мая 2020 г.
Дата проверки: 25 мая 2020 г.
Дата принятия к печати: 10 июня 2020 г.
Для цитирования:
Стренина М.А. Цифровая экономика: коммуникации с использованием нейронных сетей в международном общении // Вестник Российского университета дружбы народов. Серия: Экономика. 2020. Т. 28. № 3. С. 547-555. http://dx.doi.org/10.22363/2313-2329-2020-28-3-547-555
Сведения об авторе:
Стренина Мария Александровна, кандидат экономических наука, доцент, эксперт-аналитик и соорганизатор инновационного проекта ООО «Трансинк». E-mail: [email protected]
DOI 10.22363/2313-2329-2020-28-3-547-555
Research article
Digital economy: communication using neural networks in international communication
Maria A. Strenina
"Transync" Ltd.
2/12 1-ya Boevskaya St, bldg. 4, Moscow, 107014, Russian Federation
Abstract. The article considers theoretical and practical issues of development and implementation, as well as potential development of technological solutions for voice communication of people speaking foreign languages using simultaneous machine translation, as well as potential directions of these programs for international conferences, seminars, business meetings, education in foreign universities. The article deals with the concrete experience of implementing a scientific and technological project on software development and application development carried out within the framework of the innovation project of the Russian Foundation for Innovations Development. The potential of development of this type of technologies and products in Russia in conditions of digital economy creation is also analyzed.
Keywords: algorithm, software, database, information storage, server, audio data, language recognition, translation into foreign language, voice segment, software code, cloud platform, neural networks
References
Cherednichenko, A.V. (2010). Tehnologii sozdanija adaptiruemyh sistem obrabotki infor-macii [Technologies of creation of the adaptable information processing systems]. Software and systems, (10), 82-85. (In Russ.) Finam Group. (n.d.). Analytical Reviews. 2018-2019. Retrieved May 15, 2020, from
www.finam.ru (In Russ.) Oskina, N.A. (2017). Mul'tijazykovaja tipologija semantem koncepta "novejshie informacion-nye tehnologii " [Multilingual typology semantics of the concept "newest information technologies"] (Dissertation of the Candidate of Philological Sciences) (p. 172). Moscow, Moscow State Linguistic University. (In Russ.) Review of Telecommunications, Cloud and IT Markets in B2B Segment in Russia, 2014-2018, Forecast to 2022. Retrieved May 15, 2020, from https://json.tv/ict_telecom_analytics_ view/obzor-telekommunikatsionnyh-oblachnyh-i-it-rynkov-v-segmente-b2b-v-rossii-2014-2018-gg-prognoz-do-2022-g-20200415041014 (In Russ.) Rusanova, I.V. (2017). Analiz platform dlja razrabotki gibridnogo mobil'nogo prilozhenija dlja sistem Ios i Android [Analysis of Platforms for Development of Hybrid Mobile Application for Ios and Android Systems]. Current issues of aviation and aerospace, 3(13), 1100-1102 (In Russ). Samoilov, A.G. (2019). Perspektivnye tehnologii v sredstvah peredachi informacii [Prospective technologies in media of information transfer]. Materialy 13-j nauchno-tehniches-koj konferencii PTSPI - 2019 [Materials of 13th Scientific and Technical Conference PTSPI- 2019], 2, 280 (In Russ.) Scientific and Technical Materials of LLC "Transync" Innovation Company - Foundation for Assistance to Innovations. Moscow, 2019-2020. Retrieved May 15, 2020, from http://fasie.ru (In Russ.) Zhukovskaya, A.N., & Zaushitsina, A.S. (2017). Osobennosti razrabotki krossplatformennyh mobil'nyh prilozhenij [Features of development of cross-platform mobile applications]. Reshetnev readings, 2, 330-331 (In Russ.)
Article history:
Received: 17 May 2020 Revised: 25 May 2020 Accepted: 10 June 2020
For citation:
Strenina, M.A. (2020). Digital economy: Communication using neural networks in international communication. RUDN Journal of Economics, 28(3), 547-555. (In Russ.) http:// dx.doi.org/10.22363/2313-2329-2020-28-3-547-555
Bio note:
Maria A. Strenina, PhD, expert analyst and co-organizer of the innovation project "Transync" Ltd. E-mail: [email protected]