Научная статья на тему 'МОДЕЛИ КВАНТОВЫХ ВЫЧИСЛЕНИЙ ДЛЯ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ'

МОДЕЛИ КВАНТОВЫХ ВЫЧИСЛЕНИЙ ДЛЯ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
83
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННЫЕ СЕТИ / КВАНТОВЫЕ КОМПЬЮТЕРЫ / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / МАШИННОЕ ОБУЧЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кириченко Евгений Олегович, Курочка Алексей Александрович, Шаранов Александр Олегович

Нейронные сети - это вычислительные модели, которые привели к прогрессу в области машинного обучения (Machine Learning) и приложений искусственного интеллекта (Artificial Inteligence). Параллельно в последние годы стали доступны первые маломасштабные квантовые вычислительные устройства, прокладывающие путь для развития новой парадигмы обработки информации. Здесь мы приводим обзор самых последних предложений, направленных на объединение этих продолжающихся революций, и в частности на реализацию ключевых функциональных возможностей искусственных нейронных сетей на квантовых архитектурах. Мы подчеркиваем захватывающие перспективы в этом контексте и обсуждаем потенциальную роль ближайшего квантового оборудования в поисках преимуществ квантового машинного обучения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

QUANTUM COMPUTING MODELS FOR ARTICIAL NEURAL NETWORKS

Neural networks are computing models that have been leading progress in Machine Learning (ML) and Artificial Intelligence (AI) applications. In parallel, the first small scale quantum computing devices have become available in recent years, paving the way for the development of a new paradigm in information processing. Here we give an overview of the most recent proposals aimed at bringing together these ongoing revolutions, and particularly at implementing the key functionalities of artificial neural networks on quantum architectures. We highlight the exciting perspectives in this context, and discuss the potential role of near term quantum hardware in the quest for quantum machine learning advantage.

Текст научной работы на тему «МОДЕЛИ КВАНТОВЫХ ВЫЧИСЛЕНИЙ ДЛЯ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ»

9. Solmaz Niknam, Balasubramaniam Natarajan, and Reza Barazideh, Interference Analysis for Finite-Area 5G mmWave Networks Considering Blockage Effect

10. Wentian Mai, Hai-Lin Liu, Lei Chen, Jiongcheng Li, Henghui Xiao. Multi-Objective Evolutionary Algorithm For 4G Base Station Planning. // [Электронный ресурс] URL: https://hub.sfedu.ru/repository (дата обращения: 20.01.2023).

11. Умный город // [Электронный ресурс] URL: https://habr.com/ru/company/gsgroup/blog/386253 (дата обращения: 20.01.2023).

12. Облачные и граничные вычисления // [Электронный ресурс] URL: https://market.cnews.ru/articles/2019-2 oblachnye i granichnye vychisleniya (дата обращения: 20.01.2023).

13. 5G mMTC // [Электронный ресурс] URL: https://www.gigabyte.com/Solutions/Networking/mmtc (дата обращения: 20.01.2023).

14. Телекоммуникации. Учебные материалы и лекции // [Электронный ресурс] URL: https://siblec.ru/telekommunikatsii (дата обращения: 20.01.2023).

15. Технология Beamforming, // [Электронный ресурс] URL: https://help.keenetic.com/hc/ru/articles/F-Beamforming (дата обращения: 20.01.2023).

16. SDN и NFV: как это работает на сети оператора связи // [Электронный ресурс] URL: https://shalaginov.com/2015/12/27/sdn-^nfv (дата обращения: 20.01.2023).

Повещенко Марк Иванович, магистр, оператор, era_1@mil.ru, Россия, Анапа, ФГАУ «ВИТ

«ЭРА»

INDOOR SIMULATION OF 5G NETWORKS M.I. Poveshchenko

The relevance of this article is due to the rapid development of mobile radio networks. The enormous growth in the number of radio devices makes the effective use of the radio spectrum and, as a result, the task of building RF control systems that allow optimal planning of radio networks relevant. 4G networks are not currently able to meet the needs of modern society. 5G networks are meant to replace them. In this work, we simulated the propagation of radio waves in the 5G frequency range in order to establish the nature of their propagation indoors.

Key words: 5G, mobile communications, radio spectrum, 4G, modeling.

Poveshchenko Mark Ivanovich, magister, operator of MIT «ERA», era_1@mil.ru, Russia, Anapa, FGAU «MIT «ERA»

УДК 519.688

DOI: 10.24412/2071-6168-2023-5-11-15

МОДЕЛИ КВАНТОВЫХ ВЫЧИСЛЕНИЙ ДЛЯ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ

Е.О. Кириченко, А.А. Курочка, А.О. Шаранов

Нейронные сети - это вычислительные модели, которые привели к прогрессу в области машинного обучения (Machine Learning) и приложений искусственного интеллекта (Artificial Inteligence). Параллельно в последние годы стали доступны первые маломасштабные квантовые вычислительные устройства, прокладывающие путь для развития новой парадигмы обработки информации. Здесь мы приводим обзор самых последних предложений, направленных на объединение этих продолжающихся революций, и в частности на реализацию ключевых функциональных возможностей искусственных нейронных сетей на квантовых архитектурах. Мы подчеркиваем захватывающие перспективы в этом контексте и обсуждаем потенциальную роль ближайшего квантового оборудования в поисках преимуществ квантового машинного обучения.

Ключевые слова: нейронные сети, квантовые компьютеры, искусственный интеллект, машинное обучение.

Искусственный интеллект (ИИ) в широком смысле относится к широкому набору алгоритмов, которые за последнее десятилетие продемонстрировали впечатляющие, а иногда и неожиданные успехи в анализе больших наборов данных [1]. Эти алгоритмы часто основаны на вычислительной модели, называемой нейронной сетью (НС), которая относится к семейству методов дифференциального программирования.

Объем данных и функций, разработанных классическими нейронными сетями, а также количество параметров, определяющих их структуру, неуклонно увеличивалось в течение последних лет. Эти достижения были достигнуты за счет резкого роста спроса на энергию и вычислительные мощности [2] в области искусственного интеллекта. В этом отношении квантовые компьютеры могут предложить жизнеспособный путь для продолжения такого роста в измерении имеющихся проблем и, параллельно, обеспечить совершенно новые функциональные возможности. Фактически, квантовая информация разрабатывается путем использования суперпозиций в векторных пространствах [3], и планируется, что квантовые процессоры вскоре превзойдут вычислительные возможности классических суперкомпьютеров.

Что касается классических вычислительных парадигм, то квантовые вычисления имеют свои особенности. Одним из них является то, что квантовые вычисления по своей сути линейны. Хотя это свойство может гарантировать, например, что увеличение вычислительной мощности не сопровождается параллельным увеличением затрат на энергию, это также означает, что реализация нелинейных функций, образующих основу нейронных сетей, является нетривиальной задачей. Кроме того, информация не может быть скопирована с произвольной точностью в квантовых алгоритмах, что означает, что такие задачи, как многократное обращение к переменной, невозможны, когда последняя представлена квантовым состоянием. Как следствие, классические алгоритмы НН не могут быть просто перенесены на квантовые платформы. Схематичное представление классической и квантовой моделей обучения показано на рис. 1 (а,б).

В этой статье мы кратко рассмотрим основные направления, которые были предприняты на протяжении многих лет для разработки искусственных нейронных сетей для квантовых вычислительных сред, используемые для преодоления возможных трудностей, и будущие перспективы этой области.

а

Классическая

нейронная

сеть

Входной слой Скрытый слой

О - "

Цх-.в)

б

квантовая нейронная

-В-

.4, ¡.г, 1 -в-

-0- е- &

ав.х)

в

квантовые персептроны

и1

и„

Анцилла ■

Кодирование МеТОДЫ кубитов

квантового

ядра

<НЗ

¡0)®

Функция активации

— Ь0!

— 43-

Ф(х') 43=

— 43-

— нэ-

Иг 1>'|_

г

Рис. 1. Схематическое представление классической и квантовой моделей обучения

Между параметризованной квантовой схемой (ПКС) [4] и классическими нейронными сетями много общего. В обеих моделях информация обрабатывается через последовательность параметризованных слоев, которые итеративно обновляются с помощью классического оптимизатора. Ключевое различие заключается в способе обработки информации. Квантовые компьютеры позволят достичь некоторой формы вычислительного преимущества, т.е. ускорения или лучшей производительности, из-за присущих им квантовых эффектов, недоступных в классических сценариях обучения. Множество различных определений квантовых нейронных сетей (КНС), в настоящее время является определением параметризованной квантовой схемы, структура которой непосредственно вдохновлена классическими нейронными сетями. Таким образом, мы формально определяем КНС как ПКС, то есть:

ивш (в)=п и (в ж = иь (вь ж ••• имт, (1)

1=ь

где Ш(Ш) - вариационные уровни, Wi — это (обычно запутывающие) фиксированные операции, которые не зависят ни от какого параметра, а L - количество слоев (рис. 1 (б)). В зависимости от исследуемой проблемы и связности квантового устройства существуют различные реализации как для запутывающей структуры, так и для параметризованных выходов [6]. Обратите внимание, что это определение почти совпадает с определением вариативных квантовых алгоритмов (ВКА), и на самом деле термины ВКА и КНС часто используются как взаимозаменяемые.

Несмотря на то, что она является довольно общей, в последнее время все больше исследований подчеркивают, что такая структура в ее наивной реализации может быть плохо выразительной в том смысле, что она может представлять только несколько функций — на самом деле, в основном синусоидальные функции — входных данных. Важная веха классической теории обучения, теорема об универсальной аппроксимации [5], гарантирует, что классические НС достаточно мощны, чтобы аппроксими-

12

ровать любую функцию Дх) входных данных х. Интересно, что было показано, что аналогичный результат справедлив и для КНС, при условии, что входные данные загружаются в квантовую схему несколько раз на протяжении всего вычисления. Интуитивно такая повторная загрузка данных может рассматриваться как необходимая функция для уравновешивания эффекта теоремы квантовой механики об отсутствии клонирования. Фактически, в то время как в классических НС выходные данные нейрона копируются и передаются каждому нейрону в следующем слое, в квантовом режиме это невозможно, поэтому необходимо явно ввести некоторую степень классической избыточности. Как правило, чем чаще данные повторно загружаются во время вычислений, тем более выразительной становится модель квантового обучения, поскольку она способна представлять свойства данных более высокого порядка. Таким образом, для более эффективной конструкции каждый слой в уравнении 1 следует заменить на ^ Б{х)и1Ж1, где £(х) обозначает процедуру кодирования данных, отображающую входной сигнал х в его соответствующее квантовое состояние.

Эта формулировка по-прежнему оставляет большую свободу в выборе способа реализации кодирования и вариационной схемы. Однако, как это происходит в классической области, существуют также различные архитектуры для КНС, и ниже мы дадим краткий обзор некоторых из них, которые получили больше внимания.

Квантовые модели Персептрона. В ранних работах по квантовым моделям одиночных искусственных нейронов (известных как персептроны) были сосредоточены на том, как воспроизвести нелинейности классических персептронов с помощью квантовых систем, которые, напротив, подчиняются линейным унитарным эволюциям. В более поздних предложениях (например, рис. 1(в)) было показано, что квантовые персептроны способны выполнять простые задачи распознавания образов для двоичных и изображений в серой шкале, возможно, используя методы вариационной дискретизации для обучения и поиска адаптивных реализаций квантовых схем. Путем соединения нескольких квантовых нейронов модели квантовых искусственных нейронных сетей были также реализованы в экспериментах по проверке принципа действия на сверхпроводящих устройствах.

Квантовые сверхточные нейронные сети. Как следует из названия, эти модели вдохновлены соответствующим классическим аналогом, в настоящее время широко распространенным в области обработки изображений. В этих сетях, схематически показанных на рис. 1 (г), входные данные обрабатываются через повторяющуюся серию так называемых сверхточных слоев и слоев объединения. Первый применяет свертку входных данных — т.е. квазилокальное преобразование трансляционно-инвариантным образом — для извлечения некоторой релевантной информации, второй применяет сжатие такой информации в представлении с более низкой размерностью. После многих итераций сеть выдает информативное и достаточно маломерное представление, которое может быть проанализировано с помощью стандартных методов, таких как полностью подключенные НС с прямой связью. Аналогично, в квантовых сверхточных НС квантовое состояние сначала подвергается слою свертки, состоящему из параметризованной унитарной операции, действующей на отдельные подмножества кубитов, а затем процедуры объединения, полученной путем измерения некоторых кубитов. Эта процедура повторяется до тех пор, пока не останется всего несколько кубитов, в которых хранилась вся соответствующая информация. Этот метод оказался особенно полезным для действительно квантовых задач, таких как квантовое распознавание фазы и квантовая коррекция ошибок. Более того, использование только логарифмически большого числа параметров по отношению к числу кубитов особенно важно для достижения эффективного обучения и эффективных реализаций на устройствах ближнего действия.

Ожидается, что квантовые компьютеры станут более мощными, чем их классические аналоги, во многих конкретных приложениях [6] и [7], и особенно при выборке из сложных распределений вероятностей — функция, особенно актуальная для приложений генеративного моделирования. Поэтому естественно спросить, применима ли эта иерархия также к моделям обучения.

Тем не менее, недавно были выдвинуты некоторые первоначальные результаты, направленные на тщательный анализ возможностей (или мощности) квантовых нейронных сетей [8]. Начиная с измерений Вапника-Червоненкис, которое является классической мерой модели обучения, связанной с максимальным количеством независимых классификаций, которые может реализовать модель, универсальной метрикой емкости, связанной с максимальной информацией, которая может быть сохранена в параметрах модели обучения, будь то классический или квантовый, был определен [8]. Основываясь на этом определении, было заявлено, что квантовые модели обучения обладают такой же общей емкостью, как и любая классическая модель, имеющая такое же размера. Однако, такие показатели емкости, могут стать бессмысленными и трудными — если не совсем непрактичными — для измерения, и поэтому не могут использоваться в качестве общей точной меры фактической мощности моделей обучения. По этой причине предлагается использовать эффективное измерение в качестве меры измерения, мотивированное информационно-теоретическими точками зрения. Эта мера может быть связана с границами обобщения моделей обучения, что приводит к тому, что квантовые нейронные сети могут быть более выразительными и эффективными во время обучения, чем их классические аналоги, благодаря более равномерно распределенному спектру информации Фишера. Некоторые доказательства были получены в результате анализа двух конкретных экземпляров КНС: один имеет тривиальное кодирование входных данных, а другой использует схему кодирования, предложенную в [9], которая считается классически трудной для моделирования и действительно демонстрирует замечательные характеристики. Несмотря на такую спе-

цифичность, это один из первых результатов, проводящих четкое разделение между квантовыми и классическими нейронными сетями, подчеркивая большие возможности первых.

Методы квантового машинного обучения, и, в частности, модели квантовых нейронных сетей, обещают значительно увеличить наши вычислительные возможности, открывая совершенно новые области исследований. Основные теоретические и практические проблемы в настоящее время включают в себя обучаемость, идентификацию и надлежащую обработку соответствующих наборов данных, а также систематическое сравнение с классическими аналогами. Более того, при неуклонном прогрессе в области аппаратного обеспечения в ближайшем будущем значительное внимание будет уделено экспериментальным демонстрациям, имеющим практическое значение. Исследования развиваются быстрыми темпами, и в ближайшие годы ожидаются новые захватывающие результаты.

При обсуждении эффективности квантовых нейронных сетей и для достижения истинного квантового преимущества следует сравнивать не только с предыдущими квантовыми моделями, но и с наилучшими доступными классическими альтернативами. По этой причине и до тех пор, пока не будут достигнуты отказоустойчивые квантовые вычисления, квантовые процедуры на классических компьютерах могут проложить путь к открытию эффективных решений. Одним из наиболее ярких примеров являются тензорные сети [10]. Фактически, многие предложения по квантовым нейронным сетям вдохновлены или могут быть непосредственно перефразированы на языке тензорных сетей, так что библиотеки, разработанные для этих приложений, могут быть использованы для запуска некоторых экземпляров этих квантовых алгоритмов. Поэтому в ближайшие годы следует ожидать ожесточенной конкуренции между квантовыми процессорами и передовыми классическими методами, включая так называемые квантовые состояния нейронных сетей для изучения физики многих тел.

Список литературы

1. I. Goodfellow, Y. Bengio, and A. Courville, Deep Learning (MIT Press, 2016).

2. S. G. Andrae and T. Edler. On global electricity usage of communication technology: Trends to 2030, Challenges 6, 117 (2015).

3. M. A. Nielsen and I. L. Chuang. Quantum computation and quantum information, 10th ed. (Cambridge University Press, Cambridge, UK, 2010).

4. M. Benedetti, E. Lloyd, S. Sack, and M. Fiorentini. Parameterized quantum circuits as machine learning models, Quantum Sci. Technol. 4, 043001 (2019).

5. K. Hornik, Approximation capabilities of multilayer feedforward networks, Neural Netw. 4, 251

(1991).

6. A. W. Harrow and A. Montanaro. Quantum computational supremacy, Nature 549, 203-209

(2017).

7. F. Arute, K. Arya, R. Babbush, D. Bacon, J. C. Bardin, R. Barends, R. Biswas, S. Boixo, F. G. S. L. Brandao, and D. A. e. Buell, Quantum supremacy using a programmable superconducting processor, Nature 574, 505-510 (2019).

8. L. G. Wright and P. L. McMahon, The capacity of quantum neural networks (2019).

9. A. Abbas, D. Sutter, C. Zoufal, A. Lucchi, A. Figalli, and S. Woerner, The power of quantum neural networks (2020).

10. S. Montangero, Introduction to Tensor Network Methods (Springer Nature Switzerland AG, Cham, CH, 2018).

Кириченко Евгений Олегович, специалист, старший оператор, era1@mil.ru, Россия, Анапа, ФГАУ «ВИТ «ЭРА»,

Курочка Алексей Александрович, специалист, старший оператор, Россия, Анапа, ФГАУ «ВИТ

«ЭРА»,

Шаранов Александр Олегович, специалист, старший оператор, Россия, Анапа, ФГАУ «ВИТ

«ЭРА»

QUANTUM COMPUTING MODELS FOR ARTICIAL NEURAL NETWORKS E.O. Kirichenko, A.A. Kurochka, A.O. Sharanov

Neural networks are computing models that have been leading progress in Machine Learning (ML) and Artificial Intelligence (AI) applications. In parallel, the first small scale quantum computing devices have become available in recent years, paving the way for the development of a new paradigm in information processing. Here we give an overview of the most recent proposals aimed at bringing together these ongoing revolutions, and particularly at implementing the key functionalities of artificial neural networks on quantum architectures. We highlight the exciting perspectives in this context, and discuss the potential role of near term quantum hardware in the quest for quantum machine learning advantage.

14

Key words: neural network, quantum computers, artificial intelligence, machine learning.

Kirichenko Evgeniy Olegovich, specialist, senior operator, era_1@mil.ru, Russia, Anapa, FGAU «MIT «ERA»,

Kurochka Alexey Alexandrovich, specialist, senior operator, Russia, Anapa, FGAU «MIT «ERA», Sharanov Alexandr Olegovich, specialist, senior operator, Russia, Anapa, FGAU «MIT «ERA»

УДК 681.787

DOI: 10.24412/2071-6168-2023-5-15-21

МОДЕЛИРОВАНИЕ ПРОЦЕССА ФОРМИРОВАНИЯ ОПТИЧЕСКОЙ ЛОВУШКИ ГОЛОГРАФИЧЕСКИМ МЕТОДОМ С РАЗЛИЧНЫМИ РАСПРЕДЕЛЕНИЯМИ

ИНТЕНСИВНОСТИ СВЕТА

Д.О. Ковалев, А.С. Котков, А.П. Маслак

Актуальность данной статьи заключается в том, что впервые представлена общая модель формирования голографических оптических ловушек, основанных на интерференции света, которая позволяет исследовать распределения интенсивности ловушек и условие стабильного захвата частиц и учитывает углы падения пучков света и распределение интенсивности световых пучков. В работе приведены результаты математического моделирования оптических ловушек, основанных на голографиче-ском методе.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ключевые слова: оптическая ловушка, математическая модель, интенсивность, интерференция, условие захвата.

Оптическая ловушка, также называемая оптическим пинцетом, формируется путем фокусировки лазерного луча линзой с высокой числовой апертурой (NA). Диэлектрическая частица, находящаяся, рядом с фокусом будет испытывать силу, вызванную передачей импульса от рассеяния падающих фотонов. Результирующая оптическая сила раскладывается на две составляющие: рассеивающая сила - в направлении распространения света и градиентная сила - в направлении пространственного градиента света [1].

Рассеивающая составляющая силы толкает частицу в направлении распространения света. Излучение лазера падает на частицу с одного направления, но рассеивается во множестве направлений, в то время как часть падающего света может быть поглощена. Так в результате происходит передача чистого импульса частице от падающих, на неё, фотонов.

Градиентная сила возникает из-за того, что диполь в неоднородном электрическом поле испытывает силу в направлении градиента поля. В оптической ловушке лазер индуцирует флуктуирующие диполи в диэлектрической частице, и именно взаимодействие этих диполей с неоднородным электрическим полем в фокусе приводит к возникновению силы захвата градиента [2].

Возможность манипулирования захваченными микрообъектами, а также разработка методик по калибровке сил оптического захвата для различных микрообъектов позволяет применять оптический пинцет для задач, связанных с сортировкой, упорядочением или локализацией одиночных микрообъектов, взвешенных в жидкости и количественным измерением сил взаимодействия фемтоньютонного масштаба между ними. Уникальной особенностью оптического пинцета является возможность изучения свойств одиночных микрообъектов [3].

Целью данной работы является определение закономерностей и обозначение условий в формировании голографических оптических ловушек, основанных на интерференции двух пучков света с различными распределениями интенсивности.

Пусть две жестко сфокусированные плоские монохроматические волны E0 и Ej падают под

углами 0о и 0j к оси Z, как показано на рисунке 1.

Выражение (1) описывает пространственное распределение интенсивности интерференционной картины светового поля в оптической ловушке:

I (r ) = E0( r) • е-

■(ko •r+q>o)

E1(r)■

i( k ■r

+ 2

Eo(r )■

■ ( ko ■r +q>o)

E1(r)■

i ■ (k ■ r

■ cos(sin 6o

■x - sin 6

■ x + cos 6o

■z - cos 6

i Надоели баннеры? Вы всегда можете отключить рекламу.