Научная статья на тему 'НЕЙРОННАЯ СЕТЬ ДЛЯ ВЫЧИСЛЕНИЯ НЕЛИНЕЙНОГО ФУРЬЕ СПЕКТРА'

НЕЙРОННАЯ СЕТЬ ДЛЯ ВЫЧИСЛЕНИЯ НЕЛИНЕЙНОГО ФУРЬЕ СПЕКТРА Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
69
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Седов Е.В., Чеховской И.С., Прилепский Я.Е., Турицын С.К., Федорук М.П.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «НЕЙРОННАЯ СЕТЬ ДЛЯ ВЫЧИСЛЕНИЯ НЕЛИНЕЙНОГО ФУРЬЕ СПЕКТРА»

DOI 10.24412/2308-6920-2021-6-326-327

нейронная сеть для вычисления

нелинейного фурье спектра

Седов Е.В.1,2*, Чеховской И.С.1, Прилепский Я.Е.2, Турицын С.К.1'2, Федорук М.П.1

'Новосибирский Государственный Университет, г. Новосибирск, Россия 2Институт фотонных технологий Астона, Университет Астона, г. Бирмингем, Великобритания

E-mail: e.sedov@g.nsu.ru

Нелинейное преобразование Фурье (NFT) является нетрадиционным подходом для управления нелинейными искажениями сигнала в оптоволоконных каналах связи. Прямое NFT соответствует представлению оптического сигнала в специальном базисе, называемым нелинейным спектром. Последний состоит из дискретной и непрерывной частей, которые тривиально меняются в зависимости от пространственной координаты в канале связи, описывающимся нелинейным уравнением Шредингера [1, 2]. Было продемонстрировано, что системы передачи, основанные на использовании NFT и модуляции нелинейных спектральных мод, имеют потенциал для того, чтобы превзойти существую-щие коммуникационные системы [3]. Однако одна из серьезных проблем в применении NFT в высокоскоростных системах является возможность работы с оптическими сигналами, существенно искаженными шумом [4]. Ряд численных методов расчета нелинейных спектров были предложены и протестированы для приложения в оптических системах передачи данных [5]. Значительный прогресс был достигнут в сокращении сложности алгоритмов (быстрый NFT) [6] и повышению их точности [7]. Однако в данный момент обработка сложных форм на основе NFT в режиме реального времени все еще далека от практической реализации на аппаратном уровне, а производительность NFT систем сильно зависит от отклонений реальной системы от идеализированной модели канала [8]. Привлекательный подход для преодоления этих трудностей заключается в использовании машинного обучения и, в частности, нейронных сетей (NN) для обработки сигналов на основе NFT. В этой работе мы де-монстрируем специальную архитектуру нейронной сети, которая была получена с помощью Байесовской оптимизации гиперпараметров. С помощью нейронной сети мы можем достичь высокой точности восстановления нелинейного спектра, даже в присутствии шума.

Наша цель - вычислять непрерывный нелинейный спектр, учитывая решения спектральной задачи Захарова-Шабата [2] со специальными граничными условиями на конце заднего сигнала. Математическое описание и детали NFT можно найти в [1]. Для тренировки нейронной сети мы использовали 94035 WDM сигнала, каждый из которых состоял из 1024 комплексных точек. Формат модуляции был

выбран QPSK, количество оптических несущих равно 15. Энергия сигнала составляет 39.0 безразмерных единиц и была выбрана такой, чтобы нелинейные эффекты были сильно выражены. Предварительно мы проверили, чтобы в тренировочном наборе не было сигналов, содержащих солитоны. Для каждого сигнала был посчитан непрерывный нелинейный Фурье спектр. Количество точек в спектрах также равно 1024. Для последующей тренировки в случае наличия некоррелированного Гауссова шума, мы дополнительно использовали 6 наборов данных с разным значением отношения энергии сиг-нала к энергии шума (SNR): {0, 5, 10, 13, 20, 30} dB. Каждый набор состоял из 423160 сигналов, что соответствует 5 разным реализациям шума. 7 наборов из 9403 сигналов использовались в качестве валидационных данных и не использовались в процессе обучения.

Рис. 1 демонстрирует схематическое изображение оптимизированной архитектуры нейронной сети. Сверточная часть состоит из трех слоев с 10, 15 и 10 фильтрами. Далее

1UOUS sp

1024x2

Рис. 1. Архитектура нейронной сети

идет полносвязныи слои, на выходе которого мы получаем одну часть предсказанного спектра (действительную или мнимую). Для предсказания полного спектра используются две нейронных сети с идентичной архитектурой.

326............№6 2021 СПЕЦВЫПУСК «ФОТОН-ЭКСПРЕСС-НАУКА 2021» www.fotonexpress.rufotonexpress@mail.ru

Для анализа точности работы нейронной сети и способности обработки сигналов с шумом мы сравниваем отклонения, полученного с помощью нейронной сети спектра от посчитанного стандартными методами КБТ для сигналов без шума. В качестве метрики используется средняя относительная ошибка по всему валидационному набору данных для каждого отдельного значения уровня шума. Таблица 1 ошибку расчета нелинейного спектра для сигналов без и с добавлением шума. Серые клетки соответствуют случаям, когда точность предсказания нелинейного спектра для нейронной сети ниже, чем у NFT, в то время как белые клетки соответствуют случаям, когда точность непрерывного спектра, предсказанного нейронной сетью, выше. Первая строка соответствует случаю без шума (б/ш) и всегда будет «серой» поскольку нейронная сеть не может предсказать значения точнее, чем рассчитанные с помощью КБТ. Однако значения ошибки для искаженных шумом сигналов проявляют интересные тенденции. Из таблицы следует, что для низкого уровня шума в обучающем наборе (до 10 дБ, столбцы с третьего по пятый) ошибка NN обычно самая низкая для валидационного набора без шума (вторая строка). Таким образом, добавление слабого шума в набор обучающих данных только ухудшает возможность восстановления NN даже если это снижение незначительно. В наиболее интересном случае сильного шума (т. е. накопленного в системах большой протяженности) сеть лучше всего работает для наборов сигналов, где значение SNR одинаково для проверочного и обучающего наборов. В таких случаях относительная погрешность составляет около 8-12%, тогда как ошибка для обычного NFT находится на уровне 100-200%. При уменьшении шума (строки снизу вверх) в валида-ционном наборе значение ошибки остается примерно на том же уровне после ячейки, соответствующей одинаковому уровню SNR для обучающего и валидационного набора данных. Эти результаты подтверждают, что представленная архитектура NN способна выполнять операцию NFT для сложных сигналов, и, кроме того, она также может работать как высокоэффективный элемент шумоподавления, когда уровень шума становится значимым.

Таблица 1. Сравнение точности нейронной сети с обычными методами NFT для вычисления нелинейного спектра. Ячейки содержат значение относительной ошибки для каждой конкретной пары

тренировочного и валидационного SNR

Тренировочное значение SNR, Ж №Т Без шума 30_20_13_10_5_0

(U

о ai

и 9 к ^ о ю s я а

ие

m

<D g

И

б/ш 30 20 13 10 5 0

6.91E-02 2.21E-01 4.89E-01 6.78E-01 1.16 2.00

8.39E-04 5.54E-02 1.74E-01 3.66E-01 4.88E-01 7.26E-01 9.48E-01

6.52E-03 9.56E-03 2.53E-02 7.74E-02 1.29E-01 2.73E-01 4.79E-01

1.26E-02 1.36E-02 1.97E-02 4.53E-02 7.36E-02 1.72E-01 3.60E-01

2.38E-02 2.42E-02 2.58E-02 3.54E-02 5.12E-02 1.15E-01 2.59E-01

3.59E-02 3.63E-02 3.65E-02 3.98E-02 4.85E-02 9.93E-02 2.29E-01

7.43E-02 7.49E-02 7.40E-02 7.06E-02 6.87E-02 7.98E-02 1.74E-01

1.42E-01 1.44E-01 1.43E-01 1.38E-01 1.33E-01 1.17E-01 1.16E-01

Мы рассмотрели реализацию NFT с помощью нейронных сетей со специальной структурой, применив байесовскую оптимизацию гиперпараметров для определения наиболее эффективной сетевой архитектуры. Мы рассмотрели здесь почти неизученный случай, связанный с вычислением непрерывного нелинейного спектра, который наиболее интересен с точки зрения оптической связи. Было продемонстрировано, что обработка на основе NN может существенно повысить точность NFT в присутствии шума по сравнению с традиционным методом высокоточной обработки NFT. Преимущество шумоподавления становится наиболее заметным при высоких уровнях шума, при этом максимальное качество восстановления обычно достигается, когда SNR обучающих данных совпадает с SNR валидационного набора.

Исследование выполнено при поддержке фонда Президента РФ для государственной поддержки молодых российских ученых (грант № МК-677.2020.9). Работа И.С. Чеховского была поддержана государственным заданием на проведение фундаментальных исследований (FSUS-2020-0034), а работа Я.Е. Прилепского - фондом Leverhulme Trust (проект RPG-2018-063).

Литература

1. Turitsyn S.K. et al, Optica, 4, 307-322 (2017)

2. Zakharov V.E. and Shabat A.B., Soviet Physics JETP, 34, 62 (1972)

3. Yousefi M. and YangzhangX., IEEE Transactions on Information Theory, 66, 478-495 (2019)

4. Pankratova M. et al, Physical Review Applied, 13, 054 021 (2020)

5. Boffetta G. and Osborne A.R.,Journal of computational physics, 102, 252-264 (1992)

6. Wahls S. and Poor H. V., International Conference on Acoustics, 5780-5784 (2013)

7. Medvedev S. et al, Optics Express, 28, 20, Jan. (2020)

8. Civelli S. et al, IEEE Photonics Technology Letters, 29, 1332-1335 (2017)

№6 2021 СПЕЦВЫПУСК «ФОТОН-ЭКСПРЕСС-НАУКА 2021» www.fotonexpres.rufotonexpress@mail.ru 327

i Надоели баннеры? Вы всегда можете отключить рекламу.