Научная статья на тему 'Моделирование процессов, описываемых волновым дифференциальным уравнением, с использованием ячеистых нейронных сетей'

Моделирование процессов, описываемых волновым дифференциальным уравнением, с использованием ячеистых нейронных сетей Текст научной статьи по специальности «Математика»

CC BY
677
210
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ЯЧЕИСТАЯ НЕЙРОННАЯ СЕТЬ / НЕЙРОУРАВНЕНИЯ / ВОЛНОВОЕ УРАВНЕНИЕ

Аннотация научной статьи по математике, автор научной работы — Корсунов Н. И., Ломакин А. В.

Рассмотрена проблема численного моделирования волновых процессов. Показана целесообразность применения параллельных вычислительных алгоритмов для решения трехмерных начальнокраевых задач для волнового уравнения. Предложена и обоснована архитектура нейронной сети, реализующей процедуру построения решения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Моделирование процессов, описываемых волновым дифференциальным уравнением, с использованием ячеистых нейронных сетей»

Серия История. Политология. Экономика. Информатика. 2014 № 15 (186). Выпуск 31/1

МОДЕЛИРОВАНИЕ ПРОЦЕССОВ, ОПИСЫВАЕМЫХ ВОЛНОВЫМ ДИФФЕРЕНЦИАЛЬНЫМ УРАВНЕНИЕМ, С ИСПОЛЬЗОВАНИЕМ ЯЧЕИСТЫХ НЕЙРОННЫХ СЕТЕЙ

УДК 004.94

Н.И. КОРСУНОВ А.В. ЛОМАКИН

Белгородский

государственный

национальный

исследовательский

университет

e-mail:

[email protected] [email protected]

Рассмотрена проблема численного моделирования волновых процессов. Показана целесообразность применения параллельных вычислительных алгоритмов для решения трехмерных начально-краевых задач для волнового уравнения. Предложена и обоснована архитектура нейронной сети, реализующей процедуру построения решения.

Ключевые слова: ячеистая нейронная сеть, нейроуравнения, волновое уравнение.

Проблема компьютерного моделирования нестационарных процессов, несмотря на большое количество исследований в этом направлении, остается актуальной в силу широкого разнообразия решаемых задач, специфику которых необходимо учитывать при разработке методов и алгоритмов построения численных решений.

Многие физические поля описываются уравнениями Лапласа, Пуассона, волновыми уравнениями и уравнениями теплопроводности [1]. Необходимость получения решения этих уравнений возникает при реализации задач в различных сферах деятельности. К таким задачам относятся сжатие HDR-изображений, матирование изображений, редактирование изображений, для разрешения которых необходимо решение уравнения Пуассона. Но, несмотря на разнообразие методов [1], уравнение Пуассона в целом ряде из них применяется для решения одной и той же задачи, а именно восстановления изображения по градиентному полю.

В данной статье рассмотрено решение волновых уравнений. Волновые уравнения описывают почти все разновидности малых колебаний в распределённых механических системах (продольные звуковые колебания в газе, жидкости, твердом теле, поперечные колебания в струнах, на поверхности воды).

Существует класс задач, где нахождения решения требует высокой точности, что приводит к высоким вычислительным затратам и увеличению времени нахождения решения [3].

На сегодняшний день задача численного решения дифференциальных уравнений решается сеточными методами, однако практически все сеточные методы являются источником сверхбольших систем линейных алгебраических уравнений. Например, при решении дифференциального уравнения второго порядка эллиптического типа (стационарное уравнение теплопроводности или диффузии) в трехмерном пространстве полученная система уравнений будет иметь матрицу размером IJK (где I, J, К — количество узлов сетки вдоль координатных осей), что требует немалого числа простых арифметических операций. При решении типичной задачи с К = 100, порядок количества необходимых операций достигнет около 1014. При увеличении разрешения сетки еще в 10 раз время, необходимое для решения поставленной задачи, достигнет существенных величин даже при использовании самых мощных современных суперкомпьютеров [3].

Еще одной проблемой является задание произвольных краевых условий. В отличие от метода конечных элементов, позволяющего естественным образом включить краевые условия вида

I=} w

dx

НАУЧНЫЕ ВЕДОМОСТИ ШМ Серия История. Политология. Экономика. Информатика.

2014 №15 (186). Выпуск 31/1

в получаемые уравнения, метод конечных разностей требует для определения таких условий искусственного усложнения сетки дискретизации, ввода дополнительных вспомогательных узлов, позволяющих определить значение производной искомой функции через конечно-разностное выражение. Конечно же, это не лучшим образом сказывается на количестве узлов, а, следовательно, и на размерности полученной системы линейных алгебраических уравнений.

Как неудобство можно также отметить тот факт, что априори затруднительно определить оптимальную сетку разбиения, которая бы содержала минимально возможное для заданной точности количество узлов. Однако в последнее время разработано достаточное количество адаптивных расчетных схем, позволяющих сгладить этот недостаток.

Поэтому актуальной является задача ускорения решения, что вызывает необходимость в распараллеливании вычислений. Для этого приходится разрабатывать параллельные алгоритмы, что часто приводит к усложнению программной реализации. Предлагаемый подход, основанный на применении нейронных сетей, не требует дополнительного времени на разработку алгоритмов параллельных вычислений. Это связано с тем, что в нейронные сети, как инструмент математического описания объектов, ориентированы на использование параллелизма изначально [1].

Можно выделить три основных направления разработок нейронных сетей для численного решения задач математической физики.

Первое использует идеи метода невязок, а именно - получение решения дифференциального уравнения с помощью некоторого набора простых базисных функций. Метод основывается на том факте, что отдельные виды сплайнов, например, В1- могут быть получены с помощью суперпозиции кусочно-линейных активационных функций. Такая форма решения может быть непосредственно отображена на архитектуру нейронной сети прямого распространения. Недостатком этого метода является то, что количество базисных функций при применении подхода, аналогичного методу невязок, очень велико и быстро растет с увеличением количества узлов задачи; в свою очередь, при увеличении размерности задачи (например, при переходе от двумерной области к трехмерной) увеличивается количество параметров, необходимых для задания базисных функций. Это приводит к тому, что метод крайне плохо масштабируется и начинает проигрывать классическим численным методам при решении задач большой размерности.

Вторым основным направлением можно считать решение полученной при применении метода конечных разностей или метода конечных элементов системы линейных уравнений обращением матрицы с помощью обучаемой нейронной сети с архитектурой Хопфилда. В этом случае обучение сети с такой архитектурой соответствует минимизации энергетической функции. Отображая полученную систему линейных алгебраических уравнений на нейронную сеть так, чтобы энергетическая функция соответствовала невязке решения системы линейных уравнений, мы решаем систему уравнений при обучении нейронной сети. К сожалению, основные вычислительные затраты при применении этого метода приходятся на этап обучения нейронной сети (фактически - на этап минимизации энергетической функции). Недостатком этого метода является большое время обучения и то, что обученную нейронную сеть нельзя применить для решения другой системы уравнений (хотя, конечно, можно использовать в качестве начального состояния при обучении).

Третье направление - получение дифференцируемого аналитического решения с помощью нейронных сетей специфической структуры. В отличие от предыдущих двух методов, этот метод дает приближенное аналитическое решение поставленной задачи,

представленное в виде суперпозиции двух функций - одна из которых ^(^О

удовлетворяет краевым условиям, а вторая обращается на границе области в ноль

Щх,р)

и частично задается нейронной сетью .

Серия История. Политология. Экономика. Информатика. 2014 № 15 (186). Выпуск 31/1

К сожалению, такой подход требует, чтобы область О была прямоугольной, что не всегда возможно при решении практических задач. Кроме того, для обучения персептрона уже требуется наличие решения поставленной задачи на более грубой сетке, что подразумевает использование одного из классических методов в "связке" с описанным.

Нами предложена архитектура сети, которая позволяет находить решение уравнений математической физики, к которым относятся:

• уравнения Лапласа;

• уравнения Пуассона;

• уравнения теплопроводности;

• волновые уравнения.

Рассмотрены подходы к решению данных уравнений [1], а также показана возможность решения волнового уравнения с использованием нейронной сети ячеистой структуры, а также приведено доказательство на основе закона сохранения энергии.

В области ^, в которой производится поиск решения, выделим узлы дискретизации, образующие п-мерную однородную прямоугольную сетку дискретизации с фиксированным шагом И.. В этом случае приближенное решение может быть получено с помощью конечно-разностного представления уравнения. Несмотря на то, что метод конечных элементов позволяет работать с более сложными геометрическими областями, он приводит к большей погрешности и сложности обучения, а так же более требователен к вычислительным ресурсам по сравнению с методом конечных разностей.

Использование метода конечных разностей в нейронной сети требует наличия у сети определенной архитектуры, которая позволила бы минимизировать затраты на обучение. При этом для каждого из уравнений должна доказываться адекватность выбора архитектуры сети и класса численных методов [2].

В предложенной архитектуре нейронной сети используются решетчатые нейронные сети. Общим принципом построения таких нейронных сетей является то, что при размерности сети п каждый нейрон имеет не более чем 2п +1 связей — с непосредственными соседями и самим собой.

Ранее было рассмотрено решение уравнения Лапласа с помощью нейронной сети с ячеистой архитектурой [1] (рис. 1).

Рис. 1. Структура нейронной сети

Серия История. Политология. Экономика. Информатика. 2014 № 15 (186). Выпуск 31/1

На рисунке 2 приведена общая схема обучения сети.

Рис. 2. Схема обучения нейронной сети

При проектировании сети были получены нейроуравнения всей сети /. = и (х:), х{ е X. Коэффициенты в этих нейроуравнениях определены следующим образом:

w,,= b 1 - b

w,.

2n

* J-.

WV=WJi

где w — вес связи, идущей от i-го нейрона к j-му, b е [0,1) — «настроечный» коэффициент

сети, n — размерность сети.

Фактически сеть получает решение уравнения, корректируя переменные и получая неизвестные компоненты по уже известным в процессе обучения.

Выберем активационные функции и веса обратных связей нейронов, соответствующих граничным условиям, в зависимости от вида краевого условия, определенного в узле, следующим образом:

• для краевого условия первого вида: f (g) = v = const, wu = 0, где g — выход сумматора.

<

НАУЧНЫЕ ВЕДОМОСТИ Серия История. Политология. Экономика. Информатика. ю7

2014 № 15 (186). Выпуск 31/1

• для краевого условия первого вида: f (g) = v = const, wu = 0, где g — выход сумматора.

• для краевого условия второго вида: f (g) = к\ g + v •1—- |, w.. = — , где к = т2^ —

V 2n J к N

коэффициент, зависящий от формы границы в узле; \Щ — мощность множества N — количество непосредственных соседей нейрона.

• для краевого условия третьего вида: f (g) = к\g +1—— •a •(x-vt)|.

V 2n J

Показано из условий сохранения энергии, что сеть дает решение волнового уравнения. Критерием выбрано выполнение закона сохранения энергии.

Пусть Si — — значение функции, стоящей в левой части волнового уравнения, в i-ом узле сетки. В стабильном состоянии нейронной сети для каждого нейрона i будет выполняться неравенство f (<+1)- f(t) + <е, где f(t) — выходное значение нейрона i в момент

времени t; s — сколь угодно малая величина.

Применяя преобразования, аналогичные приведённым при доказательстве для уравнения Лапласа [l], приходим к выражению:

В отличие от известных методов применения нейронных сетей для моделирования стационарных физических полей, в данном методе достаточно просто реализуются граничные условия.

Список литературы

1. N. Korsunov, V. Mikhelev, A. Lomakin, "Application of Lattice Neural Networks for Modeling of Stationary Physical Fields," Proceedings of the 2013 IEEE 7th International Conference on Intelligent Data Acquisition and Advanced Computing Systems, 2013, Vol. 1, pp. 369-372.

2. Randall J. LeVeque, "Finite Difference Methods for Ordinary and Partial Differential Equations, Steady State and Time Dependent Problems"

3. Корсунов Н.И., Начетов А.А. Коррекция ошибок деления чисел, вызванных воздействием помех // Научные ведомости БелГУ: компьютерное моделирование. - Б.: Белгородский государственный университет, 2013 г. - № o15(158)2013. - Выпуск 27/1. - С. 76-82.

MODELING OF PROCESSES DESCRIBED BY WAVE EQUATIONS USING CELLULAR NEURAL NETWORKS

N.I. KORSUNOV A.V. LOMAKIN

Belgorod State National Reserch University

e-mail:

[email protected] [email protected]

The problem of numerical modeling of wave processes was considered. The feasibility of parallel computing algorithms for solving of three-dimensional boundary value problems of wave equation was shown. Architecture of the neural network that implements the procedure of constructing the solutions proposed and justified.

Keywords: cellular neural networks, neuroequiations, wave equiation.

i Надоели баннеры? Вы всегда можете отключить рекламу.