УДК 519.632
К.Е. БУРНАЕВ, БелГТУ им. Шухова, Белгород, Россия
ПРИБЛИЖЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ ТЕПЛОПРОВОДНОСТИ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ
У статті розглядається можливість отримання наближеного рішення диференційних рівнянь у частинних похідних за допомогою одношарових нейронних мереж із зворотними зв'язками. Досліджуються питання стабільності нейронної мережі. Представлений простий приклад застосування мереж вказаної структури для вирішення диференційного рівняння. Проведено порівняння результатів рішення з результатами, одержаними методом кінцевих елементів.
The possibility of solving partial derivative differential equations by using neural networks with specific structure is investigated in the article. The simple single-layer neural network ability to approximate the solution of PDE is proved. The issue of network stability is examined. A simple example of described method application is given and the simple result comparison with the finite element method is made.
Постановка задачи. Общий вид уравнения теплопроводности для стационарных тепловых процессов в п -мерном пространстве определяется уравнением Пуассона (или его частным случаем при п = 0 - уравнением Лапласа):
Ди = -g, (1)
где функции и(х), g(х) определены на области ОсЕп. Задача формулируется следующим образом: найти такую функцию и, которая бы удовлетворяла уравнению Пуассона и некоторым условиям, заданным на
ди
границе Г области Q: u(x) = v (x), ди
дп
= v2(x) , — дп
= а(у3 (x) - u(x)) .
Заметим, что даже относительно простые задачи, возникающие на практике, могут содержать краевые условия всех трех типов и, как правило, имеют О «неудобной» - в частности, не прямоугольной - формы [1 - 5].
Задачи такого вида возникают при решении многих технических задач -расчете охлаждающих систем, пресс-форм и литьевых форм, печатных плат и тому подобного. Как правило, при решении таких задач пользователя главным образом интересует получение численного решения.
Обзор существующих методов решения задачи. Методы решения дифференциальных уравнений в частных производных можно разбить на две большие группы: аналитические и численные. Аналитические методы, такие как метод разделения переменных, метод функции Грина или методы, использующие интегральные преобразования, дают возможность получить
Г
Г
аналитическое выражение решения. Однако все эти методы, к сожалению, не могут быть применены для решения произвольной задачи, так как они накладывают жесткие ограничения на вид граничных условий задачи и (или) форму области, в которой идет поиск решения. В некоторых случаях с помощью искусственных методик возможно привести некоторые задачи к требуемому виду, однако, в общем случае это невозможно [3 - 5]. Отсутствие формальных правил решения произвольной задачи мешает применению аналитических методов в системах автоматизированного проектирования.
Численные методы, в частности, методы конечных разностей и конечных элементов, являются в достаточной степени универсальными методами. При их применении процесс сводится к дискретизации задачи и поиску решения системы линейных алгебраических уравнений. Как правило, системы автоматизированного проектирования используют именно численные методы. Однако проблема такого подхода состоит в том, что такие алгоритмы в силу своей последовательной природы плохо распараллеливаются между несколькими вычислительными устройствами. Учитывая все большее распространение распределенных вычислительных систем, возникает потребность в алгоритме, имеющем достоинства упомянутых метода конечных разностей, метода конечных элементов и позволяющем использовать преимущества параллельных вычислений [2].
Применение нейронных сетей. Создадим нейронную сеть, нейроны которой имеют линейные активационные функции /(х) = х и каждый
нейрон имеет 2п +1 связей - с непосредственными соседями и самим собой. Обозначим множество номеров нейронов, являющихся непосредственными соседями і -го нейрона как N, номера нейронов, предшествующих і -му нейрону по ] -й координате как PJІ, следующих по ] -й координате как 8^ . Веса связей выберем, основываясь на следующих правилах:
щ = Ь, V/, Ь є (0,1);
Щ ^І; (2)
где WІJ - вес связи, идущей от / -го нейрона к } -му. Проведем дискретизацию области О, покрыв ее прямоугольной сеткой прямых
Хр = Ррк , где Р;г принимает все целые значения из интервала
Обозначим множество координат узлов сетки дискретизации как X. Поставим в соответствие значению искомой функции в узле сетки выходное
™ІІ =
значение нейрона = и(х,), х, е X.
Заметим, что в стабильном состоянии нейронной сети будет выполняться неравенство |/]('+1) - |-') | < £ , где £ - сколь угодно малая величина. Преобразуя неравенство очевидным образом, получаем:
У
(*+1).
ь/Г+ £ 1-Ьл“)
< £ ,
(3)
или, перегруппировывая слагаемые с учетом того, что N = 2п получим
1 - Ь
£(/?
(*) - у (*)
и далее
£ V
а -2у(,)+/2
< £ .
к=1
(4)
(5)
Как легко видеть, под знаком суммы стоит приближенное выражение для второй производной функции по к-й переменной в узле I . Произведя тривиальные преобразования, получаем соотношение
£|£ (С -2 Я'+Л?, )|
<0.
V к=1
являющееся дискретной формой выражения
| Ди(х)2dx и 0 .
(6)
(7)
Таким образом, стабильное состояние нейронной сети будет удовлетворять уравнению Лапласа. Рассмотрим, как можно перейти от уравнения Лапласа, не включающего в себя информацию о внутренних источниках тепла, к общему уравнению Пуассона. Используем активационную функцию нейронов общего вида
(х) = х + gi, (8)
где ^ = g(х) - значение функции, стоящей в правой части уравнения Пуассона, в I -м узле сетки. Применяя аналогичные (4) - (6) преобразования, приходим к выражению
£ («- 2 у")+4))+*,
к=1
< £ .
(9)
или
V
У
п
2
2
□
{тії -2 У"1+€)+*
і V к=1
(10)
^ (Ди( х) + Я(х))2 Лх и 0.
(11)
Таким образом, определяя величину единичного смещения, подаваемого на каждый из нейронов сетки, получаем решения произвольного уравнения Пуассона. Рассмотрим, как в выбранной модели могут задаваться краевые условия задачи. Выделим три основных вида краевых условий:
и(х) = у(х), х є Г ; ды
дп
= у(х), х є Г ;
ды
дп
= а(ы(х) - v(х)), х є Г .
(12)
(13)
(14)
Очевидно, что часть нейронов будет соответствовать узлам сетки дискретизации, находящимся на границе Г области О. Для задания краевых условий используем нейроны с измененными активационными функциями
(15)
/ (х) = к(х + уі ); к = |- коэффициент, зависящий от формы границы в
N
узле
/(х) = х + а(х - V,.). (16)
Покажем, что граничные условия в стабильном состоянии нейронной сети будут выполняться для каждого нейрона, соответствующего граничному узлу сетки дискретизации.
Для первого случая доказательство не требуется в силу очевидности.
0
и
о
х
х
Рис. 1. 130
Для второго случая сначала рассмотрим двумерный случай, приведенный на рис. 1. Здесь
Тогда, в силу (5)
да
дп
і(/І - /2 )+(/і - /3 )+(/і - /4 ) •
После тривиальной подстановки (17) получаем
ди
дп
(17)
(18)
(19)
После обобщения выражений (17) - (18) на произвольное число измерений п получаем следующее выражение для к-го узла (считаем, что границу в данном узле можно определить (п -1 )-мерной гиперплоскостью, заданной уравнением хп = с и 5^ = 0):
(п-1 . , Л
1к =
2п -1
)+ її
+ 'Ркп + Ук
V і=1
ди
дп
п-1
(20)
(21)
* ^ ((/к - /РЫ ) + (/к - /зк1)) + (/к -/.Ркп ) ~ ^ ■
хк 1=1
Покажем, что нейронная сеть выбранной структуры стабильна и имеет единственное стабильное состояние. Нестабильность нейронной сети может быть вызвана одной из двух причин [6, 7]:
1. Существование в сети циклов с положительными обратными связями. Эта проблема характерна для нейронных сетей, использующих неограниченные активационные функции нейронов.
2. «Осцилляция» сети, то есть ее колебание между несколькими состояниями. Эта проблема, как правило, характерна для синхронных нейронных сетей, в которых все нейроны изменяют свое выходное значение одновременно.
X
X
В силу условия (2), наложенного на веса связей сети, в сети не может существовать связей с весом, большим единицы. Учитывая кроме этого то, что активационные функции нейронов являются линейными с коэффициентами усиления меньше или равными единице, получаем, что суммарный выходной сигнал нейронов не будет превышать суммарный входной сигнал. Таким образом, возможно гарантировать отсутствие положительных обратных связей в сети.
Пример решения задачи. В качестве иллюстрации выбрана достаточно простая задача, условие которой приведено на рис. 2. Для решения задачи была использована нейронная сеть размером 10 х10 указанной структуры. Коэффициент b, задающий теплопроводность материала, был выбран равным 0.1. Стабильным считалось состояние нейронной сети, в котором максимальное по абсолютному значению изменение выходного сигнала нейрона было меньше 10 2. Было произведено 100 запусков со случайными начальными состояниями нейронной сети. Результат сравнивался с решением аналогичной задачи методом конечных элементов с треугольными элементами и сеткой дискретизации 10 х10 и 100 х100.
При сравнении с МКЭ получены следующие результаты: для сетки МКЭ 10 х10 порядок максимального отклонения - 102 (0.01 - 0.1% в отдельно взятом узле); для сетки МКЭ 100 х 100 порядок максимального отклонения -10_1 (0.1 - 1% в отдельно взятом узле).
Выводы. Таким образом, можно получить приближенное решение дифференциального уравнения с помощью нейронной сети указанной структуры. Заметим, что хотя мы говорили о решении уравнения теплопроводности, описанная модель применима для решения произвольных эллиптических дифференциальных уравнений в частных производных.
Список литературы: 1. Адамар Ж. Задача Коши для линейных уравнений с частными производными гиперболического вида. - М.: Наука, 1978. - 351 с. 2. Арфкен Г. Математические методы в физике. - М.: Атомиздат, 1969. - 712 с. 3. Беллман Р., Энджел Э. Динамическое программирование и уравнения в частных производных / Под ред. А.М. Летова. - М.: Мир, 1974.
- 207 с. 4. ЗоммерфельдА. Дифференциальные уравнения в частных производных физики. - М.: Издательство иностранной литературы, 1950. - 456 с. 5. Несис Е. И. Методы математической физики. - М.: Просвещение, 1977. - 99 с. 6. Горбань А. Н.. Обучение нейронных сетей. - М.: СП ПараГраф, 1990. 6. Круглов В., Борисов В. Искусственные нейронные сети. Теория и практика.
- М.: Горячая Линия - Телеком, 2002. - 377 с.
Поступила в редакцию 29.09.2004