Научная статья на тему 'Имитационное моделирование нейросетей для решения уравнений математической физики локально-асинхронными методами'

Имитационное моделирование нейросетей для решения уравнений математической физики локально-асинхронными методами Текст научной статьи по специальности «Математика»

CC BY
222
37
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Новотарский Михаил Анатольевич

В статье дано краткое изложение краевой задачи математической физики и изложены особенности локально-асинхронного метода для ее решения, отражены основополагающие принципы реализации данного метода на основе нейросети. Обсуждается структура нейросети и алгоритм ее функционирования, даны основные подходы к формализации исходной задачи с помощью PRO-сетей, формулируются принципы построения нейросетевого имитатора.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Новотарский Михаил Анатольевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

In clause the brief statement of a boundary value problem of mathematical physics is given and the features of a local-asynchronous method for its solving are stated, the basic principles of realization of the given method on a neural network reflected. The neuronet structure and algorithm for it's functioning is discussed, the basic approaches to formalization of an initial task with the help of PRO-nets are given, and the principles of construction of the neurosimulator are formulated.

Текст научной работы на тему «Имитационное моделирование нейросетей для решения уравнений математической физики локально-асинхронными методами»

контролировать температуру воздуха внутри помещении, применяется расчет теплогидравлических режимов потребителей через относительные характеристики (по отношению к расчетному режиму) [7], что позволяет существенно снизить объем исходной информации, необходимой при расчете ТСС в целом и в несколько раз сокращает время расчета потребителя.

Изложенные принципы эквивалентирования и декомпозиции таким образом диктуют соответствующие принципы организации БД (разбиение на уровни тепловых сетеи, набор объектов, из которых формируется расчетная схема и т.п.).

ВЫВОДЫ

1. Сформулированы новые требования и направления развития прикладного ПО для компьютерного моделирования ТСС при их проектировании, эксплуатации и диспетчерском управлении.

2. Дана характеристика реализации нового поколения ПО, обеспечивающего решение основных режимно-техно-логических задач для систем теплоснабжения.

ПЕРЕЧЕНЬ ССЫЛОК

1. Методы и алгоритмы расчета тепловых сетей/ В,Я, Хаси-лев, А,П, Меренков, Б,М, Каганович М.: Энергия, 1978.

2. Меренков А, П,, Хасилев В, Я,, Теория гидравлических цепей, М.: Наука, 1985.

3. Сеннова Е,В,, Сидлер В,Г, Математическое моделирование и оптимизация развивающихся теплоснабжающих систем. -Новосибирск: Наука, СО, 1987.- 221с

4. Математическое моделирование и оптимизация систем тепло-, водо-, нефте-, газоснабжения. / А,П,Меренков, Е,В,Сеннова, С,В,Сумароков, и др,- Новосибирск: ВО "Наука", -Сиб. Изд. фирма, 1992. - 407 с.

5. Методы управления физико-техническими системами энергетики в новых условиях / Н,И,Воропай, Н,Н,Новицкий, Е,В,Сеннова и др, - Новосибирск: Наука, Сибирская издательская фирма РАН, 1995.-334с.

6. Сидлер В,Г,, Шалагинова 3,И,, Математическая модель теплогидравлических режимов абонентских вводов // Методы анализа и оптимального синтеза трубопроводных систем. - Иркутск: СЭИ СО РАН, 1991.- С.111-124.

7. Шалагинова 3,И, Разработка и применение методов тепло-гидравлического расчета для задач эксплуатации теплоснабжающих систем // Международная научно-практическая конференция "Человек. Среда. Вселенная, том 1, Иркутск, 1997.- 198с.

УДК 681,32:007,58

ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ НЕЙРОСЕТЕЙ ДЛЯ РЕШЕНИЯ УРАВНЕНИЙ МАТЕМАТИЧЕСКОЙ ФИЗИКИ ЛОКАЛЬНО-АСИНХРОННЫМИ МЕТОДАМИ

М.А.Новотарский

В статье дано краткое изложение краевой задачи математической физики и изложены особенности локально-асинхронного метода для ее решения, отражены основополагающие принципы реализации данного метода на основе нейросети. Обсуждается структура нейросети и алгоритм ее функционирования, даны основные подходы к формализации исходной задачи с помощью PRO-сетей, формулируются принципы построения нейросетевого имитатора.

В статт1 даеться короткий виклад крайовоЧ задач1 мате-матичноЧ фгзики i викладет особливостг локально-асинхронного методу для ii вирШення, вiдображенi основш принципи реалiзацi'i даного методу на нейромережi. Обговорюеться структура нейромережi i алгоритм ii функцюнування, данi основн тдходи до формалiзацii вихiдноi задачi за допомогою PRO-мереж, формулюються принципи побудови нейромереже-вого iмiтатора .

In clause the brief statement of a boundary value problem of mathematical physics is given and the features of a local-asynchronous method for its solving are stated, the basic principles of realization of the given method on a neural network reflected. The neuronet structure and algorithm for it's functioning is discussed, the basic approaches to formalization of an initial task with the help of PRO-nets are given, and the principles of construction of the neurosimulator are formulated.

ВВЕДЕНИЕ

Прошло десятилетие с тех пор, как мир охватила "неИронная лихорадка". Число компьютеров и программных продуктов, использующих неиросетевую технологию, растет с каждым днем. Объем мирового рынка неИронных сетеИ ежегодно увеличивается на 40% и составляет около 1 млрд. долларов. К настоящему времени уже сформировался круг проблем, традиционно решаемых с применением данноИ технологии. Наиболее широко используется она для решения всевозможных задач прогнозирования и распознавания, преимущественно в финан-совоИ сфере и медицине. Однако такая специализация неИросетеИ ни в коеИ мере не может рассматриваться как окончательная.

Это универсальная технология, позволяющая решать задачи в самых неожиданных областях. Строгим обоснованием такого подхода следует считать знаменитую теорему Колмогорова, перефразированную в терминах неИросетеИ.

1. ТЕОРЕМА КОЛМОГОРОВА

Если известны функции Н,, то любую непрерывную

функцию от п переменных можно точно реализовать с помощью простой нейросети на основе трехслойного пер-цептрона. Для этого достаточно подобрать 2п + 1 передаточных функций ^^ нейронов скрытого слоя.

F(X1sX2,...х) = £ gj

j = 1

I hj(Xi) i = 1

(1)

где gj и h

4

непрерывные функции, причем hij не

ij

зависят от функции

К сожалению, практическое использование теоремы Колмогорова сильно затруднено тем, что функции Н,, - не-

Ч

гладкие и трудно вычислимые, а для выбора функций gj

не существует сколь-нибудь эффективных методик. Поэтому для каждого нового класса задач, решение которых предполагается получать с помощью нейросети, разрабатываются свои концепции построения ее структуры и алгоритма функционирования. Решение дифференциальных уравнений - это сравнительно молодая, но бурно развивающаяся область применения нейросетей. Известны примеры успешных разработок в этой области, как в ближнем, так и в дальнем зарубежье [1,2]. Специфика исследований, проводимых в Институте математики HAH Украины, заключается в том, что нейросети ориентированы на решения уравнений математической физики локально-асинхронными многосеточными методами. Как раз особенности данных методов и являются побудительным мотивом к использованию нейросетей для их реализации.

2. ЛОКАЛЬНО-АСИНХРОННЫЕ МЕТОДЫ

Локально-асинхронные многосеточные методы для решения краевых задач - это методы, которые предполагают получение решения глобальной задачи путем разбиения ее на множество локальных задач, решаемых параллельно [3]. Решение каждой из таких задач понимается как самостоятельный локальный процесс, который может взаимодействовать с другими подобными локальными процессами с целью приема данных и передачи результатов вычислений. Разбиение локальной задачи может осуществляться с учетом пространственно-временных аспектов решения общей задачи. Самый простой подход предполагает отождествление нейронов нейросети с узлами сеточной области. В этом случае форма и размерность нейросети соответствует конфигурации границ краевой задачи.

Исходная краевая задача задается в общем виде операторным уравнением

LU = F ,

решение u разностным решением u^ , получим разностную краевую задачу

Lhuh = fh , (3)

Для решения данной разностной краевой задачи на основе нейросети предложен локально-асинхронный многосеточный метод [3]. Его отличительной чертой есть то, что при реализации итерационного процесса uh(п + 1 ) = Iter(uh(n), Lh ,fh ,vh) вычисление vh осуществляется исходя из точного решения уравнения LhVh = dh и формирования невязки dh для каждого

узла сеточной области путем операций проецирования и интерполирования невязок, взятых с узлов с различным шагом сетки. Подлинная асинхронность этого метода состоит в том, что для него доказана сходимость итерационного процесса к решению при использовании хаотической последовательности формирования координат соседних узлов для переменного точечного шаблона. Изменение шага сетки, а, следовательно, и координат точечного шаблона, принято выбирать кратным двойке. Отсюда следует выбор структуры нейросети, реализующей обработку значений функции uh и невязки dh ,

полученных на предыдущей сетке. Количество входов нейрона и размерность сети будет определяться размерностью исходной задачи. На рис.1 представлена простейшая нейросеть, позволяющая рассмотреть одномерный случай.

(2)

Заменяя, оператор Ь разностным оператором Ьн , правую часть / - некоторой сеточной функцией /н , а точное

Рисунок 1 - Нейросеть для решения уравнений математической физики локально-асинхронным многосеточным методом

Основной особенностью такой сети можно считать ее рекуррентность, что диктуется необходимостью реализации итерационного процесса. Известно, что использование рекуррентных нейросетей сопряжено с рядом проблем, одна из которых заключается в трудности определения момента останова. В данном случае эти трудности реша-

2 п + 1

114

ISSN 1607-3274 "Радтелектронжа, шформатика, управл1ння" № 1, 2001

ются путем введения послоИноИ специализации. Сеть содержит три слоя неИронов, каждыИ из которых ориентирован на реализацию специфических функциИ. ПервыИ слоИ предназначен для выбора текущего канала приема информации и предварительноИ ее подготовки к участию в итерационном процессе. Дендриты неИронов второго (скрытого) слоя управляются синапсами, значения весов которых могут принимать значения 0 или 1.

ФормирующиИся таким образом вектор весов синапсов для каждого неИрона второго слоя (рис.2) задает тре-буемыИ согласно алгоритма точечныИ шаблон окружения.

где

Рисунок - 2 Нейрон второго слоя

и, ( п ) = Ч, (У),

Ч = {Ч,} , , = (0, 2к + 1),

У =

I(

w

^кУ.

+ ^У; + W кУ к , + 2 , + 2к-

, - 2 , - 2 wi = (0, 1), у. = {й, и(п - 1)}

),

сети в ходе ее функционирования. Инструментом формализации являются РИО-сети [4], которые фиксируют уровень исследования неИросети путем задания ее имита-ционноИ модели в виде набора абстракциИ

Ф = (£ Т, О, V) .

(4)

Функция Ч, для данного неИрона представляет собоИ

итерационную формулу разностноИ схемы, определяемую способом перехода от (2) к (3).

ТретиИ слоИ неИронов - это анализаторы завершения итерационного процесса, в функции которых входит активация синапсов первого слоя до момента получения сходимости. При получении признака сходимости для ,-И точки неИрон третьего слоя блокирует соответствующиИ синапс первого слоя, что приводит к блокировке рекуррентноИ связи и прекращению итерационного процесса.

3. РЯй-СЕТЕВАЯ МОДЕЛЬ

Для исследования данноИ неИросети и методов решения на неИ уравнениИ математическоИ физики создан про-граммныИ имитатор. В основу его положена РИО-сетевая имитационная модель. Такая модель есть формальное описание структуры и процессов, протекающих в неИро-

При этом множество позициИ 5 отражает степень детализации компонент модели и, тем самым, задает статическое состояние неИросети. Множество переходов Т отражает динамику функционирования модели, которая реализуется посредством алгоритмов переработки информации, представленноИ элементами множества 5. Структура путеИ перемещения информации в модели фиксируется множеством О, а результаты исследованиИ и текущее состояние модели заносятся в глобальные переменные, составляющие множество V. Множество позициИ

£ = {(в о, мо, во),(в1, мх, В1),...(в, м, в1) ,„,( ы№ бш)}

содержит набор элементов, каждыИ из которых есть триада: - номер позиции , М{ = {т^ т.2, ..., тк},

т.к - к-И атрибут метки, В{ = {¿1, ¿2, ..., Ьк} , Ьк - к-И буфер данных.

Множество переходов содержит набор элементов , каждыИ из которых является сложноИ структуроИ данных:

т = {^ г»... ц... ль},

где Ь - количество ¿-элементов в РИО-сети; - переход или I - элемент, г, е Т, г = (А, С, р, п, т, йт1п, йтах), Л, С - конечные непустые множества входных и выходных ребер; р - управляющая процедура; п - вычислительная процедура; т - время срабатывания перехода; йт;п, йтах - соответственно минимальное и максимальное время задержки срабатывания перехода.

Множество ребер сетевого двудольного графа определяет связи между позициями и переходами: О:£ X Ти ТX £ . Структура связеИ между переходами и позициями может быть задана произвольным образом.

Наиболее простоИ способ - это матрица инцидентности I: £ X Т ^ г, где 7 = {-1, 1, 0 } ,

1(г) =

-1, если ) е О;

-1

1, если (з,г) е О ; 0, остальные случаи.

Ввиду громоздкости и большоИ разреженности матрица инцидентности не является эффективным способом задания структуры связи. Более эффективным подходом могут служить различные динамические списковые и/

или иерархические структуры.

Множество глобальных переменных V = {V1, } включает три вида подмножеств, отличающихся по функ--циональному назначению. Подмножество VI содержит

глобальные переменные, описывающие временные характеристики имитационной модели (состояние глобального счетчика времени, время реакции различных ресурсов и др.). Подмножество У2 - это служебные переменные, отражающие текущее состояние компонент модели. Подмножество Уз включает глобальные переменные статистического характера.

Рисунок 3 - РКО-сетевая модель нейрона

РИО-сетевая модель имеет также свое графическое представление. Элементы множества 5 изображаются в виде кружков, связанных ребрами, входящими во множество О, с переходами, представленными в виде вертикальных отрезков и входящими во множество Т. РИО-сетевой эквивалент нейрона скрытого слоя исследуемой нейросети изображен на рис.3. Активизация процедуры п перехода осуществляется посредством процедуры р , основной задачей которой является анализ состояния меток на входных и выходных позициях. В данной модели наличие метки на входной позиции сети интерпретируется как включенное состояние синапса нейрона. При наличии метки на входной позиции процедура р имитирует случайно распределенную в диапазоне , <^тах

аппаратную задержку и запускает процедуру п, параметрами которой выступают элементы множества В. По результатам вычисления формируется выходной вектор В,

который в сопровождении соответствующей метки устанавливается на выходную позицию. Затем глобальный счетчик системного времени продвигается на величину Т .

По PRO-сетевому формальному описанию в среде визуального программирования Delphi построен программный имитатор PROSimulator, позволяющий в диалоговом режиме задавать большое количество параметров модели. Основная задача его калибровки сводится к обучению моделируемой нейросети по методу обучения без учителя. Как уже упоминалось, локально-асинхронный метод гарантирует сходимость к решению при использовании хаотического выбора координат точечного шаблона. Однако скорость такой сходимости далеко не всегда является приемлемой. Поэтому обучение сети заключается в запоминании каждым нейроном наиболее эффективной последовательности активации синапсов для каждого класса краевых задач. Практическая работа показала высокую скорость обучаемости сети при использовании специальных методик обучения на типовых задачах с небольшим количеством точек дискретизации и перенесением этих результатов на задачи с большим объемом вычислений.

ЗАКЛЮЧЕНИЕ

В заключение следует отметить, что использование несколько нетрадиционного понимания работы нейрона дало возможность объединить идеи параллельной обработки с преимуществами нейросетевых структур. Такой подход позволил расширить круг задач, для решения которых используются нейросети и, по мнению автора, немного сблизить позиции представителей точных наук и биологов, которые в ответ на предложенный им пер-цептрон Розенблата постоянно напоминают о том, что не мозг, а, скорее всего каждый нейрон можно сравнивать с вычислительной машиной.

ПЕРЕЧЕНЬ ССЫЛОК

1. Федорова H.H., Терехов С.А. Нейросетевой аппроксиматор для численного решения дифференциальных уравнений. Тезисы III рабочего семинара-совещания "Нейронные сети в информационных технологиях", Снежинск, 1-3 апреля, 1998. Интернет: http://www.vniitf.ru/~nimfa/conf/nnit98/ abstracts.html.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Lagaris I.E., Likas A., Fotiadis D.I. Artificial Neural Networks for solving Ordinary and Partial Differential Equations. Submitted to IEEE TNN, 1997 Internet: http://xyz.lanl.gov/physics/ 9705023

3. Марчук В.А., Нестеренко Б.Б. Асинхронные методы параллельных вычислений // Труды Института математика НАН Украины.-1999.-22.-308с.

4. Нестеренко Б.Б., Новотарский М.А. Мультипроцессорные системы. Институт математики.-Киев:1995.-408с.

116

ISSN 1607-3274 "Радтелектронжа, ¡нформатика, управл1ння" № 1, 2001

i Надоели баннеры? Вы всегда можете отключить рекламу.