контролировать температуру воздуха внутри помещении, применяется расчет теплогидравлических режимов потребителей через относительные характеристики (по отношению к расчетному режиму) [7], что позволяет существенно снизить объем исходной информации, необходимой при расчете ТСС в целом и в несколько раз сокращает время расчета потребителя.
Изложенные принципы эквивалентирования и декомпозиции таким образом диктуют соответствующие принципы организации БД (разбиение на уровни тепловых сетеи, набор объектов, из которых формируется расчетная схема и т.п.).
ВЫВОДЫ
1. Сформулированы новые требования и направления развития прикладного ПО для компьютерного моделирования ТСС при их проектировании, эксплуатации и диспетчерском управлении.
2. Дана характеристика реализации нового поколения ПО, обеспечивающего решение основных режимно-техно-логических задач для систем теплоснабжения.
ПЕРЕЧЕНЬ ССЫЛОК
1. Методы и алгоритмы расчета тепловых сетей/ В,Я, Хаси-лев, А,П, Меренков, Б,М, Каганович М.: Энергия, 1978.
2. Меренков А, П,, Хасилев В, Я,, Теория гидравлических цепей, М.: Наука, 1985.
3. Сеннова Е,В,, Сидлер В,Г, Математическое моделирование и оптимизация развивающихся теплоснабжающих систем. -Новосибирск: Наука, СО, 1987.- 221с
4. Математическое моделирование и оптимизация систем тепло-, водо-, нефте-, газоснабжения. / А,П,Меренков, Е,В,Сеннова, С,В,Сумароков, и др,- Новосибирск: ВО "Наука", -Сиб. Изд. фирма, 1992. - 407 с.
5. Методы управления физико-техническими системами энергетики в новых условиях / Н,И,Воропай, Н,Н,Новицкий, Е,В,Сеннова и др, - Новосибирск: Наука, Сибирская издательская фирма РАН, 1995.-334с.
6. Сидлер В,Г,, Шалагинова 3,И,, Математическая модель теплогидравлических режимов абонентских вводов // Методы анализа и оптимального синтеза трубопроводных систем. - Иркутск: СЭИ СО РАН, 1991.- С.111-124.
7. Шалагинова 3,И, Разработка и применение методов тепло-гидравлического расчета для задач эксплуатации теплоснабжающих систем // Международная научно-практическая конференция "Человек. Среда. Вселенная, том 1, Иркутск, 1997.- 198с.
УДК 681,32:007,58
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ НЕЙРОСЕТЕЙ ДЛЯ РЕШЕНИЯ УРАВНЕНИЙ МАТЕМАТИЧЕСКОЙ ФИЗИКИ ЛОКАЛЬНО-АСИНХРОННЫМИ МЕТОДАМИ
М.А.Новотарский
В статье дано краткое изложение краевой задачи математической физики и изложены особенности локально-асинхронного метода для ее решения, отражены основополагающие принципы реализации данного метода на основе нейросети. Обсуждается структура нейросети и алгоритм ее функционирования, даны основные подходы к формализации исходной задачи с помощью PRO-сетей, формулируются принципы построения нейросетевого имитатора.
В статт1 даеться короткий виклад крайовоЧ задач1 мате-матичноЧ фгзики i викладет особливостг локально-асинхронного методу для ii вирШення, вiдображенi основш принципи реалiзацi'i даного методу на нейромережi. Обговорюеться структура нейромережi i алгоритм ii функцюнування, данi основн тдходи до формалiзацii вихiдноi задачi за допомогою PRO-мереж, формулюються принципи побудови нейромереже-вого iмiтатора .
In clause the brief statement of a boundary value problem of mathematical physics is given and the features of a local-asynchronous method for its solving are stated, the basic principles of realization of the given method on a neural network reflected. The neuronet structure and algorithm for it's functioning is discussed, the basic approaches to formalization of an initial task with the help of PRO-nets are given, and the principles of construction of the neurosimulator are formulated.
ВВЕДЕНИЕ
Прошло десятилетие с тех пор, как мир охватила "неИронная лихорадка". Число компьютеров и программных продуктов, использующих неиросетевую технологию, растет с каждым днем. Объем мирового рынка неИронных сетеИ ежегодно увеличивается на 40% и составляет около 1 млрд. долларов. К настоящему времени уже сформировался круг проблем, традиционно решаемых с применением данноИ технологии. Наиболее широко используется она для решения всевозможных задач прогнозирования и распознавания, преимущественно в финан-совоИ сфере и медицине. Однако такая специализация неИросетеИ ни в коеИ мере не может рассматриваться как окончательная.
Это универсальная технология, позволяющая решать задачи в самых неожиданных областях. Строгим обоснованием такого подхода следует считать знаменитую теорему Колмогорова, перефразированную в терминах неИросетеИ.
1. ТЕОРЕМА КОЛМОГОРОВА
Если известны функции Н,, то любую непрерывную
функцию от п переменных можно точно реализовать с помощью простой нейросети на основе трехслойного пер-цептрона. Для этого достаточно подобрать 2п + 1 передаточных функций ^^ нейронов скрытого слоя.
F(X1sX2,...х) = £ gj
j = 1
I hj(Xi) i = 1
(1)
где gj и h
4
непрерывные функции, причем hij не
ij
зависят от функции
К сожалению, практическое использование теоремы Колмогорова сильно затруднено тем, что функции Н,, - не-
Ч
гладкие и трудно вычислимые, а для выбора функций gj
не существует сколь-нибудь эффективных методик. Поэтому для каждого нового класса задач, решение которых предполагается получать с помощью нейросети, разрабатываются свои концепции построения ее структуры и алгоритма функционирования. Решение дифференциальных уравнений - это сравнительно молодая, но бурно развивающаяся область применения нейросетей. Известны примеры успешных разработок в этой области, как в ближнем, так и в дальнем зарубежье [1,2]. Специфика исследований, проводимых в Институте математики HAH Украины, заключается в том, что нейросети ориентированы на решения уравнений математической физики локально-асинхронными многосеточными методами. Как раз особенности данных методов и являются побудительным мотивом к использованию нейросетей для их реализации.
2. ЛОКАЛЬНО-АСИНХРОННЫЕ МЕТОДЫ
Локально-асинхронные многосеточные методы для решения краевых задач - это методы, которые предполагают получение решения глобальной задачи путем разбиения ее на множество локальных задач, решаемых параллельно [3]. Решение каждой из таких задач понимается как самостоятельный локальный процесс, который может взаимодействовать с другими подобными локальными процессами с целью приема данных и передачи результатов вычислений. Разбиение локальной задачи может осуществляться с учетом пространственно-временных аспектов решения общей задачи. Самый простой подход предполагает отождествление нейронов нейросети с узлами сеточной области. В этом случае форма и размерность нейросети соответствует конфигурации границ краевой задачи.
Исходная краевая задача задается в общем виде операторным уравнением
LU = F ,
решение u разностным решением u^ , получим разностную краевую задачу
Lhuh = fh , (3)
Для решения данной разностной краевой задачи на основе нейросети предложен локально-асинхронный многосеточный метод [3]. Его отличительной чертой есть то, что при реализации итерационного процесса uh(п + 1 ) = Iter(uh(n), Lh ,fh ,vh) вычисление vh осуществляется исходя из точного решения уравнения LhVh = dh и формирования невязки dh для каждого
узла сеточной области путем операций проецирования и интерполирования невязок, взятых с узлов с различным шагом сетки. Подлинная асинхронность этого метода состоит в том, что для него доказана сходимость итерационного процесса к решению при использовании хаотической последовательности формирования координат соседних узлов для переменного точечного шаблона. Изменение шага сетки, а, следовательно, и координат точечного шаблона, принято выбирать кратным двойке. Отсюда следует выбор структуры нейросети, реализующей обработку значений функции uh и невязки dh ,
полученных на предыдущей сетке. Количество входов нейрона и размерность сети будет определяться размерностью исходной задачи. На рис.1 представлена простейшая нейросеть, позволяющая рассмотреть одномерный случай.
(2)
Заменяя, оператор Ь разностным оператором Ьн , правую часть / - некоторой сеточной функцией /н , а точное
Рисунок 1 - Нейросеть для решения уравнений математической физики локально-асинхронным многосеточным методом
Основной особенностью такой сети можно считать ее рекуррентность, что диктуется необходимостью реализации итерационного процесса. Известно, что использование рекуррентных нейросетей сопряжено с рядом проблем, одна из которых заключается в трудности определения момента останова. В данном случае эти трудности реша-
2 п + 1
114
ISSN 1607-3274 "Радтелектронжа, шформатика, управл1ння" № 1, 2001
ются путем введения послоИноИ специализации. Сеть содержит три слоя неИронов, каждыИ из которых ориентирован на реализацию специфических функциИ. ПервыИ слоИ предназначен для выбора текущего канала приема информации и предварительноИ ее подготовки к участию в итерационном процессе. Дендриты неИронов второго (скрытого) слоя управляются синапсами, значения весов которых могут принимать значения 0 или 1.
ФормирующиИся таким образом вектор весов синапсов для каждого неИрона второго слоя (рис.2) задает тре-буемыИ согласно алгоритма точечныИ шаблон окружения.
где
Рисунок - 2 Нейрон второго слоя
и, ( п ) = Ч, (У),
Ч = {Ч,} , , = (0, 2к + 1),
У =
I(
w
^кУ.
+ ^У; + W кУ к , + 2 , + 2к-
, - 2 , - 2 wi = (0, 1), у. = {й, и(п - 1)}
),
сети в ходе ее функционирования. Инструментом формализации являются РИО-сети [4], которые фиксируют уровень исследования неИросети путем задания ее имита-ционноИ модели в виде набора абстракциИ
Ф = (£ Т, О, V) .
(4)
Функция Ч, для данного неИрона представляет собоИ
итерационную формулу разностноИ схемы, определяемую способом перехода от (2) к (3).
ТретиИ слоИ неИронов - это анализаторы завершения итерационного процесса, в функции которых входит активация синапсов первого слоя до момента получения сходимости. При получении признака сходимости для ,-И точки неИрон третьего слоя блокирует соответствующиИ синапс первого слоя, что приводит к блокировке рекуррентноИ связи и прекращению итерационного процесса.
3. РЯй-СЕТЕВАЯ МОДЕЛЬ
Для исследования данноИ неИросети и методов решения на неИ уравнениИ математическоИ физики создан про-граммныИ имитатор. В основу его положена РИО-сетевая имитационная модель. Такая модель есть формальное описание структуры и процессов, протекающих в неИро-
При этом множество позициИ 5 отражает степень детализации компонент модели и, тем самым, задает статическое состояние неИросети. Множество переходов Т отражает динамику функционирования модели, которая реализуется посредством алгоритмов переработки информации, представленноИ элементами множества 5. Структура путеИ перемещения информации в модели фиксируется множеством О, а результаты исследованиИ и текущее состояние модели заносятся в глобальные переменные, составляющие множество V. Множество позициИ
£ = {(в о, мо, во),(в1, мх, В1),...(в, м, в1) ,„,( ы№ бш)}
содержит набор элементов, каждыИ из которых есть триада: - номер позиции , М{ = {т^ т.2, ..., тк},
т.к - к-И атрибут метки, В{ = {¿1, ¿2, ..., Ьк} , Ьк - к-И буфер данных.
Множество переходов содержит набор элементов , каждыИ из которых является сложноИ структуроИ данных:
т = {^ г»... ц... ль},
где Ь - количество ¿-элементов в РИО-сети; - переход или I - элемент, г, е Т, г = (А, С, р, п, т, йт1п, йтах), Л, С - конечные непустые множества входных и выходных ребер; р - управляющая процедура; п - вычислительная процедура; т - время срабатывания перехода; йт;п, йтах - соответственно минимальное и максимальное время задержки срабатывания перехода.
Множество ребер сетевого двудольного графа определяет связи между позициями и переходами: О:£ X Ти ТX £ . Структура связеИ между переходами и позициями может быть задана произвольным образом.
Наиболее простоИ способ - это матрица инцидентности I: £ X Т ^ г, где 7 = {-1, 1, 0 } ,
1(г) =
-1, если ) е О;
-1
1, если (з,г) е О ; 0, остальные случаи.
Ввиду громоздкости и большоИ разреженности матрица инцидентности не является эффективным способом задания структуры связи. Более эффективным подходом могут служить различные динамические списковые и/
или иерархические структуры.
Множество глобальных переменных V = {V1, } включает три вида подмножеств, отличающихся по функ--циональному назначению. Подмножество VI содержит
глобальные переменные, описывающие временные характеристики имитационной модели (состояние глобального счетчика времени, время реакции различных ресурсов и др.). Подмножество У2 - это служебные переменные, отражающие текущее состояние компонент модели. Подмножество Уз включает глобальные переменные статистического характера.
Рисунок 3 - РКО-сетевая модель нейрона
РИО-сетевая модель имеет также свое графическое представление. Элементы множества 5 изображаются в виде кружков, связанных ребрами, входящими во множество О, с переходами, представленными в виде вертикальных отрезков и входящими во множество Т. РИО-сетевой эквивалент нейрона скрытого слоя исследуемой нейросети изображен на рис.3. Активизация процедуры п перехода осуществляется посредством процедуры р , основной задачей которой является анализ состояния меток на входных и выходных позициях. В данной модели наличие метки на входной позиции сети интерпретируется как включенное состояние синапса нейрона. При наличии метки на входной позиции процедура р имитирует случайно распределенную в диапазоне , <^тах
аппаратную задержку и запускает процедуру п, параметрами которой выступают элементы множества В. По результатам вычисления формируется выходной вектор В,
который в сопровождении соответствующей метки устанавливается на выходную позицию. Затем глобальный счетчик системного времени продвигается на величину Т .
По PRO-сетевому формальному описанию в среде визуального программирования Delphi построен программный имитатор PROSimulator, позволяющий в диалоговом режиме задавать большое количество параметров модели. Основная задача его калибровки сводится к обучению моделируемой нейросети по методу обучения без учителя. Как уже упоминалось, локально-асинхронный метод гарантирует сходимость к решению при использовании хаотического выбора координат точечного шаблона. Однако скорость такой сходимости далеко не всегда является приемлемой. Поэтому обучение сети заключается в запоминании каждым нейроном наиболее эффективной последовательности активации синапсов для каждого класса краевых задач. Практическая работа показала высокую скорость обучаемости сети при использовании специальных методик обучения на типовых задачах с небольшим количеством точек дискретизации и перенесением этих результатов на задачи с большим объемом вычислений.
ЗАКЛЮЧЕНИЕ
В заключение следует отметить, что использование несколько нетрадиционного понимания работы нейрона дало возможность объединить идеи параллельной обработки с преимуществами нейросетевых структур. Такой подход позволил расширить круг задач, для решения которых используются нейросети и, по мнению автора, немного сблизить позиции представителей точных наук и биологов, которые в ответ на предложенный им пер-цептрон Розенблата постоянно напоминают о том, что не мозг, а, скорее всего каждый нейрон можно сравнивать с вычислительной машиной.
ПЕРЕЧЕНЬ ССЫЛОК
1. Федорова H.H., Терехов С.А. Нейросетевой аппроксиматор для численного решения дифференциальных уравнений. Тезисы III рабочего семинара-совещания "Нейронные сети в информационных технологиях", Снежинск, 1-3 апреля, 1998. Интернет: http://www.vniitf.ru/~nimfa/conf/nnit98/ abstracts.html.
2. Lagaris I.E., Likas A., Fotiadis D.I. Artificial Neural Networks for solving Ordinary and Partial Differential Equations. Submitted to IEEE TNN, 1997 Internet: http://xyz.lanl.gov/physics/ 9705023
3. Марчук В.А., Нестеренко Б.Б. Асинхронные методы параллельных вычислений // Труды Института математика НАН Украины.-1999.-22.-308с.
4. Нестеренко Б.Б., Новотарский М.А. Мультипроцессорные системы. Институт математики.-Киев:1995.-408с.
116
ISSN 1607-3274 "Радтелектронжа, ¡нформатика, управл1ння" № 1, 2001