Научная статья на тему 'Конвейерные информационные процессы в многослойных нейронных сетях'

Конвейерные информационные процессы в многослойных нейронных сетях Текст научной статьи по специальности «Математика»

CC BY
47
11
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Захаров Иван Сафонович, Лопин Вячеслав Николаевич

В работе исследуются информационные процессы в иерархических нейронных сетях с известной топологией. Делается попытка интерпретировать конвейерную обработку информации в таких сетях волновыми пакетами. Показывается, что обработка информации в сетях, данной топологии, имеет пространственно-временной характер и отвечает гипотезе о пространственно-временной организации потенциалов головного мозга. Результаты работы могут быть использованы при создании высокопроизводительных систем обработки информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

In work the information processes in the hierarchy of the neuronal nets with known topology are investigated. The attempt is done(made) to interprete conveyor information processing in such nets by wave packets. Is shown, that the information processing in nets given topology, has space-time character and answers a hypothesis about space-time organizations of potentials of a head brain. The outcomes of work can be used for want of creation of high-duty data reduction systems.

Текст научной работы на тему «Конвейерные информационные процессы в многослойных нейронных сетях»

Ю. 3. Житников, Б. Ю. Житников: Метод оценки надежности сложных систем

опубликованные работы в этой области, не учитывают в должной мере внешних условий эксплуатации системы и зависимость между блоками.

Не учитываются так же циклограммы работы, то есть продолжительность функционирования отдельных блоков, хотя это обстоятельство для определённого вида систем (роботы, автоматические линии) существенно влияют на условные вероятности выхода из строя блоков.

Под надёжностью сложной системы будем понимать её способность выполнять заданные функции, сохраняя при этом эксплуатационные характеристики в заданных пределах на данном интервале времени. При этом предполагается, что надёжность работы отдельных элементов системы известна либо из экспериментов, либо из других соображений.

Обозначим через Т - продолжительность работы цикла системы. Для автоматов и роботов это время выполнения заданного вида работ, а для автоматических линий с непрерывным циклом - единица времени (часы, минуты и т.д.).

Пусть система имеет N блоков, а циклограмма включения их в работу и выключения на интервале длиной Т заданы ступенчатыми функциями включения

{/,(Г)}, , = 1, N. На рис. 1 приведён график (циклограмма) одной из таких функций.

ПЛОТНОСТИ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ

Для оценки надёжности сложной системы необходимо иметь определённую информацию о надёжности работы отдельных блоков. Этот вопрос может быть решён посредством проведения серии экспериментов с последующей статической обработкой результатов с целью нахождения закона распределения времени безотказной работы блока.

Пусть % - случайное время выхода из строя 1-го

блока, тогда для этой случайной величины закон распределения (Г) задаётся соотношением:

Г) = Р{% < Г}, г = 1, N. (1)

Иначе говоря, значение ЕДГ) равно вероятности того,

что % < Г .

Если Г) непрерывная дифференцируемая функция

а¥

на числовой оси времени, то функция р( Г) = —

г аГ

называется плотностью распределения вероятностей.

На практике наиболее часто используется три закона распределения: равномерное распределение на заданном интервале, нормальное распределение и

экспоненциальное распределение.

Пусть ¿г - предельный срок службы 1-го блока, тогда

равномерная плотность распределения определена соотношением:

г 1 /Ьр если Г е (ф, р;(Г) = Гф Г Т ю

[ф, если Г е ¿г

На рис. 2. показан график этой функции.

(2)

Здесь:

а., а2,.... а

' п

Рис. 1

моменты включения 1-го блока в

Р 1/Т

работу, а е^, в2, ..., епг - моменты выключения;

п - общее число включений 1-го блока за время Т, т > 1 .

Для конкретной системы указанные функции {/(Г)}

определены однозначно, а необходимость их учёта при вычислении надёжности системы обусловлена следующим обстоятельством. Если 1-й блок на данном интервале времени не работает, то и выйти из строя за указанное время он не может из-за неполадок в самой системе. Очевидно в этом случае данный блок "выпадает" из системы и не влияет на работу других блоков. В конечном итоге изменяется во времени, по этой причине, и условные вероятности выхода из строя других блоков

На значения последних влияют и имеющиеся взаимосвязи между блоками.

Рис. 2

Очевидно площадь прямоугольника равна 1. Экспоненциальная плотность распределения задаётся функцией

-РЛ

Рг(Г) = а ¡^ 1 - е , ГеЬг , график которой приведён на рис. 3.

(3)

Ь, г

Рис. 3

Площадь заштрихованной области должна быть равна

а

о

а

с

с

Г

единице, то есть:

Ь (1

-вл

- е г I сСг = 1 .

Р,(а, Ь) = ¡р,(г)Лг .

(7)

Отсюда находим значение а,:

в,

ВЕРОЯТНОСТЬ НЕРАБОЧЕГО ОТДЕЛЬНОГО БЛОКА

СОСТОЯНИЯ

' г -в^п

[Ь в, - 1 + ' ]

Здесь: Ь, - предельный срок службы блока. Нормальное распределение задаётся функцией:

.2

(4)

Р,( г) =

1

(О, гДЛ)

ехр

-(г -1,)

2 о

(5)

В сложной системе работа отдельных блоков в заданном интервале времени взаимообусловлена. Иначе говоря, в каждый момент времени для 1-го и ]-го блока,

коэффициент

значимости ]-го блока для нормальной работы 1-го блока, 0 < а.. < 1 .

Очевидно а,.(г) = 0, если ]-й блок не влияет на работу

'Ф], будет определено число а .(г)

где: I. - математическое ожидание срока службы 1-го блока, но а,,(г) = 1

блока, а о, - среднеквадратичное отклонение.

Для общего случая каких-либо рекомендаций по выбору плотностей распределения выхода из строя отдельных блоков дать нельзя, ибо вопрос сводится к статистической обработке результатов наблюдений.

Допустим, для каждого блока определена плотность вероятности р,( г),' = 1, N. Поскольку на интервале

длиной Т заданы циклограммы (см. рис. 1) для каждого блока, то введём взвешенную по времени плотность распределения:

Рд г) = рД г)-/'( г),' = 1, N. (6)

Эта функция учитывает режим работы блока в отличие от обычной плотности распределения и, следовательно, результаты расчётов должны быть значительно точнее. Разумеется, если /,(г) = 1 для

г е [ф, Т], то Р'(г) = Р'(г).

Однако для разрывной функции г) (см. рис. 1) получаем р,( г) = 0 при неработающем блоке и

.

/

С1

61 Рис. 4 Сп'

Очевидно, для любого интервала (а,Ь), в, а>0, а<Ь<Ц, вероятность выхода 1-го блока из строя равна:

В результате получаем матричную функцию А(г) = {а ,](г)} - коэффициентов значимости.

Например, для системы, структурная схема которой изображена на рис. 5 матрица имеет вид:

А1 =

1 0 0 а21 0 а23 а31 а32 1

вход 1 2 3 выход

т

Рис. 5

Однако для системы, структурная схема которой изображена на рис. 6 получаем:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

А2 =

1 0 0 а21 1 0 а31 а32 1

Р'(г) = р'(г) для г е [сСк, ек], к = 1,

Например, совмещение графиков на рис. 1 и рис. 3 даёт график р,(г) , приведённый на рис. 4.

выход

3 -1

Рис. 6

Причём, значения а21, а31, а32 = 1, так как выход из строя 1-го блока влечёт за собой нерабочее состояние 2-го и 3-го, а выход из строя 2-го блока обуславливает нерабочее состояние 3-го блока.

Давайте рассмотрим более сложный случай, соответствующий рис. 7.

т т

вход 2 4

3 4 выход

Рис. 7

Матрица А3 здесь будет иметь вид:

Ь

ь

а

0

а=

вход

1

2

а

вход

1

ь

52

"Рад1оелектрон1ка, 1нформатика, управл1ння" № 1, 1999

И. С. Захаров, В. Н.Лопин: Конвейерные информационные процессы в многослойных нейронных сетях.

A3 =

0 0 0 1 0 0

a31 a32 1 a34 a41 a42 1 1

Если блоки 1, 2 дублирующие, то a31 = a32 = 1 /2 и

м = a„ = 1/2 .

Если

a31 a^^) a д a

блоки

независимые,

32

41

42

= 1 .

Будем считать, что для заданной системы матрица А(0 найдена. Тогда условная вероятность нерабочего состояния 1-го блока из-за выхода из строя ]-го блока равна

Pt(t) = ajt)ytJ(t),

(8)

где у^ > 0 - некоторая функция, уточняющая

зависимость между 1-ми и ]-ми блоками за счёт

изменения внешних условий. В частности может быть % ^ 1.

Теперь найдём вероятность нерабочего состояния 1-го блока на интервале [0, 1], Ге [0, Т] . Поскольку надо учесть влияние всех блоков на работу 1-го блока, то по формуле полной вероятности получаем вероятность нерабочего состояния 1-го блока на интервале [0, 1]:

q,( t ) = X Ptj( t )PJ( t ) ; t = 1, n .

(9)

Здесь

J = 1

Пусть необходимо оценить надёжность работы системы в интервале [0, Т].

Согласно формуле (9) вероятность невыхода из рабочего состояния 1-го блока равна (1 -Г)) для

Г е [0, Т] . Для того, чтобы вся система на этом интервале была в рабочем состоянии необходимо одновременно обеспечить рабочее состояние всех N блоков. Поэтому, по теореме умножения вероятностей получаем вероятность надёжной работы всей системы:

N

3(Г) = П (1 -ч,(Г)), (1)

/ = 1

для Г е [ 0, Т] .

Допустим, что необходима оценка надёжности работы системы за к, к > 1 , периодов длиной Т.

Согласно (11) для 8-го периода получим:

N

3 = П [ 1 - &,

/ = 1

N ТЬ

где: ц] = £ Р/Г)Р](Г) , Р] = | р}(ЩГ)йГ,

/ = 1 Т( Ь - 1)

ft(T + t) = f(t) , т, T(S - 1 ) ;( T - S))

P.. = а..(т )у--(т ), ij j s"'Jy s''

Очевидно вероятность надёжной работы системы на интервале [0, 8Т] равна произведению вероятностей

{3^} , то есть:

Pt(t) = \рг(Щ(т)dT .

(10)

Таким образом, для любого Г е [0, Т] вероятность нерабочего состояния в интервале [0, 1], находится по формулам (9) и (10).

НАДЁЖНОСТЬ РАБОТЫ СИСТЕМЫ.

= П 3Г , Ь = 1, 2, 3, ..., к .

г = 1

В частности, для интервала [0, кТ] имеем:

к

Ч = ПзГ.

г = 1

Тем самым, поставленная задача решена.

же

эти

N

О

0

УДК 519.72;616.8-091.81

КОНВЕЙЕРНЫЕ ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ В МНОГОСЛОЙНЫХ

НЕЙРОННЫХ СЕТЯХ.

И. С. Захаров, В. Н.Лопин

В работе исследуются информационные процессы в иерархических нейронных сетях с известной топологией. Делается попытка интерпретировать конвейерную обработку информации в таких сетях волновыми пакетами. Показывается, что обработка информации в сетях, данной топологии, имеет пространственно-временной характер и

отвечает гипотезе о пространственно-временной организации потенциалов головного мозга. Результаты работы могут быть использованы при создании высокопроизводительных систем обработки информации.

In work the information processes in the hierarchy of the neu-

ronal nets with known topology are investigated. The attempt is done(made) to interprete conveyor information processing in such nets by wave packets. Is shown, that the information processing in nets given topology, has space-time character and answers a hypothesis about space-time organizations of potentials of a head brain. The outcomes of work can be used for want of creation of high-duty data reduction systems.

На протяжении многих лет сохраняется интерес к исследованию информационных процессов в нейронных структурах. Это обусловлено высокой эффективностью обработки информации, присущей таким структурам. В настоящее время отсутствуют достоверные знания о механизмах обработки информации нейронными сетями, существует лишь множество гипотез. Одна из современных гипотез представленная школами М.Н.Ливанова, А.Н.Лебедева, Н.П.Бехтеревой [1,2], базируется на существовании динамических волновых пакетов, как основных носителей информации. Согласно этой гипотезе, информация хранится в памяти в виде устойчивых комбинаций из незатухающих волн нейронной активности. В работе [3] исследована модель нейронной сети, подтверждающая существование таких волновых пакетов. Однако, результаты этих исследований объясняют скорее физическую природу волновых процессов в нейронных сетях, информационный аспект этих процессов исследован недостаточно.

В настоящей работе проводится интерпретации волновых процессов конвейерной обработкой информации в искусственных многослойных нейронных сетях. Эти свойства достаточно полно проявляются в конвергентных сетях, рассмотренных ранее в работах [ 4,5 ]. Моделирование таких сетей может быть проведено с использованием формальных моделей нейронов -пороговых элементов. Модель нейрона для сетей минимальной конфигурации, как показано в [5], описывается выражением:

av[k + 1] = Sgnj 2аЦ - 1 [k]x xv[k] + а2 - 1 [k]j, (1)

времени [к+ 1 ] ,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V - 1г;п V - 1Г,, а1 [к] , а2 [к] - выходные сигна.

V -1 слоя в момент времени [к] , х^/[к] - сигнал

синхронизации нейрона V слоя.

Рассматриваемая модель нейрона является дискретным аналогом непрерывной модели, предложенной в работе [3]. Временные задержки между слоями сети определяют динамическую память сети. Внутреннее состояние сети в момент времени [к] можно представить упорядоченной последовательностью состояний нейронов вида:

q[k] = j(a![[k],a2[k])(a"1 1[k],a2 1 [k], ...,a4 ^[k,])... (2)

...(a1 [k ],..., al2„ [k ])1

Рассмотрим работу сети при реализации некоторого списка булевых функций от п переменных. Очевидно, любая булева функция от п переменных может быть определена некоторой системой остаточных функций:

f(x 1, ..., xn) = Sgn! 2 a1(x1, ..., xn _ 1 )x xn + a2(x1, ..., xn _ 1 ) j,

n -1

a1 (x1,..., xn - 1 ) = Sgn< 2a1 (x1, xn - 2)x xn - 1 + (3)

, n - 1

+ a2 (x1,., xn - 2)

a"2(x1, xn - 1 ) = Sgn-|2a3 1 (x1, ..., xn - 2)x xn - 1 +

, n - 1 . .

+ a4 (x1,., xn - 2)

x1 ) = Sgn-^2a1 x x1 + a1 | ,

«2» -1 (х1)=2 а1» -1х х1+а2»},

здесь а у(*) - остаточные булевы функции,

а^, а^, ..., а^ - двоичный набор, задающий функцию

/(х 1, ..., х ). Таким образом, некоторому списку функций п переменных /( ■ ),/Д ■ ), ...,/( ■ ) можно поставить в соответствие матрицу

(4)

1У 1У 1У - л

где а^а2 ...а » - двоичный набор, определяющий ^ю

функцию списка /( ■ ),/,( ■ ), ...,/»( ■ ) . Пусть, начальное состояние сети определится выражением

д[0] =|(а"1[0],ап2[0])(а"1- 1 [0],а2- 1[0], ...,а"4- 1 [0])...(5)

в момент 11 a1 11 a2 . 11 • a n 2n

12 a1 12 a2 . 12 • a n 2n

нейронов

- сигнал 1n a1 1n a2 . 1n • a n 2n

11

11

V

54

"Радюелектрошка, шформатика, управлшня" № 1, 1999

i Надоели баннеры? Вы всегда можете отключить рекламу.