Научная статья на тему 'К СЕТЕВОМУ ПРЕДСТАВЛЕНИЮ. ОБУЧЕНИЕ'

К СЕТЕВОМУ ПРЕДСТАВЛЕНИЮ. ОБУЧЕНИЕ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
16
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННАЯ СЕТЬ / КАЧЕСТВО / КОЛИЧЕСТВО / МЕРА / СРАВНЕНИЕ / ОБУЧЕНИЕ / ЦЕЛЬ / КВАТЕРНИОНЫ / NEURAL NETWORK / QUALITY / QUANTITY / MEASURE / COMPARISON / TRAINING / GOAL / QUATERNIONS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Соловьёв А. С.

В работе предлагается метод обучения нейронной сети с учётом её количественных и качественных особенностей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

TO THE NETWORK VIEW. TRAINING

The paper proposes a method of training a neural network with regard to its quantitative and qualitative features.

Текст научной работы на тему «К СЕТЕВОМУ ПРЕДСТАВЛЕНИЮ. ОБУЧЕНИЕ»

УДК 004.032.22, 519.24, 330.1, 316.4

Соловьёв А. С. пенсионер Россия, г. Ростов-на-Дону

К СЕТЕВОМУ ПРЕДСТАВЛЕНИЮ. ОБУЧЕНИЕ.

Аннотация: В работе предлагается метод обучения нейронной сети с учётом её количественных и качественных особенностей.

Ключевые слова: нейронная сеть, качество, количество, мера, сравнение, обучение, цель, кватернионы.

Soloviev A.S. retiree

Russia, Rostov-on-don TO THE NETWORK VIEW. TRAINING.

Annotation: The paper proposes a method of training a neural network with regard to its quantitative and qualitative features.

Key words: neural network, quality, quantity, measure, comparison, training, goal, quaternions.

Пусть в некоторой нормальной системе выделен тернарный узел

!Ро

Pi ¥2 5Рз

Рис. 1. Узел нормальной сети прямого распространения со смежными узлами нижестоящего среза.

(1) Для нормальной системы имеем соотношение

(2) % = т¥1 + + шз¥з = = {1, 2,3}, при этом для коэффициентов выполняется условие

(3) ю1 + ю2 + а3 = а1, = 1,

а узлы системы определяются собственными функциями с собственными значениями равными единице

(4) х, = х- = 1.

В общем случае для стоящего в иерархии узла на более высокой ступени в сети прямого распространения имеем зависимость от смежных узлов нижележащего среза

(5) хо = mixi ¥= rn\xl ¥1 + mx1 ¥2 + mx3 ¥3, ieN.

Соотношение, аналогичное (1), справедливое для зависимости собственных функций, будет справедливо и для собственных значений

(6) x0 = mix', ieN.

Элемент сети будем рассматривать как вектор

(7) Xi = xi¥i

и знаком (*) обозначать переход к сопряжённому вектору, опуская вниз у сопряжённого вектора индекс. Тогда, если ввести векторы

(8) х = (xi ieN), ю = (mi| ieN),

равенство (4) можно записать в виде внутреннего произведения векторов

(9) хо = ю*х.

Рассмотрим две различные сети с одинаковой архитектурой. Выделим в них узел с собственной функцией ¥0 и рассмотрим его действие со смежными узлами. Поскольку архитектура сетей одинакова, то если узел одной сети имеет представление, изображённое на рис. 1, то аналогичное представление имеет и выделенный фрагмент второй сети, но описание их действия будет различными уравнениями - уравнением (8) и равенством

(10) y = Ф*у.

С учётом нормальности систем будем иметь

(11) У = X.

Таким образом, данные фрагменты будут отличаться только пропускной способностью связей. Будем полагать, что (8) и (9) состояния узла ¥0 из пространства X возможны состояний системы. Более того, считать состояние (9) целевым (плановым), а состояние (8) - фактическим. И полагать, что требуется последовательно сближать фактическое состояние с эталоном, естественно, с учётом ограничений на показатели функционирования.

Сравним данные фрагменты системы опираясь на основное метрическое тождество и используя свойства скобки процедуры Кэли-Диксона в алгебре Клиффорда в пространстве X0X в качестве элементов тензорного произведения c = х0у0. Для этого, на их бинарном соответствии z = (х0, У0), введём функции для внутреннего a = х0*у0 и внешнего b = х0Лу0= inb произведений, где n единичный вектор в представлении х0ху0 = bn и гомоморфизм в пространстве определим функционалом D = c2 = D(z). Получаем, что на данном бинарном соответствии справедливо тождество Пифагора

(12) a2 + b2 = c2,

а для его тензорной кватерниональной формы имеет место волновое представление

(13) c = c¥, ¥= exp(inff),

Будем полагать, что фактическое состояние системы есть образ (модель) оригинала, т.е. его расчётного состояния - эталон, в практической деятельности естественно последовательное стремление фактического состояния к эталону, и считать, что, не нарушая общности, ограничения (накладываемые на производственные факторы) для подобного совершенствования отсутствуют. Как скульптор из глыбы мрамора высекает Аполлона, так и мы будем последовательно совершенствовать образ, последовательно отсекая мешающие обстоятельства в нашем совершенствовании. Для производственной системы это модернизация производства, стимулирование и обучение персонала и т. п.

Как правило, если рассматривать производственные сети, то это будут многоуровневые иерархические структуры и алгоритм их совершенствования, с учётом сети прямого распространения, можно строить поэлементно, либо послойно, например, снизу вверх, либо сверху вниз. Из статистического сходства соответствующих слоёв вытекает основа алгоритма - последовательное улучшение корреляционного сходства.

Коэффициент корреляции определяется формулой

(14) г = а/с.

Применяя неравенства Коши-Буняковского

(15) а < = с,

в котором равенство достигается при полном соответствии сравниваемых слоёв, и полагая г>0,находим

(16) а = гс < = с.

При монотонном росте коэффициента корреляции образ будет последовательно стремиться к эталону. Предположим, что при темпах прироста Т(х) некоторого фактора сети темпы прироста коэффициента корреляции равны Т(г). При условии, что эластичность (чувствительность) коэффициента корреляции относительно данного изменения равна 5* получаем

(17) г(г + 1) = (1 + 5Т(х))г(^.

Заключаем, что корреляция будет возрастать, если показатели 5 и Т(х) будут одного знака.

Пусть х и у произвольные фрагменты исходных систем, находящихся в структурном бинарном соответствии, а х и у - некоторые соответствующие их узлы. Для эластичности коэффициента корреляции данных фрагментов по показателю х получаем выражение

(18) 5= ху/а(х,у) - х2/с2(х,у),

т.е. сумма £ = эластичностей коэффициентов корреляции (17) по всем узлам данных фрагментов равна нулю. Следовательно, среди показателей эластичности узлов есть как положительные, так и отрицательные. Сумму положительных слагаемых обозначим £+, а сумму абсолютных величин отрицательных слагаемых обозначим £-. Приходим к выражению

(18) £ = £+ - £ = 0.

Представление (18) такого расслоения показывает, что качественное сближение модели с эталоном можно проводить двумя методами улучшая качество модели за счёт совершенствования узлов:

1) путём последовательного роста корреляции узлов с положительными эластичностями действия, и

2) качественного сближения путём улучшения корреляции за счёт совершенствования элементов с отрицательным показателем эластичности.

Волновое представление (12) сходства фрагментов сети свидетельствует, что качественное сближение модели с эталоном можно проводить:

a) обращая внимание только на показатели с положительными коэффициентами эластичности, т.е. случай 1);

b) обращая внимание только на элементы сети с отрицательными коэффициентами эластичности, случай 2);

c) применяя в сближении одновременно как случай 1), так и случай

2).

Это свидетельствует, что "скульптор" из одной и той же " мраморной глыбы" может получить множество количественно различных, но качественно подобных моделей, т.е. в представлении (12) у таких моделей могут быть близкими по значению аргументы в, но сильно варьироваться количественные показатели - амплитуды а, т.е. х = ку, а(х) = kа(y).

На примере ненормированного фрагмента сети рис.1 определим состояния х = (1; 2; 3) и у = (1; 1; 2). При одинаковом качестве состояний их компоненты пропорциональны. Предъявляя у как эталон, состояние х можно привести к качественно подобному у состоянию двумя методами: 1) уменьшением компонент х2 и х3, и 2)увеличением в два раза компоненты х1 и увеличением в полтора раза компоненты х3. Если в первом случае получаем х = у, то в случае 2) имеем х = 2у. Это объясняют и значения коэффициентов эластичности: ^ = 5/126, = - 8/126, ¿3 = 3/126.

Отметим, что волновое представление (12) даёт возможность наблюдать процесс обучение в цветовой гамме.

i Надоели баннеры? Вы всегда можете отключить рекламу.