УДК 004.032.22, 519.24, 330.1, 316.4
Соловьёв А. С. пенсионер Россия, г. Ростов-на-Дону
К СЕТЕВОМУ ПРЕДСТАВЛЕНИЮ. ОБУЧЕНИЕ.
Аннотация: В работе предлагается метод обучения нейронной сети с учётом её количественных и качественных особенностей.
Ключевые слова: нейронная сеть, качество, количество, мера, сравнение, обучение, цель, кватернионы.
Soloviev A.S. retiree
Russia, Rostov-on-don TO THE NETWORK VIEW. TRAINING.
Annotation: The paper proposes a method of training a neural network with regard to its quantitative and qualitative features.
Key words: neural network, quality, quantity, measure, comparison, training, goal, quaternions.
Пусть в некоторой нормальной системе выделен тернарный узел
!Ро
Pi ¥2 5Рз
Рис. 1. Узел нормальной сети прямого распространения со смежными узлами нижестоящего среза.
(1) Для нормальной системы имеем соотношение
(2) % = т¥1 + + шз¥з = = {1, 2,3}, при этом для коэффициентов выполняется условие
(3) ю1 + ю2 + а3 = а1, = 1,
а узлы системы определяются собственными функциями с собственными значениями равными единице
(4) х, = х- = 1.
В общем случае для стоящего в иерархии узла на более высокой ступени в сети прямого распространения имеем зависимость от смежных узлов нижележащего среза
(5) хо = mixi ¥= rn\xl ¥1 + mx1 ¥2 + mx3 ¥3, ieN.
Соотношение, аналогичное (1), справедливое для зависимости собственных функций, будет справедливо и для собственных значений
(6) x0 = mix', ieN.
Элемент сети будем рассматривать как вектор
(7) Xi = xi¥i
и знаком (*) обозначать переход к сопряжённому вектору, опуская вниз у сопряжённого вектора индекс. Тогда, если ввести векторы
(8) х = (xi ieN), ю = (mi| ieN),
равенство (4) можно записать в виде внутреннего произведения векторов
(9) хо = ю*х.
Рассмотрим две различные сети с одинаковой архитектурой. Выделим в них узел с собственной функцией ¥0 и рассмотрим его действие со смежными узлами. Поскольку архитектура сетей одинакова, то если узел одной сети имеет представление, изображённое на рис. 1, то аналогичное представление имеет и выделенный фрагмент второй сети, но описание их действия будет различными уравнениями - уравнением (8) и равенством
(10) y = Ф*у.
С учётом нормальности систем будем иметь
(11) У = X.
Таким образом, данные фрагменты будут отличаться только пропускной способностью связей. Будем полагать, что (8) и (9) состояния узла ¥0 из пространства X возможны состояний системы. Более того, считать состояние (9) целевым (плановым), а состояние (8) - фактическим. И полагать, что требуется последовательно сближать фактическое состояние с эталоном, естественно, с учётом ограничений на показатели функционирования.
Сравним данные фрагменты системы опираясь на основное метрическое тождество и используя свойства скобки процедуры Кэли-Диксона в алгебре Клиффорда в пространстве X0X в качестве элементов тензорного произведения c = х0у0. Для этого, на их бинарном соответствии z = (х0, У0), введём функции для внутреннего a = х0*у0 и внешнего b = х0Лу0= inb произведений, где n единичный вектор в представлении х0ху0 = bn и гомоморфизм в пространстве определим функционалом D = c2 = D(z). Получаем, что на данном бинарном соответствии справедливо тождество Пифагора
(12) a2 + b2 = c2,
а для его тензорной кватерниональной формы имеет место волновое представление
(13) c = c¥, ¥= exp(inff),
Будем полагать, что фактическое состояние системы есть образ (модель) оригинала, т.е. его расчётного состояния - эталон, в практической деятельности естественно последовательное стремление фактического состояния к эталону, и считать, что, не нарушая общности, ограничения (накладываемые на производственные факторы) для подобного совершенствования отсутствуют. Как скульптор из глыбы мрамора высекает Аполлона, так и мы будем последовательно совершенствовать образ, последовательно отсекая мешающие обстоятельства в нашем совершенствовании. Для производственной системы это модернизация производства, стимулирование и обучение персонала и т. п.
Как правило, если рассматривать производственные сети, то это будут многоуровневые иерархические структуры и алгоритм их совершенствования, с учётом сети прямого распространения, можно строить поэлементно, либо послойно, например, снизу вверх, либо сверху вниз. Из статистического сходства соответствующих слоёв вытекает основа алгоритма - последовательное улучшение корреляционного сходства.
Коэффициент корреляции определяется формулой
(14) г = а/с.
Применяя неравенства Коши-Буняковского
(15) а < = с,
в котором равенство достигается при полном соответствии сравниваемых слоёв, и полагая г>0,находим
(16) а = гс < = с.
При монотонном росте коэффициента корреляции образ будет последовательно стремиться к эталону. Предположим, что при темпах прироста Т(х) некоторого фактора сети темпы прироста коэффициента корреляции равны Т(г). При условии, что эластичность (чувствительность) коэффициента корреляции относительно данного изменения равна 5* получаем
(17) г(г + 1) = (1 + 5Т(х))г(^.
Заключаем, что корреляция будет возрастать, если показатели 5 и Т(х) будут одного знака.
Пусть х и у произвольные фрагменты исходных систем, находящихся в структурном бинарном соответствии, а х и у - некоторые соответствующие их узлы. Для эластичности коэффициента корреляции данных фрагментов по показателю х получаем выражение
(18) 5= ху/а(х,у) - х2/с2(х,у),
т.е. сумма £ = эластичностей коэффициентов корреляции (17) по всем узлам данных фрагментов равна нулю. Следовательно, среди показателей эластичности узлов есть как положительные, так и отрицательные. Сумму положительных слагаемых обозначим £+, а сумму абсолютных величин отрицательных слагаемых обозначим £-. Приходим к выражению
(18) £ = £+ - £ = 0.
Представление (18) такого расслоения показывает, что качественное сближение модели с эталоном можно проводить двумя методами улучшая качество модели за счёт совершенствования узлов:
1) путём последовательного роста корреляции узлов с положительными эластичностями действия, и
2) качественного сближения путём улучшения корреляции за счёт совершенствования элементов с отрицательным показателем эластичности.
Волновое представление (12) сходства фрагментов сети свидетельствует, что качественное сближение модели с эталоном можно проводить:
a) обращая внимание только на показатели с положительными коэффициентами эластичности, т.е. случай 1);
b) обращая внимание только на элементы сети с отрицательными коэффициентами эластичности, случай 2);
c) применяя в сближении одновременно как случай 1), так и случай
2).
Это свидетельствует, что "скульптор" из одной и той же " мраморной глыбы" может получить множество количественно различных, но качественно подобных моделей, т.е. в представлении (12) у таких моделей могут быть близкими по значению аргументы в, но сильно варьироваться количественные показатели - амплитуды а, т.е. х = ку, а(х) = kа(y).
На примере ненормированного фрагмента сети рис.1 определим состояния х = (1; 2; 3) и у = (1; 1; 2). При одинаковом качестве состояний их компоненты пропорциональны. Предъявляя у как эталон, состояние х можно привести к качественно подобному у состоянию двумя методами: 1) уменьшением компонент х2 и х3, и 2)увеличением в два раза компоненты х1 и увеличением в полтора раза компоненты х3. Если в первом случае получаем х = у, то в случае 2) имеем х = 2у. Это объясняют и значения коэффициентов эластичности: ^ = 5/126, = - 8/126, ¿3 = 3/126.
Отметим, что волновое представление (12) даёт возможность наблюдать процесс обучение в цветовой гамме.