Научная статья на тему 'Логические нейронные сети: методы автоматического коструирования, редукции, извлечения правил'

Логические нейронные сети: методы автоматического коструирования, редукции, извлечения правил Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1155
309
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛОГИЧЕСКИЕ НЕЙРОННЫЕ СЕТИ / МОДЕЛИРОВАНИЕ / МЕТОДЫ И АЛГОРИТМЫ ПОСТРОЕНИЯ НЕЙРОННЫХ СЕТЕЙ / ИЗВЛЕЧЕНИЕ ПРАВИЛ / ПРИМЕНЕНИЕ ЛОГИЧЕСКИХ НЕЙРОННЫХ СЕТЕЙ / LOGICAL NEURAL NETWORKS / MODELING / METHODS AND ALGORITHMS FOR CONSTRUCTING NEURAL NETWORKS / REDUCTION / RULE EXTRACTION / THE USE OF LOGICAL NEURAL NETWORKS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Фридман Ольга Владимировна

Рассмотрен класс логических нейронных сетей. Представлен обзор методов и алгоритмов, применяемых при построении нейронных сетей, методы извлечения правил. Рассматриваются вопросы применения логических нейронных сетей для решения различных задач.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Фридман Ольга Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LOGIC NEURAL NETWORKS: METHODS OF AUTOMATIC DESIGN, REDUCTION, RULE EXTRACTION

The class of logical neural networks is considered. A review of the methods and algorithms used in the construction of neural networks, reduction, and rule extraction are presented. The problems of using logical neural networks to solve various problems are considered.

Текст научной работы на тему «Логические нейронные сети: методы автоматического коструирования, редукции, извлечения правил»

8. V. V. Dikovitsky, M. G. Shishaev. Automated Extraction of Deontological Statements Through a Multilevel Analysis of Legal Acts // Computational and Statistical Methods in Intelligent Systems, pp. 102-110.

9. Библиотека программного обеспечения с открытым исходным кодом для Machine Intelligence TensorFlow. URL: https://www.tensorflow.org.

10. Фреймворк для кросс-лингвистически последовательной грамматической аннотации на 60 языках. URL: http://universaldependencies.org.

Сведения об авторах

Диковицкий Владимир Витальевич

к.т.н, старший научный сотрудник е-mail: dikovitsky@gmail.com Vladimir V. Dikovitskiy Ph.D. (Tech. Sci.), researcher

Шишаев Максим Геннадьевич

д.т.н., главный научный сотрудник е-mail: shishaev@iimm. ru Maxim G. Shishaev Dr.Sci (Tech.), lead researcher

Пимешков Вадим Константинович

стажер-исследователь е-mail: pimeshkov@iimm.ru Vadim K. Pimeshkov

research assistant

РСН: 10.25702/К8С.2307-5252.2019.9.97-108 УДК 004.89

О. В. Фридман

Институт информатики и математического моделирования ФИЦ КНЦ РАН

ЛОГИЧЕСКИЕ НЕЙРОННЫЕ СЕТИ: МЕТОДЫ АВТОМАТИЧЕСКОГО КОСТРУИРОВАНИЯ, РЕДУКЦИИ, ИЗВЛЕЧЕНИЯ ПРАВИЛ*

Аннотация

Рассмотрен класс логических нейронных сетей. Представлен обзор методов и алгоритмов, применяемых при построении нейронных сетей, методы извлечения правил. Рассматриваются вопросы применения логических нейронных сетей для решения различных задач. Ключевые слова:

логические нейронные сети, моделирование, методы и алгоритмы построения нейронных сетей, извлечение правил, применение логических нейронных сетей.

* Работа выполнена в рамках темы НИР «Развитие методологии построения интеллектуальных мультипредметных систем информационной поддержки регионального развития на примере территорий Арктической зоны Российской Федерации (АЗРФ)» (№ 0226-2019-0036).

O. V. Fridman

LOGIC NEURAL NETWORKS: METHODS OF AUTOMATIC DESIGN, REDUCTION, RULE EXTRACTION

Abstract

The class of logical neural networks is considered. A review of the methods and algorithme used in the construction of neural networks, reduction, and rule extraction are presented. The problems of using logical neural networks to solve various problems are considered.

Keywords:

logical neural networks, modeling, methods and algorithms for constructing neural networks, reduction, rule extraction, the use of logical neural networks.

Введение

В настоящее время разработаны десятки различных моделей нейронных сетей, которые получили применение во многих сферах современной жизни, в частности, для задач анализа большого количества данных, для трудноформализуемых и неформализуемых задач, для задач с комплексными алгоритмами и алгоритмами с неявными параметрами и др. Нейронные сети получили широкое распространение при необходимости одновременного анализа большого числа данных, выделении тенденций и прогнозирования в зависимости от полученной информации, как, например, на рынке бумаг или валютном рынке.

Архитектуру нейронной сети можно характеризовать схемой SIMD (Single Instruction — Multiple Data), то есть выполнение одной функции для множества данных [1].

Для реализации структуры сети, необходимо ввести связи между нейронами. Основные виды связей, используемых в нейронных сетях, следующие:

• прямая связь: процесс передачи выходного сигнала происходит последовательно, с выхода одного слоя, на вход следующего;

• обратная связь: выходные сигналы передаются на вход предыдущего слоя, что позволяет производить рекуррентные операции на нейронных сетях;

• боковая связь: выходные сигналы передаются внутри слоя от нейрона к нейрону.

Перед созданием нейронной сети проводится анализ задачи, в процессе которого определяются топология и размеры сети, передаточные и активационные функции и прочие параметры. После завершения этапа формализации и переноса поставленной задачи на модель нейронной сети, начинается процесс обучения.

Обучение нейронной сети требует много времени, и чем сложнее структура, тем дольше будет проходить обучение. Для ускорения данного процесса существует лишь одно решение - улучшение самого алгоритма обучения. Наиболее эффективной, с точки зрения временных затрат модификацией для процессов обучения является распараллеливание алгоритма.

После завершения стадии обучения, структура нейронной сети фиксируется, то есть дальнейших изменений весов и связей не происходит, сеть переходит в рабочий режим.

В зависимости от поставленных целей, принято классифицировать нейронные сети. Для систем анализа изображений, задач автоматизации

управления, экономической сферы, существуют типовые нейронные сети, которые далее модифицируются под конкретно поставленную задачу. В данной работе будет рассмотрен класс логических нейронных сетей [2].

1. Логические нейронные сети

Пусть имеется некоторое множество высказываний, по которому путём неарифметических преобразований должен быть получен результат. Для работы с подобными множествами, необходимо их формализовать, представив все высказывания в виде предикатов, получив возможность обработки предикатов при помощи операций алгебры логики. Решение задачи зависит от истинности или ложности высказываний входного множества. Исходя из этого, логическую нейронную сеть можно охарактеризовать как нейронную сеть, базисом для которой является булева алгебра.

Определим функционал и вид сети. Если взять совокупность всех событий, и выделить среди них те высказывания, которые полностью покрывают смысловой диапазон, получим новое множество. В том случае, если каждая допустимая ситуация характеризуется тем, что истинное значение принимает только одно высказывание этой совокупности, полученное множество будет называться исчерпывающим множеством событий. На основе полученного множества, введя некоторую иерархию, будем строить логические цепочки, позволяющие однозначно получить результат. Систему из таких логических путей, в случае её непротиворечивости и полноты, можно рассматривать как систему принятий решений (СПР). Прежде чем перейти к построению нейронной сети из СПР, необходим ещё один шаг в формализации задачи - определение величины входных сигналов.

Поскольку в сети, нейроны представлены в некотором стандартном виде, то величины возбуждения, синаптические связи, пороги и функции должны быть либо одинаковы, либо лежать в общем диапазоне значений для всей сети.

После этого шага, можно приступить к выбору параметров сети.

В модели логической нейронной сети рассматриваются 2 типа нейронов, реализующих логические функции: нейрон-конъюнктор и нейрон-дизъюнктор [3], объединённых связями, полученными из условий задачи. Опираясь на булеву алгебру, логические нейронные сети покрывают широкий спектр задач, а также осуществлять логический вывод типа «причина-следствие», что применяется для различных систем управления, а также для систем автоматического доказательства теорем.

Главным отличием логических нейронных сетей от сетей других видов является то, что не существует одного шаблона для реализации всего класса логических нейронных сетей. Каждая такая сеть строится под задачу, путём объединения в сети конъюнкторов и дизъюнкторов. Только путём анализа конкретной задачи может быть создана логическая нейронная сеть.

Проанализировав входное множество, необходимо выделить все используемые переменные, подаваемые на вход, после чего надо построить структуру, а затем обучить её. Первая часть обучения происходит методом трассировки, когда по предъявляемому сети эталону выстраивается путь от входных значений к выходному. При предъявлении нескольких эталонов нейронная сеть строит пути последовательно, выбирая ещё не задействованные

нейроны и вводя необходимые связи. Данный алгоритм повторяется до тех пор, пока не будет достигнута полная определённость для всех входных эталонов, предъявляемых сети. Для алгоритма трассировки нейронной сети используется понятие матрицы следования - матрицы, в которой строки и столбцы — нейроны, а значения, стоящие на их пересечении отвечают за наличие или отсутствие связи. Алгоритм позволяет выстроить связи, цепочки следования из входного слоя к выходному через скрытые слои. Таким образом, получают готовую структуру логической нейронной сети. Следующим шагом обучения является приведение нейронной сети после трассировки, то есть коррекция весов и порогов для достижения необходимых результатов. В итоге, полученная логическая нейронная сеть способна на основе формализованных входных данных, выдать выходное значение на основе логических операций. Таким образом, логическая нейронная сеть, по сути, является автоматизированной системой логического вывода. Сферой применения таких сетей являются системы управления, банковская сфера, различные системы анализа, а также система автоматического доказательства теорем, основывающаяся на методе логического вывода.

2. Построение логических нейронных сетей

Рассмотрим методы и алгоритмы, применяемые при построении нейронных сетей. При построении нейронной сети используются конструктивные методы, которые предполагают последовательное построение (редукцию) нейронной сети путем поэтапного добавления (удаления) элементов архитектуры сети (связей, нейронов, скрытых слоев). Алгоритмы конструирования функционируют по определенному правилу таким образом, что любое изменение архитектуры на каждом этапе гарантированно уменьшает значение ошибки сети. Правило подчиняется следующей схеме: локализация неверно решенных примеров и коррекция архитектуры сети только для них, не затрагивая, по возможности, корректных.

В работе [3] подробно описаны алгоритмы автоматического конструирования нейронных сетей реализующих произвольные логические функции (бинарные алгоритмы).

Для конструирования нейронных сетей специального вида применяются другие методы и алгоритмы, такие как метод динамического добавления узлов, каскадная корреляция и др.

Другим направлением, которое можно выделить среди конструктивных алгоритмов, являются методы редукции нейронной сети. Все подходы к редукции объединены следующей общей схемой работы. Исходной является некоторая, уже обученная, нейронная сеть. В предположении, что размеры этой сети можно уменьшить, отсекаются определенные каким-либо образом избыточные нейроны или существующие связи между ними. Как правило, в качестве критерия выбирается степень воздействия нейрона (связи) на величину ошибки, а убираются соответственно слабо влияющие нейроны (веса). После упрощения нейронной сети повторяется процесс дообучения и повторного усечения до тех пор, пока величина ошибки не достигнет желаемой величины или топология нейронной сети не достигнет необходимой простоты. Очевидными недостатками подхода усечения являются неопределенность в принципах построения исходной нейронной сети и большой объем вычислений. Обычно метод усечения

применяется для экономии ресурсов при необходимости аппаратной реализации уже найденной нейронной сети.

Исторически, первой техникой упрощения сети была техника усечения, предложенная в 1989 г. Мозером и Смоленским [4].

Более исследованным подходом к упрощению нейронной сети является техника усечения весов, основанная на оценке значимости весов связей. В отечественной литературе техника усечения весов носит название процедуры контрастирования и впервые была предложена в работе [5].

Для направления упрощения сети методом усечения весов широко известными являются методы оптимального повреждения мозга (Optimal Brain Damage, OBD) [6] и его более позднее развитие - лучший нейрохирург (Optimal Brain Surgeon, OBS) [7].

Современным способом построения нейронных сетей является использование эволюционного подхода к поиску по пространству возможных архитектур. Исторически сложились три методологии эволюционного поиска [8]: эволюционное программирование Фогела, 1966 г., эволюционные стратегии Реченберга, 1973 г. и генетические алгоритмы (ГА) Холланда, 1975 г. [9]. Общую схему поиска архитектуры нейронных сетей с помощью ГА можно представить следующим образом. Информация об архитектуре нейронной сети специальным образом кодируется в генетический код. Затем генерируются поколения, к которым применяются стандартные генетические операции. Оценка каждого индивидуума производится следующим образом: нейронная сеть восстанавливается из генетической строки и производится ее тестирование.

Таким образом, конструктивные алгоритмы позволяют быстро создавать сети, но жестко заданные правила построения не позволяют совершать отклонения в пространстве архитектур от некоторой окрестности. Это позволяет говорить о конструктивном подходе, как о подходе, реализующем локальный поиск, и сильно подверженный попаданию в локальные минимумы.

Особое место занимают алгоритмы редукции: они позволяют получить неплохие результаты, но предполагают полноту имеющейся модели до начала работы. Иными словами, до начала работы алгоритма уже предполагается наличие некоторой нейронной сети, успешно решающей проблему, для которой делается предположение о возможном ее упрощении. Это условие сильно ограничивает круг возможного применения методов усечения.

Эволюционные алгоритмы несомненно реализуют охват всего пространства архитектур и соответственно реализуют глобальный поиск, с большей вероятностью попадания в глобальный минимум. Но подобный способ организации поиска занимает очень много времени [3].

3. Извлечение правил из обученных нейронных сетей

В работах [10, 11] рассмотрены вопросы совместного использования нейросетевых технологий с методами логического вывода и поддержки принятия решений в задачах «интеллектуального» анализа данных. Проведен анализ существующих алгоритмов и методов построения деревьев решений.

Особенностью алгоритмов и методов, применимых для решения задач интеллектуального анализа данных, является отсутствие ограничительных рамок априорных предположений о структуре выборки и виде распределений значений

анализируемых показателей, чему наилучшим образом соответствует использование нейросетевых технологий. Это обусловлено способностью нейронных сетей к моделированию нелинейных процессов, воспроизведению чрезвычайно сложных зависимостей, адаптивностью к условиям функционирования, а главное, способностью извлекать и обобщать существенные особенности из поступающей информации. Тем самым сеть осуществляет построение правил, однако эти правила содержатся в весовых коэффициентах, функциях активации и связях между нейронами, но обычно их структура слишком сложна для восприятия и определения влияния отдельного признака на выходное значение. Нейронная сеть, по сути, выступает «черным ящиком», на вход которого подаются исходные данные и на выходе получается некоторый результат, однако обоснования, почему было принято именно такое решение, не предоставляется. Правила содержатся в весовых коэффициентах, функциях активации и связях между нейронами, но обычно их структура слишком сложна для восприятия. Более того, в многослойной сети эти параметры могут представлять собой нелинейные, немонотонные отношения между входными и целевыми значениями. Таким образом, как правило, не представляется возможным отделить влияние определенного признака на целевое значение, потому что этот эффект может быть опосредован значениями других параметров. Другой сложностью является проблема выбора оптимальной топологии сети, значений параметров и структурных особенностей, которые бы наилучшим образом удовлетворяли решаемой задаче на имеющихся исходных данных. В связи с этим, особую важность приобретают вопросы совместного использования нейросетевых технологий с методами логического вывода и поддержки принятия решений, где в качестве основного подхода применяются деревья решений.

Дерево решений состоит из вершин двух типов. Вершины решений, содержащие вопросы, обозначаются окружностями. Цели или логические выводы обозначаются прямоугольниками. Вершины нумеруются и на дугах задаются условия. Каждая вершина может иметь не более одного входа. Пути движения по дереву с верхнего уровня на самые нижние определяют логические правила в виде цепочек конъюнкций [10].

Правила, выражающие закономерности, формулируются в виде продукций: «ЕСЛИ А ТО В» или в случае множества условий: «ЕСЛИ (условие 1) Л (условие 2) Л ... Л (условие N ТО (Значение вершины вывода)». Их достоинством является простота и наглядность описания процесса поиска решения.

Деревья решения могут использоваться как самостоятельное средство анализа многомерных данных и поиска в них логических закономерностей. Общий принцип построения дерева заключается в рекурсивном разбиении объектов из обучающей выборки на подмножества, которые содержат объекты, относящиеся к одному классу.

Методы выделения закономерностей с помощью деревьев решений обладают свойством наглядности и позволяют находить такие связи, которые заключены не только в отдельных признаках, но и в сочетании признаков. Они предоставляют возможность прогнозировать и связывать различные параметры изучаемого явления в единое целое, что во многих случаях дает этим методам

значительное преимущество по сравнению с классическими методами многомерного анализа.

Одним из направлений использования деревьев решений для интеллектуального анализа данных является их применение для извлечения правил из нейронных сетей. Совместное использование нейросетевых технологий с методами логического вывода способно улучшить понимание структуры изучаемого явления за счет предоставления результата, полученного в ходе обучения нейронной сети, в виде иерархической, последовательной структуры правил типа «ЕСЛИ - ТО».

Можно выделить два подхода к извлечению правил из многослойных нейронных сетей. Первый подход заключается в извлечении набора глобальных правил, которые характеризуют классы на выходе непосредственно через значения входных параметров. Альтернативой является извлечение локальных правил, разделяя многослойную сеть на совокупность однослойных сетей. Каждое извлекаемое локальное правило характеризует отдельный скрытый или выходной нейрон с учетом элементов, которые имеют с ним взвешенные соединения. Затем правила объединяются в набор, который определяет поведение всей сети в целом.

Одним из алгоритмов извлечения правил из нейронных сетей, обученных решению задачи классификации, является метод NeuroRule [12]. Данный алгоритм основан на извлечении локальных правил и включает три основных этапа.

Этап 1. Обучение нейронной сети, когда двухслойный персептрон обучается вплоть до получения достаточной точности классификации. В первоначальный момент выбирается большое число промежуточных нейронов, и после обучения излишние нейроны и связи отбрасываются.

Этап 2. Прореживание нейронной сети. Обученная нейронная сеть содержит все возможные связи между входными нейронами и нейронами скрытого слоя, а также между скрытыми и выходными нейронами. Полное число этих связей обычно столь велико, что из анализа их значений невозможно извлечь доступные для понимания пользователем классифицирующие правила. Прореживание заключается в удалении излишних связей и нейронов, не приводящем к увеличению ошибки классификации сетью. Результирующая сеть обычно содержит немного нейронов и связей между ними, и функционирование такой сети поддается исследованию.

Этап 3. Извлечение правил. На этом этапе из прореженной нейронной сети извлекаются правила. Для этого проводят подготовку к извлечению правил, которая заключается в кодировании непрерывных величин, как на входе, так и внутри сети. Осуществляется кодирование признаков классифицируемых объектов, если они представляют собой непрерывные величины. Для их представления можно использовать бинарные нейроны и принцип кодирования типа «термометр». Значения, которые принимают нейроны скрытого слоя кластеризуются и заменяются значениями, определяющими центры кластеров. Число таких кластеров выбирается небольшим. После такой дискретизации активностей промежуточных нейронов производится проверка точности классификации объектов сетью. Если она остается приемлемой, то подготовка к извлечению правил заканчивается. Далее осуществляется извлечение правил, при этом движение по сети происходит от классифицирующих выходных нейронов

к входам сети. Предполагается, что эти правила достаточно очевидны при проверке и легко применяются к большим базам данных.

К недостаткам большинства алгоритмов извлечения правил можно отнести отсутствие универсальности и масштабируемости. В связи с этим, наибольший интерес представляет алгоритм TREPAN [13] и его модификации, которые лишены этих недостатков и не предъявляют никаких требований к архитектуре сети, входным и выходным значениям, алгоритму обучения и т.д. Данный подход осуществляет построение дерева решений на основе знаний, заложенных в обученную нейронную сеть, причем достаточно того, что сеть является неким «черным ящиком» или «Оракулом», которому можно задавать вопросы и получать от него ответы. Более того, алгоритм является достаточно универсальным и может применяться к широкому кругу других обученных классификаторов. Он также хорошо масштабируется и не чувствителен к размерности пространства входных признаков и размеру сети.

Основное преимуществом данного подхода заключается в обобщающей способности искусственных нейронных сетей, что позволяет получать более простые деревья решений. Возможность генерации дополнительных примеров и использование «Оракула» для отнесения их к тому или иному классу позволяет компенсировать недостаток данных, часто наблюдающийся при построении деревьев на нижних уровнях. Таким образом, алгоритм позволяет извлекать структурированных знаний не только из чрезвычайно упрощенных нейронных сетей, но и из произвольных классификаторов, что делает возможным его применение в широком круге практических задач [11].

4. Применение логических нейронных сетей

Теперь рассмотрим вопросы применения логических нейронных сетей и конкретные примеры их применения при решении различных задач.

В работе [2] описаны различные задачи, решаемые при помощи логических нейронных сетей, в частности задачи анализа и прогнозирования экономических показателей (биржевых сделок), таких как котировки и объемы продаж активов на фондовом рынке, выбор наилучшего проекта строительства, определение стратегии международных торговых сделок и т.д., Решение этих задач основано на анализе многофакторных моделей. Разнообразие факторов политического, экономического и социального характера, а также такие конкретные показатели, как уровень инфляции, кредитные ставки банков, уровень безработицы, обменные валютные курсы, изменение объемов производства, денежная эмиссия и эмиссия ценных бумаг и др., представляют значительные трудности при формальном описании задачи, а главное — при определении зависимостей прогнозируемого результирующего показателя (котировка, объем продаж, цена и др.) от совокупности этих факторов. Даже предположение о линейности или мультипликативности не уменьшают неопределенности при аналитическом построении таких зависимостей. Таким образом, задача анализа и прогнозирования экономических показателей относится к классу трудно формализуемых [14].

В работе [15] объектом исследования является управление производственными запасами. Предмет исследования — инструментальные модели и методы управления производственными запасами в условиях неопределенности. Для строгого логического мышления, исключающего

неопределенность, приходится оперировать не отдельными событиями и даже не исчерпывающими множествами таких событий, а композициями таких множеств. Между событиями, принадлежащими различным множествам, возможна зависимость, порождающая сложные высказывания. В работе использованы модели управления запасами с учетом денежной стоимости денег (модель со скидками, с дефицитом, с заёмными денежными средствами), традиционные стратегии управления («наибольшей осмотрительности», «дополнительного резерва» «процент от спроса»), для принятия решений разработана логическая нейронная сеть под задачу.

Решение задачи классификации [16] становится все более актуальным в связи с развитием технологии и разрастанием обрабатываемых объемов данных. Использование нейронных сетей обязательны при решении задач классификации, т.к. нейронные сети обладают способностью выявления значимых признаков и скрытых закономерностей. Преимуществами логической нейронной сети являются: более высокая точность классификации, большая скорость обучения и переобучения. Задача классификации встречается в самых разных областях человеческой деятельности и решается для последующего прогнозирования состояния исследуемой системы, например, в системах распознавания, в медицинской диагностике, банковской кредитной системы, контроля качества и т.д. и имеет практическую значимость. Существует огромное количество алгоритмов классификации, применяющиеся в решении определенных задач.

Под задачу классификации легко подстраивается логическая нейронная сеть с булевыми выходами. Логические нейронные сети хорошо подходят, когда классов, в которые нужно определить тот или иной объект не очень много. Это утверждение обусловлено тем, что в такой нейронной сети на выходном слое нейронов столько, сколько классов, и принадлежность объекта классификации к данному классу определяется 1 на выходе данного нейрона и 0 на всех остальных. Нейронные сети обладают способностью выявления значимых признаков и скрытых закономерностей. Преимуществами логической нейронной сети являются: более высокая точность классификации, большая скорость обучения и переобучения. Недостатками такой модели является разрастание нейронной сети при большом количестве классов, к которым надо отнести тот или иной объект и большом количестве характеристик объектов.

В работе [17] для синтеза антецедента (условия активации) решающих продукционных правил в случае представления характеризующих объект признаков в виде булевых переменных используются искусственные логические нейронные сети (ЛНС). Применяемый в настоящее время синтез ЛНС [18, 19] по сути, является итерационным процессом идентификации предикатов первого порядка, что не отвечает основным принципам самоорганизационного моделирования.

Между тем сетевые принципы синтеза моделей, лежащие в основе метода группового учета аргументов (МГУА), доказали свою перспективность в аналогичных случаях при анализе сложных открытых систем в медицинской предметной области [20].

В связи с этим аналогично МГУА предлагается использовать нейроны логической сети с ограниченным и небольшим количеством входов, постепенно усложняя структуру логической функции, «продвигаясь внутрь» по рядам ЛНС.

Ограничение на количество входных аргументов одного нейрона приближено к естественному интеллекту, который «одновременно удерживает»

в оперативной обработке ограниченное количество информации об объектах, процессах или семантических группах (включая альтернативные решения). Минимальным в этом случае является искусственный логический нейрон с двумя входами и одним выходом — бинарный нейрон

В качестве апробации возможностей ЛНС МГУА для синтеза условий активации использовалась задача синтеза адекватного решающего правила прогноза развития тромбоэмболии легочной артерии (ТЭЛА) в послеоперационный период протезирования крупных суставов.

Полученные результаты позволяют предположить эффективность предлагаемого подхода синтеза решающих правил продукционного типа для баз знаний медицинских экспертных систем, как системообразующего модуля автоматизированных систем поддержки принятия решений в хирургии, поддерживающих оптимальную терапию и-или профилактику заболеваний, возникающих в послеоперационный период и приводящих впоследствии с высокой степенью риска к инвалидности или летальности. Это обусловливается тем, что предлагаемый подход ЛНС МГУА основан на синергетическом подходе к обработке гетерогенной структуры данных, представленных логическими значениями, позволяющих существенно уменьшить субъективизм при регистрации признаков — факторов риска.

В работе [21] рассматривается возможность применения логических нейронных сетей для решения задач авторизации для клиент-серверных приложений. В статье описана архитектура и метод построения процедуры авторизации для комплекса средств аутентификации информационных систем, построенных по технологии клиент-сервер. Ввиду необходимости анализа результатов аутентификации и принятия решения по результатам этого анализа модуль авторизации реализован виде логической нейронной сети. Данная структура позволяет учесть и промоделировать все возможные ситуации, возникающие при аутентификации пользователей, так же предоставляет возможность разрешения спорных ситуаций, когда личность и принадлежность пользователя к данной системе установлено не точно. Метод принят для реализации ввиду оптимально подходящего для реализации решения поставленной задачи, т.е. задачи назначения прав и организационных мер пользователю в информационной системе. Этот метод позволяет реализовать достаточно гибкое и универсальное решение поставленной задачи, а именно позволяет расширять области принимаемых решений, при минимальной затрате усилий на модернизацию, позволяет принимать к анализу большее или меньшее количество результатов аутентификации, количество которых напрямую зависит от количества идентификаторов.

После завершения работы процедур аутентификации пользователей на входные нейроны подаются значения, характеризующие результаты верификаций того или иного идентификатора пользователя. Значения подаются на входной слой нейронов логической нейронной сети, модуля авторизации, тем самым активируя те или иные нейроны в зависимости от порога. Активация нейронов характеризует наступление того или иного события.

Количество событий напрямую связано с количеством идентификаторов использующихся в комплексе и вероятности получения нечетких результатов аутентификации данных идентификаторов. Процесс работы модуля авторизации достаточно прост и состоит из трех этапов: получение данных от модулей

аутентификации, анализ полученных данных, принятие решения по результатам анализа с последующей передачей этого решения информационной системе.

Это далеко не полный перечень существующих задач, решаемых с использованием нейросетевого подхода, в частности, логических нейронных сетей.

Заключение

Искусственные нейронные сети в настоящее время широко применяются практически во всех областях связанных с обработкой информации. Далеко не полный список приложений нейронных сетей выглядит следующим образом:

• приближение функций: регрессионный анализ, предсказание временных рядов (финансовые приложения);

• распознавание образов: радары, распознавание лиц, почерка, речи, медицинская диагностика и т. д.;

• обработка данных: классификация, кластеризация, фильтрация, сжатие данных;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• управление: технологические процессы и системы, транспортные средства, манипуляторы, робототехника;

• системы принятия решений: игры, экспертные системы. Проведенный обзор показал, что применение логических нейронных сетей

позволяет создавать доступные широкому пользователю компьютерные системы мониторинга, управления и принятия решений практически во всех сферах деятельности. Проекты таких систем в области оценки финансов и риска, в управлении и диагностике, в искусстве и развлечениях показывают универсальность подхода, возможность переориентирования нейронных сетей на новые применения. В особенности это касается наиболее распространенных совершенных нейронных сетей - однослойных, в каждом решении использующих все факторы.

Литература

1. Хайкин С. Нейронные сети: полный курс, 2-е изд., испр. Издательский дом «Вильямс». М., 2006. 1104 с.

2. Барский А.Б. Логические нейронные сети. / А.Б. Барский; НОУ «ИНТУИТ», 2016. 492 с.

3. Аксенов С. В. Организация и использование нейронных сетей (методы и технологии). / С. В. Аксенов, В. Б. Новосельцев; Под общ. ред. В. Б. Новосельцева. Изд-во НТЛ. Томск, 2006. 128 с.

4. Mozer M. C., Smolensky P. Skeletonization: a technique for trimming the fat from a network via relevance assessment. // Advances in Neural Information Processing Systems. 1989. Vol. 1. Pp. 107-115.

5. Горбань А.Н. Обучение нейронных сетей. / А. Н. Горбань; М., СП ParaGraph, СССР - США, 1990. 160 c.

6. Le Cun Y., Denker J.S., and Solla S.A. Optimal Brain Damage / Y. Le Cun, J.S. Denker, S.A. Solla // Advances in Neural Information Processing Systems II (Denver1989). 1990. Pp. 598-605.

7. Hassibi B., Stork D. G. Second Order Derivatives for Network Pruning: Optimal Brain Surgeon / B. Hassibi, D.G. Stork // Neural Information Processing Systems. 1992. Pp.164-171.

8. Pedersen M. W., Hansen, L. K., Larsen, J. Pruning With Generalization BasedWeight Saliences: gamma-OBD, gamma-OBS. / M. W. Pedersen, L. K. Hansen, J. Larsen // In Neural Information Processing Systems. NIPS. 1995. Pp. 521-527.

9. Holland J.H. Adaptation in Natural and Artificial Systems. / J.H. Holland; Univ. of Michigan Press., Second Ed., MA: The MIT Press edition. 1992. 211 p.

10. Гридин В. Н. Совместное использование нейросетевых технологий и деревьев решений для поиска логических закономерностей в данных. / В. Н. Гридин, В. И. Солодовников // Информационные технологии и нанотехнологии. 2017. С. 1756-1762.

11. Гридин В. Н. Построение деревьев решений и извлечение правил из обученных нейронных сетей. / В. Н. Гридин, В. И. Солодовников, И. А. Евдокимов, С.В. Филипков // Искусственный интеллект и принятие решений. 2013. № 4. С. 26-33.

12. Ежов А.А. Нейрокомпьютинг и его применение в экономике и бизнесе / А. А. Ежов, С. А. Шумский; М.: МИФИ. 1998. 224 с.

13. Craven M. W. Extracting tree-structured representations of trained networks / M.W. Craven, J.W. Shavlik // Advances in Neural Information Processing Systems. MIT Press, Cambridge, MA. 1996. Vol. 8. Pp. 24-30.

14. Барский А. Б. Основы построения реагирующих объектов для систем интеллектуального отображения // А .Б. Барский, Л. Б. Милютин, А. Е. Тимофеев // Компьютеры в учебном процессе, 2005. № 5. С. 81-90.

15. Сафронова Т.А., Живицкая, Е.Н. Логические нейронные сети для управления производственными запасами в условиях неопределенности. Режим доступа: http://be5.biz/ekonomika1/r2012/2015.htm.

16. Жилов Р. А. Применение логической нейронной сети к задаче классификации // Вестник КРАУНЦ. Физ.-мат. науки. -018. № 3(23). С. 180-183.

17. Димитриченко Д. П. Применение переменнозначных логических функций и нейронных сетей в системах принятия решений // Вестник КРАУНЦ. Физ.-мат. Науки. 2016. № 4-1(16). С. 9-100.

18. Агеева У. О. Бионическое интеллектуальное протезирование конечностей и логические нейронные сети / У. О. Агеева, В. Г. Агеева, А. Б. Барский // Информационные технологии. 2016. Т. 22, № 5. С. 379-386.

19. Барский А. Б. Медицинские информационно-справочные системы на логических нейронных сетях / А. Б. Барский, А. А. Дмитриев, О. А. Барская // Информационные технологии. 2010. № 1. С. 1-32.

20. Дунин В. О. Разработка средств интеллектуального анализа и обработки медицинской информации / В. О. Дунин, В. А. Егоров // Современные информационные технологии. 2013. № 18. С. 173-178.

21. Борискин С.М. Логическая нейронная сеть как решение задачи авторизации для комплекса средств аутентификации. // Актуальные проблемы современной науки. 2011. № 1.

Сведения об авторах Фридман Ольга Владимировна к.т.н., старший научный сотрудник e-mail: ofridman@iimm. ru Olga V. Fridman PhD, senior researcher

i Надоели баннеры? Вы всегда можете отключить рекламу.