УДК 519.95
ФОРМАЛИЗАЦИЯ ПРОБЛЕМЫ РАЗРАБОТКИ ЭКСПЕРТНОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ С РАЗВИВАЮЩИМСЯ ИНТЕЛЛЕКТУАЛЬНЫМ ЯДРОМ НА БАЗЕ ИНС-МОДЕЛЕЙ
© А.А. Арзамасцев, Н.А. Зенкова, А.В. Неудахин
Ключевые слова: автоматизированная экспертная система, развивающееся интеллектуальное ядро, нейросетевые модели, математическая формализация задач накопления информации.
Статья посвящена разработке автоматизированной технологии построения экспертных систем, сочетающих в себе функциональные преимущества развивающегося интеллектуального ядра и сетевых технологий взаимодействия. Приведены результаты математической формализации задач накопления информации и построения на ее основе развивающегося интеллектуального ядра.
Необходимость в экспертных системах (ЭС), как в интеллектуальных помощниках, способных решать трудноформализуемые задачи, существует во многих сферах человеческой деятельности: промышленности, научных исследованиях, социальной и экономической сферах.
Ранее нами была разработана автоматизированная технология построения ЭС с интеллектуальным ядром на основе нейросетевых моделей [1-2]. Концептуальная модель таких ЭС приводится на рис. 1. Основными отличительными компонентами данной модели является веб-интерфейс, база данных, используемая для долговременного хранения технической информации, а также интеллектуальное ядро, включающее развивающуюся систему представления знаний экспертов, основанную на нейросетевых моделях.
Для разработки автоматизированной технологии построения ЭС, соответствующих разработанной концептуальной модели, была проведена математическая формализации задач накопления информации и построения на ее основе развивающегося интеллектуального ядра.
Основные принципы формализации. Пусть имеется распределенная система получения исходной информации, включающая N терминалов, каждый из которых предназначен для ввода п независимых параметров, имеющих т уровней каждый. Работа терминалов организована таким образом, что каждый из них работает лишь часть времени так, что интервалы их простоя являются случайными величинами, заданными плотностями распределенийр1(т), р2(т), ..., рщ(т). Время ввода информации не зависит от номера терминала, но линейно зависит от п, т. е. Трл = к1п, где к1 - некоторый коэффициент пропорциональности. Будем считать, что очередная порция информации добавляется к базе данных в виде одной записи, когда на і-м терминале (і = 1, ..., Щ каждому независимому параметру х} (]' = 1, ..., п) присвоен соответствующий уровень 1к (к = 1, ... , т).
Будем считать, что передача информации с любого терминала в базу данных осуществляется мгновенно,
т. к. это время на несколько порядков меньше времени, затрачиваемого пользователем на ввод информации.
Тогда среднее время одного цикла работы г-го терминала (ввод + ожидание следующего ввода информации), соответствующее добавлению в базу данных одной записи, может быть вычислено как:
^ шах
тг = к1п + рі (т)^т.
Поэтому за период времени Т (например Т = 24 ч) на г-м терминале могут быть осуществлены циклов ввода, соответствующие добавлению в базу данных г; Т
записей: г, =-----------------. Соответственно, об-
Іі
к1п + ^т рі (т)й?т
щее число записей информации в БД, полученное со всех терминалов за период Т, составит:
N N
я=2 г,=Т 2-
г=1 г =1
1
к1п + ^ (т)й?т
0
Выполним оценку периода первичного накопления данных в БД - Г1, предшествующего первому обучению интеллектуального ядра (ИНС-модели).
В соответствии с теоремами А.Н. Колмогорова [12] о представимости функций нескольких переменных с помощью суперпозиций и сумм функций одного переменного, можно утверждать, что каждая непрерывная функция п переменных, заданная на единичном кубе п-мерного пространства, представима в виде:
2п+1
(хр)
р=1
где функции
Ид (и) непрерывны, а функции фр (хр), кроме того, еще и стандартны, т. е. не зависят от выбора функции /.
Рис. 1. Концептуальная модель веб-ориентированных нейросетевых ЭС
Рис. 2. Представление функции п переменных в виде ИНС-модели
Фактически это означает, что «минимальная» структура ИНС-модели, позволяющая аппроксимировать функцию п переменных, должна иметь следующий вид: входной слой, состоящий из п нейронов, первый скрытый слой, включающий (2п+1)-п функциональных нейронов, второй скрытый слой, состоящий из (2п+1) функциональных нейронов, и выходной, суммирующий нейроны (рис. 2). Указанная нейронная сеть не является полносвязанной и имеет (2п + 1)п + (2п + 1)п + 2п + + 1 = (2п + 1)2 связей (степеней свободы при обучении ИНС-модели).
Л—
\ Е*=0,06 Е0=1 к=1
Е* ^ < <
“ “ “
0 2 4 6 8 10
і
Рис. 3. Корреляция эмпирических данных по среднеквадратичной погрешности обучения сети - Е (треугольники) от времени обучения с результатами расчета по уравнению (6). На графике показаны приведенные безразмерные значения
Необходимо заметить, что теоремы А.Н. Колмогорова не несут никакой информации о типе нелинейности функций ф и к. Так, в интеллектуальном ядре экспертной системы, базируемом на ИНС-модели, мы используем активационную функцию
Ї (5) =--0^ и полносвязанную сеть - многослой-
1 + е
ный персептрон. Для этого случая число степеней свободы ИНС-модели будет (2п + 1)-(3п2 + п + 1). Учитывая, что число записей в БД должно быть не меньше, чем число степеней свободы, получим оценку для первичного периода накопления данных:
/ Л-1
1
тл > К ■
к,П + [ Г /> ( Г
(1)
где К = (2п +1) для ИНС-модели, построенной в соответствии с теоремой А.Н. Колмогорова, и
Рис. 4. График накопления первичной информации (верхняя часть рисунка); R - число записей в базе данных, полученных с терминалов. Процесс обучения ИНС-модели, составляющей интеллектуальное ядро ЭС. Е - приведенная среднеквадратическая ошибка ИНС-модели. По оси абсцисс - безразмерное время
Рис. 5. Функциональная модель жизненного цикла построения ЭС, обладающих интеллектуальным ядром на основе ИНС-моделей и веб-интерфейсом
K = (2n + 1)(3n + n +1) для полносвязанной ИНС- или
модели. 1
Процесс обучения интеллектуального ядра ЭС за- ____in|k(e* -
ключается в минимизации функционала вида: k
E(t))]
— t + c .
(5)
E{w[S (n )]} — ||Д||— YtM — Y ^ (w ) —
Rn
'V"' 'V"' ( tabl v net
i—1 j—1
(w )2
(2)
Вектор те определяется структурой сети S, которая, в свою очередь, связана с числом ее входов п так, что имеется однозначное соответствие п и %^). Поэтому вектор те*, зависящий от структуры сети и минимизирующий функционал (2), соответствует оптимальной ИНС-модели интеллектуального ядра и может быть определен как:
w* = ш^шт F (\¥) (3)
-и*еО
Минимизацию функционала (2) осуществляем двумя методами: градиентным, так что последующие значения вектора вычисляются по формуле
wt+1 = wt — h(t)grad(E(wг), и методом сканирования. Для указанных методов оценки времени обучения могут быть получены следующим образом:
= к3 RaN . Здесь к2 и к3 - коэффициенты, зависящие от технических характеристик используемого оборудования, а - число разбиений диапазона изменения переменной.
Процесс обучения ИНС-модели, составляющей интеллектуальное ядро ЭС, зависит от количества и качества данных в обучающей выборке и может быть описан следующим дифференциальным уравнением:
dE (t) dt
— k4 [E * — E (t)],
Определив постоянную интегрирования из начальных условий (4), получим решение в виде:
E (t) — E * (1 — e~kt)+ EQe ~
(б)
Предложенная математическая формализация на практике позволяет решить следующие задачи: оценить первичный период накопления информации, необходимой для построения ИНС-модели исследуемого объекта; определить начальную структуру ИНС-модели на основе входных характеристик объекта исследования; сделать оценку количества циклов обучения интеллектуального ядра в присутствии эксперта.
На основе полученных результатов была разработана функциональная модель (рис. 5) жизненного цикла процесса построения ЭС с интеллектуальным ядром на основе нейросетевых моделей и поддерживающих механизмы удаленного доступа.
ЛИТЕРАТУРА
Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Автоматизированная технология построения экспертных систем с интеллектуальным ядром на основе ИНС-моделей // Открытое образование. 2008. № 3 (68). С. 35-39.
Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Технология построения медицинской экспертной системы на основе аппарата искусственных нейронных сетей // Информационные технологии. 2009. № 8. С. 60-63.
Колмогоров А.Н. О представлении непрерывных функций нескольких переменных суперпозициями непрерывных функций меньшего числа переменных // Докл. АН СССР. 1956. Т. 108. № 2. С. 179-182.
Колмогоров А. Н. О представлении непрерывных функций нескольких переменных в виде суперпозиции непрерывных функций одного переменного // Докл. АН СССР. 1957. Т. 114. № 5. С. 953956. (Цит. по книге: Горбань А.Н., Россиев Д.А. Нейронные сети на персональном компьютере. Новосибирск: Наука, 1996).
с начальным условием:
E(Q) = Eq
(4)
Поступила в редакцию 11 июня 2QQ9 г.
где Б^), Б0 и Б - значения приведенной среднеквадратичной погрешности, ее начального значения и уровня, на котором она будет зафиксирована в конце цикла обучения ИНС-модели; к4 - параметр удельной скорости обучения, зависящий от п, объема обучающей выборки и используемого метода минимизации невязки (2); t - безразмерное время.
Разделяя переменные в уравнении (4) и интегрируя, получим:
Г dE (t) — Г
J k (e * — E (t)) )
= dt
Arzamastsev A.A., Zenkova N.A., Neudahin A.V. Formalisation of a problem of working out of expert informational system with developing intellectual kernel on the basis of ANN-models.
Article is devoted to working out of the automated technology of construction of the expert systems combining functional advantages of the developing intellectual kernel and network technologies of interaction. Results of mathematical formalization of problems of accumulation of the information and construction on its basis of a developing intellectual kernel are resulted.
Key words: automated expert system; developing intellectual kernel; neuro-net models; mathematical formalization of problems of accumulation of the information.
kt