Научная статья на тему 'Разработка экспертной информационной системы с развивающимся интеллектуальным ядром на базе ИНС-моделей'

Разработка экспертной информационной системы с развивающимся интеллектуальным ядром на базе ИНС-моделей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
136
55
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВТОМАТИЗИРОВАННАЯ ЭКСПЕРТНАЯ СИСТЕМА / РАЗВИВАЮЩЕЕСЯ ИНТЕЛЛЕКТУАЛЬНОЕ ЯДРО / НЕЙРОСЕТЕВЫЕ МОДЕЛИ / МАТЕМАТИЧЕСКАЯ ФОРМАЛИЗАЦИЯ ЗАДАЧ НАКОПЛЕНИЯ ИНФОРМАЦИИ / AUTOMATED EXPERT SYSTEM / DEVELOPING INTELLECTUAL KERNEL / NEURO-NET MODELS / MATHEMATICAL FORMALIZATION OF PROBLEMS OF ACCUMULATION OF INFORMATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Арзамасцев Александр Анатольевич, Зенкова Наталья Александровна, Неудахин Александр Викторович

Статья посвящена разработке автоматизированной технологии построения экспертных систем, сочетающих в себе функциональные преимущества развивающегося интеллектуального ядра и сетевых технологий взаимодействия. Приведены результаты математической формализации задач накопления информации и построения на ее основе развивающегося интеллектуального ядра.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Арзамасцев Александр Анатольевич, Зенкова Наталья Александровна, Неудахин Александр Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF OF EXPERT INFORMATIONAL SYSTEM WITH DEVELOPING INTELLECTUAL KERNEL ON THE BASIS OF ANN-MODELS

Article is devoted to working out of the automated technology of construction of the expert systems combining functional advantages of the developing intellectual kernel and network technologies of interaction. Results of mathematical formalization of accumulation problems of information and construction on its basis the developing intellectual kernel are given.

Текст научной работы на тему «Разработка экспертной информационной системы с развивающимся интеллектуальным ядром на базе ИНС-моделей»

УДК 519.95

РАЗРАБОТКА ЭКСПЕРТНОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ С РАЗВИВАЮЩИМСЯ ИНТЕЛЛЕКТУАЛЬНЫМ ЯДРОМ НА БАЗЕ ИНС-МОДЕЛЕЙ

© А.А. Арзамасцев, Н.А. Зенкова, А.В. Неудахин

Ключевые слова: автоматизированная экспертная система, развивающееся интеллектуальное ядро, нейросетевые модели, математическая формализация задач накопления информации.

Статья посвящена разработке автоматизированной технологии построения экспертных систем, сочетающих в себе функциональные преимущества развивающегося интеллектуального ядра и сетевых технологий взаимодействия. Приведены результаты математической формализации задач накопления информации и построения на ее основе развивающегося интеллектуального ядра.

Необходимость в экспертных системах (ЭС) как в интеллектуальных помощниках, способных решать трудноформализуемые задачи, существует во многих сферах человеческой деятельности: промышленности, научных исследованиях, социальной и экономической сферах.

Ранее нами была разработана автоматизированная технология построения ЭС с интеллектуальным ядром на основе нейросетевых моделей [1-2]. Концептуальная модель таких ЭС приводится на рис. 1. Основными отличительными компонентами данной модели являются вебинтерфейс, база данных, используемая для долговременного хранения технической информации, а также интеллектуальное ядро, включающее развивающуюся систему представления знаний экспертов, основанную на нейросетевых моделях.

Для разработки автоматизированной технологии построения ЭС, соответствующих разработанной концептуальной модели, была проведена математическая формализации задач накопления информации и построения на ее основе развивающегося интеллектуального ядра [3].

Формализация проблемы. Пусть имеется распределенная система получения исходной информации, включающая N терминалов, каждый из которых предназначен для ввода п независимых параметров, имеющих т уровней каждый. Работа терминалов организована таким образом, что каждый из них работает лишь часть времени так, что интервалы их простоя являются случайными величинами, заданными плотностями распределений ^(г), р2(г), ..., р^г). Время ввода информации не зависит от номера терминала, но линейно зависит от п, т. е. гтрих = = к\п, где к\ - некоторый коэффициент пропорциональности. Будем считать, что очередная порция информации добавляется к базе данных в виде одной записи, когда на /-м терминале (/ = 1, ..., N каждому независимому параметру х] ( = 1, ..., п) присвоен соответствующий уровень 1к (к = 1, ..., т).

Будем считать, что передача информации с любого терминала в базу данных осуществляется мгновенно, т. к. это время на несколько порядков меньше времени, затрачиваемого пользователем на ввод информации.

Тогда среднее время одного цикла работы /-го терминала (ввод + ожидание следующего ввода информации), соответствующее добавлению в базу данных одной записи, может быть вычислено как:

1849

I

тг = к1п + | т р( (т)^т.

0

Поэтому за период времени Т (например Т = 24 ч) на /-м терминале могут быть осуществлены г1 циклов ввода, соответствующие добавлению в базу данных г1 записей: Т

г/ =----. Соответственно, общее число записей информации в БД, полученное

к1п + |т рі (т)ёт

со всех терминалов за период Т, составит:

N N

я = 1 г = ТI

/=1 /=1

г

к1п + |т рі (т)ёт

Выполним оценку периода первичного накопления данных в БД - ^, предшествующего первому обучению интеллектуального ядра (ИНС-модели).

В соответствии с теоремами А.Н. Колмогорова [4-5] о представимости функций нескольких переменных с помощью суперпозиций и сумм функций одного переменного, можно утверждать, что каждая непрерывная функция п переменных, заданная на единичном кубе

2п +1

я-мерного пространства, представима в виде

Ч=1

где

функции Ид(и) непрерывны, а функции ф^ (хр), кроме того, еще и стандартны, т. е. не зависят от выбора функции f.

Рис. 1. Концептуальная модель веб-ориентированных нейросетевых ЭС

1

1850

Рис. 2. Представление функции п переменных в виде ИНС-модели

Фактически это означает, что «минимальная» структура ИНС-модели, позволяющая аппроксимировать функцию п переменных, должна иметь следующий вид: входной слой, состоящий из п нейронов, первый скрытый слой, включающий (2п+1)-п функциональных нейронов, второй скрытый слой, состоящий из (2п+1) функциональных нейронов, и выходной, суммирующий нейроны (рис. 2). Указанная нейронная сеть не является полносвязанной и имеет (2п+\)п + (2/7+1 )п + 2/7+1 = (2/7+1 )2 связей (степеней свободы при обучении ИНС-модели).

Е

Рис. 3. Корреляция эмпирических данных по среднеквадратичной погрешности обучения сети - Е (треугольники) от времени обучения с результатами расчета по уравнению (6): на графике показаны приведенные безразмерные значения

Необходимо заметить, что теоремы А.Н. Колмогорова не несут никакой информации о типе нелинейности функций ф и к. Так, в интеллектуальном ядре экспертной системы, базируемом на ИНС-модели, мы используем активационную функцию /(з) =----------------------и полносвя-

1 + в~аЬ

1851

занную сеть - многослойный персептрон. Для этого случая число степеней свободы ИНС-модели будет (2n + 1)-(3n2 + n + 1). Учитывая, что число записей в БД должно быть не меньше, чем число степеней свободы, получим оценку для первичного периода накопления данных:

(1)

где K = (2n +1) для ИНС-модели, построенной в соответствии с теоремой А.Н. Колмогорова, 2

и K = (2n + l)(3n + n +1) для полносвязанной ИНС-модели.

Процесс обучения интеллектуального ядра ЭС заключается в минимизации функционала вида:

E{w[S(n)]}= ||Л|| = Ytabl - Ynet (w

11 ( - Y/et (w))

i=1 j=1

(2)

Рис. 4. График накопления первичной информации (верхняя часть рисунка): К - число записей в базе данных, полученных с терминалов; процесс обучения ИНС-модели, составляющей интеллектуальное ядро ЭС;

Е - приведенная среднеквадратическая ошибка ИНС-модели; по оси абсцисс - безразмерное время

1852

- 2-----------------

Концептуализация

объекта

исследования

Рис. 5. Функциональная модель жизненного цикла построения ЭС, обладающих интеллектуальным ядром на основе ИНС-моделей и веб-интерфейсом

Вектор w определяется структурой сети S, которая, в свою очередь, связана с числом ее входов n так, что имеется однозначное соответствие n и w(S). Поэтому вектор w*, зависящий от структуры сети и минимизирующий функционал (2), соответствует оптимальной ИНС-модели интеллектуального ядра и может быть определен как:

w* = arg min F (w) . (3)

»eQ

Минимизацию функционала (2) осуществляем двумя методами: градиентным, так, что последующие значения вектора w вычисляются по формуле wt+1 = wt - h(t)grad(E(w1), и методом сканирования. Для указанных методов оценки времени обучения могут быть получены

следующим образом: 0grad = к2nR и 0skan = кзЯаN. Здесь k2 и k3 - коэффициенты, зависящие от технических характеристик используемого оборудования, а - число разбиений диапазона изменения переменной.

Процесс обучения ИНС-модели, составляющей интеллектуальное ядро ЭС, зависит от количества и качества данных в обучающей выборке и может быть описан следующим дифференциальным уравнением:

dE (t) =

------= к 4

dt 4

с начальным условием:

E(0) = E0 , (4)

E - E(t) ,

Идентификация

проблемной

области

1853

где E(t), E0 и E* - значения приведенной среднеквадратичной погрешности, ее начального значения и уровня, на котором она будет зафиксирована в конце цикла обучения ИНС-модели; к4 -параметр удельной скорости обучения, зависящий от n, объема обучающей выборки и используемого метода минимизации невязки (2); t - безразмерное время.

Разделяя переменные в уравнении (4) и интегрируя, получим:

I =1л

или

- lln

k

k(е - E(t))] = t + с . (5)

Определив постоянную интегрирования из начальных условий (4), получим решение в виде:

E(t) = E*(l - e-kt)+ E0e~kt . (б)

Предложенная математическая формализация на практике позволяет решить следующие задачи: оценить первичный период накопления информации, необходимой для построения ИНС-модели исследуемого объекта; определить начальную структуру ИНС-модели на основе входных характеристик объекта исследования; сделать оценку количества циклов обучения интеллектуального ядра в присутствии эксперта.

На основе полученных результатов была разработана функциональная модель (рис. 5) жизненного цикла процесса построения ЭС с интеллектуальным ядром на основе нейросетевых моделей и поддерживающих механизмы удаленного доступа.

Практическая реализация. Информационная технология построения ЭС на основе нейросе-тевой модели и с распределенным вводом данных, соответствующая функциональной модели ЭС (рис. 5), заключается в последовательном выполнении следующих шагов:

- изучение объекта, для которого разрабатывается ЭС; выделение векторов входных характеристик и возможных выходных состояний данного объекта;

- накопление первичной информации об объекте в БД посредством распределенной сетевой системы сбора данных в течение периода, определяемого аналитической моделью (1);

- формирование первичной структуры ИНС-модели в соответствии с теоремой А.Н. Колмогорова и рис. 2;

- планирование поэтапного процесса обучения развивающейся ИНС-модели по предложенному уравнению (6); обучение ИНС-модели согласно предложенным аналитическим моделям;

- совершенствование ИНС-модели на основе вновь поступающих эмпирических данных под контролем эксперта, который определяет законченность формирования системы представления знаний;

- эксплуатация ЭС (без эксперта).

На основе сравнения разработанной технологии с существующими аналогами выделены ее функциональные преимущества, заключающиеся в следующем: универсальность - применительно к различным предметным областям (без внесения конструктивных изменений в программное обеспечение); многопользовательский доступ к одному объекту исследования; автоматизация процесса проектирования базы знаний за счет конструктивных алгоритмов построения ИНС-модели; поддержка сетевых технологий взаимодействия.

Выявлены условия, при которых может быть осуществлено применение разработанной технологии, такие как: возможность формализовать начальную структуру объекта и закодировать примеры его диагностики в числовом виде; наличие эксперта, обладающего высоким профессиональным уровнем (выше уровня рядового специалиста), способного адекватно оцени-

1854

вать параметрические данные объекта; достаточная квалифицированность пользователей, имеющих опыт использования сервисов, предоставляемых консорциумом WWW.

Осуществлена также компьютерная реализация информационной технологии на основе разработки специализированного программного комплекса.

Организация программного комплекса, который представляет собой веб-ориентированную интерактивную систему, состоящую из двух подсистем: информационной и интеллектуальной - представлена на рис. 6.

Основным назначением информационной подсистемы являются накопление, хранение, визуализация технической информации, а также обеспечение веб-ориентированного интерфейса. Компонентами подсистемы являются программно-логическое ядро, реализованное с помощью РНР-скриптов, и серверная система управления базами данных MySQL, с помощью которой была разработана структура связанных между собой таблиц, каждая из которых хранит определенную техническую информацию.

Интеллектуальная подсистема предназначена для реализации процессов построения, обучения, модификации, эксплуатации ИНС-моделей, являющихся самостоятельными системами представления знаний в ЭС. Подсистема включает 4 основных компонента: блок мониторинга данных, который обеспечивает передачу входных и выходных данных, отслеживает поступление новой информации в базу данных; преобразователь, осуществляющий подготовку обучающей выборки для сети; конструктор, обеспечивающий автоматизированное построение и обучение интеллектуальной модели (ИНС) исследуемого объекта.

Для апробации разработанного программного комплекса были построены три экспертные системы в двух предметных областях: медицинской и социологической.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Медицинская ЭС решала проблему общеклинического анализа крови по десяти показателям (уровень гемоглобина (г/л); скорость оседания эритроцитов (мм/ч); лейкоциты (109/л); эритроциты (1012/л); цветовой показатель; лейкоцитарная формула (5 составляющих)). Для построения модели знаний ЭС потребовалась обучающая выборка объемом в 350 примеров, при которой уровень погрешности ИНС модели достиг допустимого значения и стабилизировался, следовательно при этом ЭС стала пригодна для использования в режиме эксплуатации. Входными данными для ЭС были значения показателей крови, по рассчитанному ИНС-моделью выходному значению определялось состояние здоровья пациента (выходы: 1 - здоров, 2 - стационарное лечение, 3 - амбулаторное лечение, 4 - экстренная госпитализация (табл. 1)).

Пользователь

Г

Информационная подсистема

Рис. б. Структурная схема организации программного комплекса

1855

Таким образом, получена структура ИНС-модели (рис. 7), включающая 10 входных нейронов, 210 нейронов первого скрытого слоя, 21 нейрон второго скрытого слоя, один выходной суммирующий нейрон (в табл. 2 представлен фрагмент массива значений весовых коэффициентов синаптических связей нейронов, полученного в результате обучения ИНС-модели).

Рис. 7. Структурная схема ИНС-модели медицинской ЭС

Таблица 1

Результаты тестирования медицинской ЭС

Х1 Х2 Хз Х4 Х5 Х6 Х7 Х8 Х9 Х10 У

1 134 5 5,4 4,19 0,96 0 3 60 30 8 3

2 111 5 5,9 3,82 0,87 0 5 53 36 6 2

50 137 6 3,2 4,28 0,96 1 1 53 30 9 1

Таблица 2

Коэффициенты синаптических связей нейронов входного и первого скрытого слоев

ИНС-модели медицинской ЭС

Номера нейронов 1 2 3 4 5 6 7 8 9 10 11 12 13 14 210

1 0,074 0,052 0,099 0,063 0,076 0,080 0,090 0,034 0,033 0,064 0,071 0,050 0,089 0,078 0,040

2 0,047 0,009 0,039 0,053 0,079 0,036 0,070 0,099 0,068 0,019 0,096 0,090 0,011 0,011 0,038

10 0,013 0,001 0,057 0,006 0,018 0,027 0,076 0,087 0,008 0,017 0,086 0,054 0,074 0,079 0,012

При тестировании ЭС на данных, являющихся результатами общеклинического анализа крови и не участвовавших в процессе построения ИНС-модели, правильно было распознано 70 % введенных данных, для 25 % была дана близкая классификация, в 5 % случаев система ошиблась. Указанные показатели позволяют сделать вывод о применимости разработанной ЭС в медицинских учреждениях в качестве интеллектуального помощника при проведении общеклинического анализа крови начинающими специалистами.

Результаты этого примера применения и других (для социологических исследований), позволяют сделать вывод о работоспособности программного комплекса, являющегося практической реализацией разработанной автоматизированной технологии.

1856

ЛИТЕРАТУРА

1. Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Автоматизированная технология построения экспертных систем с интеллектуальным ядром на основе ИНС-моделей // Открытое образование. 2008. № 3 (68). С. 35-39.

2. Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Технология построения медицинской экспертной системы на основе аппарата искусственных нейронных сетей // Информационные технологии. 2009. № 8. С. 60-63.

3. Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Формализация проблемы разработки экспертной информационной системы с развивающимся интеллектуальным ядром на базе ИНС-моделей // Вестн. Тамб. ун-та. Сер. Естеств. и техн. науки. Тамбов, 2010. Т. 15. Вып. 1. С. 287-290.

4. Колмогоров А.Н. О представлении непрерывных функций нескольких переменных суперпозициями непрерывных функций меньшего числа переменных // Докл. АН СССР. 1956. Т. 108. № 2. С. 179-182.

5. Колмогоров А. Н. О представлении непрерывных функций нескольких переменных в виде суперпозиции непрерывных функций одного переменного // Докл. АН СССР. 1957. Т. 114. № 5. С. 953-956. (Цит. по книге: Горбань А.Н., Россиев Д. А. Нейронные сети на персональном компьютере. Новосибирск: Наука, 1996).

Поступила в редакцию 1 сентября 2010 г.

Arzamastsev A.A., Zenkova N.A., Neudahin A.V. Development of of expert informational system with developing intellectual kernel on the basis of ANN-models

Article is devoted to working out of the automated technology of construction of the expert systems combining functional advantages of the developing intellectual kernel and network technologies of interaction. Results of mathematical formalization of accumulation problems of information and construction on its basis the developing intellectual kernel are given.

Key words: automated expert system; developing intellectual kernel; neuro-net models; mathematical formalization of problems of accumulation of information.

1857

i Надоели баннеры? Вы всегда можете отключить рекламу.