Информационно-экстремальный алгоритм обучения системы диагностирования патологических процессов

Довбыш Анатолий Степанович; Джулгам Саад Абдуллах Саад Мохамед; Стадник Анна Анатольевна

ИНФОРМАЦИОННО-ЭКСТРЕМАЛЬНЫЙ АЛГОРИТМ ОБУЧЕНИЯ СИСТЕМЫ ДИАГНОСТИРОВАНИЯ ПАТОЛОГИЧЕСКИХ

ПРОЦЕССОВ

Довбыш Анатолий Степанович

д-р техн. наук, профессор Сумского государственного университета, г. Сумы,

Украина

E-mail: kras@id.sumdu.edu.ua Джулгам Саад Абдуллах СаадМохамед

аспирант Сумского государственного университета, г. Сумы, Украина

E-mail: saad710@mail. ru Стадник Анна Анатольевна аспирант Сумского государственного университета, г. Сумы, Украина

E-mail: anna_stadnik_16.12@mail. ru

THE INFORMATION-EXTREME LEARNING ALGORITHM OF PATHOLOGICAL PROCESS DIAGNOSIS SYSTEM

Dovbysh Anatoliy Stepanovich

dr. Sc., Professor of Sumy State University, Sumy, Ukraine Dzhulgam Saad Abdullah SaadMohamed phD student of Sumy State University, Sumy, Ukraine

Stadnyk Anna Anatol'evna

phD student of Sumy State University, Sumy, Ukraine

АННОТАЦИЯ

Статья посвящена повышению функциональной эффективности компьютеризированной системы диагностирования (КСД) патологических процессов. Рассматривается в рамках информационно -экстремальной интеллектуальной технологии оптимизация параметров обучения системы поддержки принятия решений (СППР), являющейся основной составляющей КСД при трёхальтернативных решениях. Показано, что использование трёхальтернативной системы оценок решений увеличивает оперативность обучения СППР.

ABSTRACT

The article is dedicated to functional efficiency enhancing of computerized diagnostic system (CDS) for pathological processes detection. Optimization of learning parameters of decision support system (DSS), which is the main component of CDS, is considered within the bounds of information-extreme intellectual

technology with threealternative solutions. It is shown that using of threealternative solutions grading system increases training operativeness of DSS.

Ключевые слова: информационно -экстремальный алгоритм; компьютеризированная система диагностирования; унимодальный классификатор; система оценок трёхальтернативных решений; оппортунистическая инфекция.

Keywords: information-extreme algorithm; computer diagnostic system; unimodal classifier; threealternative grading system of solutions; opportunistic infection.

Введение

Современный этап развития медицинских информационных систем характеризуется изменением направленности развития информационных технологий на создание интеллектуальной составляющей в процессах принятия решений при диагностировании и прогнозировании протекания и последствий лечения патологических процессов [1, 3]. Основным недостатком известных методов технологии Data Mining является нерешённая проблема инвариантности алгоритмов принятия решений от произвольных начальных условий. Одним из перспективных подходов к повышению функциональной эффективности является использование идей и методов информационно -экстремальной интеллектуальной технологии (ИЭИ-технологии), основанной на максимизации информационной способности системы поддержки принятия решений (СППР) в процессе её обучения [2, 4]. В работе [2] рассматривалась задача информационно-экстремального синтеза обучающейся СППР при двухальтернативной системе оценок решений. Одним из путей повышения достоверности компьютерного диагностирования является переход от двухальтернативной системы оценок принимаемых решений к трёхальтернативной в форме «Меньше нормы» -«Норма»-«Больше нормы».

В статье рассматривается задача информационно -экстремального обучения

компьютеризированной системы диагностирования (КСД) при трёхальтернативной системе оценок диагностических решений. 1. Формализованная постановка задачи

Рассмотрим обучающуюся СППР, являющуюся составной частью интеллектуальной КСД. Пусть дано алфавит классов распознавания

{Х°т | т = 1 ,М}, характеризующих функциональные состояния патологического процесса, и обучающую многомерную матрицу типа «объект-свойство»

|| у^ г1 = \,Ы, у = \,п ||, где Ж, и — количество диагностических признаков и

векторов-реализаций образа соответственно. Известен структурированный вектор g =< > параметров функционирования, влияющих на

функциональную эффективность СППР, и его ограничения .

Необходимо в процессе обучения оптимизировать значения координат вектора g, обеспечивающих максимум усреднённого по алфавиту {Х°т} информационного критерия функциональной эффективности (КФЭ) обучения СППР

1 м

Е =Т7 2>аХ Ет (1)

М т=1 {к}

где: Ет — КФЭ обучения СППР распознавать реализации класса Х°т;

{к} — упорядоченное множество шагов обучения.

В режиме экзамена необходимо принять решение о принадлежности распознаваемой реализации образа к одному из классов алфавита {Хт}.

2. Алгоритм обучения СППР

Идея обучения СППР в рамках ИЭИ-технологии состоит в оптимизации координат вектора параметров обучения g путём поиска максимального значения критерия (1) в рабочей (допустимой) области его определения. При этом в качестве параметров обучения выступают как параметры, влияющие на

геометрическую форму восстанавливаемых в радиальном базисе бинарного пространства признаков контейнеров классов распознавания, так и параметры, влияющие на топологию распределения реализаций образов. Необходимым условием использования трёхальтернативных решений при обучении является наличие нормированного алфавита классов распознавания, характеризующихся оценкой в форме «Норма», «Меньше нормы» и «Ещё меньше нормы». Особенность такого классификатора, который условно назовём унимодальным, состоит в том, что классы распознавания имеют единый центр рассеивания реализаций образов в отличие от полимодального классификатора, имеющего несколько центров рассеивания.

В качестве базового алгоритма обучения в ИЭИ-технологии выступает двухциклическая итерационная процедура оптимизации параметра поля контрольных допусков 5

8* = arg шах (шах Ет } , (2)

G5

где G§ — область допустимых значений контрольных допусков на признаки распознавания.

Рассмотрим схему алгоритма, восстанавливающего в процессе обучения СППР оптимальные контейнеры классов распознавания путем определения для

базового класса Xf оптимальных контрольных допусков по процедуре (2) при

их одновременном изменении для всех признаков распознавания.

Входными данными являются обучающая матрица и система нормированных допусков {§#}, определяющая область значений соответствующих контрольных допусков на признаки распознавания. За область значений параметра 5 принимается интервал [0; 8Н / 2]. Рассмотрим основные этапы реализации алгоритма (2): 1. В качестве базового принимается класс Xf, характеризующий

функциональное состояние процесса «Норма».

2. Обнуляется счетчик шагов изменения параметра 8: /:=0.

3. Инициализируется счетчик: /:=l+1 и вычисляются нижние Анк [I] и

верхние Авк [I] контрольные допуски для всех признаков:

8 8

АНкг [/] = Уи ~ §^; Авкг [/] = У 1,1 + ■, (3)

где: у1 г - I -й признак эталонного вектора-реализации у базового класса ХО,

характеризующего наиболее предпочтительное для лица, принимающего решения, функциональное состояние СППР.

4. Вычисляется для каждого т -го класса на каждом к -м шаге обучения значение усреднённого информационного КФЭ (1) и осуществляется поиск его глобального значения в рабочей (допустимой) области определения функции КФЭ и определение оптимальных геометрических параметров контейнеров классов распознавания, формирующие решающие правила.

В качестве критерия оптимизации параметров обучения СППР рассмотрим модификацию информационной меры Кульбака для трёхальтернативных решений, вычисляемую на к -м шаге обучения системы распознавать

реализации класса Х°т и выраженную через точностные характеристики:

1 2 П(к) + 4 - 4ГВ(Л) + <т(Л) 1

Е{к)_±ш(к) +1_2ГВ(*)+ст(*)Р*1ое, 1>т 1Рт т] (4)

где: — первая достоверность, ошибка второго рода и ошибка

третьего рода соответственно.

5. Если 8 < 8Я / 2, то выполняется пункт 3, иначе пункт 7.

6. Если максимальное значение критерия (4) находится в рабочей области

определения его функции, то выполняется пункт 8, иначе пункт 3.

7. Определяется оптимальный параметр поля контрольных допусков

* *

5 :=аг

8. Вычисляются по формуле (3) оптимальные значения контрольных допусков.

9. ОСТАНОВ.

Таким образом, информационно-экстремальное обучение СППР сводится к оптимизации контрольных допусков на признаки распознавания путём реализации итерационной процедуры поиска глобального максимума информационного КФЭ (1) в рабочей области определения его функции.

3. Результаты реализации алгоритма обучения

Рассмотрим реализацию алгоритма обучения СППР с использованием трьохальтернативной системы оценок: «Норма», «Меньше нормы» и «Ещё меньше нормы» для диагностирования оппортунистических инфекций у ВИЧ -инфицированных лиц. Алфавит классов распознавания состоял из трех классов: класс Х°, характеризующий контрольную группу лиц (практически здоровые доноры крови), класс Х° — ВИЧ-инфицированные лица с среднетяжелым течением заболевания (количество оппортунистических инфекций на одного больного от одной до двух) и класс Х° — ВИЧ-инфицированные лица с тяжелым течением заболевания (количество оппортунистических инфекций на одного больного более двух). Обучающие матрицы классов распознавания имели по 35 реализаций, каждая из которых состояла из 63 признаков распознавания. При этом вектор-реализация класса представлял структурированную последовательность клинико -лабораторных и иммуногенетических диагностических признаков, характеризующих: общее состояние пациента в момент обращения за медицинской помощью, поражения органов и систем, показатели клинического, биохимического анализа крови, исследование уровней популяций лимфоцитов и сывороточные уровни ГЬ -4, 1Ь-10, Т№-а, полиморфизмы единичных нуклеотидов генов цитокинов 1Ь-4 (-

590С/Т), 1Ь-10 (-592С/А), Т№-а (-3080/Л).

В качестве критерия оптимизации параметров обучения рассматривалась нормированная модификация функции (4)

Е(к) Т7 = т_ (5)

т, тах

где: > — КФЭ, вычисляемый по формуле (4);

^тах - максимальное значение критерия (4), вычисляемое при значениях

На рис. 1 показан график зависимости усреднённого нормированного КФЭ (5) от параметра поля допусков 8, полученного в процессе параллельной оптимизации системы контрольных допусков на признаки распознавания. На графике тёмные участки обозначают рабочие (допустимые) области определения функции КФЭ (5), в которых выполняются условия < 0,5,

с = р№) + &к) <0,5 и а >(Л

I т т " т т-1

Е 0,6

Рисунок 1. График зависимости критерия Кульбака от величины параметра поля контрольных допусков

Анализ рис. 1 показывает, что оптимальное значение параметра поля контрольных допусков равно 5* =±71% от усреднённых для класса Х°

значений диагностических признаков при максимальном значении КФЭ Ё* =0,58.

С целью повышения функциональной эффективности обучения был реализован алгоритм последовательной оптимизации контрольных допусков. При этом полученная при параллельной оптимизации система контрольных допусков рассматривалась как квазиоптимальная и была принята в качестве стартовой при реализации алгоритма последовательной оптимизации.

На рис. 2 показан график зависимости усредненного по алфавиту классов распознавания нормированного КФЭ (5) от количества итераций (прогонов) я при реализации алгоритма последовательной оптимизации контрольных допусков на признаки распознавания с использованием двухальтернативных решений.

E

1

0,8 0,6 0,4 0,2 0

1 2 3 4 s

Рисунок 2. График зависимости нормированного критерия Кульбака от количества итераций алгоритма обучения

Анализ рис. 2 показывает, что максимальное значение усредненного значения КФЭ Е =1 получено на втором прогоне алгоритма последовательной оптимизации.

При реализации алгоритма последовательной оптимизации контрольных допусков на признаки распознавания с использованием системы оценок трёхальтернативных решений усредненный по алфавиту классов распознавания нормированный КФЭ (5) достиг своего максимального значения Е =1 уже на первом прогоне итерационной процедуры. Это свидетельствует о том, что использование системы оценок трёхальтернативных решений позволяет

повысить оперативность построения безошибочных по обучающей матрице решающих правил.

На рис. 3 показано графики зависимости КФЭ (5) от радиусов гиперсферических контейнеров классов распознавания, полученные при реализации алгоритма последовательной оптимизации контрольных допусков на диагностические признаки распознавания.

Е1

Е2

0,8 0,6 0,4 0,2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0 2 4 6 8 10 12 14 16 18 а

а

0,8 0,6 0,4 0,2

8 10 12 14 16 18 20 22 24 26 а

б

Рисунок 3. Графики зависимости нормированного критерия Кульбака от радиусов контейнеров классов распознавания: а - класс Х°; б - класс Х°2

Анализ рис. 3 показывает, что оптимальные радиусы контейнеров классов распознавания равны: для класса Х° - =7 (в кодовых единицах), для класса Х° - сГ2 = 17. При этом внешнему контейнеру класса Х° принадлежат реализации, находящиеся на расстоянии от центра рассеивания, равном с1ъ > 17 и ограниченном размерностью пространства признаков, то есть с1*ъ = 63. Поскольку значения нормированного КФЭ достигают в процессе обучения

своего максимального граничного значения (Е = 1), то полученные оптимальные геометрические параметры восстановленных в радиальном базисе пространства диагностических признаков контейнеров классов распознавания позволяют построить безошибочные по обучающей матрице решающие правила.

В режиме экзамена решение принималось путем определения

1

0

максимального значения геометрической функции принадлежности по процедуре, имеющей для гиперсферического классификатора и реализаций класса Х° вид

*

if d[xm ®xe]<dm then e [0;1] else \xm^ < 0,

где: d[xm@xe\ — кодовое расстояние между эталонным вектором хт и распознаваемым вектором хе ;

d* — оптимальный радиус контейнера класса X^ .

По результатам физического моделирования в режиме экзамена СППР подтверждено работоспособность и надежность разработанного информационного и программного обеспечения. Выводы

1. Использование трёхальтернативной системы оценок решений в процессе обучения диагностической СППР приводит к увеличению значения информационного КФЭ и повышению оперативности алгоритма обучения по сравнению с двухальтернативными решениями.

2. В общем случае для построения безошибочных по обучающей матрице решающих правил может в соответствии с принципом отложенных решений потребоваться оптимизация других параметров функционирования СППР, влияющих на её функциональную эффективность.

Список литературы:

1. Барсегян А., Куприянов М.С., Степаненко В.В. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP: 2-е изд., перераб. и доп. СПб.: БХВ-Петербург. — 2007. — 384 с.

2. Довбыш А.С., Будник Н.Н., Москаленко В.В. Информационно -экстремальный алгоритм оптимизации параметров гиперэллипсоидных контейнеров классов распознавания // Международный научно -

технический журнал «Проблемы управления и информатики». — 2012. — № 5. — С. 111—119.

3. Симанков В.С., Луценко Е.В. Адаптивное управление сложными системами на основе теории распознавания образов. - Краснодар: техн. унт Кубан. гос. технол. ун-та. — 1999. — 318 с.

4. Dovbysh A.S., Martynenko S.S, Kovalenko A.S. Information-extreme algorithm for recognizing current distribution maps in magnetocardiography // Journal of Automation and Information Sciences. — 2011. — V. 43. — № 2. — P. 63— 70.

THE INFORMATION-EXTREME LEARNING ALGORITHM OF PATHOLOGICAL PROCESS DIAGNOSIS SYSTEM

Текст научной работы на тему «Информационно-экстремальный алгоритм обучения системы диагностирования патологических процессов»