Научная статья на тему 'Применение нечеткого вывода с оптимизацией в диагностике синдрома эндогенной интоксикации'

Применение нечеткого вывода с оптимизацией в диагностике синдрома эндогенной интоксикации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
154
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
нечеткие нейронные сети / веса / база знаний / fuzzy net / weights / knowledge base

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Белова О. Ю.

На материале из Областной клинической больницы имени Н. Н. Бурденко о пациентах с хронической почечной недостаточностью была разработана система диагностики заболевания с использованием нечетких нейронных сетей. Сделан вывод, что ошибка составляет 1,7 % на выборке, состоящей из историй больных с хронической почечной недостаточностью в терминальной стадии. Нечеткая нейронная сеть на данных о больных в ранней стадии хронической почечной недостаточности дает ошибку, после оптимизации 3,8 %.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The materials about patients with chronic renal insufficiency were made from regional clinical hospital by Burdenko N. N. The system of diagnostics of endogenous intoxication with fuzzy net was developed. We concluded that the error makes 1,7 % on sample consists of medical histories about patients with terminal chronic renal insufficiency. Fuzzy net after optimization has error 3,8 % on sample consists of medical histories about patients with early chronic renal insufficiency.

Текст научной работы на тему «Применение нечеткого вывода с оптимизацией в диагностике синдрома эндогенной интоксикации»

ИЗВЕСТИЯ

ПЕНЗЕНСКОГО ГОСУДАРСТВЕННОГО ПЕДАГОГИЧЕСКОГО УНИВЕРСИТЕТА имени В. Г. БЕЛИНСКОГО ФИЗИКО-МАТЕМАТИЧЕСКИЕ И ТЕХНИЧЕСКИЕ НАУКИ № 13 (17)2009

IZ VESTIA

PENZENSKOGO GOSUDARSTVENNOGO PEDAGOGICHESKOGO UNIVERSITETA imeni V. G. BELINSKOGO PHYSICAL, MATHEMATICAL AND TECHNICAL SCIENCES № 13 (17)2009

УДК 593.1

ПРИМЕНЕНИЕ НЕЧЕТКОГО ВЫВОДА С ОПТИМИЗАЦИЕЙ В ДИАГНОСТИКЕ СИНДРОМА ЭНДОГЕННОЙ ИНТОКСИКАЦИИ

© о. Ю. БЕЛОВА

Пензенский государственный педагогический университет им. В. Г. Белинского, кафедра вычислительных систем и моделирования e-mail: [email protected]

Белова О. Ю. - Применение нечеткого вывода с оптимизацией в диагностике синдрома эндогенной интоксикации // Известия ПГПУ им. В. Г. Белинского. 2009. № 13 (17). С. 75-78. - На материале из Областной клинической больницы имени Н. Н. Бурденко о пациентах с хронической почечной недостаточностью была разработана система диагностики заболевания с использованием нечетких нейронных сетей. Сделан вывод, что ошибка составляет 1,7 % на выборке, состоящей из историй больных с хронической почечной недостаточностью в терминальной стадии. Нечеткая нейронная сеть на данных о больных в ранней стадии хронической почечной недостаточности дает ошибку, после оптимизации 3,8 %.

Ключевые слова: нечеткие нейронные сети, веса, база знаний.

Belova O. U. - Fuzzy net with optimization in the diagnostics of endogenous intoxication // Izv. Penz. gos. pedagog.

univ. im.i V. G. Belinskogo. 2009. № 13 (17). P. 75-78. - The materials about patients with chronic renal insufficiency were made from regional clinical hospital by Burdenko N. N . The system of diagnostics of endogenous intoxication with fuzzy net was developed. We concluded that the error makes 1,7 % on sample consists of medical histories about patients with terminal chronic renal insufficiency. Fuzzy net after optimization has error 3,8 % on sample consists of medical histories about patients with early chronic renal insufficiency. Keywords: fuzzy net, weights, knowledge base.

Синдром эндогенной интоксикации (СЭИ) остается одной из наиболее актуальных проблем в структуре современной соматической патологии. Это общепатологический синдром с клиническими проявлениями интоксикации при различных патологических состояниях, неоднородных по этиологии и тяжести. При СЭИ в тканях накапливаются биологические продукты, которые являются результатом реагирования на повреждающий фактор [1-2]. В ряде клинических ситуаций СЭи выполняет собственную, зачастую ведущую, роль в патогенезе, что существенным образом осложняет прогноз и течение заболевания.

Задачей данного исследования является применение нечеткого подхода в диагностике синдрома эндогенной интоксикации (СЭИ) больных.

Традиционным показателем, характеризующим состояние пациента, является общий и биохимический анализ крови. На основании маркеров СЭИ, показателей свидетельствующих о заболевании, были выделены наиболее информативные [1-4]:

- Мочевина,

- Креатинин.

Для нечеткой нейронной сети из полученных данных были сформированы обучающая, тестовая и

проверочная выборки. Так как вся выборка состоит из 84 историй болезни, пациентов с хронической почечной недостаточностью в терминальной стадии, она была поделена на три части. Выборка, состоящая из 40 историй болезни, пациентов в ранней стадии хронической почечной недостаточности, также была поделена на три части.

Нечеткая нейронная сеть представляет собой набор нечетких правил, которые описывают классы в имеющемся наборе исходных данных, и нечеткую систему вывода для их переработки с целью получения результата диагностики [3]. Нечеткое правило имеет следующий вид:

Як: Як: Еслих1 е Л1ки....х" е Л"к,

то класс у = Ск с весом Ук,

где Кк - метка к -го правила, х = (х1,... х") - п -мерный вектор входных признаков, у - выходной признак, Ак - нечеткое множество предпосылки правила Як, Ск - метка класса, V - вес или степень достоверности правила.

Эксперименты проводились на нечеткой нейронной сети с использованием алгоритма нечеткого вывода Сугено [5]. Основная особенность данного

алгоритма состоит в том, что заключения правил задаются не нечеткими термами, а линейной функцией от входов. Были определены термы-множества для входных и выходных переменных. В качестве терм-множества первой лингвистической переменной «Мочевина» использовалось множество Т4={«низкий уровень», «средний уровень», «высокий уровень»}, это множество также использовалось и для второй лингвистической переменной «Креатинин». В качестве терм-множества выходной лингвистической переменной «Состояние больного» использовалось множество Т3={«болен», «здоров»}.

Для моделирования укрупненных влияющих факторов использовались экспертные нечеткие базы знаний типа Сугено [4], приведенные в таблице, где х1, х2 - входные переменные, у - выходная переменная Элементы антецедентов нечетких правил связаны логическими операциями И (правила 1-9), ИЛИ (правила 10-11).

таблица 1

нечеткая база знаний для моделирования состояния больного (логическая операция и, или)

для выходной переменной используется константа в интервале [-1 1], т. к. используется алгоритм нечеткого вывода Сугено.

№ х2 у

1 Высокое Высокое Болен

2 Низкое Низкое Болен

3 Среднее Среднее Здоров

4 Высокое Низкое Болен

5 Низкое Высокое Болен

6 Среднее Высокое Болен

7 Высокое Среднее Болен

8 Среднее Низкое Болен

9 Низкое Среднее Болен

10 Высокое Высокое Болен

11 Низкое Низкое Болен

для входных переменных используется треугольная функция принадлежности. Эта функция используется для задания таких свойств множеств, которые характеризуют неопределенность типа: «приблизительно равно», «среднее значение», «расположен в интервале» [4-5]

0, х < а

(х ) =

х - a

b - a c - x

c - b 0, c < x

a < x < b b < x < c

где {а, Ь, с} - набор параметров данного слоя. Параметры этого слоя относятся к так называемым параметрам предпосылок.

На рисунке 3 представлено распределение функций принадлежности для каждой входной переменной.

Рис. Функции принадлежности для входных переменных

В Matlab Fuzzy Logic Toolbox настройка нечетких моделей типа Сугено осуществляется функцией anfis. Эта функция автоматически настраивает все параметры модели, поэтому после обучения иногда получаются непрозрачные нечеткие модели.

Нечеткая модель Сугено считается прозрачной при выполнении таких условий:

1) база знаний не является противоречивой или избыточной, т. е. не содержит правил с одинаковыми антецедентами;

2) база знаний согласована с количеством термов, т. е. каждый терм фигурирует хотя бы в одном нечетком правиле;

3) для произвольного входного вектора на выходе получается нечеткое множество;

4) по отдельности каждая функция принадлежности содержательно интерпретируется, т. е. соответствующее нечеткое множество является нормальным и выпуклым [4];

5) каждое терм-множество содержательно интерпретируется, т. е.:

• количество термов не слишком большое, чтобы эксперт каждому нечеткому множеству мог поставить в соответствие лингвистическую оценку;

• нечеткие множества разных термов не должны быть эквивалентными или почти эквивалентными. Следовательно, графики функций принадлежности соседних термов, например, "Низкий" и "Ниже среднего", должны различаться визуально;

ИНФОРМАТИКА ►►►►►

6) база знаний должна быть компактной, т. е. содержать минимальное (или близкое к нему) количество правил, необходимых для адекватного моделирования исследуемой зависимости. При большом числе входных переменных компактность базы знаний обеспечивает иерархическое представление правил [6-7]

Правила удовлетворены при формировании базы знаний и при обучении правила не изменяются. Для сохранения прозрачности нечеткой модели после обучения настраивали только веса нечетких правил, оставив координат максимумов функций принадлежностей равными границам изменения интервалов возможных значений входных переменных. Обычно настраиваются консеквенты правил и коэффициенты концентрации функций принадлежности входных переменных [10]. В данной работе в отличие от известных работ настраивались веса правил. Значения весов правил ограничим диапазоном [0, 1], так как вероятность может принимать значения только из этого интервала. Кроме того, потребуем, чтобы веса правил были не ниже 0, и не превышал 1.

Перед оптимизацией определяли количество термов лингвистической переменной (множество допустимых значений лингвистической переменной), количество правил в базе знаний. Настраиваем веса правил, они задаются случайным образом в соответствии с законом равномерного распределения. Полученные веса присваиваются нечетким правилам. В дальнейшем обучение проходит на настроенной сети.

для учета выше описанных ограничений разработали сценарий настройки (net.m) нечеткой модели, используя функции оптимизации Optimization Toolbox. Следующим шагом является настройка параметров оптимизации.

1. Минимальное изменение в переменных для конечно-разностных градиентов - 0, 000001;

2. Максимальное изменение в переменных для конечно-разностных градиентов - 0,1;

3. Используем среднемасштабный алгоритм. он применяет метод Последовательного квадратичного Программирования (SQP). В данном методе на каждой итерации решается подзадача квадратичного Программирования (QP). Вид матрицы Гессе для функции Лагранжа обновляется на каждой итерации с помощью формулы BFGS

hbfgs (H,ах, У) = H -

(Ax - Hy, y )AxAxT (Ax - Hy )AxT + Ax (Ax - Hy )T

После оптимизации веса правил приняли такие значения:

Таблица 2

Веса нечетких правил после оптимизации

(у, Ax )

(у, Ax )

Максимально число допустимых итераций - 55.

4. Максимально число допустимых расчетов функции - 150.

Использовалась функция ^шсоп. Данная функция находит минимум для скалярной функции нескольких переменных с ограничениями начиная с начального приближения. В общем случае, эта задача относится к нелинейной оптимизации с ограничениями [10].

№ правила вес правила

1 0,30

2 0,73

3 0,10

4 0,79

5 0,78

6 0,53

7 0,25

8 0,07

9 0,62

10 0,24

11 0,06

исследования проводились с использованием выборки, состоящей из историй болезни пациентов с хронической почечной недостаточностью в терминальной стадии, а также с использованием выборки пациентов с хронической почечной недостаточностью в ранней стадии.

Эксперименты на нечетких нейронных сетях показали, что на сети с 2-х элементным входом ошибка составляет 1,7 % на выборке, состоящей из историй больных с хронической почечной недостаточностью в терминальной стадии. из них 1 ошибка первого рода. Ошибка первого рода - это когда анализ показал заболевание, хотя на самом деле человек здоров [8-10].

Нечеткая нейронная сеть на данных о больных в ранней стадии хронической почечной недостаточности до оптимизации дает ошибку 19,03 %, после оптимизации 3,8 %, из них 1 ошибка первого рода. ошибка второго рода - это когда анализ показал отсутствие заболевания, хотя на самом деле человек болен [8-10]. Предложенная оптимизация весов нечеткой сети позволила в пять раз уменьшить погрешность диагностики.

СПИСОКЛИТЕРАТУРЫ

1. Капустин Б. Б., Старчиков С. В. , Ахметов Р. Ф. Способ определения степени эндогенной интоксикации у больных с абдоминальным сепсисом // Труды международного конгресса «Новые технологии в хирургии». Ростов на Дону, 2005. 47 с.

2. Круглов В. В., Дли М.И., Голунова Р.Ю. Нечеткая логика и искусственные нейронные сети . М.: Физмат-лит, 2001. 224 с.

3. Леоненков А. В. Нечеткое моделирование в среде МЛТЬЛВ и ^уТЕСН. СПб.: БХВ-Петербург, 2005. 736 с.

4. Малахова М. Я. Метод регистрации эндогенной интоксикации: Пособие для врачей. СПб.: Изд-во СПб МАПО, 1995. 34 с.

5. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия-Телеком, 2004. 452 с.

6. Ротштейн А. П. Интеллектуальные технологии идентификации: нечеткая логика, генетические алгоритмы, нейронные сети. Винница.: 1999. 320 с.

7. Ротштейн А. П., Кательников Д. И. Идентификация нелинейных зависимостей нечеткими базами знаний // Кибернетика и системный анализ. 1998. №5. С. 53-61.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Список функций Statistics Toolbox. Образовательный математический сайт: http://matlab.exponenta.ru/ statist/book2/index.php

9. Штовба С. Д. Введение в теорию нечетких множеств и нечеткую логику. http://matlab.exponenta.ru/ fuzzylogic/bookl/

10. Электронный учебник StatSoft: STATISTIC A 1.0. // Приложение к журналу "Компьютер пресс" CD-ROM 1999, № 9, "Компьютерное образование".

i Надоели баннеры? Вы всегда можете отключить рекламу.