Научная статья на тему 'Классификация степени тяжести заболевания на основе искусственных нейронных сетей'

Классификация степени тяжести заболевания на основе искусственных нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1526
142
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕДИЦИНА / MEDICINE / ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ / INTELLIGENT SYSTEMS / ЗНАНИЯ / KNOWLEDGE / ЗАБОЛЕВАНИЕ / ИСКУССТВЕННАЯ НЕЙРОННАЯ СЕТЬ / ARTIFICIAL NEURAL NETWORK / ПРЕЦЕДЕНТ / PRECEDENT / ILLNESS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Молодченков Алексей Игоревич, Фраленко Виталий Петрович, Хачумов Вячеслав Михайлович

Задача автоматической классификации степени тяжести заболеваний является актуальной, так как её решение существенно облегчает работу врача при анализе больших объёмов данных и постановке диагноза. Существуют различные подходы к решению этой задачи. Один из них связан с применением продукционных правил. Продукционные правила расширяют возможности представления знаний в клинической медицине и эффективны при построении диагностических систем. Отмечая перспективность применения продукционных правил, тем не менее, следует заметить, что решение на их основе реальных задач высокого уровня сложности требует больших объёмов вычислений и перестройки структуры системы правил при изменении условий задачи. В то же время в качестве эффективного альтернативного инструмента анализа сложных ситуаций и классификации широкое распространение получили искусственные нейронные сети (ИНС), которые позволяют проводить распознавание и диагностирование различных явлений и объектов высокой сложности путём обучения. В настоящей работе представлено исследование возможности применения различных нейронных сетей для анализа степени тяжести заболеваний на основе прецедентной информации. В частности, решены задачи определения степени тяжести обострения протрузии межпозвонкового диска и определения степени обострения бронхиальной астмы. Для улучшения распознавания обучающая выборка расширяется за счёт создания непротиворечащих условиям задачи дополнительных прецедентов. Использованы искусственные нейронные сети различной конфигурации и с разными функциями активации: однослойный и многослойный персептроны.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Молодченков Алексей Игоревич, Фраленко Виталий Петрович, Хачумов Вячеслав Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Illness Severity Classification Based on Artificial Neural Networks

The task of automatic classification of illness is very important since its solution greatly facilitates the work of a physician in a large amounts of data analysis and diagnosis. There are different approaches to solving this problem. One of them involves the use of production rules. Production rules empower knowledge representation in clinical medicine and effective in building diagnostic systems. Noting the prospects of applying production rules, however, it should be noted that the decision on the basis of their high complexity real problems requires large amounts of computation and restructure a system of rules at change of problem conditions. At the same time, as an effective alternative tool to analyze complex situations and classifications artificial neural networks (ANN) are widely used, which allow to perform the recognition and diagnosis of various phenomena and high complexity objects by training. This paper studies the possibility of using different neural networks to analyze an illness severity on the basis of precedential information. In particular, the problem of determining the severities of acute intervertebral disc protrusion and of acute acute asthma are solved. In order to improve recognition, the training set is expanded by creating additional precedents that that do not contradict the terms of the problem.The artificial neural networks of various configurations and with different activation functions are used: single-layer and multilayer perceptrons.

Текст научной работы на тему «Классификация степени тяжести заболевания на основе искусственных нейронных сетей»

УДК 004.89:616.7:616-01

Классификация степени тяжести заболевания на основе искусственных нейронных сетей

А. И. Молодченков*, В. П. Фраленко^, В. М. Хачумов*

* Федеральное государственное бюджетное учреждение науки Институт системного анализа Российской академии наук 117312 Москва, пр-т 60-летия Октября, 9 ^ Федеральное государственное бюджетное учреждение науки Институт программных систем им. А.К. Айламазяна РАН

152021 Ярославская область, Переславский район, с. Веськово, ул. Петра I, д.4а

Задача автоматической классификации степени тяжести заболеваний является актуальной, так как её решение существенно облегчает работу врача при анализе больших объёмов данных и постановке диагноза. Существуют различные подходы к решению этой задачи. Один из них связан с применением продукционных правил. Продукционные правила расширяют возможности представления знаний в клинической медицине и эффективны при построении диагностических систем. Отмечая перспективность применения продукционных правил, тем не менее, следует заметить, что решение на их основе реальных задач высокого уровня сложности требует больших объёмов вычислений и перестройки структуры системы правил при изменении условий задачи. В то же время в качестве эффективного альтернативного инструмента анализа сложных ситуаций и классификации широкое распространение получили искусственные нейронные сети (ИНС), которые позволяют проводить распознавание и диагностирование различных явлений и объектов высокой сложности путём обучения.

В настоящей работе представлено исследование возможности применения различных нейронных сетей для анализа степени тяжести заболеваний на основе прецедентной информации. В частности, решены задачи определения степени тяжести обострения про-трузии межпозвонкового диска и определения степени обострения бронхиальной астмы. Для улучшения распознавания обучающая выборка расширяется за счёт создания непротиворечащих условиям задачи дополнительных прецедентов. Использованы искусственные нейронные сети различной конфигурации и с разными функциями активации: однослойный и многослойный персептроны.

Ключевые слова: медицина, интеллектуальные системы, знания, заболевание, искусственная нейронная сеть, прецедент.

Введение

В работе [1] были рассмотрены особенности построения медицинских интеллектуальных систем на основе правил и механизмов, расширяющих возможности использования продукционных правил в клинической медицине при распознавании степени тяжести заболевания. Отмечается перспективность непосредственного использовании прецедентов и методов обучения в различных медицинских задачах. Как известно, одним из лучших инструментов в этой области являются искусственные нейронные сети. В частности, нейронные сети широко применяются для распознавания образов, ситуаций, прогнозирования потоков данных и сжатия изображений [2,3]. В этих работах на основе экспериментов показано, что нейронные сети могут быть эффективно использованы для обработки и классификации данных. В настоящей работе рассматривается возможность применения нейронных сетей для классификации степени заболеваний опорно-двигательного аппарата и дыхательной системы человека.

Статья поступила в редакцию 17 января 2014 г.

Работа выполнена в рамках проектов РФФИ № 13-07-12162 «Исследование и разработка методов и алгоритмов синтеза медицинских технологических процессов на основе прецедентной информации» и № 13-07-00025-а «Исследование методов анализа интегрированной текстовой, графической и речевой информации».

1. Постановка задачи распознавания

Будем решать задачу классификации, формулируемую следующим образом [4]. Пусть дано множество М объектов {ш^}; на этом множестве имеется разбиение на конечное число подмножеств (классов) 0&,к = 1 ,т, 1 0& = М. Каждый класс 0к имеет внутреннюю структуру, например, в виде некоторого множества объектов-эталонов. Объекты задаются значениями некоторых признаков х^,'} = 1,^ (этот набор всегда один и тот же для всех объектов, рассматриваемых при решении задачи). Совокупность значений признаков определяет описание объекта I (ш) = {х1,х2,... }. Информация о вхождении некоторого объекта ш в какой-либо класс представляется в виде информационного вектора (11 (ш), 12 (ш),... ,1т (ш)), где (ш) несёт информацию о принадлежности объекта ш к классу 0&:

если ш € 0к если ш € 0&

если неизвестна принадлежность ш к 0&.

Решение о принадлежности произвольного объекта Шг классу 0& принимается на основе сравнения расстояний между объектом и классами. Для решения этой задачи используются: методы дискриминантного анализа, информационный подход, метод потенциальных функций, искусственные нейронные сети, деревья решений, байесовский классификатор и другие методы.

Рассмотрим без потери общности задачу бинарной классификации [5]. Пусть задана исходная информация для объектов Шг, г = 1,...,т в виде обучающих выборок (см. табл. 1).

Таблица 1

Обучающая выборка классов ^ и

Объекты Признаки и их значения Класс

х1 Хр

Ш1 Х11 Х1р 01

1 01

Шт1 + 1 х(т1 + 1)1 %(т1 + 1)р 02

Хш1 хшр 02

Классы О1 и О2 представлены матрицами значений признаков Х1 и размерности (т1 х р) и (т2 х р) соответственно, причём т1 + т2 = т. Подобное представление входных данных является очень удобным для решения задач классификации нейронными сетями.

2. Задача классификации степени тяжести обострения протрузии межпозвонкового диска

Рассмотрим задачу определения степени тяжести обострения протрузии межпозвонкового диска. В качестве обучающей выборки возьмём данные табл. 2, в которой содержатся примеры классификации экспертами степени тяжести обострения протрузии межпозвонкового диска на уровне Ь5-Б1-позвонков. Примеры 1-3

1к м = \ 0,

А,

соответствуют тяжёлому обострению, примеры 4-7 — лёгкому обострению. Каждый пример задан набором из семи признаков, куда входят: анталгический наклон туловища, интенсивность болевого синдрома по шкале болевого аудита (от 0 до 120), Ахиллов рефлекс, чувствительность в промежности, чувствительность по дерматому Б1, сила в стопе (разгибание), характер мочеиспускания.

Таблица 2

Таблица прецедентов для задачи определения степени тяжести обострения

протрузии

Примеры Признаки

Анталгический наклон туловища Интенсивность болевого синдрома (0-120) Ахиллов рефлекс Чувствительность в промежности Чувствительность по дерматому Б1 Сила в стопе (разгибание) Мочеиспускание

1 2 3 4 5 6 7

П1 есть 41-120 отсутствует изменена изменена парез затруднено

П2 есть 41-120 норма норма изменена парез затруднено

П3 есть 41-120 норма изменена изменена норма норма

П4 нет 0-20 норма не изменена не изменена норма норма

П5 нет 21-40 отсутствует не изменена изменена норма затруднено

П6 нет 41-69 отсутствует изменена изменена парез затруднено

П7 есть >60 норма норма изменена норма норма

Для решения этой задачи будем использовать однослойную ИНС, содержащую два персептрона, как это показано на рис. 1. Выходы ИНС принимают значения от —1 до +1, при этом побеждает тот, у которого выход больше. Для подготовки данных и настройки нейронной сети имеющиеся в таблице логические признаки заменены на числовые следующим образом:

— анталгический наклон туловища: есть — 1, нет — 0;

— ахиллов рефлекс: отсутствует — 1, норма — 0;

— чувствительность в промежности: изменена — 2, не изменена — 1, норма — 0;

— чувствительность по дерматому Б1: изменена - 2, не изменена - 1, норма - 0;

— сила в стопе (разгибание): парез — 1, норма — 0.

Далее нейронная сеть была обучена по методу Видроу-Хоффа на расширенной учебной выборке (см. результирующие настройки в табл. 3), для чего каждый из примеров П1-П7 был искусственно дополнен ещё восемью непротиворечащими условиям прецедентами.

Дополним табл. 2 новыми данными, представленными в табл. 4, и выполним на её основе проверку корректности распознавания. Заметим, что:

1) для примера П2пе№:

— выход первого нейрона: 0, 6966;

— выход второго нейрона: —0,4294.

2) для примера П6пе№:

— выход первого нейрона: —0, 8898;

— выход второго нейрона: 1, 0851.

Рис. 1. Архитектура сети и вид функции активации

Таблица 3

Настройки ИНС на персептронах

Номер связи Вес связи нейрона 1 Вес связи нейрона 2

0 2, 03824425 -2,03251386

1 -0,00303476 0,00567939

2 -0,69657361 0,69450271

3 0, 52868771 -0,52111155

4 -1,14119816 1,16242325

5 0,02362459 -0,03530731

6 1,15992868 -1,14073264

Таблица 4

Проверочные данные

Пример Числовое значение признака

1 2 3 4 5 6 7

П2 1 80 0 0 2 1 1

П6new 0 50 1 2 2 1 1

Таким образом, ИНС правильно классифицирует не только примеры табл. 2, но и дополнительные прецеденты.

3. Задача классификации степени обострения бронхиальной астмы

Расширим исследования, проиллюстрировав возможности ИНС на примере определения степени обострения бронхиальной астмы. В качестве обучающей выборки возьмём примеры обострения бронхиальной астмы, содержащиеся в табл. 5.

Таблица 5

Примеры степеней обострения бронхиальной астмы

Примеры Признаки

Пульс ЧДД Сознание

П1 125 30 возбуждение

П2 130 25 возбуждение

П3 120 30 возбуждение

П4 120 25 возбуждение

П5 110 18 нет возбуждения

Каждый пример задан набором признаков, их значений и классифицирован экспертом. Используется всего три признака (в реальности их должно быть не менее девяти): пульс, частота дыхательных движений (ЧДД), состояние (сознание). Конечно, все данные в таблице условны и не обязаны соответствовать реальным ситуациям.

В табл. 5 примеры 1-3 соответствуют тяжёлому обострению, пример 4 — обострению средней степени, пример 5 — обострению лёгкой степени. Каждая строка соответствует одному вектору значений признаков.

Для настройки нейронной сети в имеющиеся логические признаки заменены на числовые: возбуждение — 0, нет возбуждения — 1. Для решения задачи классификации использована двухслойная нейронная сеть с четырьмя нейронами первого слоя и тремя нейронами второго слоя (см. рис. 2).

Рис. 2. Архитектура сети и вид функции активации

В нейронах использовалась активационная функция типа сигмойд / (5) = 1+е-а. На выходе сети сигнал принимает значения, лежащие в пределах от 0 до 1, причём побеждает тот нейрон, у которого выход больше. Для обучения используется метод обратного распространения ошибки. Результаты обучения представлены в табл. 6.

Результаты экспериментов на данных из обучающей выборки (см. табл. 5) дали следующие результаты:

1) для примера П2:

— выход первого нейрона: 0, 8857,

— выход второго нейрона: 0, 0438,

— выход третьего нейрона: 0, 0131;

2) для примера П4:

— выход первого нейрона: 0, 0626,

— выход второго нейрона: 0, 9648,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— выход третьего нейрона: 0, 0016;

3) для примера П5:

— выход первого нейрона: 0, 0537,

— выход второго нейрона: 0, 6185 ■ 10-5,

— выход третьего нейрона: 0, 9865.

Таблица 6

Настройки ИНС на нейронах с сигмойдами

Нейроны слоя 1 Веса связей слоя 1 Нейроны слоя 2 Веса связей слоя 2

Нейрон 1 -0, 72929650 Нейрон 1 4,96775818

Нейрон 1 4,09415245 Нейрон 1 6,00490713

Нейрон 1 -0, 94958502 Нейрон 1 4,85745764

Нейрон 2 -0, 75706023 Нейрон 1 -7, 73010015

Нейрон 2 3,33974790 Нейрон 2 8, 85942173

Нейрон 2 0,86849415 Нейрон 2 -7,04825926

Нейрон 3 0,91924751 Нейрон 2 -6,52516127

Нейрон 3 -4, 59275532 Нейрон 2 -5,47324800

Нейрон 3 1,28539204 Нейрон 3 -8,60115528

Нейрон 4 0,12968515 Нейрон 3 1,14342797

Нейрон 4 -0, 0824437 Нейрон 3 2,14581323

Нейрон 4 1,32225764 Нейрон 3 2,14907765

Таким образом, все прецеденты были правильно классифицированы искусственной нейронной сетью.

Заключение

Проведённые исследования показали, что нейронные сети могут успешно применяться для решения задач распознавания степени тяжести болезни даже при наличии ограниченной выборки. В случае малой обучающей выборки её можно расширить за счёт создания непротиворечащих условиям задачи дополнительных прецедентов. В зависимости от типа решаемой задачи могут быть использованы ИНС различной конфигурации и с разными функциями активации. В случае, когда приходится добавлять второй слой нейронов, используются более сложные типы настройки.

Литература

1. Методы искусственного интеллекта в клинической медицине. Синтез плана лечения на основе прецедентов / Г. И. Назаренко, А. Г. Назаренко, А. И. Молодченков, Г. С. Осипов // Информационные технологии и вычислительные системы. — 2010. — № 1. — С. 24-35. [Artificial Intelligence Methods in Clinical Medicine. Treatment Plan Synthesis Based on the Precedents / G. I. Nazarenko, A. G. Nazarenko, A. I. Molodchenkov, G. S. Osipov // Information Technologies and Computer Systems. — 2010. — No 1. — Pp. 24-35. — (in russian). ]

2. Хачумов В. М. О расширении функциональных возможностей искусственных нейронных сетей // Авиакосмическое приборостроение. — 2008. — № 5. — С. 53-59. [Khachumov V. M. About the Enhancement of Artificial Neural Networks

Functionality // Aerospace Instrumentation. — 2008. — No 5. — Pp. 53-59. — (in russian). ]

3. Анализ эффективности применения искусственных нейронных сетей для решения задач распознавания, сжатия и прогнозирования / А. А. Талалаев, И.П. Тищенко, В. П. Фраленко, В. М. Хачумов // Искусственный интеллект и принятие решений. — 2008. — № 2. — С. 24-33. [Analysis of the Artificial Neural Networks Applying Efficiency for Solving Recognition, Compression and Prediction Problems / A. A. Talalaev, I. P. Tishhenko, V. P. Fralenko, V. M. Khachumov // Artificial Intelligence and Decision Taking. — 2008. — No 2. — Pp. 24-33. — (in russian). ]

4. Журавлёв Ю. И. Об алгебраических методах в задачах распознавания и классификации // Распознавание. Классификация. Прогноз. Математические методы и их применение. — Наука, 1989. — Т. 1. — С. 9-16. [Zhuravlev Yu. I. Algebraic Methods in Pattern Recognition and Classification // Recognition. Classification. Prediction. Mathematical Methods and Their Application. — Nauka, 1989. — Vol. 1. — Pp. 9-16. — (in russian). ]

5. Толмачев И. Л., Хачумов М. В. Бинарная классификация на основе варьирования размерности пространства признаков и выбора эффективной метрики // Искусственный интеллект и принятие решений. — 2010. — № 2. — С. 310. [Tolmachev I.L., Khachumov M. V. Binary Classification Based on Feature Space Dimension Varying and Effective Metrics Choice // Artificial Intelligence and Decision Taking. — 2010. — No 2. — Pp. 3-10. — (in russian). ]

UDC 004.89:616.7:616-01

Illness Severity Classification Based on Artificial Neural

Networks

A. I. Molodchenkov*, V. P. Fralenko^, V. M. Khachumov*

* Institute for Systems Analysis of the Russian Academy of Sciences 9, pr. 60-letiya Oktyabrya, Moscow, Russia, 117312 ^ Ailamazyan Program Systems Institute of the Russian Academy of Sciences 4a, Peter I, Veskovo, Pereslavl-Zalessky Yaroslavl Region, Russia, 152021

The task of automatic classification of illness is very important since its solution greatly facilitates the work of a physician in a large amounts of data analysis and diagnosis. There are different approaches to solving this problem. One of them involves the use of production rules. Production rules empower knowledge representation in clinical medicine and effective in building diagnostic systems. Noting the prospects of applying production rules, however, it should be noted that the decision on the basis of their high complexity real problems requires large amounts of computation and restructure a system of rules at change of problem conditions. At the same time, as an effective alternative tool to analyze complex situations and classifications artificial neural networks (ANN) are widely used, which allow to perform the recognition and diagnosis of various phenomena and high complexity objects by training.

This paper studies the possibility of using different neural networks to analyze an illness severity on the basis of precedential information. In particular, the problem of determining the severities of acute intervertebral disc protrusion and of acute acute asthma are solved. In order to improve recognition, the training set is expanded by creating additional precedents that that do not contradict the terms of the problem.The artificial neural networks of various configurations and with different activation functions are used: single-layer and multilayer perceptrons.

Key words and phrases: medicine, intelligent systems, knowledge, illness, artificial neural network, precedent.

i Надоели баннеры? Вы всегда можете отключить рекламу.