Научная статья на тему 'Разработка решающих правил для системы подддержки принятия решений дифференциальной диагностики бронхиальной астмы'

Разработка решающих правил для системы подддержки принятия решений дифференциальной диагностики бронхиальной астмы Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
391
87
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ В МЕДИЦИНЕ / МЕДИЦИНСКИЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ / MATHEMATIC MODELING IN MEDICINE / MEDICAL INFORMATION TECHNOLOGY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Макарова Людмила Сергеевна, Семерякова Евгения Геннадьевна

Рассмотрены вопросы получения решающих правил для системы поддержки принятия решений дифференциальной диагностики бронхиальной астмы. Представлены и проанализированы результаты, полученные с помощью двух методов: нейронных сетей и дискриминантного анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Макарова Людмила Сергеевна, Семерякова Евгения Геннадьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Разработка решающих правил для системы подддержки принятия решений дифференциальной диагностики бронхиальной астмы»

УДК 004.9

Макарова Людмила Сергеевна, студент кафедры прикладной математики Института кибернетики ТПУ.

E-mail:

makarova_lyudmila@rambler.ru Область научных интересов: моделирование в медицине. Семерякова Евгения Геннадьевна, старший преподаватель кафедры естественнонаучных и специальных дисциплин Новокузнецкого филиала ТПУ.

E-mail:

semeryakova_eg@mail.ru Область научных интересов: методы математического моделирования, информационные медицинские технологии.

РАЗРАБОТКА РЕШАЮЩИХ ПРАВИЛ ДЛЯ СИСТЕМЫ ПОДДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ДИФФЕРЕНЦИАЛЬНОЙ ДИАГНОСТИКИ БРОНХИАЛЬНОЙ АСТМЫ

Л.С. Макарова, Е.Г. Семерякова

Томский политехнический университет E-mail: makarova_lyudmila@rambler.ru

Рассмотрены вопросы получения решающих правил для системы поддержки принятия решений дифференциальной диагностики бронхиальной астмы. Представлены и проанализированы результаты, полученные с помощью двух методов: нейронных сетей и дискриминантного анализа.

Ключевые слова:

Математическое моделирование в медицине, медицинские информационные технологии.

Диагностика играет в медицине важнейшую роль, и постановка диагноза требует от врача большого мастерства, знаний и интуиции. Точность диагноза и быстрота, с которой его можно поставить, зависят, разумеется, от очень многих факторов: от состояния больного, от имеющихся данных о симптомах и признаках заболевания и результатах лабораторных анализов, от общего объема медицинской информации о наблюдении таких симптомов при самых различных заболеваниях и, наконец, от квалификации самого врача. Своевременно поставленный точный диагноз часто облегчает выбор метода лечения и значительно повышает вероятность выздоровления больного. Исходя из всех этих соображений, вполне естественно попытаться определить условия, при которых диагноз может быть поставлен максимально быстро и точно. В течение многих веков врачи с переменным успехом предпринимали попытки решить эту задачу. Однако в последние годы благодаря применению современных методов лечения и диагностики, основанных на новейших достижениях науки и техники, возможности получения успешных результатов значительно возросли. Поэтому важно найти точные методы описания, исследования, оценки и контроля процесса постановки диагноза. Нейронные сети - мощный метод для решения задач распознавания образов в ситуациях, когда в экспериментальных данных отсутствуют значительные фрагменты информации, а имеющаяся информация предельно зашумлена [1].

Также в медицинской диагностике распространен дискриминантный анализ. При его использовании главным показателем является точность классификации.

Нейронные сети представляют собой нелинейные системы, позволяющие гораздо лучше классифицировать данные, чем обычно используемые линейные методы. В приложении к медицинской диагностике они дают возможность значительно повысить специфичность метода, не снижая его чувствительности.

В отличие от традиционных средств обработки информации, программирование нейронных сетей осуществляется неявно в процессе обучения. Обучение строится следующим образом: существует так называемый задачник, то есть набор примеров с заданными ответами. Эти примеры предъявляются системе. Нейроны получают условия примеров и преобразуют их. Далее нейроны несколько раз обмениваются преобразованными сигналами и, наконец, выдают ответ в виде набора сигналов. Отклонение от правильного ответа штрафуется. Обучение заключается в минимизации штрафа как неявной функции связей.

Важнейшее свойство нейронных сетей, свидетельствующее об их огромном потенциале и широких прикладных возможностях, состоит в параллельной обработке информации одновременно всеми нейронами. Благодаря этой способности при большом количестве межнейрон-ных связей достигается значительное ускорение процесса обработки информации. Очень большое количество межнейронных соединений приводит к тому, что сеть становится нечувствительной к ошибкам, возникающим в отдельных контактах. Функции поврежденных соединений принимают на себя другие элементы, в результате в деятельности сети не наблюдаются заметные нарушения [2]. Другое, не менее важное, свойство нейронной сети состоит в способности к обучению и к обобщению полученных знаний [3].

Дискриминантный анализ - это раздел математической статистики, содержанием которого является разработка методов решения задач различения (дискриминации) объектов наблюдения по определенным признакам. При использовании метода дискриминантного анализа главным показателем является точность классификации, и этот показатель можно легко определить, оценив долю правильно классифицированных при помощи прогностического уравнения наблюдений. Если исследователь работает с достаточно большой выборкой, применяется следующий подход: выполняется анализ по части данных, а затем прогностическое уравнение применяется для классификации наблюдений во второй половине данных. Точность прогноза оценивается, т. е. происходит перекрестная верификация. В дискриминантном анализе существуют методы пошагового отбора переменных, помогающие осуществить выбор предсказывающих переменных [4].

Рассмотрим возможности использования нейросетевых технологий и дискриминантного анализа в задачах медицинской диагностики на примере задачи дифференциальной диагностики бронхиальной астмы.

Имеется выборка X из т объектов (пациентов, с различными формами бронхиальной астмы), характеризующихся п переменными (показатели бронхолегочной системы)

V Хт1

где г - номер объекта (пациента);у - номер переменной (признака).

Вектор У = {у1,...,уь...,ук}, где у,- один из возможных диагнозов (различные формы бронхиальной астмы); к - количество диагностируемых классов (возможных диагнозов).

Таким образом, задача заключается в построении модели дифференциальной диагностики бронхиальной астмы, т. е. в построении решающего правила для отнесения ,-го объекта (, = 1...т) (пациента) с определенным набором признаков у ( = 1...п) к одному из имеющихся классов у, (г = 1...к) (диагнозов), т. е. решение задачи классификации.

Задача классификации представляет собой задачу отнесения образца к одному из нескольких попарно не пересекающихся множеств. При решении задач классификации необходимо отнести имеющиеся статические образцы (характеристики ситуации на рынке, данные медосмотра, информация о клиенте) к определенным классам. Возможно несколько способов представления данных. Наиболее распространенным является способ, при котором образец представляется вектором. Компоненты этого вектора представляют собой различные характеристики образца, которые влияют на принятие решения о том, к какому классу можно отнести данный образец. В нашем случае в качестве компонентов этого вектора будут данные из медицинской карты больного. Таким образом, на основании некоторой информации о примере, необходимо определить, к какому классу его можно отнести. Классификатор, таким образом, относит объект к одному из классов в соответствии с определенным разбиением ^-мерного пространства, которое называется пространством входов, и размерность этого пространства является количеством компонент вектора.

Персептрон представляет собой сеть, состоящую из нескольких последовательно соединенных слоев формальных нейронов МакКаллока и Питтса. На низшем уровне иерархии находится входной слой, состоящий из сенсорных элементов, задачей которого является только прием и распространение по сети входной информации. Далее имеются один скрытый слой. Каждый нейрон на скрытом слое имеет несколько входов, соединенных с выходами нейронов

тп /

предыдущего слоя или непосредственно со входными сенсорами X1..Xn, и один выход. Нейрон характеризуется уникальным вектором весовых коэффициентов W. Веса всех нейронов слоя формируют матрицу, которую мы будем обозначать V. Функция нейрона состоит в вычислении взвешенной суммы его входов с дальнейшим нелинейным преобразованием ее в выходной сигнал:

у = -(у щх,-®). (1)

1 + e ’

Выходы нейронов последнего, выходного, слоя описывают результат классификации У = У(X). Матрицу весовых коэффициентов от входов к скрытому слою обозначим W, а матрицу весов, соединяющих скрытый и выходной слой - как V. Для индексов примем следующие обозначения: входы будем нумеровать только индексом г, элементы скрытого слоя - индексом у, а выходы - индексом к.

Пусть сеть обучается на выборке (Ха,Уа), а = 1...р. Активности нейронов будем обозначать малыми буквами у с соответствующим индексом, а суммарные взвешенные входы нейронов - малыми буквами х. Начальные значения весов всех нейронов всех слоев V (? = 0) и W (? = 0) полагаются случайными числами. Сети предъявляется входной образ Ха, в результате формируется выходной образ Уа. При этом нейроны последовательно от слоя к слою функционируют по следующим формулам:

• скрытый слой:

х‘Ъя'Х ' у, = /(х,) ■

выходной слой:

хк =

У/кУг , Ук = / (Хк)

Здесь /(х) - сигмоидальная функция, определяемая по формуле (1).

Функционал квадратичной ошибки сети для данного входного образа имеет вид:

Е=2у,(л - уа)2.

Таким образом, необходимо найти матрицу весов V, которая даст минимальную ошибку обучения нейронной сети.

Альтернативными способами решения задач классификации являются методы дискриминантного анализа, в котором реализованы методы классической статистики. В теории анализа многомерных данных всесторонне разработаны процедуры построения линейных дискриминантных функций (ЛДФ), обеспечивающих при определенных предположениях минимум критерия средней вероятности ошибочной классификации. Так, для случая двух классов 0)1 и ю2 методы построения ЛДФ опираются на два предположения [5].

Первое состоит в том, что области ^ и 02, в которых концентрируются объекты из двух классов могут быть разделены (р-1)-мерной гиперплоскостью:

у(х) + ^0 = п,1 х + х2 +... + wpxp = 0.

Коэффициенты wi в данном случае интерпретируются как параметры, характеризующие наклон гиперплоскости к координатным осям, а w0 называются порогом и соответствует расстоянию от гиперплоскости до начала координат. Второе предположение касается критерия качества разделения областей Д и 02 гиперплоскостью у(х) + w0 = 0. Вектор оптимальных весовых коэффициентов w определяется следующим образом:

w = ^-1(т1 - т2), где т, - вектор средних значений признаков для класса wi.

Если объекты каждого класса имеют многомерное нормальное распределение с одинаковой ковариационной матрицей Б и векторами средних значений mi, то пороговое значение

, минимизирующее критерий средней вероятности ошибки, будет:

=-ю (щ + т2) +т——.

2 Р( (о2)

В качестве исходной информации использовались данные клиники, в которой зарегистрированы результаты клинических исследований больных с различными формами бронхиальной астмы: психогенно-индуцированная; сомато-психогенная; непсихогенная и психогенная одышка (не болеют бронхиальной астмой). Данные получены Е.В. Немеровым (подробное описание в [5, 6]). Для каждого человека имеются результаты анализов: физиологические показания дыхания (минутный объем дыхания, жизненная емкость легких, форсированная емкость легких, объем форсированного выдоха за 1 с и т. д.), психологические показания (депрессия по Беку, депрессия по Цунгу, тревога реактивная, тревожность личностная, тревога по Шихану, степень вентиляционной недостаточности и т. д.), индексированные значения физиологических показаний - динамика показателей функции легких. В общем 173 различных показаний, по которым можно наиболее точно определить болеет ли человек бронхиальной астмой, и если да, то ее тип.

Нейрон представляет собой единицу обработки информации в нейронной сети. На рис. 1 приведена модель нейрона, лежащая в основе искусственных нейронных сетей.

Вход I---

IV,

Синапс

Сумматор

Функция

активации

оит

Аксон

-►О

Выход

Рис. 1. Модель искусственного нейрона

В этой модели нейрона можно выделить три основных элемента:

• синапсы, каждый из которых характеризуется своим весом или силой. Осуществляют связь между нейронами, умножают входной сигнал Хі на весовой коэффициент синапса , характеризующий силу синаптической связи;

• сумматор, аналог тела клетки нейрона. Выполняет сложение внешних входных сигналов или сигналов, поступающих по синаптическим связям от других нейронов. Определяет уровень возбуждения нейрона;

• функцию активации, определяющую окончательный выходной уровень нейрона, с которым сигнал возбуждения (торможения) поступает на синапсы следующих нейронов.

Модель нейрона имитирует в первом приближении свойства биологического нейрона. На вход искусственного нейрона поступает некоторое множество сигналов, каждый из которых является выходом другого нейрона. Каждый вход умножается на соответствующий вес, пропорциональный синаптической силе, и все произведения суммируются, определяя уровень активации нейрона.

Для построения модели дифференциальной диагностики бронхиальной астмы будем использовать многослойный персептрон.

На практике чаще всего используют двухслойный персептрон. Рассмотрим схему двухслойного персептрона, представленную на рис. 2.

Рис. 2. Структурная схема двухслойного персептрона.

Здесь g¡, 1 = 1, 2, ..., Ь - выходные сигналы первого слоя нейронов. Верхние индексы в скобках (т), т = 1, 2, означают номер слоя нейрона.

Для исключения коллизий следует отметить, что понятие «слой» часто применяют по отношению к сигналам ИНС (а не к нейронам). В таком смысле представленная на рисунке сеть

- трехслойная: входные сигналы сети х,,х2,... хИ составляют входной слой, выходные сигналы первого нейронного слоя ^1,^2, - ■ ■ 8Ь образуют первый скрытый слой, а выходные сигналы уьу2,--- Ум - слой выходной. Для обозначения структуры сети используется кодировка в виде «И-Ь-М».

Выходные сигналы нейронных слоев легко рассчитываются по следующим формулам:

8! X 1¡о ¡У1 хА1 =1’Ь >

У = /(Х^о ¡¡2) ) = /(Х^о ¡¡2)/(Е*1о ЧЧ »’* = Ь м ’

Необходимо подчеркнуть, что функции активации абсолютно всех нейронов сети абсолютно идентичны. Цель обучения многослойного нейрона заключается в подборе таких значений всех весовых коэффициентов сети ¡'Х)ц и ¡(2)ц, которые обеспечивают максимальное совпадение выходного вектора Ук и эталонного вектора ожидаемых значений Вк при предъявлении входного вектора Хк.

В случае единичной обучающей выборки <Х, Б> целевая функция задается в виде:

е(Ю=-2хМ,<у<-4)2 к=1ГР

В случае нескольких обучающих пар <Хк,Вк >, целевая функция превращается в сумму по всем парам:

е ^) - 2 е :.х м,(у - <>. >!-

Для компьютерной реализации диагностической модели с помощью многослойного персептрона была выбрана система МайаЪ, для реализации модели с помощью дискриминантных функций выбрали систему 81а1СгарЫс8. В результате была построена модель дифференциальной диагностики бронхиальной астмы, которая с определенной точностью может отнести индивида к определенной группе из представленных четырех.

После исследования модели в двух разных программах получили следующие результаты:

1. Модель, построенная с помощью многослойного персептрона, не во всех случаях является надежной. Обучив и протестировав полученную модель, можно сделать вывод, что для построения нейросети нужно больше примеров - показателей больных бронхиальной астмой.

При физиологических показаниях мы получили неудовлетворительные результаты. Такая модель является ненадежной. При моделировании с психологическими показаниями и индексами физиологических и психологических показаний мы получили хорошие результаты

- совпадение свыше 80 %, что говорит о надежности полученной модели.

2. Модель, построенная с помощью дискриминантного анализа, дала наилучшие результаты в случае использования физиологических показателей больных - точность диагностики больных первой группы составляет 95,65 %, второй группы - 94,74 % и третьей группы 93,10 %. Это довольно точные результаты, которые могут в какой-то мере содействовать окончательному заключению специалиста. Вместе с тем констатация отсутствия бронхиальной астмы (группа 4) осуществляется со 100 % надежностью. При использовании психологических показателей качество распознавания построенной модели не превышало 50 %. При индексах физиологических и психологических показателей мы получили следующие результаты: качество распознавания на контрольной выборке составило 82 %, что является достаточно хорошим результатов для задач медицинской диагностики.

Полученная диагностическая модель будет использована в системе поддержки принятия решения дифференциальной диагностики различных форм бронхиальной астмы.

СПИСОК ЛИТЕРАТУРЫ

1. Ежов А.А., Чечеткин В.Н. Нейронные сети в медицине // Открытые системы. - 2007. - № 4.

- С. 34-37.

2. Тархов Д.А. Нейронные сети. Модели и алгоритмы. - М.: Радиотехника, 2005. - 168 с.

3. Галушкин А.И. Теория нейронных сетей. Кн.1 / Общ. ред. А.И. Галушкина. - M.: ИПРЖР, 2000. - 416 с.

4. Дюк В., Эмануэль В. Информационные технологии в медико-биологических исследованиях. - СПб.: Питер, 2003. - 528 с.

5. Немеров Е.В., Языков К.Г. К вопросу изучения личностных свойств в психофизиологической реактивности больных бронхиальной астмой на аудиовизуальную стимуляцию // Вестник ТГПУ. - 2011. - Вып. 6 (108). - С. 134-137.

6. Берестнева О.Г., Осадчая И.А., Немеров Е.В. Методы исследования структуры медицинских данных // Вестник науки Сибири. Серия: Медицинские технологии. - 2012. - Т. 2. - № 1. - C. 333-338. URL: http://sjs.tpu.ru/joumal/article/view/245/250. (дата обращения: 10.03.2012).

Поступила 23.04.2012 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.