Научная статья на тему 'Разработка и исследование модели диагностики легочных заболеваний на основе дискриминантного анализа'

Разработка и исследование модели диагностики легочных заболеваний на основе дискриминантного анализа Текст научной статьи по специальности «Клиническая медицина»

CC BY
231
67
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИАГНОСТИЧЕСКАЯ ДИСКРИМИНАНТНАЯ МОДЕЛЬ / ЛЕГОЧНЫЕ ЗАБОЛЕВАНИЯ / DIAGNOSTIC DISCRIMINANT MODEL / LUNG DISEASE

Аннотация научной статьи по клинической медицине, автор научной работы — Холопкина Л. В., Носачева М. П.

Обоснован выбор параметров и построена модель классификации на основе дискриминантного анализа. Приведены результаты исследования модели на примере диагностики легочных заболеваний

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по клинической медицине , автор научной работы — Холопкина Л. В., Носачева М. П.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT AND RESEARCH OF LUNG DISEASE DIAGNOSTIC MODEL BASED ON DISCRIMINANT ANALYSIS

The choice of parameters was justified and it was built the classification model based on the discriminant analysis. The results of investigation on the example of discriminant model diagnosis of pulmonary disease were given

Текст научной работы на тему «Разработка и исследование модели диагностики легочных заболеваний на основе дискриминантного анализа»

УДК 519.237

РАЗРАБОТКА И ИССЛЕДОВАНИЕ МОДЕЛИ ДИАГНОСТИКИ ЛЕГОЧНЫХ ЗАБОЛЕВАНИЙ НА ОСНОВЕ ДИСКРИМИНАНТНОГО АНАЛИЗА

Л.В. Холопкина, М.П. Носачева

Обоснован выбор параметров и построена модель классификации на основе дискриминантного анализа. Приведены результаты исследования модели на примере диагностики легочных заболеваний

Ключевые слова: диагностическая дискриминантная

Задачи медицинской диагностики относятся в общем плане к проблеме классификации и решаются с использованием компьютерных технологий [1,2] самыми разнообразными методами, среди которых особое место принадлежит дискриминантному анализу: как линейному, так и нелинейному. Выбор метода построения модели существенно определяется типом исходных данных, их точностью и достоверностью. Особая роль при отборе при отборе исходных данных в процессе построения модели отводится врачу-эксперту, квалификация которого должна быть достаточно высокой для оценки достоверности результатов .

На основании анализа опыта использования компьютерных технологий [36] был выбран для построения диагностической модели дискриминантный анализ, а в качестве объекта исследования -легочные заболевания детей.

Для решения проблемы диагностики были использованы методы дискриминантного анализа, которые позволяют устанавливать различия между двумя и более группами (классами) на основании исследования нескольких переменных, называемых дискриминантными.

Существуют определенные требования для дискриминантных переменных [7,8]:

- число дискриминантных переменных может быть неограниченным, но оно обязательно должно быть меньше, чем число объектов анализа, по крайней мере, на два;

- недопустимо использование линейно зависимых переменных;

- нормальное распределение каждой переменной внутри каждого из анализируемых классов.

Холопкина Людмила Владимировна - ВГТУ, канд. техн. наук, доцент, тел. (473)243-77-18

Носачева Майя Павловна - ВГТУ, ст. преподаватель, тел. (473)243-77-18

модель, легочные заболевания

Для построения диагностической модели было обследовано 103 ребенка раннего возраста, направленных в Областную детскую клиническую больницу № 2. После изучения истории жизни, осмотра, проведения комплексного лабораторного обследования детей и последующего наблюдения за детьми в течение 2 лет был поставлен клинический диагноз: обструктивный бронхит был выявлен у 60 детей (58,3 %), бронхиальная астма - у 43 детей (41,7 %). У многих детей отмечались сложности в дифференциальной диагностике этих заболеваний.

Полученные результаты были

использованы в дальнейшем, как при построении диагностической модели, так и при ее тестировании.

Индивидуальная карта наблюдения на каждого больного состояла из 228 параметров, адаптированных для анализа на компьютере.

Статистический анализ полученных данных проводился в операционной системе с использованием программы Statistica for Windows, version 10.0.

Алгоритм обработки данных включал следующие этапы:

1. Вычисление параметров описательной статистики в модуле Basic Statistics and Tables (Основные статистики и таблицы).

Во всей выборке в целом и по отдельным группам вычислялись следующие

статистические показатели [3]:

математическое ожидание - X, медиана Mе,

минимум - Xmin, максимум - Xmax, размах варьирования - R, коэффициент вариации -V , стандартное отклонение - Sx, дисперсия -

Dx, стандартная ошибка среднего - m .

2. Оценка характера распределения. Для оценки характера распределения анализируемых величин использовали Lilliefors test. Если изучаемые параметры имели нормальное распределение, то допускалось использование параметрических критериев. При отклонении гипотезы о

нормальном распределении величин использовались непараметрические критерии.

3. Проверка гипотез о достоверности или недостоверности различий по одному параметру между двумя сравниваемыми группами. В случае нормального распределения обеих выборок использовался парный 1>критерий (если значения наблюдений объединены в пары) или непарный 1>критерий (критерий Стьюдента).

При распределении хотя бы одной из анализируемых выборок, отличном от нормального распределения, использовали непараметрический критерий Манна-Уитни.

4. Оценка связей между параметрами. Для проверки гипотезы о наличии достоверных связей между изучаемыми параметрами рассчитывался коэффициент корреляции г(при нормальном

распределении изучаемых выборок) или коэффициент ранговой корреляции Спирмана Г (при распределении, отличном от

нормального хотя бы одной выборки).

5. Оценка информативности каждого из признаков на основе однофакторного дисперсионного анализа и с учетом его корреляционной взаимосвязи с другими параметрами. Был произведен выбор наиболее информативных параметров для построения дискриминантных моделей дифференциальной диагностики заболеваний и прогнозирования реинфекции в стационаре.

Результаты статистического анализа были учтены при выборе переменных,

удовлетворяющих требованиям

дискриминантного анализа.

Для построения дискриминантной модели дифференциальной диагностики между обструктивным бронхитом и бронхиальной астмой у детей раннего возраста были отобраны следующие 10 дискриминантных переменных:

- стимуляция родовой деятельности матери;

- число эпизодов бронхитов у детей;

- приступообразность одышки в прошлые эпизоды бронхитов;

- бронхиты с температурой менее 38°с;

- эффективность бронхолитиков;

- тяжелая степень атопического дерматита в прошлом;

- сенсибилизация к бытовым аллергенам;

- приступообразность начала одышки в данный бронхит;

- обложенность языка белым налетом;

- абсолютное число эозинофилов в крови при поступлении в стационар.

Для построения дискриминантной модели прогнозирования реинфекции ОРВИ в стационаре были отобраны следующие 9 параметров:

- курение при ребенке;

- асфиксия в родах;

- энцефалопатия в роддоме;

- проблемы с пищеварением;

- приступообразность возникновения одышки в прошлые эпизоды бронхита;

- бронхиты с температурой менее 38° в прошлом;

- эффект бронхолитиков в прошедшие бронхиты;

- атопический дерматит в прошлом;

- наличие лекарственной аллергии.

6. Создание компьютерной

дискриминантной модели дифференциальной диагностики обструктивного бронхита и бронхиальной астмы и дискриминантной модели прогнозирования реинфекции ОРВИ в стационаре на основе выбранных параметров.

Дискриминантный анализ использовался, чтобы на основе измерения нескольких признаков больного классифицировать его, то есть отнести его к одной из нескольких классов (диагнозов, состояний) оптимальным способом. Под оптимальным способом понимался минимум вероятности ложной классификации. При создании

дискриминантных моделей использовался стандартный вариант дискриминантного анализа с толерантностью 0,01 с использованием модуля Discriminant analysis (Дискриминантный анализ) программы Statistica for Windows, version 10.0.

Дискриминантная модель компьютерной дифференциальной диагностики была построена на основании информации о 69 пациентах (41 ребенок с обструктивным бронхитом и 28 детей с бронхиальной астмой).

Проверка созданной модели была осуществлена у 34 пациентов с неизвестным для компьютера диагнозом. При проверке дискриминантной модели правильный диагноз обструктивного бронхита был поставлен компьютером у 16 из 19 детей (84,2 %), правильный диагноз бронхиальной астмы - у 11 из 15 пациентов (73,3 %). Общее число правильных диагнозов - 27 из 34 (79,4 %).

Чувствительность созданной

дискриминантной модели для диагностики обструктивного бронхита составила 84,2 %, специфичность - 80,0 %, для диагностики

бронхиальной астмы чувствительность - 73,3 %, специфичность - 78,6 %.

Дискриминантная модель

прогнозирования реинфекции ОРВИ в стационаре была построена на основании данных о 56 пациентах раннего возраста с обструктивными бронхитами и бронхиальной астмой (43 ребенка без реинфекции ОРВИ и 13 детей с реинфекцией ОРВИ). Проверка созданной дискриминантной модели осуществлялась у 47 пациентов с обструктивными бронхитами и бронхиальной астмой с неизвестным для компьютера диагнозом. При проверке дискриминантной модели правильный компьютерный прогноз реинфекции ОРВИ был осуществлен у 9 из 10 детей (90,0 %), у которых действительно присоединилась реинфекция ОРВИ; правильный прогноз "лечение без реинфекции ОРВИ" произведен компьютером у 31 из 37 детей (83,8 %) без реинфекции ОРВИ. Общее число больных, у которых был осуществлен правильный компьютерный прогноз - 40 из 47 (85,1 %).

Чувствительность созданной

дискриминантной модели для прогнозирования реинфекции ОРВИ у детей раннего возраста с обструктивными бронхитами и БА составила 90,0 %, специфичность - 60,0 %; для прогнозирования лечения без реинфекции ОРВИ чувствительность - 83,8 %, специфичность - 96,9 %. Использование созданной модели поможет выделить 90 % детей с высоким риском реинфекции ОРВИ в стационаре.

Система компьютерной диагностики, примененная на этапе госпитализации больного в стационар, позволяет значительно снизить риск реинфекции, ускорит

выздоровление и уменьшит длительность нахождения в стационаре.

В качестве основного направления дальнейшего совершенствования модели и диагностической системы в целом следует использование других методов и алгоритмов в соответствии с принципами

многоальтернативности [1,2,5] для адаптации к типу исходных данных, что повысит точность диагностического заключения.

Литература

1. Подвальный С. Л. Многоальтернативные системы: обзор и классификация // Системы управления и информационные технологии. 2012. № 2 (48), С.4-13.

2. Подвальный С.Л. Информационно-управляющие системы мониторинга сложных объектов. Воронеж: Научная книга, 2010. - 164 с.

3. Подвальный С.Л. Методы многомерной классификации в задачах медицинской диагностики / С.Л. Подвальный, А.С. Матасов, И.А. Бырко// Машиностроитель. 2002. № 8. С.59-61.

4. Компьютерная система диагностики недостаточности кровотока на базе нелинейного дискриминантного анализа / С.Л. Подвальный, И.В. Окрачкова, О.В. Фирсов и др. // Вестник Воронежского государственного технического университета. - 2010. -Т. 6. - № 5. - С.145-148.

5. Podval'ny S.l. Intelligent modeling systems:design principles / S.L. Podval'ny, T.M. Ledeneva// Automation and renome control. 2013. T. 74. № 7. С. 1201-1210.

6. Подвальный, Е. С. Многоальтернативная диагностика на базе дискриминантного анализа Фишера с использованием ядра [Текст] / Е. С. Подвальный, А. В. Плотников // Вестник Воронежского государственного технического университета. - 2013. - Т.9. - № 1. - С.15-18.

7. Факторный, дискриминантный и кластерный анализ/ Под ред. И.С. Енюкова. М.: Финансы и статистика, 1989. 215 с.

8. Симчера В.М. Методы многомерного анализа статистических данных. М.: Финансы и статистика, 2008. 400 с.

Воронежский государственный технический университет

DEVELOPMENT AND RESEARCH OF LUNG DISEASE DIAGNOSTIC MODEL BASED

ON DISCRIMINANT ANALYSIS

L.V. Kholopkina, M.P. Nosacheva

The choice of parameters was justified and it was built the classification model based on the discriminant analysis. The results of investigation on the example of discriminant model diagnosis of pulmonary disease were given

Key words: diagnostic discriminant model, lung disease

i Надоели баннеры? Вы всегда можете отключить рекламу.