Научная статья на тему 'Cравнительный анализ применения статистических методов и нейронных сетей для диагностики заболеваний опорно-двигательного аппарата'

Cравнительный анализ применения статистических методов и нейронных сетей для диагностики заболеваний опорно-двигательного аппарата Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
191
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАТИСТИЧЕСКИЕ МЕТОДЫ / НЕЙРОННАЯ СЕТЬ / ДИАГНОСТИКА / ЗАБОЛЕВАНИЯ ОПОРНО-ДВИГАТЕЛЬНОГО АППАРАТА / STATISTICAL METHODS / NEURAL NETWORK / DIAGNOSIS / DISEASES OF THE MUSCULOSKELETAL SYSTEM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Антонова Н. Е.

Статья посвящена исследованию эффективности использования статистических методов теории распознавания образов и нейронных сетей для диагностики заболеваний опорно-двигательного аппарата. Проведен анализ работоспособности системы и оценка точности предсказания заболевания.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Антонова Н. Е.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARATIVE ANALYSIS OF THE APPLICATION OF STATISTICAL METHODS AND NEURAL NETWORKS FOR DIAGNOSIS OF DISEASES OF THE MUSCULOSKELETAL SYSTEM

The article is investigated the effectiveness of the use of statistical methods of the theory of pattern recognition and neural networks for the diagnosis of diseases of the musculoskeletal system. The analysis and evaluation of system performance prediction of disease.

Текст научной работы на тему «Cравнительный анализ применения статистических методов и нейронных сетей для диагностики заболеваний опорно-двигательного аппарата»

УДК 614.23:616.71

Н.Е. Антонова

CРАВНИТЕЛЬНЫЙ АНАЛИЗ ПРИМЕНЕНИЯ СТАТИСТИЧЕСКИХ МЕТОДОВ И НЕЙРОННЫХ СЕТЕЙ ДЛЯ ДИАГНОСТИКИ ЗАБОЛЕВАНИЙ ОПОРНОДВИГАТЕЛЬНОГО АППАРАТА

Статья посвящена исследованию эффективности использования статистических методов теории распознавания образов и нейронных сетей для диагностики заболеваний опорно-двигательного аппарата. Проведен анализ работоспособности системы и оценка точности предсказания заболевания.

Статистические методы, нейронная сеть, диагностика, заболевания опорно-двигательного аппарата

N.E. Antonova COMPARATIVE ANALYSIS OF THE APPLICATION OF STATISTICAL METHODS AND NEURAL NETWORKS FOR DIAGNOSIS OF DISEASES OF THE MUSCULOSKELETAL SYSTEM

The article is investigated the effectiveness of the use of statistical methods of the theory of pattern recognition and neural networks for the diagnosis of diseases of the musculoskeletal system. The analysis and evaluation of system performance prediction of disease.

Statistical methods, neural network, diagnosis, diseases of the musculoskeletal system

Актуальность ранней диагностики заболеваний и различных патологий опорнодвигательного аппарата до сих пор остается нерешенной. Имеющиеся в распоряжении врача традиционные клинические средства определения нарушений движения человека не позволяют получить точную количественную и качественную информацию, поэтому используется опосредованная информация. [1] Таким образом, имеющиеся современные технологии восстановления или изменения двигательной функции не соответствуют средствам диагностики ее состояния.

Перспективным направлением является формализация задач медицинской диагностики, в частности, применение статистических методов теории распознавания образов и нейронных сетей.

Целью работы является исследование методов статистики и теории распознавания образов, позволяющих эффективно распознавать заболевание опорно-двигательного аппарата. Для решения поставленной задачи сформированы две группы наблюдений: обучающая и контрольная (объем выборки равен 200) и подготовлена обучающая информация. Далее проведен регрессионный и дискриминантный анализ с пошаговым исключением.

Статистический анализ данных осуществлялся с помощью пакета «Statistica 10.0» [2].

При проведении регрессионного анализа для оценки линейной связи между входными и выходными переменными определен коэффициент корреляции Гху = 0,998 что свидетельствует о существенной прямой корреляционной связи между снимаемыми при исследовании показателями и категорией обследованных [3].

Значение коэффициента детерминации R = 99,7% свидетельствует о том, модель можно считать в высокой степени информативной. Фактор Х и модель на 99,7% объясняет дисперсию выходной переменной. По значению критерия F = 4158,2 и уровню значимости р = 0,05754 модель следует признать значимой, ее достоверность близка к 100%. Таким образом, число наблюдений в эксперименте оказалось вполне достаточным для построения статистически значимой модели.

Рассмотрим значения коэффициентов модели и оценку их значимости. Свободный член a = 3,53; коэффициенты регресии bX = 0,17801, bY = 0,13021, bx = 0,00481, by = 0,07962, bL = 0,00403, bS = 0,00097, bA = 0,00123, bB =-0,09228 определяют характер изменения выходной переменной.

0,20 0,15 0,10

_со

аЗ

=3

■а

-0,10 -0,15 -0,20

-0,14 -0,12 -0,10 -0,08 -0,06 -0,04 -0,02 0,00 0,02 0,04 0,06 0,08 0,10 0,12 0,14

Residuals 10,95 Conf.lnt~|

Residuals vs. Deleted Residuals Dependent variable: CLASS

Рис. 1. График линии регрессии

Так как значимыми признаются коэффициенты с уровнем значимости р < 0,05, поэтому модель будет иметь вид

у = 0Д7801Х - 0,130217 - 0,07962* + 0,00403Ь + 0,000973 .

Далее рассмотрим результаты дискриминантного анализа с пошаговым исключением переменных. Оценка информативности показателей, включенных в линейную дискриминантную функцию, при проведении дискриминантного анализа показала, что наиболее информативными симптомами являются (с уровнем значимости р = 0,01) координаты смещения проекции центра тяжести во фронтальной и сагиттальной плоскостях, девиации во фронтальной и сагиттальной плоскостях, длина и площадь статокинезиограммы.

Линейные квалификационные функции рассчитываются по формулам:

ЛКФ1 = 11550,7 + 6,2X - 592,27 + 213,4* - 65,6у + 8,4Ь +1,73 +1536,3А;

ЛКФ2 = -13753,0 + 74,9X - 654,97 + 236,5* - 77,6у + 8,6Ь + 2,13 +1527,7А;

ЛКФ3 = -12317,8 + 256,7X - 609,77 + 231,7* - 82,7у + 6,5Ь + 2,33 + 978,0А;

ЛКФ4 = -11544,0 +131,7 X - 627,57 + 91,9* -176,7у + 16,1Ь + 2,23 +1357,4А.

Для решения задач медицинской диагностики следует использовать первые две канонических линейных дифференциальных функций с суммарным вкладом в дисперсию симптомов 98,5%.

Канонические линейные дифференциальные функции рассчитываются по формуле:

П = 41,9 - 0,64X + 0,157 + 2,29* +1,75у - 0,14Ь - 0,0033 + 0,57А;

^2 = 9,25 - 4,57X - 0,087 - 0,51* + 0,04у + 0,06Ь - 0,0093 +11,29А.

Рис. 2. Положение объектов четырех групп в координатах первой и второй канонических линейных дифференциальных функций

Решение диагностической задачи выполняется согласно графику на рис. 2, на котором нанесены центроиды четырех диагностируемых групп. Больного, для которого по его показателям определены F1 и F2 (Root1 и Root2), следует отнести к группе по минимальному расстоянию от соответствующего центроида.

Применение методов статистического анализа в рассматриваемой области ограничивается нечеткой трактовкой моделей нормы, адаптации и патологии. Наиболее универсальным инструментом диагностики являются нейронные сети [4].

Для разработки алгоритмов дифференциальной диагностики применялись методы математического моделирования по технологии нейронных сетей пакетов «Statistica Neural Networks 10.0» и «Statistica 10.0» (StatSoft, Inc., США).

Проведя анализ работоспособности системы с помощью нейронной сети, получили точность предсказания заболевания 85-90%.

Y (Target) vs. Y (Output) Samples: Train, Test

-20

-21 'і'г тТ«я[ сдршиуртр на

-23

-24

-25

J. -26

9, -27 >

-28

-29

-30

-31 -32 -33 рГТуУТу- ^

-29 -28 -27 -26 -25 -24 -23 -22 -21 -20 -19 -18 -17 Y (Target)

о 1.MLP 1-7-8 о 2.MLP 1-9-8 о 3.MLP 1-6-8 с. 4.MLP 1-4-8 о 5.MLP 1-4-8 -o-Y

Рис. 3. Результаты работы нейронной сети

В результате проведенной работы получена оценка эффективности диагностики заболеваний опорно-двигательного аппарата с помощью статистических методов и нейронных сетей. Точность предсказания заболевания составляет свыше 90% для статистических методов, и 85-90% для нейронных сетей, что свидетельствует о целесообразности использования статистических методов дальнейшего исследования и разработки алгоритмов дифференциальной диагностики.

ЛИТЕРАТУРА

1. Юнкеров В.И., Григорьев С.Г. Математико-статистическая обработка данных медицинских исследований. Военно-медицинская академия. СПб, 2002. 266 с.

2. Нейронные сети. Statistica Neural Networks. Методология и технологии современного анализа данных. Горячая Линия-Телеком, 2008. 392 с.

3. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. Статистические проблемы обучения. Наука. М., 1974. 416 с.

4. Хайкин С. Нейронные сети. 2006. 1104 с.

Антонова Наталья Евгеньевна -

аспирант кафедры «Системы искусственного интеллекта» Саратовского государственного технического университета имени Гагарина Ю.А.

Статья поступила в редакцию 7.03.12, принята к опубликованию 12.03.12

i Надоели баннеры? Вы всегда можете отключить рекламу.