Научная статья на тему 'Прикладные аспекты применения математико-статистических методов моделирования в медицине'

Прикладные аспекты применения математико-статистических методов моделирования в медицине Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
283
56
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОСЕТЕВОЙ АНАЛИЗ / МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ / СТАТИСТИЧЕСКИЙ АНАЛИЗ / КЛАСТЕРНЫЙ АНАЛИЗ / НЕЙРОИНФОРМАТИКА / NEURAL NETWORK ANALYSIS / MATHEMATICAL MODELING / STATISTICAL ANALYSIS / CLUSTER ANALYSIS / NEUROINFORMATICS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Супильников Алексей Александрович, Юхимец Сергей Николаевич

Обосновано использование нейросетевого анализа как одного из математических инструментов подтверждения результатов, полученных классическими методами статистического анализа. Проведение математического моделирования в рамках клинических и морфологических исследований позволяет значительно повысить эффективность работы, получить новую ценную информацию, вскрыть закономерности процессов морфогенеза.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ASPECTS OF MATHEMATICAL MODELING AND STATISTICAL METHODS IN MEDICAL

Justified the use of neural network analysis as a mathematical tool confirm the results obtained by classical methods of statistical analysis. Carrying out mathematical modeling in clinical and morphological studies can significantly improve performance, get valuable new information to reveal regularities of the processes of morphogenesis.

Текст научной работы на тему «Прикладные аспекты применения математико-статистических методов моделирования в медицине»

УДК 611.161 + 004.032.26 + 57.087.1

© 2012 А.А. Супильников, С.Н. Юхимец

ПРИКЛАДНЫЕ АСПЕКТЫ ПРИМЕНЕНИЯ МАТЕМАТИКОСТАТИСТИЧЕСКИХ МЕТОДОВ МОДЕЛИРОВАНИЯ В МЕДИЦИНЕ

Обосновано использование нейросетевого анализа как одного из математических инструментов подтверждения результатов, полученных классическими методами статистического анализа.

Проведение математического моделирования в рамках клинических и морфологических исследований позволяет значительно повысить эффективность работы, получить новую ценную информацию, вскрыть закономерности процессов морфогенеза.

Ключевые слова: нейросетевой анализ, математическое моделирование, статистический анализ, кластерный анализ, нейроинформатика.

В современном системном анализе применяется группа методов многомерного статистического анализа и специальные модели, среди последних различают статические и динамические. Статические модели служат для описания объектов на определенный момент времени. Динамические модели - для моделирования динамических процессов. Классификация математических моделей предполагает различение детерминистских, дискретных и непрерывных методов [1,2].

Все универсальные пакеты имеют много пересечений по составу входящих в них статистических процедур. Каждый из этих пакетов - это комплекс разнообразных математических методов, методов статистической обработки и визуализации данных. Использование того или иного пакета зависит от характера решаемых задач, объема обрабатываемых данных, квалификации исследователя и, конечно, его личных предпочтений. Кроме того, современные версии программ обладают, как правило, модульной структурой, что позволяет существенно экономить денежные средства [3].

Математическое моделирование и статистический анализ в клинической медицине, морфологии и физиологии требуют предельно точной постановки исходной задачи и соотнесения её с классами задач и условиями, в которых она является корректной. Следует учитывать, что задачи моделирования состояния патологических процессов и диагностические задачи тесно и взаимно переплетаются [4].

Такое описание исходного массива осуществляется за счет обнаружения скрытых функциональных или статистических связей между отдельными данными. Для решения задач подобного рода и используется кластерный анализ [5].

В статистических исследованиях группировка первичных данных является основным приемом решения задач классификации, а значит и основой всей дальнейшей работы с собранной информацией. Особенностью методов «классического» кластерного анализа является отсутствие обучающих выборок, то есть априорной информации о распределении генеральной совокупности [6]. Подчеркнем, что кластерный анализ способен решить общий вопрос, задаваемый исследователями: как организовать наблюдаемые данные в наглядные структуры, то есть развернуть таксономию, чтобы содержательно описать различия между отдель-

ными структурами. В ряде классификаций, чем выше уровень агрегации, тем меньше сходства между членами в соответствующем классе.

Данные, описывающие диагноз или реальный процесс (патологический), как правило, недостаточно обширны и для получения достоверных решающих диагностических правил требуются большие обучающие массивы. По этой причине уместно упомянуть основное требование к описанию заболевания - проводить исследование так, чтобы, не ухудшая возможности решения задач диагностики, создавать классификационную таблицу формализованных признаков [7].

В рамках кластерного анализа эта задача традиционно решается следующим образом: из множества признаков, описывающих объект, отбирается один, наиболее информативный с точки зрения исследователя, и производится группировка в соответствии со значениями данного признака. Если требуется провести классификацию по нескольким признакам, ранжированным между собой по степени важности, то сначала производится классификация по первому признаку, затем каждый из полученных классов разбивается на подклассы по второму признаку и так далее. Подобным образом строится большинство комбинационных статистических группировок.

Различия между схемами решения задач классификации во многом определяются тем, что понимают под понятиями «сходство» и «степень сходства». Если данные понимать как точки в признаковом пространстве, то задача кластерного анализа формулируется как выделение «сгущений точек», разбиение совокупности на однородные подмножества объектов [8,9].

Кластерный анализ является описательной процедурой, естественно, он не позволяет сделать никаких статистических выводов, но дает возможность провести своеобразную разведку - изучить «структуру совокупности». Представитель же другой стратегии - дискриминантный анализ позволяет изучать различия между двумя или более группами объектов по нескольким переменным одновременно [10]. Каждая группа объектов, характеристика которой дается с помощью дискриминантных переменных, может рассматриваться как значение некоторой классифицирующей переменной, измеренной по шкале наименований. Например, если дискриминантные переменные описывают состояние больного и метод лечения, то классифицирующая переменная включает формулу наименований вида «выздоровел - не выздоровел».

В случае, когда дискриминантные переменные зависят от классифицирующей, то есть принадлежность объекта к определенному классу вызывает изменения одновременно в нескольких переменных, дискриминантный анализ является аналогом обобщенного многомерного дисперсионного анализа. Например, классифицирующая переменная - заболевание, а дискриминантые переменные, на основании которых нужно поставить диагноз, характеризуют состояние больного [11].

Развитие новых информационных технологий все настойчивее требует использования нейроинформатики с привлечением её методов для решения возникающих задач из смежных и других областей человеческого знания [12]. Начало современным моделям нейронных сетей было положено в работе У. Мак-Каллока и У. Питтса [13 ]. Эти авторы сделали первую попытку эмулировать человеческие способности, классифицировать и распознавать образы.

В основе нейросетевого подхода лежит идея построения вычислительного устройства из некоторого числа связанных параллельно работающих простых процессирующих элементов -«нейронов», соединенных между собой однонаправленными каналами передачи информации -синапсами (рис. 1) [14].

а) Биологический нейрон

Слабое

влияние

X

о

о

и

<

Синапс

/^Дендрид следующей^ нейрона

і

X О о

и <

С и н а п с

Сильное

влияние

г

Следующий нейрон

Л

б) Сильные и слабые синаптические связи биологического нейрона

в) Нейрон У. Мак-Калоха и У. Питтса

Рис.1. Биологический и формальный (У.Мак-Калоха и У. Питтса) нейроны по А.И. Иванову и др. [14]

Нейросетевая классификация медицинских данных большей частью осуществляется с помощью самоорганизующихся карт Кохонена. На наш взгляд, это связано с широким распространением универсального пакета нейросетевого анализа NN8 «^айБйса» («:81а18ой», США).

Особое место среди нейросетевых экспертных систем занимают прогностические модели, применяемые для прогнозирования исходов заболеваний.

Следует подчеркнуть, что «нейроматематика» наряду с очевидными положительными моментами имеет ряд достаточно узких мест, которые нередко сводят к нулю все потенциальные преимущества нейронных сетей.

В целом на сегодняшний день нельзя однозначно рекомендовать применение искусственных нейронных сетей для всех известных практических приложений. Представляется, что применение искусственных нейронных сетей в каждом конкретном случае должно быть 20

обосновано. Необходимо дать хотя бы приближенное численное обоснование того, что для конкретного приложения плюсы нейронных сетей (распараллеливание и низкие требования к ресурсам при реализации существенно нелинейной обработки) оказываются сильнее множества минусов современной «нейроматематики».

В публикуемых разработках используются самые разнообразные архитектуры и алгоритмы функционирования нейронных сетей. Это приводит к тому, что для почти каждой задачи разрабатывается своя собственная архитектура и часто - уникальный алгоритм или уникальная модификация уже существующего алгоритма. С точки зрения практического применения такие экспертные системы почти не отличаются от традиционных программ принятия решений. Предложены даже методы преобразования традиционных экспертных систем в нейросетевые. Разработка таких систем требует участия специалистов по нейроинформатике. Работы о возможности их конструирования пользователем практически отсутствуют, что делает такие системы достаточно дорогими и не очень удобными для практического применения, поэтому в публикациях авторы в основном сравнивают качество работы ней-росетевых алгоритмов и традиционных систем, работающих по правилам вывода [15].

При разработке и создании нейросетевых моделей в медицине необходимо проводить оценку диагностической эффективности модели с расчетом её чувствительности, специфичности и точности. Чувствительность представляет собой отношение числа истинно положительных результатов к сумме истинно положительных и истинно отрицательных результатов, выраженное в процентах. Специфичность - отношение числа истинно отрицательных результатов к сумме истинно отрицательных и ложноположительных результатов, выраженное в процентах. Точность - это процент совпадения вида процесса, спрогнозированного нейронной сетью и установленного методом экспертной оценки.

Следующая проблема связана с оценкой эффективности применения и сравнения результатов нейросетевого анализа с другими. Здесь мы встречаемся с дискриминантным анализом линейным (параметрическим) по виду дискриминантных функций.

Для сравнения эффективности использования обученных искусственных нейронных сетей [16] нами был применен пошаговый метод дискриминантного анализа с включением переменной по значению Лямбды Уилкса. Величина этого критерия характеризует способность переменной различать («дискриминировать») прогнозируемые группы. На каждом шаге в линейный многочлен (линейная дискриминантная функция) включался показатель, который максимально уменьшал суммарную Лямбду Уилкса. Средние показатели точности для дискриминантных моделей даже несколько выше, чем для нейросетевых. Однако показатели чувствительности и специфичности лучше у нейросетевых моделей [16].

Следует подчеркнуть, что нейрокомпьютинг (нейросетевой анализ) мы используем как один из математических инструментов подтверждения результатов, полученных классическими методами статистического анализа.

Таким образом, проведение математического моделирования в рамках клинических и морфологических исследований является тем направлением, которое позволяет значительно повысить эффективность работы, получить новую ценную информацию, вскрыть закономерности процессов морфогенеза, а на заключительном этапе дает практические рекомендации или план дальнейших исследований.

СПИСОК ЛИТЕРАТУРЫ

1. Сергиенко В.И. Математическая статистика в клинических исследованиях / В.И. Сергиенко, И.Б. Бондарева. М.: ГЭОТАР-МЕД, 2001. 256 с.

2. Юнкеров В.И. Математико-статистическая обработка медицинских исследований / В.И. Юнкеров, С.Г. Григорьев. СПб.: ВМедА, 2002. 266 с.

3. Дюк В.А. Data Mining: учебный курс / В.А. Дюк, А. Самойленко. СПб.: Питер, 2001. 368 с.

4. Марчук Г.И. Математические модели в иммунологии / Вычислительные методы и эксперименты. 3-е изд.,

перераб. и доп. М.: Наука, 1991. 300 с.

5. Лапач С.Н. Статистические методы в медико-биологических исследованиях с использованием Excel / С.Н. Лапач, А.В. Чубенко, П.Н. Бабич. Киев : МОРИОН, 2000. 320 с.

6. Дубров А.М. Многомерные статистические методы: учебник / А.М. Дубров, В.С. Мхитарян, Л.И. Трошин. М.: Финансы и статистика, 1998. 352 с.

7. Гублер Е.В. Вычислительные методы анализа и распознавание патологических процессов. Л.: Медицина, 1978. 319 с.

8. Дюк В.А. Обработка данных на ПК в примерах. СПб.: Питер, 1997. 240 с.

9. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. Под ред. В.Э.Фигурнова. М.: ИНФРА-М, Фи-

нансы и статистика, 1995. 384 с.

10. Айвазян С.А., Степанов В.С. Программное обеспечение по статистическому анализу данных: методология сравнительного анализа и выборочный обзор рынка. M.: ЦЭМИ РАН, 1997. 402 с.

11. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. М.: МедиаСофт, 2003. 321 с.

12. Иванов А.И. Искусственные нейронные сети в биометрии, медицине и здравоохранении: монография / А.И. Иванов, С.Е. Кисляев, П. А. Гелашвили. Самара: ООО «Офорт», 2004. 236 с.

13. МакКаллок У. С., Питтс В. Логическое исчисление идей, относящихся к нервной активности // Нейрокомпьютер. 1992. № 3,4. С.40-53.

14. Горбань А.Н. Нейроинформатика / А.Н. Горбань, В.Л. Дунин-Барковский, А.Н. Кирдин [и др.]. Новосибирск: Наука, 1998. 278 с.

15. Гелашвили П. А. Морфологический анализ и математическое моделирование в изучении внутриорганной топографии кровеносных сосудов: монография / П.А. Гелашвили, В.М. Чучков, О.А. Гелашвили [и др.]. Самара: ООО «Офорт», 2008. 223с.

i Надоели баннеры? Вы всегда можете отключить рекламу.