ИЗВЕСТИЯ
ПЕНЗЕНСКОГО ГОСУДАРСТВЕННОГО ПЕДАГОГИЧЕСКОГО УНИВЕРСИТЕТА имени В. Г. БЕЛИНСКОГО ФИЗИКО-МАТЕМАТИЧЕСКИЕ И ТЕХНИЧЕСКИЕ НАУКИ № 18 (22) 2010
IZVESTIA
PENZENSKOGO GOSUDARSTVENNOGO PEDAGOGICHESKOGO UNIVERSITETA imeni V. G. BELINSKOGO PHYSICAL, MATHEMATICAL AND TECHNICAL SCIENCES № 18 (22) 2010
УДК 004.032.26
ПРОГРАММА ДИАГНОСТИКИ СИНДРОМА ЭНДОГЕННОЙ ИНТОКСИКАЦИИ
© О. Ю. БЕЛОВА, Р. Н. КУЗНЕЦОВ Пензенский государственный педагогический университет им. В. Г. Белинского, кафедра прикладной математики и информатики e-mail: [email protected]
Белова О. Ю., Кузнецов Р. Н. - Программа диагностики синдрома эндогенной интоксикации // Известия
ПГПУ им. В. Г. Белинского. 2010. № 18 (22). С. 110-114. - В данном исследовании рассмотрено применение искусственных нейронных сетей для диагностики синдрома эндогенной интоксикации и создание экспертной системы для проведения диагностики населения. Описан процесс подготовки данных для обучения сетей, исследование различных архитектур искусственных нейронных сетей и возможности программы.
Ключевые слова: нейронные сети, синдром диагностики эндогенной интоксикации.
Belova O. U., Kuznetsov R. N. - The program of diagnostics of syndrome of endogenous intoxication // Izv. Penz. gos. pedagog. univ. im.i V. G. Belinskogo. 2010. № 18 (22). P. 110-114. - In the research taking about application of neural network of diagnostics of syndrome of endogenous intoxication (SEI) and system-building for diagnostics. Described the process of data preparation for the learning network, research different structures of neural network and program potential. Keywords: the neural network, the syndrome of endogenous intoxication.
Синдром эндогенной интоксикации (СЭИ) относится к числу наиболее распространенных в клинической практике и наблюдается при самых различных этимологически и патогенетически нетождественных состояниях. Проблема своевременной диагностики и мониторинга СЭИ затруднена недостаточностью универсальных методов идентификации специфических маркёров токсикоза.
Основной задачей данного исследования является диагностика синдрома эндогенной интоксикации (СЭИ) больных в терминальной стадии хронической почечной недостаточности. Проблема хронической и острой почечной недостаточности (ХПН) активно разрабатывается на протяжении нескольких десятилетий, что обусловлено значительной распространенностью этого осложнения. Так, по данным литературы, число больных с ХПН в США и Японии колеблется от 157 до 443 на 1 млн. населения [9]. ХПН занимает первое место по распространенности среди всех заболеваний почек в этих странах. В странах Европы число больных удерживается на уровне 20-25%. В России смертность от почечной недостаточности по данным Государственного регистра не превышает 18%. И существенно не меняется в течении последних 30 лет [7]. По данным аналитического отчета 2009 года Российского регистра заместительной почечной терапии (ЗПТ) по состоянию на 2007 год в России ЗПТ получали 20212 пациентов с терминальной стадией ХПН, что на 11,7% больше, чем в 2006 году. Тем не менее показа-
тели обеспеченности ЗПТ в России отстают от других стран. Так в США обеспеченность ЗПТ составляет 1556 пациентов на 1 миллион населения, а в РФ - 142, в связи с чем можно предположить, что реальное количество пациентов с терминальной стадией ХПН значительно выше и продолжает расти. Ожидается, что в 2010 году число таких пациентов достигнет в мире примерно 2 млн человек [2, 10]. Все это свидетельствует об актуальности проблемы.
Для объективной оценки наличия СЭИ существуют различные неспецифические лабораторные методы, позволяющие с той или иной степенью точности и достоверности судить о выраженности данного синдрома. В хирургической практике (травматическая болезнь, перитонит, панкреонекроз и т.д.) при изучении степени тяжести СЭИ используют определение количества лейкоцитов периферической крови и лейкоцитарную формулу, а также их функциональную активность с помощью теста восстановления нитро-синего тетразолия [2]; из иммунологических методов -определение иммуноглобулинов, циркулирующих им-муннокомплексов [1, 5]. Из биохимических методов широко используется определение продуктов пере-кисного окисления липидов, в основном, малонового диальдегида. В лабораторной диагностике распространено определение уровня молекул средней массы, являющихся общепризнанным биохимическим маркёром СЭИ при различных патологических состояниях. В медицине и здравоохранении достаточно
распространено использование различных статистических методов, в частности при принятии решений в задачах оценки состояния здоровья, прогноза, выбора стратегии, тактики, профилактики и лечения. Существует множество статистических критериев для подтверждения или опровержения выдвигаемых экспер-том-медиком гипотез. Однако применение методов статистического анализа в рассматриваемой области имеет объективные ограничения из-за нечёткой трактовки моделей нормы, адаптации и патологии. Поэтому с целью повышения точности результатов научных исследований для аналитической обработки медицинской информации стали широко применяться нейро-сетевые методы [3, 4]. Следует указать, что нередко диагностическая эффективность прогнозных моделей варьируется в пределах 70-85% [8]. Важной задачей применения нейронных сетей в медицинских исследованиях является необходимость повышения достоверности прогноза.
Целью данной работы является исследование и создание нейронных сетей, позволяющих эффективно распознавать лабораторную характеристику СЭИ, а также создание экспертной системы для проведения диагностики.
Для решения задачи нейросетевой диагностики СЭИ были сформированы две группы наблюдений. Первую группу наблюдений составили 80 здоровых доноров отделения переливания крови Пензенской областной клинической больницы им Н. Н. Бурденко, вторую - 80 больных с хронической почечной недостаточностью в терминальной стадии. Всего изучено 160 историй болезни. Использовано двадцать пять показателей на основе: общего и биохимического анализа крови. Полученные данные применили для обучения и экспериментов с нейронными сетями. Были сформированы обучающая и тестовая выборки, каждая из которых содержала данные о 40 донорах и 40 пациентах, страдающих хронической почечной недостаточностью в терминальной стадии.
Данные были статистически обработаны. Вычислялось минимальное и максимальное значение для всех показателей из обучающего и тестового множества, отсутствующие лабораторные показатели выборки заменялись случайными значениями, распределенными с вероятностью распределения данных по каждому показателю. В качестве исходных данных были отобраны наиболее информативные биохимические показателями у больных ХПН мочевина и креа-тинин [5]. Это подтверждено статистическими исследованиями лабораторных данных изучаемой выборки больных. Таким образом, для диагностики рационально использовать наименьшее количество показателей (креатинин и мочевина ).
Для диагностики СЭИ использовалась трехслойная нейронная сеть прямого распространения с сигмоидальной функцией активации и алгоритмом обучения Левенберга-Марквардта [6]. В экспериментах использовались сети с двумя нейронами в первом слое, так как количество нейронов первого слоя должно быть равно количеству элементов вектора входа.
В выходном слое использовался всего один нейрон, так как сеть разбивает входное множество на два класса (больной - здоровый).
Для проведения исследований использовался пакет “Neural Network Toolbox” среды программирования MATLAB. Сеть училась диагностировать СЭИ по 2 показателям. Вначале подбиралась оптимальная архитектура нейронной сети. Для выбора оптимальной архитектуры использовался алгоритм обучения Левенберга-Марквардта. Выбор этого алгоритма обучения объясняется его быстротой и надежностью. В ходе исследований экспериментально подбиралось нужное количество нейронов скрытого слоя. Количество нейронов в скрытом слое изменялось от 10 до 25. Экспериментально было установлено, что использование в скрытом слое более 25 нейронов является избыточным и не приводит к положительным результатам. В качестве функции активации для всех сетей использовалась сигмоидальной функцией активации. Проводилось масштабирование всех входных векторов (приведение к виду [-1 1]).
Результаты интерпретировались следующим образом: если выход сети лежал в диапазоне от -0,5 до -1, то входные данные считались принадлежащими больному человеку. Если выход лежал от 0,5 до 1, то данные принадлежат здоровому человеку. Все ответы сети в интервале от -0,5 до 0,5 считались неопределенными. Для сети рассчитывалась ошибка первого и второго рода. Ошибка первого рода - это когда анализ крови показал заболевание, хотя на самом деле человек здоров. Ошибка второго рода - это когда анализ крови показал отсутствие заболевания, хотя на самом деле человек болен.
Результаты обучения нейронной сети с разным количеством нейронов в скрытом слое представлены на рис. 1.
Ґ N
160 ---------------------------------------------
140----------------------------------------------
IZO ------------1----------------1---------------1100----------------------------------------------
:ЕШиБ1Ш
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
■ ошибка ■ среднеквадратическое отклонение Ч___________________________________;
Рис. 1. Результаты экспериментов
Эксперименты при диагностике по 2 показателям выявили, что по величине ошибки лучшей является нейронная сеть с 16 нейронами в скрытом слое. Ошибка на данном количестве нейронов равна 3,7 %.
Аналогичные эксперименты при диагностике с использованием персептрона выявили, что этот тип
сетей не способен обучаться на представленных данных. Это означает, что данные показатели линейно неразделимы.
Экспериментально подобранные архитектура и параметры нейронных сетей использованы при реализации нейросетевой экспертной системы. Систе-
ма разработана в среде разработки Microsoft Visual Studio 2008, с использованием языка программирования C#.
На диаграмме вариантов использования показаны режимы работы всей системы (рис. 2). Это режим администратора и режим пользователя.
создает информационную карту больного
Рис. 2. Диаграмма вариантов использования для системы диагностики СЭИ
Для процесса обучения сети разработана диаграмма активности (рис. 3), где детально отражены действия, которые производятся при выполнении алгоритма обучения нейронной сети и функции, которые за это отвечают.
В данной системе реализована передача данных из Microsoft Excel. Информация о пациентах и их анализах хранится в таблицах Microsoft Excel. Класс, отвечающий за чтение данных из Microsoft Excel Excel_read. Данных об анализах обследуемых пациентах (креати-нин, мочевина), необходимых при обучении нейронной сети; обучающего и тестового множества.
Было создано пространство имен neural, в котором реализованы основные функции нейросетевого метода: Scaling, Summator, Tansig, Error, Sim и Train, Correction_bais, Corretion_weights.
Функция Scaling позволяет привести все исходные данные к одному диапазону. Эта функция использует метод линейного шкалирования, так как в многослойном персептроне используется функция гиперболического тангенса, и все данные приводятся к диапазону [-1; 1].
Функция Summator реализует адаптивный линейный сумматор. На вход функции поступают про-
масштабированный ранее массив входных значений и вектор весовых коэффициентов.
Выход адаптивного сумматора поступает на вход функции Tansig, реализующей функцию активации. Результатом применения этой функции является выходное значение данного нейрона.
Для подсчета ошибок сети используется функция Error. В качестве ошибки рассматриваются выходы сети, не попавшие в указанный пользователем интервал или неправильно распознанные сетью. Рассчитываются ошибка первого и второго рода. Ошибка первого рода - это когда анализ крови показал наличие заболевания, хотя на самом деле человек здоров. Ошибка второго рада - это когда анализ крови показал отсутствие заболевания, хотя на самом деле человек болен.
Функция Sim реализует функцию моделирования многослойного персептрона, аналогичную функции sim пакета прикладных программ MATLAB. На вход функции подаются исходные данные, на выходе получается выходное значение сети.
Функция Train реализует механизм обучения многослойного персептрона методом Левенберга-Марквардта. На выходе получаем обученную сеть. Обу-
чение ведется с использованием тестового множества. Данный подход позволяет избежать переобучения сети.
Функции Correctюn_bais и Coггetion_weights используется для корректировки весов и смещений с использованием данных полученных в результате вычисления градиента.
Предложенная экспертная система для диагностики синдрома эндогенной интоксикации позволяет на сокращенном наборе анализов диагностировать СЭИ с помощью многослойного персептрона с достоверностью 80 %, что не превышает ошибку сетей, созданных с использованием пакета NN7 МАТЬАВ.
формирование из Excel - ввод
файла. Функция Excel_read пользователем
Формирование обучающей выборки.Функция Іеагпіпд_(Ша
заполнение недостающих данных. Функция єШізісз
препроцессорная обработка. Функция scaling
инициализация нейронной сети. Функция 5ІПП
подача данных на вход сети
подача данных на вход сумматора. Функция summuto г
СПИСОК ЛИТЕРАТУРЫ
1. Ахметов Р.Ф., Капустин Б. Б., Старчиков С. В. Способ определения степени эндогенной интоксикации у больных с абдоминальным сепсисом // Труды международного конгресса «Новые технологии в хирургии». Ростов на Дону, 2005. С. 47.
2. Бикбов Б.Т., Томилина Н.А. Состояние заместительной терапии больных с хронической почечной недостаточностью в Российской Федерации в 1998-2007 гг.// Нефрология и диализ. 2009. №3. С. 144-233.
3. Горбань А.Н., Россиев Д.А. Нейронные сети на
персональном компьютере. Новосибирск: Наука,
1996. С. 276.
4. Лифшиц В.Б., Булдакова Т.И., Суятинов С.И., Ко-лентьев С.В. Статистический и нейросетевой методы идентификации и прогнозирования в медицине // Информационные технологии. 2004. №3. С. 60-63.
5. Малахова М. Я. Метод регистрации эндогенной интоксикации: Пособие для врачей. СПб: Изд-во СПб МАПО, 1995. С. 34.
6. Осовский С. Нейронные сети для обработки информации // Финансы и статистика. 2004. С. 344.
7. Российского регистр заместительной почечной терапии: http://www.nephro.ru
8. Щетинин В. Г., Соломаха А. А. Применение компьютерных «нейронных сетей» в клинической лабораторной диагностике // Клиническая лабораторная диагностика. 1998. №10. С. 21-33.
9. US Renal Data System, USRDS 2009 Annual Data Report: atlas of end-stage renal disease in the United States, National Institutes of Health, National Institutes of Diabetes and Digestive and Kidney Diseases, 2009.
10. White SL, Cass A, Atkins RC, Chadban SJ. Chronic kidney disease in the general population // Adv. Chronic Kidney Dis. 2005. P. 5-13.