УДК 616.61-002- 037:510.6]-053.2
Одинец Ю.В, Триндюк Ю.С., Харченко Т.В., Кочина М.Л., Фирсов А.Г. ПРИМЕНЕНИЕ НЕЧЕТКОЙ ЛОГИКИ В ПРОГНОЗИРОВАНИИ ПИЕЛОНЕФРИТОВ У ДЕТЕЙ
Харьковский национальный медицинский университет, КУОЗ «Харьковская городская клиническая детская больница №16», Харьковская медицинская академия последипломного образования
Разработана модель прогноза течения и прогрессирования пиелонефрита с использованием аппарата нечеткой логики, которая базируется на данных комплексного обследования 100 детей, больных пиелонефритом, и 20 детей группы контроля. Наиболее информативными для разделения исследуемых на кластеры являются показатели липидного спектра сыворотки крови. Полученные системы логических уравнений позволяют с высокой степенью точности классифицировать в соответствующие группы новых пациентов.
Ключевые слова: аппарат нечеткой логики, липидный спектр, пиелонефрит, дети
Связь публикации с плановыми научно-исследовательскими работами: работа выполнена соответственно комплексной научно-исследовательской работы кафедр педиатрии Харьковского национального медицинского университета по теме: «Медико-бюлопчна адапта^я дтей iз соматичною патолопею в сучасних умовах» (номер госрегистрации 0105и002756).
нечетких методах кластеризации объект прина-
Одной из наиболее актуальных проблем детской нефрологии в течение длительного времени остается проблема микробно-воспалительных заболеваний почек [1,2]. Про-веденые в разных странах за последние десятилетие крупномасштабные популяционные исследования выявили широкую распространенность пиелонефрита (ПН). Так, по данным разных авторов, ПН составляет 47-70% всей уро-нефрологической патологии и его распространенность находится в диапазоне от 3,6 до 35 случаев на 1000 детского населения в разных регионах России и Украины [3,4].
Цель: разработать модели прогнозирования течения и прогрессирования ПН у детей на основе метода нечеткой логики.
Материалы и методы
В исследование включены данные комплексного обследования 100 детей, больных ПН (43 -острым и 57- хроническим), и 20 условно здоровых детей в возрасте от 1 до 18 лет. При сборе анамнеза и обследовании детей, больных ПН, нами определено значительное количество показателей, которые в той или иной степени характеризуют состояние пациентов, однако не являются специфическими для данного заболевания. Для прогнозирования течения и прогрес-сирования ПН у детей необходимо было определить минимальный набор информативных показателей, по которым можно разделить больных ПН на группы, соответствующие длительности заболевания. После определения минимального набора информативных показателей задача состояла в разработке модели, позволяющей с достаточной точностью прогнозировать течение и прогрессирование ПН.
Для получения правил разделения пациентов на подгруппы нами использована кластеризация по алгоритму нечетких с-средних [5], что соответствует принципу обучения без учителя. В
длежит многим кластерам, но с разной степенью точности, что помогает работать с объектами на границах кластеров. Для применения алгоритма нечетких с-средних необходимо заранее знать приблизительную структуру анализируемых данных, а точнее - количество кластеров.
Предварительный анализ данных показал, что наиболее точное разделение пациентов на кластеры осуществляется по следующим информативным показателям: холестерина (ХС), общих фосолипидов (ФЛ), фосфатидилхолина (ФХ), фосфатидилсерина (ФС), фосфатидиле-таноламина (ФЭА), фосфатидилинозитола (ФИ), лизофосфатидилхолина (ЛФХ), сфингомиелина (СМ) сыворотки крови. Известно, что определенную роль в тяжести течения и прогрессирования заболеваний почек, в том числе и ПН, играет деструкция мембранных структур почечной ткани вследствие свободнорадикального окисления липидов [1,6-8].
Для синтеза нечетких правил модели прогнозирования течения и прогрессирования ПН у детей, основываясь на результатах кластеризации, центру каждого кластера
V, = (хг, у.), г = 1, с г \ з ставится в соответствие од-
х = х,.
то
х - около х
но нечеткое правило [9] вида: если
у = У-
^1, где нечеткие термы ,
У г - " ОКОЛО у г "
Для аппроксимации многомерной функции принадлежности каждого нечеткого кластера функциями принадлежности термов входных и выходных переменных используется асимметричная функция принадлежности- двухсторонняя кривая Гаусса, которая определяется по следующей формуле:
HidП¡К ВДНЗУ «Украгнсъка медична стоматологгчна академ1я»
tf (x) =
- (x-b )2
e
2cг
1,
x < b x = b
- (x-b )2 x > b
e
2c
и' (x)
функция принадлежности пере-
x к терму f; b - параметр функции при-
где менной
надлежности, соответствующий координате максимума (в данном случае - координата центра
кластера); с"°2 - параметры сжатия-растяжения функции принадлежности. Поиск оптимальных параметров функций принадлежности проводится по методу наименьших квадратов отдельно для левой и правой ветвей ее графика.
Для проведения кластеризации методом средних нами разработана схема исследований, в соответствии с которой были рассмотрены два варианта разделения пациентов на кластеры:
1. Дети, больные острым ПН, и условно здоровые дети группы контроля.
2. Дети, больные хроническим ПН, и условно здоровые дети группы контроля.
Чтобы иметь возможность сравнивать разнородные данные их значения должны быть приведены к единому масштабу, кроме того полезно провести дополнительную предобработку данных, выравнивающую распределение значений. Нормировкой каждой переменной на диапазон ее разброса обеспечивается единство масштаба данных, при этом надежнее ориентироваться не на экстремальные значения, а на типичные, т.е. статистические характеристики данных, такие как среднее и дисперсия. Все использованные для кластеризации и построения моделей данные нормировались с помощью следующей формулы:
x - x
x =
а
х
, где 1 - нормированное значение показателя;
х - среднее значение показателя и ° - его дисперсия.
Чтобы адекватно использовать логику, присутствующую в человеческих рассуждениях, для решения научных проблем необходимо разработать соответствующую математическую модель. При рассмотрении сложной системы люди рассуждают относительно ее структуры и поведения приблизительно или неточно. Нечеткая логика позволяет представить процессы принятия решений и оценки ситуаций человеком, способным рассуждать приблизительно, в некоторой алгоритмической форме [10].
Таким образом, нечеткий логический вывод -это аппроксимация зависимости «входы - выход» на основе лингвистических высказываний <Если - то> и логических операций над нечеткими множествами.
Методика построения модели, позволяющей прогнозировать течение и прогрессирование ПН у каждого нового пациента, состояла из шагов, представленных на рис.1. Поскольку в результате анализа исходных данных можно было предполагать наличие двух кластеров, то в шаге 3 методики рассчитывались степени принадлежности только для двух термов К1 и К2. Полученная нечеткая модель прогноза использовалась для определения группы, в которую следует отнести нового испытуемого. Это происходило по представленному на рис.1. алгоритму, в котором шаги 1 и 6 пропускались.
Для построения модели использован пакет программ Scilab, сопоставимый по своим возможностям и интерфейсу с пакетом MATLAB [10]. Scilab является бесплатным пакетом программ, не требует лицензии при использовании, предоставляет широкие возможности по созданию и редактированию различных видов графиков и поверхностей, имеет расширения для решения прикладных задач, достаточно мощный собственный язык программирования высокого уровня.
Для решения задачи нечеткой кластеризации на основе алгоритма нечетких с-средних был использован набор программ Fuzzy Clustering and Data Analysis Toolbox, который с небольшими изменениями позволяет реализовать алгоритм нечеткой кластеризации в пакете программ Scilab.
Результаты и их обсуждение
В результате нечеткой кластеризации детей с острым ПН и детей контрольной группы были установлены номера кластеров, к которым был отнесен конкретный больной или здоровый ребенок, что определялось по большему значению функции принадлежности. Путем нечеткой кластеризации методом с-средних к первому кластеру были отнесены больные острым ПН, ко второму - условно здоровые дети контрольной группы. Установлено, что надежная группировка используемым методом была осуществлена для 86% больных, 9 детей (14% от общего количества больных острым ПН) могут быть отнесены к двум кластерам одновременно, так как степень принадлежности, как к первому, так и ко второму кластеру для них практически одинакова. Все дети контрольной группы классифицирован верно (отнесены ко второму кластеру).
Для каждого из выделенных кластеров определены значения показателей, соответствующие центру кластера (табл.1).
2
Таблица 1
Нормированные координаты центров кластеров детей, больных острым ПН, и группы контроля
№ кластера Показатели
ХС ФЛ ФХ ФС ФЭА ФИ ЛФХ СМ
1 0,351 0,567 0,528 0,543 0,3208 0,436 0,394 0,289
2 0,275 0,310 0,137 0,158 0,110 0,125 0,093 0,063
Модель прогноза
Л
1.По координатам центров кластеров составлялись уравнения для фун кций при надлежности термов V_„_/
2. Вычислялись степени принадлежности к нечетким термам: показателей из тестовой выборки
3.Найденные значения подставлялись в систему
уравнений полученных в п. 1 и определялись
степени принадлежности решения к термам <<К1» и кК 2
4.0пределялось нечеткое множество
5. Дефаззификация полученного множества производилась по методу центра тяжести
6. Рас считывал ось сре днеквадратическое отклонение между экспериментальными данными и результатами моделирования. Если число итераций было меньше максимального, то изменялись параметры функции принадлежности и повторялись все операции с шага 2
7. По полученным результатам определялась принадлежность к кластерам:
' у (0; 1,5]
п =
Рис. 1. Порядок построения модели прогноза с использованием нечеткой логики
Для того, чтобы в дальнейшем была возможность разделить испытуемых в соответствии с результатами кластеризации была использована система нечеткого вывода Мамдани [11], для которой входными переменными являлись показатели детей, больных острым ПН, и условно здоровых, а выходными - номера групп, полу-
ченные при кластеризации. Результаты проведенной нечеткой кластеризации используются в качестве базы знаний для системы нечеткого вывода.
Правила базы знаний для полученных кластеров будут соответствовать системе нечетких логических уравнений:
В1СНПК ВДНЗУ «Украгнсъка медична стоматологгчна академ1я»
Ик1 (Х) = ИхС1 (Х1) Л ИфЛ1 (Х2 ) Л ИфХ 1 (Х3 ) Л ИфС1 (Х4 ) Л ИфЭА1 (Х5 ) Л ИфИ1 (Х6 ) Л ИлФХ 1 (Х7 ) Л ИсМ 1 (Х8 ) ИК2(Х) = МхС2 (Х1) Л МфЛ2 (Х2) Л МфХ2 (Х3) Л ИфС 2 (Х4) Л МФЭА2( Х5) Л МфИ 2 (Х6 ) Л МЛФХ 2 (Х7 ) Л рсм 2 ( Х8 ) (1 )
где Рк1 (ХИк 2 (Х) - степень выполнения правил нечеткой базы знаний для входного вектора показателей
X — ( Х 1, Х 2, Х з, Х 4, Х 5, Х 6, Х 7, Х 8 )
И ХС 1( Х1), ИФЛ 1 ( Х 2 ) , ИФХ 1( Х 3), ИФС 1( Х 4 ) , ИФЭА 1( Х 5 ) , ИФИ 1( Х 6), И Л ФХ 1( Х 7), И СМ 1( Х 8 ) и ИХС 2 ( Х1 ), ИФЛ 2 ( Х 2 ), ИФХ 2 ( Х3 ), ИФС 2 ( Х 4 ), ИФЭА 2 ( Х5 ), ИФИ 2 ( Х 6 ), ИЛФХ 2 ( Х 7 ), И СМ 2 ( Х8 )
- функции принадлежности значения показателя состояния пациента нечеткому терму базы знаний.
Для синтеза модели, позволяющей прогнозировать течение и прогрессирование ПН у детей в зависимости от наличия той или иной формы заболевания, сформирована обучающая выборка, представляющая собой матрицу, в каждой строке которой находились показатели одного испытуемого, а в столбцах - конкретные показатели всех испытуемых. В последнем столбце матрицы указаны номера подгрупп, в которые, согласно кластеризации, определены испытуемые. Далее проводилась экстракция нечеткой базы из обучающей выборки. В результате чего был получен набор оптимизированных функций принадлежности.
Таким образом, процедура классификации нового пациента в группу на основании нечеткой модели производится следующим образом: фаззификация данных конкретного ребенка состоит в расчете значения функции принадлежности для каждого из информативных показателей в соответствии с правилом. Полученные значения подставляются в соответствующие логические уравнения системы (1). Операция Л в уравнениях соответствует треугольной ¿-норме и вычисляется как
ШШ(рХС , РФЛ , РФХ , РФС , РФЭА , РФИ , ИЛФХ , РСМ )
. По полученному из уравнений значению и функции принадлежности выходной переменной определяется нечеткое значение выходной переменной, которое дефаззифицируется методом центра тяжести. Далее анализируется это значение, если оно больше порога в 1,5, то больной относится ко второй подгруппе, если меньше - к первой. В обучающей выборке кластеру №1 соответствует число 1, а кластеру №2 -число 2. В результате анализа выходных значе-
ний модели замечено, что точного соответствия номеру кластера не наблюдается, но большинство наборов показателей, соответствующих кластеру №1, находятся в интервале значений от 0 до 1,5, а соответствующие кластеру №2 - сконцентрированы в интервале от 1,5 до 2. Таким образом значение порога выбрано равным 1,5.
Для оценки адекватности разработанной модели прогноза использован следующий подход: из обучающей выборки извлекалась одна строка, соответствующая набору показателей конкретного пациента, и синтезировалась модель. По ней вычислялся номер группы, к которой относится выбранный набор показателей. Такая операция проводилась для каждой строки в выборке. Эта проверка показала, что все пациенты правильно классифицированы с использованием разработанных функций принадлежности.
Для второго варианта разделения пациентов на кластеры (дети с хроническим ПН и группы контроля) по описанной выше схеме определены соответствующие номера кластеров и рассчитаны нормированные координаты их центров (табл.2).
Результат нечеткой кластеризации детей с хроническим ПН показал, что надежная группировка используемым методом может быть осуществлена для 91% больных, 7 детей (9% от общего количества больных хроническим ПН) могут быть отнесены к двум кластерам одновременно, так как степень принадлежности, как к первому, так и ко второму кластеру для них практически одинакова. Ни один ребенок из контрольной группы не был классифицирован не верно, все они отнесены ко второму кластеру.
Таблица 2
Нормированные координаты центров кластеров детей с хроническим пиелонефритом и группы контроля
№ кластера Показатели
ХС ФЛ ФХ ФС ФЭА ФИ ЛФХ СМ
1 0,571 0,526 0,541 0,319 0,435 0,392 0,289 0,574
2 0,301 0,128 0,149 0,104 0,116 0,086 0,057 0,149
Как и в первом варианте, для того, чтобы в дальнейшем была возможность разделить пациентов в соответствии с результатами кластеризации, использована система нечеткого вывода Мамдани, для которой входными переменными являлись показатели детей, больных хроническим ПН, и условно здоровых детей, а выходными - номера групп, полученные при клас-
теризации. Результаты проведенной нечеткой кластеризации используются в качестве базы знаний для системы нечеткого вывода.
Поскольку кластеризация для случая хронического ПН проводилась по тем же информативным показателям, что и для острого, правила базы знаний будут соответствовать той же системе нечетких логических уравнений (1). Отли-
Литература
чия будут состоять только в параметрах оптимизированных функций принадлежности.
Как и для первого варианта проведена проверка адекватности разработанной модели прогноза с использованием уже описанного выше подхода. Все пациенты верно классифицированы с использованием разработанных функций принадлежности (ошибка классификации равна 0).
Выводы
1. Использование аппарата нечеткой логики для анализа показателей больных и здоровых детей позволило разработать модели прогноза для случаев острого и хронического ПН.
2. Полученные системы логических уравнений, для которых определены параметры оптимизированных функций принадлежности, позволяют с высокой степенью точности классифицировать в соответствующие группы новых пациентов.
3. Проверка адекватности разработанной модели прогнозирования течения и прогресси-рования ПН показала, что все дети, больные как острым, так и хроническим ПН, правильно разделены на кластеры с использованием рассчитанных функций принадлежности.
Реферат
ВИКОРИСТАННЯ НЕЧ1ТКО1 ЛОГ1КИ В ПРОГНОЗУВАНН1 П1еЛОНЕФРИТ1В У Д1ТЕЙ Одинець Ю.В, Триндюк Ю.С., Харченко Т.В., Кочина М.Л., Фiрсов О.Г. Ключовi слова: апарат нечггкоТ лопки, лодний спектр, глелонефрит, дп~и
Розроблено модель прогнозу переб1гу та прогресування шелонефрит1в з використанням аппарату неч1тких лопк, яка базуеться на даних комплексного обстеження 100 д1тей, хворих на шелонефрит, та 20 д1тей групи контролю. Найбтьш 1нформативними для розпод1лення досл1джуваних груп на класте-ри е показники лтщного спектру сироватки кров1. Отриман системи лог1чних р1внянь дозволяють з високим ступенем в1ропдност1 класиф|кувати у вщповщы групи нових пац1ент1в.
Summary
USE OF FUZZY LOGIC IN PREDICTION OF PYELONEPHRITIS IN CHILDREN Odynets Y.V. , Tryndiuk Y.S., Kharchenko T.V., fachina M.L., Phirsov A.G. Key words: fuzzy logic, lipid spectrum, pyelonephritis, children
We have developed the prediction model for pyelonephritis course and progression using fuzzy logic based on findings obtained by complex examination of 100 children with pyelonephritis and 20 children of the control group. Lipid spectrum of blood serum is the most informative for the distribution of the groups into the clusters. Systems of logical equations obtained allow to classify new patients into relevant groups with high degree of likelihood.
10.
ii.
Возианов А.Ф. Основы нефрологии детского возраста / А.Ф.Возианов, В.Г.Майданник, В.Г.Бидний, И.В.Багдасарова. -К. : Книга плюс, 2002. - 348 с.
Вербицкий В.И. Особенности течения, клиники, диагностики и лечения некоторых заболеваний органов мочевой системы у детей раннего возраста / В.И.Вербицкий, О.Л.Чугунова, С.В.Яковлева [и др.] // Педиатрия. - 2002. - №3. - С.4-9. 1ванов Д.Д. Нефролопчний портфель сучасного лкаря. Частина I. 1нфекцп сечовоТ системи. ПоЫбник для лiкарiв / Д.Д.1ванов, О.О.Добрик.- Львiв. - 194 с.
Детская нефрология: Руководство для врачей / Под редакцией М.С.Игнатовой. - [3 изд., перераб. и доп.]. - М : ООО «Медицинское информационное агенство», 2011. - 696 с. Babuska R. Fuzzy Modeling for Control / Babuska R. - Boston : Kluwer Academic Publishers, 1998. - 288 p.
Головачова В.О. Вплив фактс^в зовшшнього середовища на фосфолтщний спектр сироватки кровi дп"ей, хворих на нефро-патто / В.О. Головачова // Здоровье ребенка. - 2010. - №3(24). -
C.38-41.
Одинець Ю.В. Змши фосфолтщного складу кровi при нефро-па™х у дп"ей, як мешкають в еколопчно несприятливих умо-вах: Матерiали Х ювтейноТ' ВсеукраТ'нськоТ' науко-практичноТ конференцп «Актуальш питання педiатрiТ'», присвяченоТ' памят професора В.М.Сщельшкова, / Ю.В.Одинець, 6.К. Ярова, Г.1. Губша-Вакулк [та ш.] // Експерементальна i клiнiчна медицина.- 2008. - №4.- С.125.
Cevc G. Phospholipids handbook / Cevc G. - Boca Raton : CRC Press, 1993. - 988 p.
Yager R. Essentials of Fuzzy Modeling and Control./ R.Yager,
D.Fiiev. - USA : John Wiley & Sons, 1984. - 387 p.
Леоненков А.В. Нечеткое моделирование в среде MATLAB и fuzzyTECH / Леоненков А.В. - СПб. : БХВ-Петербург, 2005. -736 с.
Штовба С.Д. Проектирование нечетких систем средствами MATLAB / Штовба С.Д. - М. : Горячая линия - Телеком, 2007. -288 с.