Научная статья на тему 'МОДЕЛЬ КЛИНИЧЕСКОГО ПРОГНОЗИРОВАНИЯ САХАРНОГО ДИАБЕТА MODY ТИПА У ДЕТЕЙ'

МОДЕЛЬ КЛИНИЧЕСКОГО ПРОГНОЗИРОВАНИЯ САХАРНОГО ДИАБЕТА MODY ТИПА У ДЕТЕЙ Текст научной статьи по специальности «Клиническая медицина»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Сахарный диабет
Scopus
ВАК
RSCI
ESCI
Область наук
Ключевые слова
сахарный диабет у детей / MODY / моногенный сахарный диабет / система поддержки принятия врачебных решений / модель прогнозирования MODY / diabetes mellitus in children / MODY / monogenic diabetes mellitus / clinical decision support system / MODY prediction model

Аннотация научной статьи по клинической медицине, автор научной работы — Сечко Елена Александровна, Лаптев Дмитрий Никитич, Романенкова Елизавета Михайловна, Еремина Ирина Александровна, Безлепкина Ольга Борисовна

ОБОСНОВАНИЕ. MODY (maturity-onset diabetes of the young — диабет взрослого типа у молодых лиц) — редкая моногенная форма сахарного диабета (СД), «золотым стандартом» диагностики которой является выявление мутаций в генах, ответственных за развитие данной формы заболевания. Проведение молекулярно-генетического исследования требует существенных экономических и временных затрат. Критерии диагностики MODY хорошо известны. Создание системы поддержки принятия врачебных решений (СППВР), которая позволила бы врачу на основании клинических данных определить показания для проведения генетического исследования, является актуальным. ЦЕЛЬ. Разработка наиболее эффективного алгоритма прогнозирования MODY у детей на основании доступных клинических показателей 1710 пациентов с СД в возрасте до 18 лет с использованием многослойной нейронная сеть (НС) прямого распространения. МАТЕРИАЛЫ И МЕТОДЫ. Для разработки модели был проведен ретроспективный анализ клинических данных пациентов с СД 1 типа (СД1) и СД MODY типа в возрасте от 0 до 18 лет независимо от длительности заболевания. На основании клинических данных была реализована НС прямого распространения — многослойный перцептрон. РЕЗУЛЬТАТЫ. Выборка составила 1710 детей в возрасте до 18 лет с СД1 (78%) и MODY (22%) диабетом. Для итоговой конфигурации НС отобраны следующие предикторы: пол, возраст паспортный, возраст на момент манифестации СД, HbA1c, индекс массы тела (ИМТ) SDS, отягощенная наследственность по СД, получаемое лечение. Оценка производительности (качества) НС проводилась на тестовой выборке (площадь под ROC (receiver operating characteristics) кривой достигла 0,97). Прогностическая ценность положительного результата (ПЦПР) была достигнута при пороговом значении 0,40 (предсказанная вероятность MODY диабета 40%). При этом чувствительность составила 98%, специфичность 93%, ПЦПР с коррекцией на преваленс 78%, а ПЦОР с коррекцией на преваленс 99%, общая точность модели 94%. На основании модели НС была разработана СППВР для определения наличия у пациента MODY диабета, реализованная в виде приложения. ЗАКЛЮЧЕНИЕ. Разработанная в данной работе на базе НС модель клинического прогнозирования MODY использует доступные для каждого пациента клинические показатели для определения вероятности наличия у пациента MODY. Применение в клинической практике СППВР на базе разработанной модели окажет помощь в отборе пациентов для диагностического генетического тестирования на MODY, что позволит эффективно распределить ресурсы здравоохранения, выбрать персонализированное лечение и наблюдение пациента.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по клинической медицине , автор научной работы — Сечко Елена Александровна, Лаптев Дмитрий Никитич, Романенкова Елизавета Михайловна, Еремина Ирина Александровна, Безлепкина Ольга Борисовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CLINICAL PREDICTION MODEL FOR MODY TYPE DIABETES MELLITUS IN CHILDREN

BACKGROUND: MODY (maturity-onset diabetes of the young) is a rare monogenic form of diabetes mellitus, the gold standard of diagnosis is mutations detection in the genes responsible for the development of this form diabetes. Genetic test is expensive and takes a lot of time. The diagnostic criteria for MODY are well known. The development of clinical decision support system (CDSS) which allows physicians based on clinical data to determine who should have molecular genetic testing is relevant. AIM: Provided a retrospective analysis of clinical data of the patients with T1DM and MODY, from 0 to 18 years old, regardless of the duration of the disease to develop the model. Based on clinical data, a feedforward neural network (NN) was implemented a multilayer perceptron. MATERIALS AND METHODS: Development of the most effective algorithm for predicting MODY in children based on available clinical indicators of 1710 patients with diabetes under the age of 18 years using a multilayer feedforward neural network. RESULTS: The sample consisted of 1710 children under the age of 18 years with T1DM (78%) and MODY (22%) diabetes. For the final configuration of NS the following predictors were selected: gender, age at passport age, age at the diagnosis with DM, HbA1c, BMI SDS, family history of DM, treatment. The performance (quality) assessment of the NN was carried out on a test sample (the area under the ROC (receiver operating characteristics) curve reached 0.97). The positive predictive value of PCPR was achieved at a cut-off value of 0.40 (predicted probability of MODY diabetes 40%). At which the sensitivity was 98%, specificity 93%, PCR with prevalence correction was 78%, and PCR with prevalence correction was 99%, the overall accuracy of the model was 94%. Based on the NN model, a CDSS was developed to determine whether a patient has MODY diabetes, implemented as an application. CONCLUSION: The clinical prediction model MODY developed in this work based on the NN, uses the clinical characteristic available for each patient to determine the probability of the patient having MODY. The use of the developed model in clinical practice will assist in the selection of patients for diagnostic genetic testing for MODY, which will allow for the efficient allocation of healthcare resources, the selection of personalized treatment and patient monitoring.

Текст научной работы на тему «МОДЕЛЬ КЛИНИЧЕСКОГО ПРОГНОЗИРОВАНИЯ САХАРНОГО ДИАБЕТА MODY ТИПА У ДЕТЕЙ»

МОДЕЛЬ КЛИНИЧЕСКОГО ПРОГНОЗИРОВАНИЯ САХАРНОГО ДИАБЕТА MODY ТИПА У ДЕТЕЙ

© Д.Н. Лaптeв, Е.А. Ceчко*, Е.М. Ромaнeнковa, И.А. Еpeминa, О.Б. Бeзлeпкинa, В.А. Пeтepковa, Н.Г. Мокpышeвa

ГНЦ РФ ФГБУ «Национальный мeдицинский исслeдовaтeльский цeнтp эндокринологии Минздрава России», Москва

ОБОСНОВАНИЕ. MODY (maturity-onset diabetes of the young — диaбeт взрослого типа у молодых лиц) — peдкaя моногенная форма сахарного диaбeтa (CД), «золотым стандартом» диагностики которой являeтся выявлeниe мутаций в генах, отвeтствeнныx за paзвитиe данной формы зaболeвaния. Пpовeдeниe молeкyляpно-гeнeтичeского исслeдо-вания тpeбyeт сyщeствeнныx экономичeскиx и вpeмeнныx затрат. Kpитepии диагностики MODY хорошо извeстны. Cоздaниe систeмы поддepжки принятия вpaчeбныx peшeний (CППВР), которая позволила бы врачу на основании кли-ничeскиx данных опpeдeлить показания для пpовeдeния гeнeтичeского исслeдовaния, являeтся актуальным. ЦЕЛЬ. Разработка нaиболee эффeктивного алгоритма прогнозирования MODY у дeтeй на основании доступных кли-ничeскиx покaзaтeлeй 171G пaциeнтов с CД в возрасте до 1S лeт с использовaниeм многослойной нeйpоннaя сeть (НО прямого paспpостpaнeния.

МАТЕРИАЛЫ И МЕТОДЫ. Для разработки модeли был пpовeдeн peтpоспeктивный анализ клиничeскиx данных па-циeнтов с CД 1 типа (ЗД1) и CД MODY типа в возpaстe от G до 1S лeт нeзaвисимо от длитeльности зaболeвaния. На основании клиничeскиx данных была peaлизовaнa HC прямого paспpостpaнeния — многослойный пepцeптpон. РЕЗУЛЬТАТЫ. Выборка составила 171G дeтeй в возpaстe до 1S лeт с ОД1 (7S%) и MODY (22%) диaбeтом. Для итоговой конфигурации HC отобраны слeдyющиe пpeдиктоpы: пол, возраст паспортный, возраст на момeнт мaнифeстaции ОД HbA1c, индeкс массы тeлa (ИМТ) SDS, отягощeннaя нaслeдствeнность по ОД полyчaeмоe лeчeниe. Оцeнкa произво-дитeльности (кaчeствa) HC проводилась на тeстовой выбоpкe (площадь под ROC (receiver operating characteristics) кривой достигла G,97). Пpогностичeскaя цeнность положитeльного peзyльтaтa (ПЦПР) была достигнута при пороговом знaчeнии G,4G (пpeдскaзaннaя вepоятность MODY диaбeтa 4G%). При этом чyвствитeльность составила 9S%, спeцифичность 93%, ПЦПР с коppeкциeй на пpeвaлeнс 7S%, а ПЦОР с коppeкциeй на пpeвaлeнс 99%, общая точность модeли 94%.

На основании модeли HC была разработана CППВР для опpeдeлeния наличия у пaциeнтa MODY диaбeтa, peaлизовaн-ная в видe пpиложeния.

ЗАКЛЮЧЕНИЕ. Разработанная в данной paботe на бaзe HC модeль клиничeского прогнозирования MODY использyeт достyпныe для каждого пaциeнтa клиничeскиe покaзaтeли для опpeдeлeния вepоятности наличия у пaциeнтa MODY. Пpимeнeниe в клиничeской практик CППВР на бaзe разработанной модeли окaжeт помощь в отбоpe пaциeнтов для диaгностичeского гeнeтичeского тeстиpовaния на MODY, что позволит эффeктивно paспpeдeлить peсypсы здраво-оxpaнeния, выбрать пepсонaлизиpовaнноe лeчeниe и нaблюдeниe пaциeнтa.

КЛЮЧЕВЫЕ СЛОВА: сахарный диабет у детей; MODY; моногенный сахарный диабет; система поддержки принятия врачебных решений; модель прогнозирования MODY.

CLINICAL PREDICTION MODEL FOR MODY TYPE DIABETES MELLITUS IN CHILDREN

© Dmitry N. Laptev, Elena A. Sechko*, Elyzaveta M. Romanenkova, Iryna A. Eremina, Olga B. Bezlepkina, Valentina A. Peterkova, Natalya G. Mokrysheva

Endocrinology Research Centre, Moscow, Russia

BACKGROUND: MODY (maturity-onset diabetes of the young) is a rare monogenic form of diabetes mellitus, the gold standard of diagnosis is mutations detection in the genes responsible for the development of this form diabetes. Genetic test is expensive and takes a lot of time. The diagnostic criteria for MODY are well known. The development of clinical decision support system (CDSS) which allows physicians based on clinical data to determine who should have molecular genetic testing is relevant.

AIM: Provided a retrospective analysis of clinical data of the patients with T1DM and MODY, from 0 to 18 years old, regardless of the duration of the disease to develop the model. Based on clinical data, a feedforward neural network (NN) was implemented - a multilayer perceptron.

MATERIALS AND METHODS: Development of the most effective algorithm for predicting MODY in children based on available clinical indicators of 1710 patients with diabetes under the age of 18 years using a multilayer feedforward neural network.

RESULTS: The sample consisted of 1710 children under the age of 18 years with T1DM (78%) and MODY (22%) diabetes. For the final configuration of NS the following predictors were selected: gender, age at passport age, age at the diagnosis with DM, HbA1c, BMI SDS, family history of DM, treatment. The performance (quality) assessment of the NN was carried out on

© Endocrinology Research Centre, 2G24_Received: 29.G9.2G23. Accepted: 31.G1.2G24_BY NC ND

a test sample (the area under the ROC (receiver operating characteristics) curve reached 0.97). The positive predictive value of PCPR was achieved at a cut-off value of 0.40 (predicted probability of MODY diabetes 40%). At which the sensitivity was 98%, specificity 93%, PCR with prevalence correction was 78%, and PCR with prevalence correction was 99%, the overall accuracy of the model was 94%.

Based on the NN model, a CDSS was developed to determine whether a patient has MODY diabetes, implemented as an application.

CONCLUSION: The clinical prediction model MODY developed in this work based on the NN, uses the clinical characteristic available for each patient to determine the probability of the patient having MODY. The use of the developed model in clinical practice will assist in the selection of patients for diagnostic genetic testing for MODY, which will allow for the efficient allocation of healthcare resources, the selection of personalized treatment and patient monitoring.

KEYWORDS: diabetes mellitus in children; MODY; monogenic diabetes mellitus; clinical decision support system; MODY prediction model.

ОБОСНОВАНИЕ

MODY (акроним названия maturity-onset diabetes of the young — диабет взрослого типа у молодых лиц) — редкая моногенная форма сахарного диабета (СД), в основе которой лежат гетерозиготные мутации различных генов, ассоциированных с секрецией и/или действием инсулина, закладкой и развитием поджелудочной железы [1]. Правильный диагноз MODY имеет существенное значение для лечения пациента: некоторые формы MODY требуют проведения интенсифицированной инсулиноте-рапии, в то время как другие могут получать другие са-хароснижающие препараты или вообще обходиться без лечения. Кроме того, верный диагноз MODY определяет прогноз заболевания и риск развития диабета у членов семьи. «Золотым стандартом» диагностики MODY является выявление мутаций в генах, ответственных за развитие данной формы диабета, которое требует существенных экономических и временных затрат. Критерии диагностики MODY хорошо известны, к ним относятся: отягощенная наследственность по СД, возраст диагностики диабета до 25 лет, отсутствие ожирения и инсулинорези-стентности, отсутствие потребности в инсулине, однако только половина пациентов с подтвержденным генетически MODY соответствуют всем критериям данного заболевания [2]. Принятие решения о необходимости проведения молекулярно-генетического исследования должно приниматься на основании комплексного анализа клинических и лабораторных данных и быть направлено, с одной стороны, на выявление всех случаев MODY, с другой стороны — не приводить к необоснованному направлению на данное исследование. Таким образом, создание системы поддержки принятия врачебных решений, которая позволила бы врачу на основании клинических данных определить показания для проведения генетического исследования, является актуальным.

Искусственные нейронные сети (НС) как подкласс машинного обучения представляют собой адаптивные, обучающие и вычислительные функции, которые имитируют структуру и поведение нейронов в человеческом мозге [3]. Этот алгоритм может быть обучен различать и классифицировать сложные закономерности заболеваний с помощью интерактивного процесса обучения. После надлежащего обучения НС могут прогнозировать с большей точностью, чем традиционные статистические модели. Благодаря способности выявлять многогранные нелинейные отношения между предикторами и исходами НС нашли эффективное применение в системах поддержки принятия врачебных решений (СППВР) [4].

ЦЕЛЬ ИССЛЕДОВАНИЯ

Целью данной работы является разработка наиболее эффективного алгоритма прогнозирования MODY у детей на основании доступных клинических показателей 1710 пациентов с СД в возрасте до 18 лет с использованием многослойной НС прямого распространения.

МАТЕРИАЛЫ И МЕТОДЫ

Для разработки модели был проведен ретроспективный анализ клинических данных пациентов с СД 1 типа (СД1) и СД MODY в возрасте от 0 до 18 лет независимо от длительности заболевания, которые были обследованы в детском отделении сахарного диабета ФГБУ «НМИЦ эндокринологии» Минздрава России.

Предикторы и прогнозируемые показатели

В качестве предикторов исходно были отобраны 7 показателей, продемонстрировавших взаимосвязь с типом СД в ранее проведенных исследованиях [5, 6]: пол, паспортный возраст, возраст на момент манифестации СД, гликированный гемоглобин (НЬА1с), SDS индекса массы тела (ИМТ), отягощенная наследственность по СД (наличие СД у одного из родителей), получаемое лечение. Прогнозируемым, выходным показателем являлся тип СД: СД1 или MODY.

Подготовка данных

Для достижения максимальной производительности и более простой реализации модели исходный массив данных был предварительно обработан, т.е. проведено:

1) удаление выбросов и исключение из анализа данных пациентов, у которых более 30% значений отсутствуют;

2) приведение числовых значений переменных к одинаковой области их изменения с использованием алгоритма минимакс-нормализации;

3) подстановка (замена) отсутствующих значений (для случаев, у которых отсутствует менее 30% данных), используя метод к-ближайших соседей или kNN с евклидовым расстоянием где N — размер выборки;

4) отбор наиболее значимых признаков с использованием критерия Хи-квадрат для бинарных признаков и однофакторный дисперсионный анализ ANOVA для непрерывных признаков.

Реализация искусственной нейронной сети

НС представляет собой абстракцию структуры человеческого мозга и пытается имитировать его работу [7].

Input Layer e R7 Hidden Layer e R5 Hidden Layer e R5 Output Layer e R2

Рисунок 1. Конфигурация нейронной сети. Обозначения: Input layer — входной слой, Output layer — выходной слой, Hidden Layer — скрытые слои.

НС состоит из одного входного и выходного слоя, а также одного или нескольких скрытых слоев (рис. 1).

Каждый слой НС включает несколько нейронов, которые выполняют разные задачи. Входной слой получает данные и при необходимости преобразует их в нормализованные фрагменты, подходящие для математических вычислений. Процесс вычисления происходит в скрытых слоях, которые имеют наибольшее количество нейронов и выполняют операцию вычисления на основании межнейронных связей — весов. Выходное значение нейрона определяется функцией активации в зависимости от результата взвешенной суммы входов и порогового значения. В выходном слое нейроны получают результаты вычислений слоя обработки и представляют их пользователю.

В этом исследовании, с использованием открытой библиотеки Keras 2.9.0 (https://keras.io/), на языке программирования Python 3.10.2, была реализована НС прямого распространения — многослойный перцептрон. Keras — это API глубокого обучения, написанный на Python и работающий поверх платформы машинного обучения TensorFlow.

В качестве функции активации нейронов скрытых слоев использовалась функция ReLu (rectified linear unit). Для коррекции весов нейронов НС при обучении модели использовался оптимизированный метод стохастического градиентного спуска Adam — ADAptive Momentum. В качестве функции потерь использовалась категориальная перекрестная энтропия.

Гиперпараметры НС подбирались эмпирически до получения наилучшей конфигурации НС, с учетом оптимальной скорости обучения и производительности. Для сравнения различных конфигураций использовалась площадь под ROC кривой (AUC-ROC) и показатели матрицы несоответствий (таблицы кросс-табуляции).

СППВР

Финальная математическая модель НС была реализована в виде программы для ЭВМ (IBM PC-совместимый ПК), в качестве СППВР для определения вероятности у пациента

MODY диабета. Программа реализована на языке программирования Python 3.10.2 с использованием открытых библиотек PySimpleGUI 4.60.3 (https://www.pysimplegui.org/) и Keras 2.9.0 (https://keras.io/).

Оценка производительности НС

Для построения модели и оценки ее качества общая выборка разделена на тренировочную и тестовую в соотношении 80:20%. При обучении НС тренировочная выборка была также разделена на непосредственно тренировочную и валидационную в соотношении 80:20%.

Для оценки конфигурации НС были проанализированы показатели матрицы несоответствий (таблицы кросс-табуляции):

• Специфичность: TN / (TN + FP).

• Чувствительность или полнота (recall): TP / (TP + FN).

• Прогностическая ценность положительного результата (ПЦПР) или точность (precision) с поправкой на преваленс: Чувствительность • Частота MODY/ [Чувствительность • Частота MODY + (1 — Специфичность) • (1 — Частота MODY)].

• Прогностическая ценность отрицательного результата (ПЦОР) с поправкой на преваленс: Специфичность • (1 — Частота MODY)/[ Специфичность • (1 — Частота MODY)+(1 — Чувствительность) • Частота MODY].

• Доля правильных ответов или общая точность (accuracy): (TP + TN) / (TP + TN + FP + FN).

Где истинно положительные (TP) и истинно отрицательные (TN) — случаи MODY и СД1, правильно, а ложно-отрицательные (FN) и ложноположительные (FP) — неправильно классифицированные моделью.

Этическая экспертиза

Протокол исследования одобрен локальным комитетом по этике ФГБУ «НМИЦ эндокринологии» Минздрава России (выписка из протокола №17 от 23.10.2019). Родители пациентов дали добровольное согласие на их участие в исследовании.

Таблица 1. Клиническая характеристика общей, тренировочной и тестовой выборок пациентов. Данные представлены в виде: среднее значение №)

Вся выборка Тренировочная выборка Тестовая выборка

Всего СД1 MODY Всего СД1 MODY Всего СД1 MODY

n=1710 n=1333 n=377 n=1348 n=1045 n=303 n=362 n=288 n=74

Мужской пол (%) 48,0 47,0 50,0 48,0 51,0 47,0 49,0 45,0 50,0

Отягощенная наследственность (%) 26,0 15,0 68,0 26,0 14,0 68,0 27,0 17,0 69,0

ИМТ SDS 0,19 (1,21) 0,23 (1,21) 0,01 (1,17) 0,19 (1,21) 0,03 (1,19) 0,23 (1,21) 0,17 (1,22) -0,06 (1,08) 0,22 (1,25)

Возраст (годы) 10,56 (4,54) 10,42 (4,57) 11,12 (4,39) 10,64 (4,53) 11,21 (4,44) 10,49 (4,55) 10,26 (4,57) 10,75 (4,22) 10,14 (4,66)

Возраст манифестации (годы) 7,68 (4,32) 7,5 (4,27) 8,34 (4,45) 7,67 (4,29) 8,29 (4,47) 7,5 (4,23) 7,73 (4,44) 8,57 (4,42) 7,51 (4,42)

НЬА1с (%) 7,67 (1,77) 7,95 (1,84) 6,58 (0,76) 7,68 (1,78) 7,98 (1,86) 6,57 (0,76) 7,6 (1,7) 7,85 (1,79) 6,64 (0,76)

Получает лечение (%) 74,0 92,0 6,0 74,0 92,0 7,0 73,0 90,0 4,0

Таблица 2. Результаты статистической оценки взаимосвязи предикторов с типом сахарного диабета

Переменная Статистика Величина Значение p

Отягощенная по СД наследственность Хи-квадрат 307,2 <0,001

Получаемое лечение Хи-квадрат 294,8 <0,001

НЬА1с ANOVA 201,9 <0,001

Возраст на момент манифестации СД ANOVA 12,4 <0,001

SDS ИМТ ANOVA 10,7 0,001

Возраст паспортный ANOVA 7,2 0,007

Мужской пол Хи-квадрат 4 0,046

РЕЗУЛЬТАТЫ

После исключения не соответствующих и/или неполных записей (при отсутствии более 30% предикторных значений) итоговая выборка составила 1710 детей в возрасте до 18 лет с СД1 (78%) и MODY (22%). В группу пациентов с MODY были включены 308 пациентов с мутациями в гене вСК, 45 — в гене ЧИПА, 7 — в гене АВСС8, 6 — в гене ИМГ4в, 4 — в гене Ч№4А, 4 — в гене ЙГХв, 3 — в гене ¡ИБЙ. Среди включенных пациентов 1613 не имели пропущенных значений признаков, 92 имели 1 пропущенное значение и 5 — 2 пропущенных значения. Таким образом, общее количество пропущенных значений в отношении которых проведена подстановка (замена), составило 0,85%.

Характеристики выборок пациентов, использованных для обучения и тестирования модели, представлены в таблице 1.

Все предварительно отобранные признаки статистически значимо (р<0,05) влияли на тип СД (табл. 2) и в дальнейшем были использованы для построения различных конфигураций НС.

Для определения оптимальной конфигурации НС были проанализированы показатели прогностической эффективности нескольких моделей с последовательным включением каждого предиктора на основании бо-

лее высокой статистической величины. Результаты представлены на рис. 2 и 3.

В целом наиболее значимыми переменными для эффективной работы НС являлись отягощенная наследственность и получаемое лечение, однако включение других значимых признаков также увеличивало качество прогноза. На основании этого для итоговой конфигурации НС было принято решение использовать все предварительно отобранные предикторы. Итоговая архитектура НС представлена на рисунке 1.

На рисунке 3 представлена динамика ошибки — значения функции потерь в процессе обучения НС. Дальнейшее изменение архитектуры НС (увеличение скрытых слоев и количества нейронов в скрытых слоях) не привело к улучшению характеристик НС.

После обучения оценка производительности (качества) НС проводилась на тестовой выборке. В процессе оценки разработанная НС продемонстрировала хорошие прогностические возможности. Так, площадь под ROC (receiver operating characteristics) кривой (AUC) достигла 0,97 (рис. 3).

Для определения наиболее оптимального порогового значения предсказанной вероятности MODY диабета были проанализированы различные показатели матрицы несоответствий, отражающие качество НС (рис. 4).

97,2 60,0%

3

6

4 5

Количество признаков

■ Общая точность ■ ЛЫС ■ Ошибка

Рисунок 2. Показатели эффективности модели в зависимости от количества предикторов в процессе их последовательного добавления по статистической величине. Общая точность и ЛЫС по основной оси, ошибка по вспомогательной оси.

£

Ф CP

1.0

0.8

■Ü

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5 0.6

§ 0.4 ^

о с

0

1 0.2 s

I-

и

0.0

КОС кривая (ЛиС=0.97)

0.0

0.2 0.4 0.6 0.8

Ложно-положительный результат

1.0

Рисунок 3. Операционные характеристики итоговой конфигурации нейронной сети, полученные на тестовой выборке.

а

^ о

и

3

О

0.7

0.6

0.5

0.4

0.3

0.2

0.0

l\ Обучение --- Валидация

\\ \ \\

\ w

\\ \ \

V V ч\ V

0 10 20 30 40 50

Эпоха

Рисунок 4. Функция «потерь» при обучении нейронной сети для тренировочной и валидационной выборок.

100,0% 95,0% 90,0% 85,0% 80,0% 75,0% 70,0% 65,0% 60,0% 55,0% 50,0%

0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5 0,55 0,6 0,65 0,7 0,75 0,8 0,85 0,9

Пороговое значение

■ Чувствительность ■ Специфичность ■ ПЦПР ПЦОР ■ Общая точность

Рисунок 5. Показатели эффективности модели в зависимости от выбранного порогового значения предсказанной вероятности. Примечание. ПЦПР — прогностическая ценность положительного результата; ПЦОР — прогностическая ценность отрицательного результата

Наибольшая сумма показателей чувствительности и ПЦПР (1,76), а также чувствительности и специфичности (1,91) была достигнута при пороговом значении 0,40 (предсказанная вероятность MODY диабета — 40%) (рис. 5). При этом пороговом значении чувствительность составила 98%, специфичность — 93%, ПЦПР с коррекцией на преваленс — 78%, а ПЦОР с коррекцией на преваленс — 99%, общая точность модели — 94%.

На основании модели НС была разработана СППВР для определения наличия у пациента MODY диабета, реализованная в виде приложения (рис. 6). После внесения всех необходимых клинических признаков СППВР рассчитывает вероятность и шансы наличия MODY диабета у конкретного пациента. Получено свидетельство о государственной регистрации программ для ЭВМ «Калькулятор вероятности MODY» [8].

ОБСУЖДЕНИЕ

Различные технологии искусственного интеллекта в медицине в последнее время получают все более широкое распространение. Их применение позволяет повысить эффективность диагностики и лечения при различных заболеваниях и состояниях.

Генетическое тестирование является высокоспецифичным и чувствительным и представляет собой «золотой стандарт» диагностики MODY. Однако высокая стоимость ограничивает его использование у всех пациентов с подозрением на наличие моногенной формы СД. Решение о проведении теста является клиническим и зависит от вероятности и влияния положительного результата в сопоставлении со стоимостью теста. Использование технологий искусственного интеллекта позволит оптимизировать направление пациентов на генетическое исследование, определив вероятность MODY на основании комбинации клинических признаков, тем самым увеличив частоту

положительного результата генетического исследования и снизив затраты. Целью данной работы была разработка наиболее эффективного алгоритма прогнозирования MODY у детей на основании доступных клинических показателей 1710 пациентов с СД в возрасте до 18 лет, в том числе 377 человек с MODY, с использованием многослойной НС прямого распространения. Среди пациентов с MODY преобладали больные GCK-MODY, что характерно для педиатрической популяции.

В настоящее время существует единственная модель прогнозирования вероятности MODY, которая предложена B.M. Shields и соавт. в Великобритании в 2012 г. Для ее разработки в исследование были включены пациенты с СД, диагностированным от 1 года до 35 лет: 594 пробан-да с MODY (243 GCK, 296 HNF1A, 55 HNF4A), 278 пациентов с СД1, 319 — с СД 2 типа (СД2). Проводилось сравнение клинических характеристик между MODY и СД1, MODY и СД2. Наиболее сильным предиктором MODY при сравнении с СД1 было наличие сахарного диабета у родителей, вероятность MODY выше в 23 раза у тех пациентов, у которых у одного их родителей диагностирован СД, по сравнению с теми, у кого родители были без нарушений углеводного обмена. Другими предикторами MODY были более низкий уровень HbA1c, женский пол, более старший возраст диагностики диабета [5]. Практическое внедрение модели прогнозирования вероятности MODY в Великобритании в течение 10 лет позволило в 4 раза увеличить количество пациентов, направленных на мо-лекулярно-генетическое исследование, а также повысить долю выявления патогенных вариантов в генах, ответственных за развитие MODY с 25 до 33% [9].

При разработке СППВР в качестве предикторов нами предварительно были отобраны различные, доступные без проведения дополнительного обследования, клинические показатели, которые могут быть связанны с СД и прогнозировать тип СД: пол, паспортный возраст и на момент диагностики СД, HbA1c, SDS ИМТ, наличие

Рисунок 6. Реализация математической модели, разработанной нейронной сети в виде системы поддержки принятия врачебных решений.

Введите данные пациента Возраст 16 НЬА1с(%

-Щ Возраст диагностики 8

|6.3 3 ИМТ SDS [Ô.05|

Пол с Мужской С Женский Отягощенная наследственность ^ Да f Нет

1

1

Доза инсулина ЕД'кг (0 - если без печения) 0.04 ^

Вероятность МОВУ

83.7 % (Шансы наличия MODY составляют 1 из 1.2)

Расчитать

Выход

нарушений СД у одного из родителей, получаемая терапия. Для определения наиболее значимых переменных был применен критерий хи-квадрат и однофакторный дисперсионный анализ, что позволило подтвердить статистически значимую взаимосвязь отобранных предикторов с типом СД. Исходная база данных была подготовлена и разделена на три выборки: обучающая, вали-дационная и тестовая, для обучения, настройки и оценки НС соответственно. Архитектура НС последовательно изменялась до достижения наилучших показателей площади под ROC кривой (AUC-ROC) и матрицы несоответствий.

Результаты оценки показали, что разработанная архитектура НС в виде 7-5-5-2 (входной слой-скрытые слои-выходной слой, рис. 1) обладает достаточной общей точностью, составляющей 93% (AUC 97%), при этом чувствительность тестирования достигает 98%, а специфичность 93%.

Вероятность MODY диабета >40%, предсказанная моделью, является основанием для рассмотрения вопроса о проведении молекулярно-генетического тестирования (специфичность — 93%). В модели прогнозирования Shields и соавт. также определено пороговое значение 40% для направления на генетическое исследование, однако специфичность несколько ниже (88%) [4]. В этих случаях дальнейшее исследование уровня С-пептида и островковых аутоантител может быть проведено до генетического тестирования, при этом положительный результат на С-пептид и отрицательный результат на ауто-антитела убедительно указывает на MODY по сравнению с СД1 [10-12].

Сильной стороной разработанной модели является достаточная по количеству и качеству выборка пациентов в возрасте до 18 лет. Однако несмотря на проведенную валидацию и проверку модели, необходимо дальнейшее тестирование. Модель должна быть проверена в различных условиях и популяциях, так как распространенность СД1 и MODY диабета может существенно различаться между этническими и возрастными группами.

Включение в модель других характеристик может улучшить ее диагностические возможности. В этой модели использовались только основные клинические характеристики, а данные были ограничены информа-

цией, доступной для всех пациентов. Некоторые важные клинические признаки, которые указывают на MODY, СД1 не были включены. Островковые аутоантитела [13] и показатели секреции эндогенного инсулина, такие как уровень С-пептида, являются высокочувствительными и специфическими биомаркерами СД1, которые хорошо дифференцируют MODY и СД1 [10-12]. Дополнительными прогностическими показателями являются: инсулинорезистентность, стимулированный уровень С-пептида и гликемии. Преимущество использованных в работе клинических критериев заключается в том, что они должны быть рутинно доступны для всех пациентов. Но даже без дополнительных клинических характеристик разработанная модель продемонстрировала превосходное качество распознавания (ROC AUC>0,97), используя только клинические характеристики.

ЗАКЛЮЧЕНИЕ

Разработанная в данной работе на базе НС модель клинического прогнозирования неиммунных форм СД использует доступные для каждого пациента клинические показатели для определения вероятности наличия у пациента MODY. Применение в клинической практике СППВР на базе разработанной модели окажет помощь в отборе пациентов для диагностического генетического тестирования на MODY, что позволит эффективно распределить ресурсы здравоохранения, выбрать персонализированное лечение и наблюдение пациента.

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ

Источники финансирования. Исследование выполнено в рамках государственного задания, номер государственного учета 123021000040-9.

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с содержанием настоящей статьи.

Участие авторов. Лаптев Д.Н. — концепция и дизайн исследования, набор материала, написание и редактирование текста, получение, анализ, статистическая обработка и интерпретация полученных данных; Сечко Е.А. — концепция и дизайн исследования, набор

материала, написание текста; Романенкова Е.М. — набор материала получение, анализ, статистическая обработка и интерпретация полученных данных; Еремина И.А. — набор материала; Безлепкина О.Б. — редактирование текста; Петеркова В.А. — редактирование текста; Мокрышева Н.Г. — редактирование текста, одобрение финальной

версии рукописи. Все авторы одобрили финальную версию статьи перед публикацией, выразили согласие нести ответственность за все аспекты работы, подразумевающую надлежащее изучение и решение вопросов, связанных с точностью или добросовестностью любой части работы.

СПИСОК ЛИТЕРАТУРЫ | REFERENCES

1. Hattersley AT, et al. ISPAD Clinical Practice Consensus Guidelines 2018: The diagnosis and management of monogenic diabetes in children and adolescents // Pediatr. Diabetes. 2018. Vol. 19. P. 47-63. doi: https://doi.org/10.1111/pedi.12772

2. Shields BM, Hicks S, Shepherd MH, et al. Maturity-onset diabetes of the young (MODY): how many cases are we missing? // Diabetologia. 2010. Vol. 53, № 12. P. 2504-2508. doi: https://doi.org/10.1007/s00125-010-1799-4

3. Streun GL, et al. A machine learning approach for handling big data produced by high resolution mass spectrometry after data independent acquisition of small molecules - Proof of concept study using an artificial neural network for sample classification // Drug Test. Anal. 2020. Vol. 12, № 6. P. 836-845. doi: https://doi.org/10.1002/dta.2775

4. Rong D, Xie L, Ying Y. Computer vision detection of foreign objects in walnuts using deep learning // Comput. Electron. Agric. 2019. Vol. 162. P. 1001-1010. doi: https://doi.org/10.1016/j.compag.2019.05.019

5. Shields BM, et al. The development and validation of a clinical prediction model to determine the probability of MODY in patients with young-onset diabetes // Diabetologia. 2012. Vol. 55, № 5.

P. 1265-1272. doi: https://doi.org/10.1007/s00125-011-2418-8

6. T. da Silva Santos T, et al. MODY probability calculator utility in individuals' selection for genetic testing: Its accuracy

and performance // Endocrinol. Diabetes Metab. 2022. Vol. 5, № 5. P. e00332. doi: https://doi.org/10.1002/edm2.332

7. Encyclopedia of Information Science and Technology, Fourth Edition: / ed. Khosrow-Pour, D.B.A. M. IGI Global, 2018

8. Лаптев Д.Н., Мокрышева Н.Г., Безлепкина О.Б. и др. Калькулятор вероятности MODY. Свидетельство о регистрации программы

для ЭВМ 2023613354, 14.02.2023. Заявка №2023612238 от 08.02.2023. [Laptev DN, Mokrysheva NG, Bezlepkina OB, et al. MODY probability calculator.]

9. Pang L, et al. Improvements in Awareness and Testing Have Led to

a Threefold Increase Over 10 Years in the Identification of Monogenic Diabetes in the U.K. // Diabetes Care. 2022. Vol. 45, № 3. P. 642-649. doi: https://doi.org/10.2337/dc21-2056

10. Besser REJ, et al. Urinary C-Peptide Creatinine Ratio Is a Practical Outpatient Tool for Identifying Hepatocyte Nuclear Factor 1-a/ Hepatocyte Nuclear Factor 4-a Maturity-Onset Diabetes of the Young From Long-Duration Type 1 Diabetes // Diabetes Care. 2011. Vol. 34, № 2. P. 286-291. doi: https://doi.org/10.2337/dc10-1293

11. McDonald TJ, et al. Islet autoantibodies can discriminate maturity-onset diabetes of the young (MODY) from Type 1 diabetes: Pancreatic autoantibodies can discriminate MODY from Type 1 diabetes // Diabet. Med. 2011. Vol. 28, № 9. P. 1028-1033. doi: https://doi.org/10.1111/j.1464-5491.2011.03287.x

12. Сечко Е.А., Романенкова Е.М., Еремина И.А. и др. Роль специфических панкреатических антител в дифференциальной диагностике полной клинико-лабораторной ремиссии сахарного диабета 1 типа и MODY у детей // Сахарный диабет. 2022;25(5):449-457. [Sechko EA, Romanenkova EM, Eremina IA, et al. The role of specific pancreatic antibodies in the differential diagnosis of complete clinical and laboratory remission of type 1 diabetes mellitus and MODY in children. Diabetes mellitus. 2022;25(5):449-457. (In Russ.)] doi: https://doi.org/10.14341/DM12921

13. Barker JM. Type 1 Diabetes-Associated Autoimmunity: Natural History, Genetic Associations, and Screening //

J. Clin. Endocrinol. Metab. 2006. Vol. 91, № 4. P. 1210-1217. doi: https://doi.org/10.1210/jc.2005-1679

ИНФОРМАЦИЯ ОБ АВТОРАХ [AUTHORS INFO]

*Сечко Елена Александровна, к.м.н. [Elena A. Sechko, MD, PhD]; адрес: Россия, 117036, Москва, ул. Дм. Ульянова, д. 11 [address: 11 Dm. Ulyanova street, 117036 Moscow, Russia]; ORCID: https://orcid.org/0000-0002-8181-5572; Researcher ID: S-4114-2016; Scopus Author ID: 55880018700; eLibrary SPIN: 4608-5650; e-mail: elena.sechko@bk.ru

Лаптев Дмитрий Никитич, д.м.н. [Dmitry N. Laptev, MD, PhD]; ORCID: https://orcid.org/0000-0002-4316-8546; Researcher ID: O-1826-2013; Scopus Author ID: 24341083800; eLibrary SPIN: 2419-4019; e-mail: laptevdn@ya.ru Романенкова Елизавета Михайловна [Elizaveta M. Romanenkova, MD]; ORCID: https://orcid.org/0000-0003-0123-8857; Researcher ID: AAB-7186-2021; eLibrary SPIN: 6190-0118; e-mail: romanenkovae@list.ru

Еремина Ирина Александровна, к.м.н. [Irina A. Eremina, MD, PhD]; ORCID: https://orcid.org/0000-0001-7021-1151; Researcher ID: S-3979-2016; Scopus Author ID: 6701334405; eLibrary SPIN: 9411-4710; e-mail: ieremina58@gmail.com Безлепкина Ольга Борисовна, д.м.н. [Olga B. Bezlepkina, MD, PhD]; ORCID: https://orcid.org/0000-0001-9621-5732; Researcher ID: B-6627-2017; Scopus Author ID: 6507632848; eLibrary SPIN: 3884-0945; e-mail: olgabezlepkina@mail.ru Петеркова Валентина Александровна, д.м.н., профессор, академик РАН [Valentina A. Peterkova, MD, PhD, Professor, academician of Russian Academy of Medical Sciences]; ORCID: https://orcid.org/0000-0002-5507-4627; eLibrary SPIN: 4009-2463; e-mail: peterkovava@hotmail.com

Мокрышева Наталья Георгиевна, д.м.н., профессор, член-корр. РАН [Natalya G. Mokrysheva, MD, PhD, Professor]; ORCID: https://orcid.org/0000-0002-9717-9742; eLibrary SPIN: 5624-3875; e-mail: nm70@mail.ru

ЦИТИРОВАТЬ:

Лаптев Д.Н., Сечко Е.А., Романенкова Е.М., Еремина И.А., Безлепкина О.Б., Петеркова В.А., Мокрышева Н.Г. Модель клинического прогнозирования сахарного диабета MODY типа у детей // Сахарный диабет. — 2024. — Т. 27. — №1. — С. 33-40. doi: https://doi.org/10.14341/DM13091

TO CITE THIS ARTICLE:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Laptev DN, Sechko EA, Romanenkova EM, Eremina IA, Bezlepkina OB, Peterkova VA, Mokrysheva NG. Clinical prediction model for MODY type diabetes mellitus in children. Diabetes Mellitus. 2024;27(1):33-40. doi: https://doi.org/10.14341/DM13091

i Надоели баннеры? Вы всегда можете отключить рекламу.