Математические модели прогнозирования конечного роста и его коэффициента стандартного отклонения у детей с дефицитом гормона роста в российской популяции
© А.Е. Гаврилова, Е.В. Нагаева, О.Ю. Реброва, Т.Ю. Ширяева
ФГБУ «Национальный медицинский исследовательский центр эндокринологии» Минздрава России, Москва, Россия
Актуальность. Прогнозирование конечного роста (КР), а следовательно и эффективности длительной терапии рекомби-нантным гормоном роста (рГР) у пациентов с СТГ-дефицитом, — важное условие работы клинициста. Это позволяет осуществлять персонализированный подход к лечению пациентов с СТГ-дефицитом: контролировать регулярность введения и правильность дозирования препарата и идентифицировать факторы, от которых зависит КР.
Цель исследования — разработать математические модели прогнозирования КР и его коэффициента стандартного отклонения (standard deviation score — SDS) у пациентов с СТГ-дефицитом в российской популяции.
Материал и методы. Для моделирования использованы данные 121 пациента, наблюдавшегося в Институте детской эндокринологии ФГБУ ЭНЦ в период с 1978 по 2016 г. с диагнозом СТГ-дефицит и получавшего рГР от момента диагностики до достижения КР. В качестве предикторов использовались 11 признаков: пол, хронологический возраст на момент диагностики СТГ-дефицита, пубертатный статус, форма заболевания, регулярность терапии рГР, SDS роста при рождении, SDS роста на момент диагностики СТГ-дефицита, костный возраст на момент диагностики СТГ-дефицита, коэффициент костный возраст/хронологический, SDS генетически прогнозируемого роста, максимальный уровень СТГ в ходе теста с клофелином. Для построения моделей применялись методы множественной линейной регрессии и искусственные нейронные сети (ИНС).
Результаты. Разработанные ИНС продемонстрировали высокую точность прогнозирования КР (среднеквадратическая ошибка — 4,4 см, доля объяснимой дисперсии — 76%) и меньшую точность прогнозирования SDS КР (среднеквадратическая ошибка — 0,601, доля объяснимой дисперсии — 42%). Линейные регрессионные модели, построенные только на количественных предикторах, имели существенно худшее качество. Для наилучшей ИНС разработана программная реализация, доступная в Интернет.
Заключение. Программно реализованная модель прогнозирования КР на основе ИНС использует в качестве предикторов показатели, доступные для любого врача-клинициста, и может применяться для индивидуального прогнозирования КР. В перспективе анализ более крупных баз данных позволит улучшить качество прогнозирования эффективности терапии рГР.
Ключевые слова: искусственная нейронная сеть, множественная линейная регрессия, прогнозирование, СТГ-дефицит, инсулиноподобный фактор роста 1, терапия гормоном роста, конечный рост.
Mathematical models for predicting final achieved height and its standard deviation rate in children with growth hormone deficiency in the Russian population
© Anna E. Gavrilova, Elena V. Nagaeva, Olga Yu. Rebrova, Tatyana Yu. Shiryaeva
Endocrinology Research Centre, Moscow, Russia
Background. Predicting the efficacy of rGH therapy in patients with GH deficiency, based on the final achieved height (FAH) criterion, is an important tool for the clinician. It enables a personalized approach to the treatment of patients with GH deficiency: to recommend careful adherence to the regimen and dosage of the drug, evaluate the efficacy of therapy in different groups of patients, and clearly demonstrate the factors affecting the FAH indicator.
Aim — to develop mathematical models for predicting FAH and its standard deviation score (SDS) in patients with GH deficiency in the Russian population.
Material and methods. For simulation, we used the data of 121 patients diagnosed with GH deficiency who received rGH since the time of diagnosis to the time of final height and were followed-up at the Institute of Pediatric Endocrinology of the Endocrinology Research Centre in the period between 1978 and 2016. As model predictors, we used 11 indicators: the gender, chronological age at the time of GH deficiency diagnosis, puberty status, disease form, regularity of rGH therapy, height SDS at birth, height SDS at the time of GH deficiency diagnosis, bone age at the time of GH deficiency diagnosis, bone age/chronological index, SDS of a genetically predicted height, and maximum stimulated GH level in a clonidine test. To generate models, we used multiple linear regression, artificial neural networks (ANNs), and the Statistica 13 software.
Results. The developed ANNs demonstrated a high accuracy of predicting FAH (the root-mean-square error was 4.4 cm, and the explained variance fraction was 76%) and a lower accuracy of predicting the FAH SDS (the root-mean-square error was 0.601 SDS, and the explained variance fraction was 42%). Linear regression models that were based on quantitative predictors only had a substantially worse quality. Free software implementation was developed for the best produced ANN.
Conclusion. An ANN-based software-implemented model for predicting FAH uses indicators available for any clinician as predictors and can be used for individual prediction of FAH. In the future, the use of larger databases for simulation will improve the quality of predicting the efficacy of rGH therapy.
Keywords: artificial neural network, multiple regression, predicting, GH deficiency, insulin-like growth factor 1, growth hormone therapy, final achieved height.
Copyright © 2017 by the MediaSphere Licensee: CC BY-NC-ND doi: 10.14341/probl2017635282-290
Проблемы эндокринологии 2017;63(5):282-290 Problems of Endocrinology 2017;63(5):282-290
Соматотропная недостаточность (СТГ-дефицит) — патологическое состояние, вызванное нарушением синтеза, секреции, регуляции или биологического эффекта СТГ. Выделяют изолированный СТГ-дефицит (ИДГР) и множественный дефицит гормонов аденогипофиза (МДГА). При ИДГР единственным компонентом гипопитуитаризма является дефицит ГР, а при МДГА, помимо СТГ-дефицита, имеет место недостаточность еще одного или нескольких тропных гормонов гипофиза (адре-нокортикотропного гормона (АКТГ), тиреотропно-го гормона (ТТГ), лютеинизирующего гормона (ЛГ), фолликулостимулирующего гормона (ФСГ), пролактина).
С 1985 г. общепризнанным средством нормализации темпов роста и физического развития ребенка, обусловленной СТГ-дефицитом, является ре-комбинантный гормон роста (рГР), высокая эффективность которого многократно доказана [1—4]. В то же время ответ на лечение у детей значительно различается, а терапия является длительной и дорогостоящей. В последние годы появилась возможность анализировать результаты лечения нескольких поколений детей, длительно получавших терапию рГР и достигших конечного роста (КР), что дает основания для поиска предикторов эффективности лечения. Особенно актуальным является персонифицированный подход к назначению рГР, оптимизация эффекта и стоимости терапии.
Уже на заре применения рГР исследователи пытались разработать математические модели индивидуального прогнозирования эффективности лечения СТГ-дефицита, которые можно использовать на ранних этапах терапии рГР для расчета долговременного ростового ответа и прогнозирования КР пациента. В настоящее время разработано несколько математических моделей, две из которых прогнозируют скорость роста в первый год терапии [5, 7], одна — суммарный ростовой эффект от начала пубертата до достижения КР [8] и три — КР и коэффициент его стандартного отклонения (standard deviation score — SDS) [6, 9, 10]. В качестве предикторов в этих моделях использовались как доступные к началу терапии ауксологические и лабораторные показатели, так и данные, получаемые после начала терапии — длина голени после 3 мес лечения [5], SDS скорости роста до и в первые два года лечения, уровень дезоксипиридинолина (маркера резорбции кости) в моче через 1 мес после начала терапии, скорость роста через 3 мес после начала терапии [7]. Доля объяснимой моделями дисперсии варьирует от 37 [9] до 89% [7]. Основными недостатками разработанных ранее моделей являются ограниченные горизонты прогнозирования, недостаточная точность и необходимость использования специфических предикторов, не всегда доступных в рутинной практике.
Цель исследования — разработать математические модели прогнозирования КР и его SDS у пациентов с СТГ-дефицитом в российской популяции.
Материал и методы
Дизайн исследования
Проанализированы данные 141 пациента (64% мальчики, я=90), наблюдавшихся в Институте детской эндокринологии ФГБУ ЭНЦ в период с 1978 по 2016 г. по поводу СТГ-дефицита и достигших КР. Был использован сплошной метод формирования выборки. Период наблюдения составил от 4 до 38 лет. Информация о 23 (16%) пациентах собрана ретроспективно, о 118 (84%) — проспективно. К началу терапии рГР 114 (81%) человек находились в допубертатном возрасте и 27 (19%) — в пубертатном.
Критерии соответствия
Критерии включения в исследуемую группу:
— диагноз СТГ-дефицита, подтвержденный пробой с клофелином (максимальный уровень СТГ <10 нг/мл);
— достижение КР;
— регулярная терапия рГР в течение минимум
3 лет до достижения КР;
— клинико-лабораторная компенсация вторичных гормональных недостаточностей в течение периода наблюдения.
Критерии исключения:
— наличие объемных образований гипофиза;
— маленькие для гестационного возраста рост и масса тела при рождении (<2 SD для срока геста-ции) [15];
— синдромальная задержка роста;
— костно-хрящевые дисплазии;
— наличие тяжелых сопутствующих заболеваний;
— декомпенсация вторичных недостаточностей в течение периода наблюдения.
Продолжительность исследования
Период наблюдения за пациентами составил от
4 до 15 лет. Частота клинико-лабораторного обследования — 1 раз в год.
Описание медицинского вмешательства
После подтверждения диагноза СТГ-дефицита все пациенты получали заместительную терапию рГР в дозе 0,033 мг/кг (ежедневные подкожные инъекции в вечернее время).
Методы регистрации исходов
Клинико-лабораторные показатели:
1. Пол (м/ж).
2. Хронологический возраст на момент диагностики СТГ-дефицита (с точностью до дня).
3. Пубертатный статус (допубертатный/пубер-татный) по классификации Таннера. Объем тести-кул при осмотре мальчиков исследовался с помощью орхидометра Прадера.
4. Форма заболевания (ИДГР/МДГА) устанавливалась на основании лабораторных исследований.
5. Максимальный уровень СТГ в ходе теста с клофелином (нг/мл). Исследование крови проводилось в утренние часы натощак. Клофелин (кло-нидин) вводился однократно внутрь в дозе 0,15 мкг/м2 поверхности тела. Уровень СТГ исследовался до и через 30, 60, 90, 120 мин после введения препарата.
6. Регулярность терапии рГР (да/нет) оценивалась путем опроса пациентов. Перерыв в лечении препаратами рГР суммарно не более 1 мес в год оценивался как регулярная терапия, суммарно более 1 месяца — как нерегулярная.
Ауксологические показатели:
7. SDS роста при рождении — рассчитывался по формуле: SDS роста=(х-Х)/SD, где х — рост ребенка, Х — средний рост для данного хронологического возраста и пола, SD — стандартное отклонение роста для данного хронологического возраста и пола (при рождении для мальчиков российской популяции SD=2,02 см, Х=54,79 см, для девочек SD=2,02 см, Х=53,71 см [12]).
8. SDS роста для хронологического возраста и пола на момент диагностики СТГ-дефицита — рассчитывался для оценки степени отклонения роста пациента от среднего в британской популяции с помощью приложения Auxology [17] по результатам измерения длины тела пациента при помощи механического ростомера с точностью до 0,1 см (норма ± 2SD).
9. SDS генетически прогнозируемого роста (SDS ГПР) — рассчитывался с использованием данных о росте родителей пациента по формуле Таннера: ГПР для мальчиков = [(рост отца + рост матери + 13 см)/2] ±7 см; ГПР для девочек = [рост отца + рост матери — 13 см)/2] ± 7 см [7].
10. Костный возраст пациента (КВ) на момент диагностики СТГ-дефицита (с точностью до месяца). Оценка степени дифференцировки скелета («костного возраста») проводилась методом Greulich & Pyle [16] по рентгенограмме кистей рук с лучеза-пястными суставами.
11. Отношение «костный возраст/хронологический возраст» (КВ/ХВ) на момент диагностики СТГ-дефицита — рассчитывалось арифметически.
12. КР (в см) фиксировался при достижении пациентом хронологического возраста больше 16 лет и/или костного возраста более 16 лет у мальчиков и
более 14 лет у девочек, а также при снижении скорости роста до менее 2 см в год на фоне терапии рГР.
13. SDS КР рассчитывали с помощью приложения Auxology (для британской популяции) [17].
Этическая экспертиза
Исследование одобрено локальным этическим комитетом ФГБУ «Эндокринологический научный центр» (протокол ЛЭК №12 от 22.10.14).
Статистический анализ
Анализ данных проводился с использованием пакета прикладных программ Statistica v.13 («StatSoft Inc.», США). В качестве параметров распределений количественных признаков использованы медиана (Me), 1-й и 3-й квартили (Qt и Q3), в случае их нормальных распределений — средние и среднеквадра-тические отклонения; для бинарных признаков — абсолютные и относительные частоты. Оценка соответствия распределения нормальному осуществлялась с применением критерия Шапиро—Уилка. Для сравнения независимых групп по количественному признаку использовался метод Манна—Уит-ни. Для анализа связи количественных признаков применялся непараметрический корреляционный анализ по Спирмену. Для нивелирования проблемы множественных сравнений применялась поправка Бонферрони.
Применялись два метода математического моделирования — пошаговая множественная линейная регрессия (МЛР) и искусственные нейронные сети (ИНС). В обоих случаях откликом служили непрерывные признаки — КР и SDS КР. МЛР допускает в качестве предикторов только непрерывные признаки. Пошаговый вариант этого анализа позволяет оптимизировать число и набор предикторов в окончательной модели таким образом, чтобы достичь максимальной эффективности модели при минимальном наборе предикторов. ИНС — класс методов математического моделирования, в основе которого лежит бионический принцип сети узлов (нейроны) с множественными входными сигналами (дендритами) и одним выходным сигналом (аксон). На входной слой сети подаются данные, выходным сигналом является моделируемый отклик (рис. 1). Преимуществом данного класса методов является возможность использовать сочетание любых признаков как в качестве предикторов, так и в качестве откликов моделей, а также высокая эффективность результирующих моделей. Ранее было показано, что ИНС являются ценным инструментом создания математических моделей прогнозирования при решении медицинских задач, особенностью которых служит малое число наблюдений и необходимость совместного использования качественных и количественных предикторов [7]. В качестве топологий сети тестировались многослойные (3- и 4-слойные)
Рис. 1. Схематическое изображение 3-слойного персептрона — одной из наиболее популярных топологий искусственных нейронных сетей. Между входным слоем (из 10 нейронов — слева) и выходным слоем (из 1 искусственного нейрона — справа) расположен слой из 6 скрытых искусственных нейронов.
персептроны (МСП), радиальные базисные функции, байесовские и линейные нейронные сети. Оба метода моделирования исключают наблюдения с пропусками из анализа, поэтому количество наблюдений при различных наборах предикторов могло различаться. Для оценки качества модели использовались среднеквадратическая ошибка модели (root mean square error — RMSE), коэффициент детерминации (R2), коэффициенты корреляции наблюдаемых и прогнозируемых величин.
Результаты
Объекты (участники) исследования
Характеристика выборки пациентов, достигших КР, представлена в табл. 1. Как можно видеть, данные содержат до 9% пропусков (максимальное количество пропусков — по максимальному стимулированному уровню СТГ). Поскольку многомерный анализ исключает наблюдения с пропусками (либо требует заполнения пропусков, что обычно приводит к смещенным оценкам и завышению качества получаемых моделей), нами были вынужденно удалены все наблюдения с пропусками, после чего осталось 122 наблюдения для проведения регрессионного анализа (в таком анализе участвуют только количественные признаки) и 121 — для применения методов ИНС.
Основные результаты исследования
Результаты анализа статистической связи отдельных предикторов с КР и SDS КР для 121 полно-
го наблюдения приведены в табл. 2. Наборы признаков, статистически значимо связанные с КР и SDS КР, несколько различаются. Наличие или отсутствие таких связей может использоваться в качестве аргументов при формировании наборов предикторов для построения многофакторных моделей, однако такой подход не является ни единственным, ни заведомо эффективным. Другими возможными способами снижения размерности признакового пространства являются пошаговые процедуры в МЛР, генетический алгоритм, эвристические аргументы (например, сложность или трудоемкость оценки некоторых предикторов).
Поскольку МЛР допускает применение в качестве предикторов лишь количественных признаков, были использованы следующие показатели: SDS роста при рождении, SDS ГПР, хронологический возраст на момент диагностики СТГ-дефицита, SDS роста на момент диагностики СТГ-дефицита, КВ на момент установки СТГ-дефицита, КВ/ХВ, максимальный стимулированный уровень СТГ. В выборке было 122 наблюдения с отсутствием пропусков в этих признаках; соответственно, модели строились на этих 122 наблюдениях. Разработаны две модели — для прогнозирования КР и SDS КР, их характеристики приведены в табл. 3.
В модели МЛР, рассчитывающей КДР, статистически значимыми параметрами были SDS роста пациента при диагностике СТГ-дефицита, КВ на момент диагностики СТГ-дефицита и SDS генетически прогнозируемого роста. В модель, прогнозирующую SDS КР, дополнительно включен максимальный стимулированный уровень СТГ. Остальные 3 предиктора (SDS роста при рождении, возраст на момент диагностики СТГ-дефицита, коэффициент КВ/ХВ) оказались статистически незначимыми. Несмотря на статистическую значимость обеих моделей, они характеризуются низкой долей объяснимой дисперсии.
Модели прогнозирования КР и SDS КР строились также с применением метода ИНС. Однако теперь в качестве предикторов использовались и 4 бинарных признака. Применялись два набора признаков:
— все признаки (полный набор предикторов);
— признаки, имеющие статистически значимую одномерную связь с прогнозируемыми показателями (сокращенный набор предикторов) (см. табл. 2).
Исходная выборка была случайным образом разделена на обучающую и контрольную в соотношении 7:3 (85 и 36 наблюдений соответственно). Тестовая выборка вынужденно не создавалась в связи с крайне малым количеством полных наблюдений, а также с учетом того, что ошибка на ней обычно приближенно равна таковой на контрольной.
Наилучшие результаты при прогнозировании КР были получены на моделях многослойного пер-
Таблица 1. Характеристика группы пациентов с КР (n=141)
Параметр
Абс.
Описательная статистика, абс. частоты и _% или Me (Q,; Q3)_
Пол (м/ж), абс. (%)
Возраст на момент установки СТГ-дефицита, годы Пубертатный статус (допуб/пуб.), абс. (%) Диагноз (ИДГР/МДГА), абс. (%) Регулярность терапии (да/нет), абс. (%) SDS роста при рождении
SDS роста на момент диагностики СТГ-дефицита КВ на момент диагностики СТГ-дефицита, годы КВ/ХВ КР, см:
у девочек у мальчиков
Доля пациентов, не достигших социально приемлемой нормы [8], абс. (%) девочек (<154 см) мальчиков (<165 см) SDS КР SDS ГПР
Максимальный стимулированный уровень СТГ, нг/мл
141 140
140
141 141
132 139
133 133 141
141
141 131 129
90/51(64/36) 9,62 (6,82; 12,91) 114/26(81/19) 35/106 (25/75) 99/42(70/30) 0,56 (-0,38; 1,24) -3,39 (-4,16; -2,83) 6,0 (3,0; 8,0) 0,58 (0,48; 0,68) 166,0 (160,0; 173,1) 158,0 (153,8; 162,3) 171,0 (165,0; 176,0) 32 (23) 13 (25) 19 (21)
-0,67 (-1,37; 0,15), min= -4,00, max=1,80 -0,03 (-0,56; 0,42) 0,66 (0,20; 2,20)
Таблица 2. Характеристика одномерных статистических связей потенциальных предикторов с моделируемыми откликами (п=121)
Отклик: КР Отклик: SDS КР
Потенциальный предиктор Me (Q^ Q3) p, тест Манна-Уитни Me (Q^ Q3) p, тест Манна— Уитни
Пол:
муж. (п=78) 171 (166; 176) <0,001* -0,45 (-1,31; 0,27) 0,649
жен. (п=43) 159 (154; 163) -0,67 (-1,34; 0,16)
Диагноз:
МДГА (п=89) 167 (160; 175) 0,323 -0,34 (-1,26; 0,48) 0,006
ИДГР (п=32) 165 (159; 171) -0,93 (-1,52; -0,49)
Пубертатный статус:
пуб. (п=24) 162 (158; 170) 0,069 -0,71 (-1,39; -0,27) 0,344
допуб. (п=97) 168(161;175) -0,45 (-1,31; 0,23)
Регулярность терапии:
да (п=88) 169 (164; 176) <0,001 -0,29 (-1,08; 0,42) <0,001
нет (п=33) 158(154;161) -1,22 (-1,85; -0,67)
Отклик: КР Отклик: SDS КР
Потенциальные предикторы коэффициенты p, тест коэффициенты p, тест
корреляции Спирмена корреляции Спирмена
SDS роста при рождении 0,105 0,249 0,078 0,392
SDS целевого роста 0,340 <0,001 0,365 <0,001
Возраст при постановке диагноза, годы -0,208 0,022 -0,216 0,017
SDS роста при постановке диагноза 0,457 <0,001 0,295 0,001
Костный возраст, годы -0,202 0,026 -0,262 0,004
Отношение костного возраста к хронологическому -0,105 0,251 -0,185 0,042
Максимальный СТГ, нг/мл 0,127 0,164 -0,016 0,866
септрона при применении полного набора предикторов (см. табл. 3). Общая ошибка на лучшей ИНС (МСП 11:15-4—1:1) составила 4,417 см, а доля объяснимой дисперсии — 76%, что представляется неплохим результатом, однако и в этом случае проявился типичный недостаток ИНС — их переобучен-ность, особенно при малом числе наблюдений:
ошибки на контрольных выборках выше ошибок на обучающих, либо не согласуются друг с другом.
На рис. 2 приведена диаграмма рассеяния фактических и прогнозируемых значений КР для лучшей полученной ИНС. Видно, что эти значения расположены вблизи линии их совпадения, корреляция этих показателей является сильной (/=0,873;
Таблица 3. Характеристики множественных линейных регрессионных моделей (п=122)
Характеристика
Моделирование КР
Моделирование SDS КР
Коэффициенты уравнений регрессии для предикторов: SDS роста при рождении SDS генетически прогнозируемого роста Возраст на момент установки СТГ-дефицита, годы SDS роста на момент установки СТГ-дефицита Костный возраст на момент установки СТГ-дефицита, годы Коэффициент КВ/ХВ
Максимальный стимулированный уровень СТГ, нг/мл
Константа
Стандартная ошибка
р (уровень статистической значимости модели) Доля объяснимой дисперсии R2, %
2,112
3,160 -0,493
180,5 7,79 см <0,001 27
0,313
0,268 -0,082
-0,077 0,989 0,93 SDS 0,006 26
Рис. 2. Диаграмма рассеяния фактических значений конечного достигнутого роста (КДР) (ось абсцисс) и прогнозируемых с помощью трехслойного персептрона 11:15—4-1:1 значений (ось ординат).
р<0,001, критерий Спирмена). Наблюдения, расположенные над прямой, имеют переоценку КР, под прямой — недооценку. Гистограмма распределения остатков модели (разностей между прогнозируемыми и фактическими величинами) приведена на рис. 3. Остатки со средним и стандартным отклонением (-0,08)±4,44 нормально распределены (р=0,916; критерий Шапиро—Уилка).
Модели прогнозирования SDS КР с помощью ИНС оказались менее эффективными. Лучшая из них, построенная по полному набору предикторов, описана в табл. 4. Доля объяснимой дисперсии была высокой на обучающей выборке, но крайне низ-
кой — на контрольной. Модели, построенные по сокращенному набору предикторов, также оказались неэффективными, что подтверждает нецелесообразность использования критерия наличия одномерных связей предиктора и отклика при формировании набора потенциальных предикторов моделей.
Уравнения моделей ИНС являются громоздкими, поэтому в статье не приводятся, однако лучшая из моделей (МСП (3) 11:15—4—1:1) была программно реализована: разработан свободно доступный в Интернет программный калькулятор (ЬИр://аНа-endo.ru/page/programmnii_kalkulyator_rascheta_ konechnogo_dostig).
Таблица 4. Характеристики разработанных моделей искусственных нейронных сетей (п=121)
Моделирование КР
Моделирование SDS КР
Характеристика
полный набор предикторов
сокращенный набор предикторов
полный набор предикторов
сокращенный набор предикторов
Количество предикторов Архитектура сети
Среднеквадратическая ошибка (RMSE): все наблюдения обучающая выборка контрольная выборка Доля объяснимой дисперсии все наблюдения, % обучающая выборка, % контрольная выборка, % Коэффициент корреляции Спирмена: все наблюдения обучающая выборка контрольная выборка
11
МСП (3) 11:15—4-1:1
4,417 см 4,129 см 5,033 см
75,9 77,6 72,4
0,873 0,882 0,823
МСП (3) 4:4—4-1:1
5,546 см 5,495 см 5,664 см
62,0 60,1 65,5
0,784 0,766 0,830
11
МСП (3) 11:15—9-1:1
0,601 SDS 0,404 SDS 0,911 SDS
42,4
86,0 28,0
0,824 0,933 0,545
МСП (3) 4:4—10-1:1
0,823 SDS 0,840 SDS 0,784 SDS
43,7
35.7
59.8
0,577 0,509 0,709
4
4
N
16 I-1-1-1-1-1-1-1-1-1-1-1-1-1-Г
14 " —
12 -
10 " ———
8 - —
6 - — — —
4
2
0 |_1_1_1-Ъ-Ь_1-Ь_1-Ь_1--Ь_1--Ь_1--Ь_1-Ъ_1-Ь_1-!_■_
-14-13-12-11-10 -9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12
Разность «Прогнозируемый КДР - КДР», см
Рис. 3. Гистограмма распределения остатков модели ИНС для прогнозирования КР (разностей между фактическими и прогнозируемыми величинами).
Обсуждение
Возможность прогнозировать КР — важный инструмент клинициста. С его помощью можно осуществлять персонализированный подход к терапии рГР у пациентов с СТГ-дефицитом: подбирать дозу рГР, контролировать соблюдение регулярности вве-
дения и дозирования препарата, оценивать эффективность терапии, наглядно демонстрировать факторы, от которых зависит КР.
Первые прогностические модели использовались для прогнозирования скорости роста в первый год терапии рГР. Считается, что именно этот год максимально отражает восприимчивость организма
пациента к лечению. Однако после того как появилась возможность анализировать поколение детей, регулярно и длительно получавших терапию рГР и достигших роста близкого к конечному (до закрытия зон роста), стали появляться модели, прогнозирующие КР и его SDS [9, 10]. Стоит отметить, что КР как у здоровых людей, так и у пациентов с СТГ-дефицитом различается в зависимости от популяции [2, 4]. Для российской популяции социально приемлемым ростом считается рост выше 154 см у женщин и выше 165 см у мужчин [8]. Значительным недостатком большинства известных в настоящее время математических моделей прогнозирования КР и его SDS являются низкая доля объяснимой дисперсии и достаточно высокая погрешность вычисления. К тому же в этих моделях используется информация, доступная на момент начала терапии рГР, а для расчета КР детей в зависимости от пубертатного статуса необходимо использовать две разные формулы [9]. К недостаткам моделей МЛР (такими являются 5 из 6 известных моделей) относится невозможность использования бинарных предикторов, таких как пол, вид СТГ-дефицита (ИДГР/ МДГА), регулярность терапии рГР, пубертатный статус пациентов. Модели ИНС лишены этого недостатка. Первая ИНС для прогнозирования эффективности терапии рГР у пациентов с ИДГР была разработана J. Smyczynska и соавт. [10] в 2015 г. Она обладает достаточно высокой прогностической точностью при прогнозировании КР (СКО=3,8 см, R2=77,7%) и более низкой — при прогнозировании SDS КР (СК0=0,59 SDS, R2=43,0%). Наши модели характеризуются сходной прогностической точностью (СКО=4,4 см, R2=75,9% при прогнозировании КР; СК0=0,60 SDS, R2=42,4% при прогнозировании SDS КР), однако учитывают более широкий набор предикторов — форму заболевания, пубертатный статус, регулярность терапии. Учитывая, что СТГ-дефицит является хроническим заболеванием и требует длительного лечения, а регулярность этого лечения влияет на его успешность [13, 14], последний предиктор представляется очень важным.
Все предикторы, используемые в наших моделях, доступны для оценки практическим врачом-эндокринологом и не требуют малодоступных исследований и частого динамического наблюдения пациента. Для удобства применения разработанных
ЛИТЕРАТУРА
1. Darendeliler F, Lindberg A, Wilton P. Response to growth hormone treatment in isolated growth hormone deficiency versus multiple pituitary hormone deficiency. Horm Res Paediatr. 2011;76 Suppl 1:42-46. doi: 10.1159/000329161
2. Blethen SL, Baptista J, Kuntze J, et al. Adult height in growth hormone (GH)-deficient children treated with biosynthetic GH. The Genentech Growth Study Group. J Clin Endocrinol Metab. 1997;82(2):418-420. doi: 10.1210/jcem.82.2.3734
моделей на практике создан доступный в Интернет программный продукт.
Ограничения исследования
Основным ограничением исследования является недостаточное число наблюдений. C этим связана малая эффективность и переобученность полученных моделей, хотя методы ИНC позволили получить модель приемлемого качества. Попытки снизить число предикторов не привели к улучшению результатов.
При проведении многомерного анализа исключаются наблюдения с пропусками, поэтому мы включали в рассмотрение только такие показатели, по которым доля пропусков не превышала 10%. В частности, поэтому в число рассматриваемых признаков не были включены результаты анализа мутаций в генах, ответственных за эмбриогенез гипофиза (ARNT2, GH1, GHRH, GHRHR, GHSR, GLI2, HESX1, LHX3, LHX4, OTX2, PAX6, POU1F1, PROP1, SHH, SOX2, SOX3).
Заключение
ИНC является ценным инструментом для создания эффективных моделей в медицине, в частности, при прогнозировании эффективности терапии рГГ у пациентов с СТГ-дефицитом. В качестве исходных данных для разработанных нами моделей используются доступные для любого врача-клинициста показатели. Лучшая из разработанных моделей продемонстрировала достаточно высокую прогностическую точность при прогнозировании KP (ошибка составила 4,417 см, а доля объяснимой дисперсии 75,9%). Модель для прогнозирования SDS KP была менее качественной (ошибка составила 0,601 SDS, а доля объяснимой дисперсии 42,4%). В перспективе использование большего объема данных для моделирования позволит улучшить качество прогнозирования эффективности терапии р^.
ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с выполнением данного исследования.
Благодарности. Kоллектив авторов благодарит компанию «StatSoft Russia» за помощь в генерации программного кода и Фонд поддержки развития филантропии «ХАФ» за программную реализацию калькулятора и его размещение в Интернет.
REFERENCES
3. Rachmiel M, Rota V, Atenafu E, et al. Final height in children with idiopathic growth hormone deficiency treated with a fixed dose of recombinant growth hormone. Horm Res. 2007;68(5):236-243. doi: 10.1159/000101427
4. Thomas M, Massa G, Bourguignon JP, et al. Final height in children with idiopathic growth hormone deficiency treated with recombinant human growth hormone: the Belgian experience. Horm Res Paediatr. 2001;55(2):88-94. doi: 10.1159/000049976
5. Mortensen HB, Main K, Michaelsen KF, et al. Predicting and monitoring of growth in children with short stature during the first year of growth hormone treatment. Acta Paediatr. 1991;80(12):1150-1157. doi: 10.mi/j.1651-2227.1991.tb11803.x
6. Wikland KA, Kriström B, Rosberg S, et al. Validated multivariate models predicting the growth response to GH treatment in individual short children with a broad range in GH Secretion Capacities. PediatrRes. 2000;48(4):475-484.
doi: 10.1203/00006450-200010000-00010
7. Schonau E, Westermann F, Rauch F, et al. A new and accurate prediction model for growth response to growth hormone treatment in children with growth hormone deficiency. Eur J Endocrinol. 2001;144(1):13-20. doi: 10.1530/eje.0.1440013
8. Ranke MB, Martin DD, Lindberg A, on behalf of the Kigs International Board o. prediction model of total pubertal growth in idiopathic growth hormone deficiency: analysis of data from KIGS. Horm Res Paediatr. 2004;60(1):58-59. doi: 10.1159/000071227
9. de Ridder MAJ, Stijnen T, Hokken-Koelega ACS. Prediction of adult height in growth-hormone-treated children with growth hormone deficiency. J Clin Endocr Metab. 2007;92(3):925-931. doi: 10.1210/jc.2006-1259
10. Smyczynska J, Hilczer M, Smyczynska U, et al. Neural network models — a novel tool for predicting the efficacy of growth hormone (GH) therapy in children with short stature. Neuro Endocrinol Lett. 2015;36(4):348-353.
11. Реброва О.Ю. Применение методов интеллектуального анализа данных для решения задачи медицинской диагностики. // Новости искусственного интеллекта. — 2004. — №3. — С. 76-80. [Rebrova OYu. Primenenie metodov intellektual'nogo
analiza dannykh dlya resheniya zadachi meditsinskoy diagnostiki. Novosti iskusstvennogo intellekta. 2004;(3):76-80.(In Russ.)].
12. Нагаева Е.В. Федеральные клинические рекомендации по диагностике и лечению гипопитуитаризма у детей и подростков // Проблемы Эндокринологии. — 2013. — Т. 59. — №6. — C. 27—43. [Nagaeva EV. Russian association of endocrinologists national practice guidelines(clinical signs, diagnosis, differential diagnosis, treatment). Hypopituitarism in children and adolescents. Problems of Endocrinology. 2013;59(6):27-43. (In Russ.)].doi: 10.14341/probl201359627-43
13. Blethen SL, Baptista J, Kuntze J, et al. Adult height in growth hormone (GH)-deficient children treated with biosynthetic GH. The Genentech Growth Study Group. J Clin Endocrinol Metab. 1997;82(2):418-420. doi: 10.1210/jcem.82.2.3734
14. Rohayem J, Drechsel H, Tittel B, et al. Long-term outcomes, genetics, and pituitary morphology in patients with isolated growth hormone deficiency and multiple pituitary hormone deficiencies: a single-centre experience of four decades of growth hormone replacement. Horm Res Paediatr. 2016;86(2):106-116.
doi: 10.1159/000448098
15. WHO Child Growth Standards. Acta Paediatrica. 2006;95(suppl 1):5-101. Available from: http://www.who.int/childgrowth/standards/ru
16. Greulich WW, Pyle SI. Radiographic atlas of skeletal development of the hand and wrist. The American Journal of the Medical Sciences. 1959;238(3):393.
17. Kromeyer-Hauschild K, Jaeger U. Growth studies in Jena, Germany: changes in body size and subcutaneous fat distribution between 1975 and 1995. Am J Hum Biol. 1998;10(5):579-587.
doi: 10.1002/(sici) 1520-6300(1998) 10:5<579::aid-ajhb4>3.0.co;2-9
ИНФОРМАЦИЯ ОБ АВТОРАХ
Гаврилова Анна Евгеньевна [Anna E. Gavrilova, MD]; адрес: Россия, 117036, Москва. ул. Дм. Ульянова, д. 11 [address: 11 Dm Ulyanova street, 117036 Moscow, Russia]; ORCID: http://orcid.org/0000-0002-3628-3079; eLibrary SPIN: 2022-8974; e-mail: [email protected]
Нагаева Елена Витальевна, к.м.н. [Elena V. Nagaeva, MD, PhD]; ORCID: http://orcid.org/0000-0001-6429-7198; eLibrary SPIN: 4878-7810; e-mail: [email protected]
Ширяева Татьяна Юрьевна, к.м.н. [Tatiana Yu. Shiryaeva, MD, PhD]; ORCID: http://orcid.org/0000-0002-2604-1703; eLibrary SPIN: 1322-0042; e-mail: [email protected]
Реброва Ольга Юрьевна, д.м.н. [Olga Yu. Rebrova, PhD]; ORCID: http://orcid.org/0000-0002-6733-0958; eLibrarySPIN: 7360-3254; e-mail: [email protected]
ИНФОРМАЦИЯ
Рукопись получена: 23.09.2017. Одобрена к публикации: 04.10.2017. КАК ЦИТИРОВАТЬ:
Гаврилова А.Е., Нагаева Е.В., Реброва О.Ю., Ширяева Т.Ю. Математические модели для прогнозирования конечного роста и его коэффициента стандартного отклонения у детей с дефицитом гормона роста российской популяции // Проблемы эндокринологии. — 2017. — Т. 63. — №5. — С. 282—290. doi: 10.14341/probl2017635282-290
TO CITE THIS ARTICLE:
Gavrilova AE, Nagaeva EV, Rebrova OYu, Shiryaeva TYu. Title. Problems of Endocrinology. 2017;63(5):282-290. doi: 10.14341/probl2017635282-290