УДК 611.6:616-056.52:616-055.23:616-07:51-7
О. С. Филиппов, М. В. Коваленко
МОДЕЛЬ ПРОГНОЗИРОВАНИЯ НАРУШЕНИЙ МЕНСТРУАЛЬНОЙ ФУНКЦИИ У ДЕВУШЕК-ПОДРОСТКОВ С ОЖИРЕНИЕМ
Красноярская государственная медицинская академия (Красноярск)
Среди методик применяемых для прогнозирования и оценки вероятности наступления того или иного состояния широкое распространение получит, метод логистической регрессии. На основе данного метода была произведена оценка возможности возникновения нарушений менструальной функции при. ожирении у девушек пубертатного возраста в городе Красноярске. Группа исследования составила 182 девушки, с ожирением, имеющих нарушения менструальной функции, в возрасте от 14 до 17 лет, отобранных случайным, образом, из числа школьниц с ожирением. (ИМТ > 25), выявленных в результате профилактических осмотров в школах города Красноярска. Из группы, девушек соответствующего возраста с ожирением, но без патологии менструальной системы, методом, копии-пара была сформирована контрольная группа в количестве 182 наблюдений. В результате проведенного исследования, было построено уравнение логистической регрессии для. предсказания вероятности, принадлежности, обследуемых к группам, здоровых или. больных с нарушением, менструальной, функции, которое может, быть использовано для. доклинического прогнозирования, возможности развития данной патологии и. диагностики, уже имеющихся, заболеваний.
Ключевые слова: ожирение у девушек, менструальная функция, прогнозирование, логистическая регрессия
MODEL OF FORECASTING OF INFRINGEMENTS MENSTRUAL FUNCTIONS AT GIRLS-TEENAGERS WITH ADIPOSITY
O.S. Philippov, M.V. Kovalenko
State Medical Academy, Krasnoyarsk
Among techniques applied, to forecasting and estimations of probability of approach of any condition the wide circulation will receive a method, of logistical regress. On the basis of the given method, the estimation of an opportunity of occurrence of infringements menstrual functions has been made at adiposity at girls pubertal age in the city of Krasnoyarsk. The group of research has made 182 girls with the obesity, having infringements menstrual functions, of the age from. 14 till 17 years selected, in the casual image from, among schoolgirls with adiposity (BMI > 25), revealed as a result of routine inspections at schools of city of Krasnoyarsk. From group of girls corresponding age with adiposity, but without a pathology of reproductive system, using a copy-pair method, has been generated, control group in quantity of 182 supervisions. As a result of carried out research the equation of logistical regress for a prediction, of probability of an accessory surveyed, to groups healthy or sick with infringement menstrual functions wh ich can be used, for preclinical forecasting of an opportunity of development of the given pathology and. diagnostics has been constructed.
Key words: girls' obesity, reproduction, menstrual function, forecasting, logistical regression
ВВЕДЕНИЕ
В соответствии с клиническими представлениями наличие патологического процесса или его возникновение у конкретного человека через некоторый промежуток времени протекает при взаимодействии возможной генетической предрасположенности при влиянии внутренних и внешних факторов окружающей среды и на каждом этапе сопровождается появлением тех или иных изменений, в различной степени специфичных для каждого конкретного заболевания, на органическом, клеточном или молекулярном уровне. Кроме того, обнаруживаемые клинические признаки зачастую могут влиять на психическую сферу индивидуума, вызывая заметные изменения в поведении, обусловленные тесной взаимосвязью особенностей функционирования организма и ментальных функций. Подобные факторы, оказывающие негативное влияние, увеличивая шанс возникновения патологического процесса, являются предметом изучения практической и теоретической медицины, открывающей перспективы использования знания о характерных особенностях комплексного сочетания воздействий на индивидуум в тесной взаимосвязи с появлением патологического процесса. Совместно с исследованием наличия клинических признаков становится возможным на базе создания скрининг-методов формировать не только диагностические системы, выявляющие заболевание на ранних стадиях, но и строить модели, позволяющие оценить риск возникновения патологии в будущем, что особо актуально в случае, если сроки начала лечения напрямую влияют на его эффективность.
На протяжении последнего десятилетия в научных исследованиях, посвященных проблемам клинической медицины, все чаще приходится сталкиваться с применением математических моделей в прогностических целях: оценка вероятности того или иного состояния, определение возможности возникновения патологического процесса, прогноз течения или шансов появления различных вариантов развития заболевания. Математические модели, которые основываются на вышеизложенных подходах, относят к классу моделей дискретного
выбора, применяемых в теории случайного выбора и обоснованного принятия решений. Данные модели нашли в последние тридцать лет широкое применение в различных областях народного хозяйства и, в том числе, в медицине. Среди применяемых методик широкое распространение получает метод логистической регрессии [ 1 ], использование которого на протяжении последних десятилетий было характерно для зарубежных авторов, и только в настоящее время логистическая регрессия все чаще встречается в трудах российских ученых, в том числе научных публикациях, посвященных описанию результатов медицинских исследований [2, 3].
В ряде стран, включая Россию, не менее 30 % населения имеет избыточную массу тела [4]. В литературе отражена тесная взаимосвязь между наличием ожирения и характером менструальной функции у девушек в пубертатном периоде [5, 6]. На возникновение этой патологии влияют медицинские факторы и особенности индивидуального развития, а также социальные аспекты и образ жизни.
Ряд исследований, посвященных изучению нарушений менструальной функции у девушек с ожирением, определяют значимое влияние на возникновение нарушений менструальной функции перинатальных факторов, перенесенной черепномозговой травмы, наличие ожирения с детства, заболеваний щитовидной железы, гепатита и некоторых других. При этом в различных географических и социально-экономических зонах исследователи выявляют не только различную степень влияния тех или иных предикторов, но и в ряде случаев различные факторы, по-видимому, отражающие особенности той территории, в рамках которой проводится исследование.
Исходя из этого, целью исследования явилось построение модели, позволяющей выполнять прогнозирование возникновения нарушений менструальной функции при ожирении у девушек пубертатного возраста.
МАТЕРИАЛ И МЕТОДЫ
В результате профилактических осмотров в школах города Краснояржа было обследовано
2 536 девушек в возрасте от 12 до 17 лет. Из них ожирение (индекс массы тела > 25, по данным антропометрических измерений) зарегистрировано у 452 учащихся, которым было предложено пройти детальное обследование в соответствии с целью данной работы. В результате у 182 школьниц, вошедших в контрольную группу, обнаружены нарушения менструальной функции в виде следующей патологии: олигоменорея — 21,4 %, дисменорея — 23,8 %, аномальные маточные кровотечения пубертатного периода — 14,3 %, первичная и вторичная аменорея — 4,8 и 19,0 % соответственно. У 16,7 % (n = 7) обследуемых имели место сочетания нарушений менструальной функции: олигоменорея в сочетании с дисменореей — 11,9%, олигоменорея в сочетании с аномальными маточными кровотечениями пубертатного периода — 4,8 %.
Из группы девушек соответствующей половозрастной группы с ожирением, но без патологии менструальной системы, методом копии-пара была сформирована контрольная группа в количестве 182 наблюдений.
При анализе причин, способствующих возникновению нарушений становления менструальной функции, с целью унификации проводимых вычислений, качественные анализируемые признаки были преобразованы в индикаторные дихотомические переменные и на основе объединяющих их временных периодов и общих механизмов воздействия.
Исследование проводилось в два этапа.
Первый этап — моделирование зависимости присутствия ряда признаков и ситуаций в анамнезе обследуемых в связи с наличием или отсутствием у них нарушений менструальной функции при помощи бинарной логистической модели (Binary Logit Model). Помимо произведенного отбора факторных признаков проводилось их редуцирование (сокращение), направленное на повышение качества статистической модели и способствовавшее более понятной интерпретации полученных результатов и возможностей ее использования.
На втором этапе производилось тестирование созданной модели с позиций ее статистической значимости, и рассматривались возможности практического использования результатов проведенной работы.
Статистическая обработка собранной информации выполнялась с использованием возможностей современной вычислительной техники на базе прикладных компьютерных программ пакета MS Office (MS Excel), а также Statistica 5.0 for Windows, SPSS v.11.5
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
На массиве с данными статистической совокупности (группа исследования и группа контроля) первоначально была построена матрица коэффициентов непараметрической корреляции. Исследование матрицы выявило достаточно существенную связь между исследуемыми факторными показателями и результативным порядковым признаком — наличием нарушений менструальной функции у девушек с ожирением (табл. 1).
Таким образом, на основе результатов ранговой корреляции Спирмена можно сделать вывод о значительной связи особенностей соматического статуса с наличием нарушений менструальной функции у девушек с ожирением. При этом в указанную группу входили такие признаки как: наличие вегето-сосудистой дистонии, наличие патологии щитовидной железы; наличие аллергических реакций; хронические заболевания желудочнокишечного тракта; болезни ЛОР-органов; перенесенные оперативные вмешательства.
Особенно интересным представляется расположение на втором месте, по силе связи с возникновением нарушений менструальной функции особенностей пищевого поведения обследуемых, способствующих приобретению избыточной массы тела. Среди данных проявлений, прежде всего, учитывались количество приемов пищи более 4-х раз в день; систематическое переедание; несбалансированность пищевого рациона; преобладание в рационе мучных и кондитерских продуктов питания; нерегулярное питание.
После того как на стадии априорного анализа произведен отбор факторов, влияющих на возникновение нарушений менструальной функции, и определена логистическая форма зависимости, была собрана и проанализирована исходная статистическая информация. Это позволило перейти к построению модели влияния групп факторов-
Таблица 1
Результаты ранговой корреляции Спирмана между наличием у девушек исследуемой группы нарушений менструальной функции и значениями сгруппированных факторов-предикторов
Группа факторов Коэффициент ранговой корреляции Спирмена p-level
Характерные особенности соматического статуса 0,63 0,048
Особенности пищевого поведения обследуемых 0,60 менее 0,001
Наличие очагов хронической инфекции и частые ОРВИ 0,55 0,008
Ожирение с детства 0,45 0,011
Перенесенные детские инфекции 0,38 0,029
Особенности течения беременности 0,31 0,033
Перинатальные факторы 0,30 0,007
предикторов на развитие нарушений менструальной функции.
В качестве потенциальных предикторов рассматривали качественные признаки (характеризующие, в основном, анамнез жизни, особенности становления менструальной функции, особенности пищевого поведения, соматические заболевания, образ жизни, элементы анамнеза родителей). Относительный вклад отдельных предикторов выражали величиной статистики Вальда (Wald Chi-Square) а также величиной стандартизованного коэффициента регрессии (Standardized Estimate). Моделирование производилось по двенадцати группам факторов, сформированных в ходе предыдущего этапа. При этом значение каждого качественного фактора было перекодировано в систему «0» — «1». Выполнение условия обозначалось как «1», а отсутствие выполнения условия или ситуации воздействия фактора обозначалось как «0». Например, «Наличие ожирения с детства» предполагало размещение в базе данных значения «1» и его отсутствие — значения «0» в соответствующем поле. При наличии значения «1» для одного из факторов группы, всей группе присваивалось данное значение. Конечная модель строилась на результатах значений, относящихся к группам факторов. Интерпретация коэффициентов для переменных и результатов по изучаемому критерию заключается в сравнении со значением контрастной переменной. Например, информация в поле «Наличие нарушений менструальной функции» — «1» и «0» соответствует смысловой нагрузке — «Есть / Отсутствует».
Логистическое уравнение вероятности того, что индивидуум принадлежит к группе риска возникновения нарушений менструальной функции, можно записать, базируясь на модели дискретного выбора, как
%оЫНМФ) = (1 + £XP(_Z)} , (1)
где нарушения менструальной функции — результативный дихотомический признак, определяющий принадлежность опрошенных к группе лиц с установленным диагнозом нарушений менструальной функции, а Z из (1) есть линейная комбинация:
Z =во +в* Xi +в2* X 2 + ... + вр * Xp , (2).
Для оценки максимального правдоподобия, используемого для нахождения коэффициентов в уравнения 2, не имеется точного аналога R2, применяемого для метода наименьших квадратов в линейной регрессионной модели. Поэтому, для построения бинарной логистической модели использовался многошаговый регрессионный анализ, основанный на исключении из модели несущественных факторов по тесту, нашедший реализацию в модуле регрессионного анализа пакетов статистического программного обеспечения SPSS. В общем случае, статистика Вальда при малом числе наблюдений может давать заниженные оценки наблюдаемой значимости коэффициентов, но в
рассматриваемых выборках эта особенность не критична.
Поскольку при оценке уравнений регрессии использовался метод пошагового выключения предикторов, который ранжирует признаки в соответствии с их вкладом в модель, уровень значимости для включения (исключения) предикторов в уравнение регрессии задавался таким, чтобы достигнутый уровень значимости статистики Вальда х2 (Pr > Chi-Square) для каждого предиктора по окончании пошаговой процедуры не превышал 10 %. Общая оценка согласия модели и реальных данных производилась с использованием теста согласия Хосмера —Лемешова (Hosmer and Lemeshow Goodness-of-Fit Test).
Результаты построения математической модели методом логистической регрессии в пакете прикладных статистических программ SPSS приведены в таблице 2 (первый и заключительный шаги).
На данном этапе была создана модель прогнозирования возникновения нарушений менструальной функции для девушек с ожирением пубертатного возраста. Выражение для вычисления показателя экспоненты для уравнения регрессии представлено ниже:
Z = 12,806 - 4,751 х V1 - 3,175 х V2 -4,194 х V3 - 3,753 х V4 - 1,697 х V5,
Concordant = 95,8 %; R2 = 0,438; Max-rescaled R2 = 0,786, где: 12,806 - свободный член; V1 - перинатальные факторы: 0 - отсутствовали, 1 -присутствовали; V2 - очаги хронической инфекции и частые ОРВИ: 0 - отсутствовали, 1 - присутствовали; V3 - характерная соматическая патология: 0 - отсутствовала, 1 - присутствовала;
V4 - особенности пищевого поведения, способствующие приобретению избыточной массе тела: 0 - отсутствовали, 1 - присутствовали; V5 - наличие ожирения с детства: 0 - отсутствовало, 1 -присутствовало.
Таким образом, данная модель формирует прогноз нарушений менструальной функции у девушек с ожирением на основании сведений о перинатальных факторах, очагах хронической инфекции и частых ОРВИ, наличии соматической патологии, особенностях пищевого поведения, способствующих приобретению избыточной массы тела и наличию ожирения с детства.
В таблице коэффициентов все переменные на седьмом шаге ранжирования значимы на уровне значимости 5 %. Одним из шагов в квантификации качества модели является расчет коэффициента согласованной переквалификации. Общий коэффициент согласованной переквалификации полученной модели равен 92,64 %, что является очень высоким показателем.
Вероятность отнесения обследуемой к первой градации признака (риск нарушений менструальной функции) или «Р1» вычисляется по формуле: P1 = 1/(1 + exp(-Z)), а вероятность ее отнесения ко второй градации (группа здоровых):
P2 = 1 - P1.
Когда вероятность Р1 более 0,5, обследуемый относится к первой градации (в данном случае — к больным нарушений менструальной функции).
Более дифференцированную информацию о качестве подгонки модели можно получить, рассмотрев построенный график предсказанных вероятностей (рис. 1).
На этом графике по горизонтальной оси откладываются значения вероятности, причем левая половина соответствует случаю, когда событие не происходит (вероятность меньше 0,5). Цифрами «0» и «1» отмечены наблюдения из соответствующих групп. Поскольку в данном исследовании все-
го две вероятности, наблюдения концентрируются в двух точках на графике. Анализируя график, можно отыскать такую точку сечения выборки, отличную от 0,5, что может улучшить прогноз.
Пример. На обследовании девушка 15 лет,
V = l; V2 = 1; V3 = 0; V4 = 1; V5 = 0.
Вычисляем значение Р = 12,806T — 4,751 х 1 — 3,175 х 1-4,194 х 0 - 3,753 х 1 - 1,697 х 0 = 1,127.
При вычислении вероятности отнесения обследованной к той или иной градации признака, для вычисления экспоненты можно воспользоваться приложением из пакета офисных программ Microsoft Excel. В данном случае вероятность от-
Таблица 2
Построение модели логистической регрессии для прогнозирования нарушений менструальной функции у девушек при ожирении в пубертатном периоде
B S.E. Wald df Sig. Exp(B)
Step 1 PERINAT(1) - 4,482 1,476 9,224 1 0,002 0,011
INFECT(1) -,242 10,719 0,001 1 0,982 0,785
HRONIC(1) -3,749 1,111 11,385 1 0,001 0,024
SOMATIC(1) -4,741 2,444 3,764 1 0,052 0,009
PEARENTS(1) -0,893 0,949 0,887 1 0,346 0,409
PREGNACY(1) 0,847 2,349 0,130 1 0,719 2,332
FOOD(1) -4,006 1,527 6,883 1 0,009 0,018
ADIPOS(1) -1,483 0,926 2,562 1 0,109 0,227
LIFE(1) 1,029 1,342 0,588 1 0,443 2,799
PSYCHOL(1) -0,321 0,905 0,126 1 0,723 0,726
Step 2-6 Constant 13,522 10,941 1,527 1 0,217 745309
Step 7 PERINAT(1) -4,751 1,346 12,451 1 0,000 0,009
HRONIC(1) -3,175 0,909 12,209 1 0,000 0,042
SOMATIC(1) -4,194 1,465 8,192 1 0,004 0,015
FOOD(1) -3,753 1,283 8,557 1 0,003 0,023
ADIPOS(1) -1,697 ,826 4,218 1 0,040 0,183
Constant 12,806 2,804 20,862 1 0,000 364401
120
о
га
X
80
40
1
1 1 2
2 2 22 22 222 222 22 222
Предсказ.
вероятн.: 0 0,25 0,5 0,75 1
Группы: 111111111111111111111111111111222222222222222222222222222222
Рис. 1. Исследование групп и предсказанные вероятности. Значения: 1 - наличие нарушений менструальной функции;
2 - отсутствие нарушений менструальной функции. Каждый символ отражает 10 случаев.
несения обследованной к первой градации признака:
Pl = 0,75529, или 75,53 %
А вероятность отнесения ее к градации номер
два:
P2 = 1 - 0,75529 = 0,24471, или 24,47%.
Следовательно, исходя из того, что Р1 более 0,7, а Р2 менее 0,3 можно заключить, что обследованная относится к первой градации (угрожаемая по возникновению нарушений менструальной функции).
ВЫВОДЫ
Таким образом, уравнение логистической регрессии может быть использовано для диагностики и доклинического прогнозирования развития нарушений менструальной функции у девушек-подростков, страдающих ожирением.
ЛИТЕРАТУРА
1. Гинзбург М.М. Ожирение как болезнь образа жизни / М.М. Гинзбург, Г.С. Козупица,
Г.П. Котельников // Современные аспекты профилактики и лечения. — Самара: Изд-во Самарского Госмедуниверситета, 1997. — 48 с.
2. Гогаева Е.В. Ожирение и нарушение менструальной функции / Е.В. Гогаева // Гинекология.
- 2001. - Т. 3, № 5. - С. 13-16.
3. Терещенко И.В. Эндокринные расстройства у юношей и девушек в пубертатном периоде / И.В. Терещенко // Медицина и здравоохранение: Обзорная информация. - Москва, 1991.
- 66 с.
4. Bray G.A. Definitions and proposed current classification of obesity / G.A. Bray, C. Bouchard, W.P.T. James // Handbook of Obesity. - New York, 1998. - P. 31-40.
5. Seidell J.C. Assessing obesity: classification and epidemiology / J.C. Seidell, K.M. Flegal // Br. Med. Bull. - 1997. - Vol. 53. - P. 238-252.
6. Stunkard A.J. Psychological aspects of severe obesity / A.J. Stunkard, T.A. Wadden // Am. J. Clin. Nutr. - 1992. - Vol. 55. - P. 524-532.