Научная статья на тему 'Выявление и анализ факторов, оказывающих наибольшее влияние на результаты лечения больных инфильтративным туберкулезом легких методами статистического анализа'

Выявление и анализ факторов, оказывающих наибольшее влияние на результаты лечения больных инфильтративным туберкулезом легких методами статистического анализа Текст научной статьи по специальности «Клиническая медицина»

CC BY
201
83
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФИЛЬТРАТИВНЫЙ ТУБЕРКУЛЕЗ ЛЕГКИХ / РЕЗУЛЬТАТ ЛЕЧЕНИЯ / КОРРЕЛЯЦИОННЫЙ АНАЛИЗ / РЕГРЕССИОННЫЙ АНАЛИЗ / КОРРЕЛЯЦИОННАЯ МАТРИЦА / ПОШАГОВОЕ ВКЛЮЧЕНИЕ И ИСКЛЮЧЕНИЕ / INFILTRATIVE TUBERCULOSIS OF LUNGS / RESULT OF TREATMENT / THE CORRELATION ANALYSIS / REGRESSION ANALYSIS / A CORRELATION MATRIX / STEP-BY-STEP INCLUSION AND AN EXCEPTION

Аннотация научной статьи по клинической медицине, автор научной работы — Большаков А. А., Казимирова Н. Е., Златорев А. М., Золотько И. Н., Иноходова И. Н.

Проводится определение и анализ наличия, направления, силы связи и степени влияния независимых признаков на результаты лечения у больных инфильтративным туберкулезом с помощью корреляционного анализа (построение корреляционной матрицы) и регрессионного анализа с пошаговым включением и исключением переменных в уравнение регрессии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по клинической медицине , автор научной работы — Большаков А. А., Казимирова Н. Е., Златорев А. М., Золотько И. Н., Иноходова И. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

REVEALING AND THE ANALYSIS OF FACTORS MAKING THE GREATEST IMPACT ON RESULTS OF TREATMENT SICK infiltrativE TUBERCULOSIS OF LUNGS METHODS OF THE STATISTICAL ANALYSIS

On results of treatment at patients infiltrative tuberculosis by means of the correlation analysis (construction of a correlation matrix) and regression analysis with step-by-step inclusion and an exception of variables definition and the analysis of presence, a direction, force of communication and degree of influence of independent signs is spent to the regress equation.

Текст научной работы на тему «Выявление и анализ факторов, оказывающих наибольшее влияние на результаты лечения больных инфильтративным туберкулезом легких методами статистического анализа»

УДК.614.24-002.53-08:005.311.121]:004(045)

А.А. Большаков, Н.Е. Казимирова, А.М. Златорев, И.Н. Золотько,

И.Н. Иноходова, Л. А. Горбунова

ВЫЯВЛЕНИЕ И АНАЛИЗ ФАКТОРОВ, ОКАЗЫВАЮЩИХ НАИБОЛЬШЕЕ ВЛИЯНИЕ НА РЕЗУЛЬТАТЫ ЛЕЧЕНИЯ БОЛЬНЫХ ИНФИЛЬТРАТИВНЫМ ТУБЕРКУЛЕЗОМ ЛЕГКИХ МЕТОДАМИ СТАТИСТИЧЕСКОГО АНАЛИЗА

Проводится определение и анализ наличия, направления, силы связи и степени влияния независимых признаков на результаты лечения у больных инфильтративным туберкулезом с помощью корреляционного анализа (построение корреляционной матрицы) и регрессионного анализа с пошаговым включением и исключением переменных в уравнение регрессии.

Инфильтративный туберкулез легких, результат лечения, корреляционный анализ, регрессионный анализ, корреляционная матрица, пошаговое включение и исключение

A.A. Bolshakov, N.E. Kazimirova, A.M. Zlatorev, I.N. Zolotko I.N. Inohodova, L.A. Gorbunova

REVEALING AND THE ANALYSIS OF FACTORS MAKING THE GREATEST IMPACT ON RESULTS OF TREATMENT SICK INFILTRATIVE TUBERCULOSIS OF LUNGS METHODS OF THE STATISTICAL ANALYSIS

On results of treatment at patients infiltrative tuberculosis by means of the correlation analysis (construction of a correlation matrix) and regression analysis with step-by-step inclusion and an exception of variables definition and the analysis of presence, a direction, force of communication and degree of influence of independent signs is spent to the regress equation.

Infiltrative tuberculosis of lungs, result of treatment, the correlation analysis, regression analysis, a correlation matrix, step-by-step inclusion and an exception

Актуальность исследования. Анализ применения компьютерных систем в медицинских учреждениях показывает, что информационные технологии используются в основном для создания и форматирования текстовых документов или в диагностических и лечебных приборах, что является экономически не обоснованным и не затрагивает все функциональные возможности вычислительной техники. В то же время создание информационной системы, способной прогнозировать конечный результат применения стандартных схем лечения уже на начальном этапе обследования пациента, позволит проводить адекватную коррекцию лечебно-реабилитационных мероприятий. Такой индивидуальный подход к лечению больного будет способствовать благоприятному течению патологического процесса и повышению эффективности лечения, что открывает для пользователей новые возможности компьютерных технологий в медицине и подчеркивает актуальность поставленной задачи.

Цель исследования: выявление групп риска больных по неблагоприятному течению туберкулеза легких на основании определения характера взаимодействия и степени влияния

социально-демографических и клинико-лабораторных параметров больных инфильтратив-ным туберкулезом легких на результаты лечения.

Материалы и методы: обследовано 118 пациентов, больных инфильтративным туберкулезом легких, по 22 признакам, статистическая обработка данных проводилась с использованием ППП 81аЙ8Йеа 7.0.

Каждый пациент обследован по 22 признакам, которые закодированы соответствующим образом: результат лечения (качественный, порядковый): 1 - ухудшение, 2 - без перемен, 3 - улучшение, 4 - значительное улучшение (х1); пол (качественный, номинальный, бинарный): 1 - мужской, 2 - женский (х2); возраст (кол-во лет) (количественный, непрерывный, интервальный) ( х3 ); трудовая занятость (качественный, порядковый): 0 - не занят, 1 -занят (х4); образование (качественный, порядковый): 1 - среднее, 2 - высшее (х5); давность заболевания (мес.) (количественный, непрерывный, интервальный) (х6); объем поражения (качественный, порядковый): 1 - до доли, 2 - легкое, 3 - оба легких ( х7 ); выраженность остаточных изменений (качественный, порядковый): 1 - не выражены, 2 - выражены ( х8 ); непереносимость препаратов (качественный, порядковый): 1 - низкая, 2 - высокая (х^; выраженность интоксикационных жалоб (качественный, порядковый): 1 - выражены, 0 - не выражены ( х10 ); выраженность грудных жалоб (качественный, порядковый): 1 - выражены,

12

0 - не выражены (хп); эритроциты *10 /л (количественный, непрерывный, интервальный) (х12); лейкоциты *109/л (количественный, непрерывный, интервальный) (х13); семейное положение (качественный, порядковый): 1 - холост/не замужем, 2 - женат/замужем( х14); СОЭ, мм/ч (количественный, непрерывный, интервальный) (х15); наличие детей (количественный, непрерывный, интервальный) (х16); регион проживания (качественный, порядковый): 1 -южный, 2 - центральный, 3 - дальний (х17); фаза распада при выявлении (качественный, порядковый): 0-нет, 1-есть ( х18 ); адаптивный показатель по крови (качественный, порядковый): 1 - стресс, 2 - тренировка, 3-СА, 4-ПА (х^); Количество сопутствующих заболеваний (количественный, дискретный) ( х20 ); длительность лечения (количественный, непрерывный, интервальный) ( х21 ); выраженность нарушения режима (качественный, порядковый): 1 -выражен, 0 - не выражен ( х22 ).

Таблица 1 Таблица 2

Корреляционная матрица _________Коэффициенты корреляции

Gamma Correlations MD pairwise deleted Marked correlations are significant at p <,05000

Рез-тат Ддап показ. Фаза Регион Дети

Переменная леч. по крови эаспада при выявл. прожив, (удален, от

Рез-тат леч. 1,000000 -0,142857 0,287356 0,059349 0,02162

Адап.показ.по крови -0,142857 1,000000 -0,071672 0,149843 0,11636

Фаза распада при выявл. 0,287356 -0,071672 1,000000 -0,304752 -0,30973

Регион прожив, (удален, с 0,059349 0,149843 -0,304752 1,000000 0,08432

Дети 0,021615 0,116364 -0,309735 0,084317 1,00000

Семейное положение -0,097784 0,072405 -0,384615 0,130268 0,88687

Образование -0,222222 -0,186441 0,584000 -0,119403 -0,38235

Труд- занят. -0,004733 0,044950 -0,414671 -0,142285 0,29319

Пол -0,106808 0,060902 -0,456044 0,263249 0,38158

Возрастает -0,055874 -0,016738 -0,204486 0,040738 0,46762

Давность забол.(мес.) 0,261588 0,023112 0,052083 0,040792 -0,17846

Обьем пораж. -0,151163 -0,181590 0,517761 -0,332231 -0,44499

Выраж.ост. изм. -0,958333 0,371134 0,700000 -0,414634 -1,00000

Неперен. препар. -0,004721 -0,033479 0,101124 -0,033103 0,10488

Выраж. жалоб интокс. 0,647590 -0,281407 0,423488 -0,212871 -0,28358

Выраж. жалоб груд. 0,505005 -0,438572 0,303571 -0,079412 -0,37161

Эритр. -0,112768 -0,092880 0,211030 -0,137110 -0,14075

Лейкц. -0,068831 -0,094646 0,153703 -0,113347 -0,28169

СОЭ 0,044842 -0,016238 -0,110329 0,210427 0,04441

Кол.соп.забол. 0,075323 -0,092222 -0,117155 0,054029 -0,00157

Дпит.леч.дн. 0,415709 0,010526 0,212955 0,246322 -0,10205

Выражен, наруш. режима -0,351399 0,210072 0,365335 0,007813 -0,67664

Признак Коэффициент корреляции

Фаза распада при выявлении 0,28

Давность заболевания 0,26

Выраженность остаточных изменений -0,95

Выраженность интоксикационных 0,64

Выраженность грудных жалоб 0,50

Длительность лечения 0,41

Выраженность нарушения режима -0,35

Для установления наличия, направления и силы линейной статистической связи между результатом лечения пациента и остальными признаками в выборке используем корреляционный анализ. Исследуемая выборка является однородной и количество наблюдений в ней в 5 раз превышает количество признаков (118 и 22 соответственно), следовательно, она отвечает всем рекомендациям для проведения статистического анализа.

Так как исследуем взаимосвязь качественного признака с другими количественными и качественными признаками и в нашей матрице исходных данных имеется много совпадающих значений, применяется метод непараметрического корреляционного анализа - гамма-коррелляция. В табл. 1 приведена часть корреляционной матрицы, полученной при анализе таблицы исходных данных больных инфильтративным туберкулезом.

Из корреляционной матрицы для р < 0,05 видно, что следующие признаки имеют значимую степень корреляции с результатом лечения (табл. 2).

Из полученных данных (табл.2) видно, что такие признаки, как длительность лечения ( х21 ) и выраженность нарушения режима ( х22 ), имеют значимую степень корреляции с результатом лечения, но оценка этих признаков не может быть выполнена на начальном этапе обследования пациентов. В связи с этим на основе корреляционной матрицы (табл. 1), определим те признаки, которые не только непосредственно взаимосвязаны с данными параметрами и коррелируют с результатом лечения, но и с медицинской точки зрения могут найти обоснованное объяснение своего влияния на конечный результат лечения.

Из корреляционной матрицы для р < 0,05 видно, что следующие признаки имеют значимую степень корреляции с длительностью лечения (табл. 3).

Таблица 3

Коэффициенты корреляции клинических признаков с длительностью лечения

Таблица 4

Коэффициенты корреляции клинических признаков с нарушением режима

Признак Коэффициент корреляции

Фаза распада при выявлении 0,21

Регион проживания 0,24

Семейное положение -0,24

Из корреляционной матрицы для р<0,05 видно, что следующие признаки имеют значимую степень корреляции с нарушением режима (табл. 4).

Выявленные особенности взаимосвязи отдельных социально-демографических и медицинских признаков позволяют не исключать их при проведении последующих этапов математического анализа.

Построенная корреляционная матрица (табл. 1) показывает корреляционную зависимость свободных признаков, на

Признак Коэффициент корреляции

Фаза распада при выявлении 0,36

Дети -0,67

Семейное положение -0,59

Образование -0,44

Трудовая занятость -0,70

Пол -0,54

Возраст -0,21

Давность заболевания 0,30

Объем поражения 0,50

Выраженность остаточных изменений 0,30

Непереносимость препаратов -0,54

Количество лейкоцитов 0,25

основании которой можно построить статистическую модель, что в дальнейшем позволит выявить дополнительные признаки, в значительной мере влияющие на результат лечения.

Для выявления степени влияния независимых признаков на зависимый (результат лечения) используем регрессионный анализ с пошаговым включением и исключением переменных в уравнение регрессии.

Общий вид уравнения множественной линейной регрессии имеет вид

у = а0 + щ х +... + атхт ^ где у - зависимая переменная, х1..хт - независимые факторы, а0..ат - искомые коэффициенты.

При пошаговом включении независимая переменная включается в уравнение в случае, если она существенно увеличивает значение множественного коэффициента корреляции, т.е. значение t-критерия оценок коэффициентов выше критического уровня. В первую очередь в уравнение множественной линейной регрессии включаем длительность лечения (х21), т.е. ту переменную, которая наиболее сильно влияет на результат лечения (коэффициент множественной корреляции 0,406, коэффициент множественной детерминации = 0,164, изменение коэффициента множественной детерминации = 0,164), далее в уравнение включаем переменную (давность заболевания (х6)), которая вместе с первой формирует максимальное изменение значения множественного коэффициента корреляции, и т.д. После включения всех необходимых переменных отбираем независимые признаки, для которых p < 0,05 .

В табл. 5 представлены результаты регрессионного анализа с пошаговым включением переменных в уравнение регрессии. где, Step +in/-out - шаг включения/исключения, Multiple R - коэффициент множественной корреляции, Multiple R-square - коэффициент множественной детерминации, R-square change - изменение коэффициента множественной детерминации, F- to entr/rem - критерий F , p-level - уровень значимости, Variables included - количество включенных переменных.

Таблица 5

Результаты регрессионного анализа с пошаговым включением переменных

Переменная Summary of Stepwise Regression; DV: Рез-тат леч.

Step +in/-out Multiple R Multiple R-square R-square change F - to entr/rem p-level Variables included

Давность забол.(мес.) 1 0,295530 0,087338 0,087338 8,708324 0,004028 1

Выраж. жалоб груд. 2 0,371694 0,138156 0,050818 5,306794 0,023546 2

Лейкц. 3 0,430137 0,185018 0,046862 5,117563 0,026119 3

Объем пораж. 4 0,469622 0,220545 0,035527 4,010993 0,048282 4

Выраж. жалоб интокс. 5 0,495225 0,245248 0,024702 2,847432 0,095102 5

Выраж.ост.изм. 6 0,529637 0,280515 0,035267 4,215506 0,043095 6

СОЭ 7 0,550226 0,302749 0,022234 2,710434 0,103387 7

Фаза распада при выявл. 8 0,558021 0,311387 0,008639 1,053793 0,307582 8

Из полученных результатов (табл. 5) видно, что при условии р < 0,05 наибольшую степень влияния на результат лечения оказывают такие факторы как давность заболевания (х6), выраженность грудных жалоб (хп), количество лейкоцитов в крови (х13), объем поражения легочной ткани (х7), выраженность остаточных изменений в легких и плевре (х8). Следовательно, уравнение множественной линейной регрессии примет вид

у = а0 + а6 х6 + а11х11 + а13 х13 + а7 х7 + а8 х8.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

При регрессионном анализе с пошаговым исключением после построения уравнения регрессии и оценки значимости всех множественных коэффициентов регрессии из уравнения исключаем ту переменную (количество лейкоцитов), значение ^критерия которой ниже критического уровня, т.е. наименьшим образом влияет на коэффициент множественной корреляции

(Я = 0,705; Я2 = 0,497; изменение Я2 =-0,0002, р = 0,867). Аналогично исключаются всех остальных переменных, с последующим отбором тех, для которых значение р < 0,05 . Из полученных результатов видно, что при условии р < 0,05 наибольшую степень влияния на результат лечения оказывают такие факторы как скорость оседания эритроцитов (СОЭ) (х15), выраженность грудных жалоб ( х11 ), выраженность остаточных изменений ( х8 ) и давность заболевания ( х6 ). Следовательно, уравнение множественной линейной регрессии примет вид

у = а0 + а15 х15 + а11х11 + а8 х8 + а6 х6.

Таким образом, по итогам проведенного исследования поставленная цель достигнута, т.е. определены группы признаков, наиболее взаимосвязанных с результатом лечения больных инфильтративным туберкулезом. Среди социально-демографических показателей выделены такие признаки, как пол, трудовая занятость, семейное положение, количество детей, уровень образования, регион проживания и возраст больного. Из клинико-лабораторных параметров отмечены выраженность остаточных изменений, интоксикационных и грудных жалоб, наличие фазы распада при выявлении, давность заболевания, объем поражения, непереносимость препаратов, количество лейкоцитов и скорость оседания эритроцитов. Использование математических методов статистического анализа позволило выявить ряд наиболее информативных медицинских факторов, определение которых на первоначальном этапе обследования больных туберкулезом легких позволит выделить пациентов с высокой вероятностью неблагоприятного течения реабилитационного процесса для коррекции лечебных мероприятий.

Большаков Александр Афанасьевич -

доктор технических наук, профессор кафедры «Системы искусственного интеллекта», декан факультета электронной техники и приборостроения Саратовского государственного технического университета

Казимирова Наталья Евгеньевна -

доктор медицинских наук, профессор, заведующая кафедрой «Фтизиопульмонология» Саратовского государственного медицинского университета

Златорев Артем Михайлович -

аспирант кафедры «Фтизиопульмонология» Саратовского государственного медицинского университета

Золотько Илья Николаевич -

аспирант кафедры «Системы искусственного интеллекта» Саратовского государственного технического университета

Иноходова Ирина Николаевна -

аспирант кафедры «Фтизиопульмонология» Саратовского государственного медицинского университета

Горбунова Людмила Анатольевна -

аспирант кафедры «Фтизиопульмонологии» Саратовского государственного медицинского университета

Статья поступила в редакцию 25.09.09, принята к опубликованию 25.11.09

i Надоели баннеры? Вы всегда можете отключить рекламу.