Электронное научное издание Альманах Пространство и Время Т. 15. Вып. 1 • 2017
STUDIA STUDIOSORUM: УСПЕХИ МОЛОДЫХ ИССЛЕДОВАТЕЛЕЙ
Тематический выпуск в рамках года подготовки и проведения XIX Всемирного фестиваля молодежи и студентов в России
Electronic Scientific Edition Almanac Space and Time volume 15, issue 1
STUDIA STUDIOSORUM: Achievements of Young Researchers
Thematic Issue in the run-up to the year of preparation and holding the 19th World Festival of Youth and Students in Russia Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Band 15, Ausgb. 1.
STUDIA STUDIOSORUM: Fortschritte der Nachwuchsforscher
Thematische Ausgabe im Rahmen des Jahres der Vorbereitung und Durchführung des XIX. Weltfestivals der Jugend und Studenten in Russland
Успехи в науках о человеке
Achievements in Human Sciences / Fortschritte in der H umanw issenschaften
УДК 616.33:616.342
Гололобов Г.Ю.*, Стамов А.А.**, Мехдиев Э.Д.
***
Г.Ю. Гололобов
А.А. Стамов
Э.Д. Мехдиев
Прогнозирование осложнений язвенной болезни с помощью метода перекрёстной проверки
*Гололобов Григорий Юрьевич, студент 4 курса Дирекции образовательных программ «Медицина будущего» Первого Московского государственного медицинского университета им. И.М. Сеченова
ORCID ID https://orcid.org/0000-0002-7374-9800
E-mail: [email protected]; [email protected]
**Стамов Александр Александрович, студент 5 курса лечебного факультета Первого Московского государственного медицинского университета им. И.М. Сеченова
ORCID ID https://orcid.org/0000-0001-5642-7255
E-mail: [email protected]; [email protected]
***Мехдиев Эмиль Джамаладдинович, студент 4 курса Дирекции образовательных программ «Медицина будущего» Первого Московского государственного медицинского университета им. И.М. Сеченова
ORCID ID https://orcid.org/0000-0001-9773-1341
E-mail: [email protected]; [email protected]
В статье обсуждаются результаты предпринятого авторами исследования возможности применения метода перекрёстной проверки для оценки эффективности аналитической модели прогнозирования осложнений язвенной болезни. Полученные данные свидетельствуют о высокой точности метода перекрёстной проверки. Применение данного метода в целях диагностики в практике медицины позволяет отслеживать малейшие нюансы в изменении состояния больного, существенно оптимизирует работу врача, а также снижает риски осложнений от множества других заболеваний.
Ключевые слова: метод перекрёстной проверки; древо решений; язвенная болезнь желудка и двенадцатиперстной кишки; кровотечение; перфорация; предсказание осложнений язвенной болезни.
Введение
Язвенная болезнь (ЯБ) желудка и двенадцатиперстной кишки остается одной из важнейших проблем современной хирургической гастроэнтерологии. На XXII Российской гастроэнтерологической неделе в 2016 г. отмечалось, что гастро-дуоденальные язвы являются одними из самых распространённых заболеваний органонов пищеварения. По диспансер-
Electronic Scientific Edition Almanac Space and Time volume 15, issue 1 'STUPIA STUPIOSORUM: Achievements of Young Researchers'
Achievements in Human Sciences
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 15, Ausgb. 1. 'STUPIA STUPIOSORUM: Fortschritte der Nachwuchsforscher'
Fortschritte in der Humanwissenschaften
Гололобов Г.Ю., Стамов А.А., Мехдиев Э.Д. Прогнозирование осложнений язвенной болезни
с помощью метода перекрёстной проверки
ным данным, на учёте состоит более 3 млн. больных. Также отмечено, что от осложнений умирает около 6 тысяч человек в год [Якубчик 2011]. Последнее десятилетие характеризуется резким снижением частоты плановых операций по поводу гастродуоденальных язв (более чем в 2 раза), но количество экстренных операций, выполняемых по поводу осложнений — перфораций и кровотечений, — увеличилось в 2 и 3 раза соответственно [Галимов и др. 2002; Нуртдинов 2005]. Иными словами, успехи консервативной терапии в целом не повлияли на частоту этих осложнений и вопросы хирургического лечения язвенной болезни, особенно с учетом возросшего количества её осложненных форм, будут актуальны ещё долгое время [Афендулов, Журавлев 2008].
Всё это свидетельствует о необходимости проведения ранней и современной диагностики, которые помогут вовремя заподозрить данное заболевание на догоспитальном этапе. В настоящие время «золотым стандартом» диагностики является эндоскопическое исследование (фиброгастродуоденоскопия) и R-логическое исследование [Афендулов, Журавлев 2008; Нуртдинов 2005].
Хорошо изученные на сегодняшний день математические методы, такие как регрессионный анализ, дошли до своего теоретического предела точности и применимости. В связи с этим на первый план выходят новые методы математического анализа данных для диагностики заболеваний и их осложнений [Гололобов и др. 2016, Назаренко и др. 2010, Хаса-нов и др. 2016; Akhmetshin et al. 2012]. Большой популярностью пользуется метод искусственных нейронных сетей, который уже зарекомендовал себя в медицинской практике.
С точки зрения последней, особый интерес, на наш взгляд, вызывает как один из наиболее перспективных метод перекрёстной проверки (cross-validation), который и будет рассмотрен в данной работе.
Перекрёстная проверка (сross-validation) представляет собой статистический метод оценки и сравнения алгоритмов обучения путем деления данных на два сегмента: один используется для узнавания или обучения модели, а другой используется для проверки модели. В типичной модели перекрёстной проверки циклы тренировки и проверки должны перепроверяться в последовательных циклах таким образом, чтобы каждый пункт сверялся повторно. Основой формы перекрестной проверки является К-кратная перепроверка (K-fold cross-validation) [Refaeilzadeh et al. 2009].
С учётом изложенного целью данной работы явилось использование метода перекрёстной проверки в прогнозировании осложнений язвенной болезни.
Материалы и методы
В основу модели положены данные 171 человека, 130 из которых имеют язвенную болезнь, 35 имеют иную патологию и 6 являются здоровыми в период 2014—2016 гг.
Смоделированная база данных на каждого пациента включала себя в 227 переменных, содержащих паспортную информацию, клинический диагноз, сочетанную патологию, жалобы, лечение в прошлом, осложнения, рентгенологическое заключение, УЗИ заключение, информацию по оперативному вмешательству.
В рамках работы использовалось программное обеспечение, способное построить необходимую нам модель. Метод перекрёстной проверки осуществлялся с применением алгоритм «древо решений» (Decision Tree).
В K-кратной перекрёстной проверке данные сначала в равной степени распределяются на K-сегменты (подвыбор-ки). Затем полученные подвыборки используются следующим образом: один сегмент сохраняется в качестве проверочных данных для тестирования модели, а остальные K-1 сегменты используются в качестве обучающих данных.
Таким образом, каждая подвыборка K-1 раз участвует в обучающей выборке и ровно один раз служит тестовой выборкой. Именно в этом заключается преимущество K-кратной перекрёстной проверки перед некоторыми другими её типами, например, перекрёстной проверкой на основе метода Монте-Карло, когда весь массив данных разбивается случайным образом на данные для проверки и для обучения, что в итоге со случайной долей вероятности гарантирует повторное участие одних и тех же подвыборок как в проверке, так и в обучении, а также абсолютное неучастие в вычислениях некоторых отдельно взятых подвыборок. Обычно в K-кратной перекрёстной проверке все данные стратифицируются до начала K-итераций, что подразумевает под собой перегруппировку и присвоение числовых значений для гарантии существования единственно возможного логического толкования теории. Например, если поставлена задача бинарной классификации объектов, где каждый класс содержит 50% данных, лучше всего ранжировать данные таким образом, чтобы на каждом этапе каждый класс включал в себя около половины примеров.
В результате получается оценка эффективности выбранной модели с наиболее равномерным использованием имеющихся данных [Refaeilzadeh et al. 2009].
Electronic Scientific Edition Almanac Space and Time volume 15, issue 1 'STUDIA STUDIOSORUM: Achievements of Young Researchers'
Achievements in Human Sciences
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 15., Ausgb. 1. 'STUDIA STUDIOSORUM: Fortschritte der Nachwuchsforscher'
Fortschritte in der Humanwissenschaften
Гололобов Г.Ю., Стамов А.А., Мехдиев Э.Д. Прогнозирование осложнений язвенной болезни
с помощью метода перекрёстной проверки
Результаты
Для построения модели переменные анализировались на полноту, характер распределения и корреляцию между собой. Поскольку данная модель необходима для ранней диагностики заболевания без лабораторно-инструментальных методов, были использованы 38 переменных, большая часть которых является жалобами пациента.
Для метода перекрёстной проверки (cross-validation) использовался алгоритм «древо решений» (Decision Tree). Были смоделированы древа решений, использовавшие 34 входных параметра, для предсказания контрольного заключения (Х35—Х38, для каждого создавалось своё древо). Тестировался диагноз язвенной болезни, летальный исход, осложнения, требующие незамедлительного хирургического вмешательства — перфорация и кровотечение.
Входные данные включали:
XI — пол,
X2 — возраст, локализация болей
X3 — эпигастральная область,
X4 — правое подреберье,
X5 — левое подреберье,
X6 — спина,
Х7 — лопатка,
X8 — по всему животу,
X9 — другое место,
X10 — иррадиация в плечо,
XII — иррадиация в спину, X12 — интенсивность,
X13 — до приёма пищи (голодные боли), Х13 — после приёма пищи Х14 — сразу,
Х15 — через полтора-два часа, Х16 — ночные,
Х17 — изжога, отрыжка Х18 — воздухом, Х19 — съеденной пищей,
Х20 — боль усиливалась, прекращалась
Х21 — в горизонтальном положении, Х22 — при наклонах,
Х23 — тошнота, Х24 — рвота, Х25 — запоры, Х26 — жидкий стул, Х27 — метеоризм, Х28 — курение,
Х29 — систолическое давление, Х30 — диастолическое давление, Х31 — пульс.
Также учитывалось лечение
Х32 — амбулаторно или
Х33 — стационарно в прошлом,
Х34 — язвенный анамнез при поступлении.
Контрольные нейроны:
Х35 — летальный исход, Х36 — язвенная болезнь, Х37 — кровотечение, Х38 — перфорация.
Контрольные древа решений представлены на рис. 1—3.
Electronic Scientific Edition Almanac Space and Time volume 15, issue 1
'STUDIA STUDIOSORUM: Achievements of Young Researchers'
Achievements in Human Sciences
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 15, Ausgb. 1. 'STUDIA STUDIOSORUM: Fortschritte der Nachwuchsforscher'
Fortschritte in der Humanwissenschaften
Гололобов Г.Ю., Стамов А.А., Мехдиев Э.Д. Прогнозирование осложнений язвенной болезни
с помощью метода перекрёстной проверки
Рис. 1. Древо «Язвенная болезнь»
Рис. 2. Древо «Кровотечение»
Рис. 3. Древо «Перфорация»
Для метода перекрёстной проверки (cross-validation) были использованы те же параметры, что и для нейронной сети. Однако разделение данных на «train» и «test» происходит соответственно с методом, от большего «train» и к меньшему «test», к большему «test» и меньшему «train».
Electronic Scientific Edition Almanac Space and Time volume 15, issue 1 'STUDIA STUDIOSORUM: Achievements of Young Researchers'
Achievements in Human Sciences
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 15, Ausgb. 1. 'STUDIA STUDIOSORUM: Fortschritte der Nachwuchsforscher'
Fortschritte in der Humanwissenschaften
Гололобов Г.Ю., Стамов А.А., Мехдиев Э.Д. Прогнозирование осложнений язвенной болезни
с помощью метода перекрёстной проверки
Результаты использования алгоритма «древо решений» (Decision Tree) представлены в табл. 1.
Таблица 1
Результаты применения алгоритма «древо решений»
Параметры Точность, % Верно Ошибок
Клинический диагноз 89,47 153 18
Летальный исход 98,83 169 2
Перфорация 94,15 161 10
Кровотечение 87,92 150 21
Общая точность, % 92,59
Предсказание клинического диагноза составило 89,47%, что является хорошим результатом. Предсказание смертности 98,83%. Особенно хорошо прогнозируются осложнения — перфорация и кровотечение, 94,15% и 87,92% соответственно. Общая точность при этом составила 92,59%.
Обсуждение
Точность прогнозирования данных параметров варьирует на адекватном уровне. Большой процент предсказания летального исхода объясняется малым количеством летальных исходов в тестируемой выборке.
При сравнении с методом искусственных нейронных сетей, данный метод показывает более высокую точность, что связанно с функциональной особенностью обоих методов. Однако нельзя сказать, что метод перекрёстной проверки (cross-validation) превосходит метод искусственных нейронных сетей, поскольку не известно, как повлияет на общую точность вычислений добавление новых параметров в качественном и количественном их соотношении. Это даёт нам полное право полагать, что новые математические модели предсказания отлично работают в диагностической сфере.
Заключение
Таким образом, высокая точность предсказания осложнений позволяет судить о полезности данного метода в медицине. Появляется возможность тестировать курируемых пациентов на данной базе данных, прослеживать возможные осложнения и подбирать лучшую тактику лечения язвенной болезни. Персонализированный подход с внедрением новейших моделей позволит отслеживать незначительные нюансы и сильно оптимизировать работу врача, что позволит снизить риски осложнений множества заболеваний.
ЛИТЕРАТУРА
1. Афендулов С.А., Журавлев Г.Ю. Хирургическое лечение больных язвенной болезнью М.: ГЭОТАР-
Медиа. 2008. 344 с.
2. Галимов О.В., Шамсутдинов А.Р., Нуртдинов М.А., Дмитриев Д.М., Галимова Е.С., Нигматуллин Р.Т.,
Шумкин А.М., Муслимов С.А., Зарипов Ш.А. Способ лечения гастродуоденальных язв, осложненных рубцово-язвенным стенозом верхних отделов желудочно-кишечного тракта. Патент РФ на изобретение RUS 2189822. 2000. 10 апр. [Электронный ресурс] // FreePatent. 2002. 27 сент. Режим доступа: http://www.freepatent.ru/patents/2189822.
3. Гололобов Г.Ю., Тайсин Р.Р., Козлова О.О., Мехдиев Э.Д., Хабибуллин И.Р. Внедрение нейронных сетей
в диагностику язвенной болезни // Сборник материалов LVI научной конференции студентов и молодых учёных Западно-Казахстанского государственного медицинского университета имени Марата Оспанова с международным участием, посвященной 25-летию Независимости Республики Казахстан. Актобе, 2016. С. 62 — 63.
4. Назаренко Г.И., Осипов Г.С., Назаренко А.Г., Молодченков А.И. Интеллектуальные системы в клиниче-
ской медицине. Синтез плана лечения на основе прецедентов // Информационные технологии и вычислительные системы. 2010. № 1. С. 24 — 35.
Electronic Scientific Edition Almanac Space and Time volume 15, issue 1 'STUPIA STUPIOSORUM: Achievements of Young Researchers'
Achievements in Human Sciences
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 15., Ausgb. 1. 'STUPIA STUPIOSORUM: Fortschritte der Nachwuchsforscher'
Fortschritte in der Humanwissenschaften
Гололобов Г.Ю., Стамов А.А., Мехдиев Э.Д. Прогнозирование осложнений язвенной болезни
с помощью метода перекрёстной проверки
5. Нуртдинов М.А. Оптимизация комплексного лечения язвенной болезни желудка и двенадцатиперст-
ной кишки в хирургической клинике: Дисс. ... д. мед. н. Уфа, 2005. 225 с.
6. Хасанов А.Г., Нуртдинов М.А. Гололобов Г.Ю. О прогнозировании осложнений язвенной болезни на
основе нейронных сетей // Анналы хирургии. 2016. Т. 21. № 4. С. 231 —234.
7. Якубчик Т.Н. Клиническая гастроэнтерология. Гродно: Гродненский Государственный Медицинский
Университет, 2011. 308 с.
8. Akhmetshin R.M., Giniyatullin V.M., Kirlan S.A. "Identification of Structures of Organic Substances by Means of
Complex-valued Perceptron." Optical Memory & Neural Networks (Information Optics) 21.1 (2012): 11 — 16.
9. Refaeilzadeh P., Tang L., Liu H. "Cross Validation." Encyclopedia of Database Systems. Eds. M. Tamer A-Zsu, and
Ling Liu. New York: Springer, 2009, pp. 532 — 538.
Цитирование по ГОСТ Р 7.0.11—2011:
Гололобов, Г. Ю., Стамов, А. А., Мехдиев, Э. Д. Прогнозирование осложнений язвенной болезни с помощью метода перекрёстной проверки [Электронный ресурс] / Г.Ю. Гололобов, А.А. Стамов, Э.Д. Мехдиев // Электронное научное издание Альманах Пространство и Время. — 2017. — Т. 15. — Вып. 1: Studia studiosorum: успехи молодых исследователей. — Стационарный сетевой адрес: 2227-9490e-aprovr_e-ast15-1.2017.23.
PREDICTION OF PEPTIC ULCER DISEASE COMPLICATIONS BASED ON CROSS-VALIDATION METHOD
Grigorii Yu. Gololobov, 4th year student at the Directorate of Educational Programs of the International School "Medicine of the Future", I.M. Sechenov First Moscow State Medical University
ORCID ID https://orcid.org/0000-0002-7374-9800
E-mail: [email protected]; [email protected]
Alexander A. Stamov, 5th year student at the Department of General Medicine, I.M. Sechenov First Moscow State Medical University
ORCID ID https://orcid.org/0000-0001-5642-7255
E-mail: [email protected]; [email protected]
Emil D. Mekhdiev, 4th year student at the Directorate of Educational Programs of the International School "Medicine of the Future", I.M. Sechenov First Moscow State Medical University
ORCID ID https://orcid.org/0000-0001-9773-1341
E-mail: [email protected]; [email protected]
Peptic ulcer disease (PUD) is easily cured, but it can often lead to complications demanding serious operations, even at young age. The last decades is characterized by a sharp decrease in the frequency of planned operations for PUD (more than 2 times), but the number of emergency operations for complications (perforations and bleeding) increased 2 and 3 times, respectively. In other words, the success of conservative therapy in general did not affect the frequency of these complications and the issues of surgical treatment of peptic ulcer, especially given the increased number of its complicated forms, will be relevant for a long time. Therefore, early diagnosis and prediction of the possible complications result in successful treatment of the disease. Mathematical methods are obligatory for developments in this direction. Well-studied ones, such as regression analysis, have reached their theoretical limit of accuracy and applicability. In this regard, new methods of mathematical data analysis for the diagnosis of diseases and their complications come to the forefront.
Electronic Scientific Edition Almanac Space and Time volume 15, issue 1 'STUDIA STUDIOSORUM: Achievements of Young Researchers'
Achievements in Human Sciences
Elektronische wissenschaftliche Auflage Almanach 'Raum und Zeit Bd. 15, Ausgb. 1. 'STUDIA STUDIOSORUM: Fortschritte der Nachwuchsforscher'
Fortschritte in der Humanwissenschaften
Гололобов Г.Ю., Стамов А.А., Мехдиев Э.Д. Прогнозирование осложнений язвенной болезни
с помощью метода перекрёстной проверки
So, the subject of our study is the cross-validation method as one of the most promising logical-mathematical approaches for medical practice.
In the basis for our model development, we put data on 171 test subjects, 130 of whom suffered from PUD, 35 had a different pathology and 6 were healthy in the period 2014—2016. We modeled the database for each patient. This database included 227 variables, as follows: passport information, clinical diagnosis, combined pathology, complaints, treatment in the past, complications, radiology, ultrasound findings, information on surgical intervention. During cross-validation, we used the Decision Tree algorithm, as well as statistical analysis and the Monte Carlo method.
The reliability of clinical diagnosis prediction was 89.47% while such indicator for mortality predicting was 98.83%. Such PUD complications as perforation and bleeding are predicted particularly well: the results were 94.15% and 87.92%, respectively. In the course of our approach, overall prediction accuracy was 92.59%.
Based on these data, we conclude that cross-validation is a highly accurate method, and its application as modern diagnostic model in personalized medicine will make it possible both to mention even small changes in patient's condition and as reduce complications hazard in many diseases.
Keywords: cross-validation; decision tree; diagnostics; peptic ulcer disease; duodenal ulcer hemorrhage; ulcer perforation; peptic ulcers complications prediction.
References:
1. Afendulov S.A., Zhuravlev G.Yu. Surgical Treatment of Patients with Peptic Ulcer Disease. Moscow: GEOTAR-
Media Publisher, 2008. 344 p. (In Russian).
2. Akhmetshin R.M., Giniyatullin V.M., Kirlan S.A. "Identification of Structures of Organic Substances by Means of
Complex-valued Perceptron." Optical Memory & Neural Networks (Information Optics) 21.1 (2012): 11 — 16.
3. Galimov O.V., Shamsutdinov A.R., Nurtdinov M.A., Dmitriev D.M., Galimova E.S., Nigmatullin R.T., Shumkin
A.M., Muslimov S.A., Zaripov Sh.A. "Gastroduodenal Ulcers Treatment Method Complicated by Scar-Ulcerative Stenosis of Upper Gastrointestinal Tract. Russian Federation Patent, invention RUS 2189822, 10 Apr. 2000." FreePatent. Rospatent, 27 Sep. 2002. Web. <http://www.freepatent.ru/patents/2189822>. (In Russian).
4. Gololobov G.Yu., Taysin R.R., Kozlova O.O., Mekhdiev E.D., Khabibullin I.R. "The Introduction of Neural
Networks in Ulcer Disease Diagnosis." Proceedings of 56th Scientific Conference of Students and Young Scientists of Marat Ospanov West Kazakhstan State Medical University with International Participation Devoted to the 25th Anniversary of Independence of the Republic of Kazakhstan. Aktobe, 2016, pp. 62 — 63. (In Russian).
5. Khasanov A.G., Nurtdinov M.A., Gololobov G.Yu. "Prediction of Predict Ulcer Disease Complications of, based
on artificial neural networks." Surgery Annals 21.4 (2016): 231—234 (In Russian).
6. Nazarenko G.I., Osipov G.S., Nazarenko A.G., Molodchenkov A.I. "Intelligent Systems in Clinical Medicine.
Case-based Treatment Plan Synthesis." Information Technologies and Computer Systems 1 (2010): 24 — 35. (In Russian).
7. Nurtdinov M.A. Optimization of Gastric and Duodenal Ulcer Combination Treatment in Surgical Clinic. Doctoral
diss. Ufa, 2005. 225 p. (In Russian).
8. Refaeilzadeh P., Tang L., Liu H. "Cross Validation." Encyclopedia of Database Systems. Eds M. Tamer A-Zsu, and
Ling Liu. New York: Springer, 2009, pp. 532 — 538.
9. Yakubchik T.N. Clinical Gastroenterology. Grodno: Grodno State Medical University Publisher, 2011. 308 p. (In
Russian).
Cite MLA 7:
Gololobov, G. Yu., A. A. Stamov, and E. D. Mekhdiev. "Prediction of Peptic Ulcer Disease Complications Based on Cross-validation Method." Electronic Scientific Edition Almanac Space and Time 15.1 (Studia Studiosorum: Achievements of Young Researchers) (2017). Web. <2227-9490e-aprovr_e-ast15-1.2017.23>. (In Russian).