ДИАГНОСТИКА И ПРОГНОЗИРОВАНИЕ ВЕРОЯТНОСТИ ВОЗНИКНОВЕНИЯ ХОЛЕЦИСТИТА НА ОСНОВЕ НЕЙРОСЕТЕВОГО АНАЛИЗА ФАКТОРОВ РИСКА
Исследования и практика в медицине 2017, т.4, №4, с. 67-72
ОРИГИНАЛЬНАЯ СТАТЬЯ. БИОИНФОРМАТИКА
DOI: 10.17709/2409-2231-2017-4-4-7
В.А.Лазаренко, А.Е.Антонов
ФГБОУ ВО «Курский государственный медицинский университет» Министерства здравоохранения Российской Федерации, 305041, Россия, г. Курск, ул. К. Маркса, д. 3
Цель исследования. Разработать искусственную нейронную сеть для диагностики и прогнозирования развития холециститов на основе анализа данных о факторах риска, а также изучить возможности ее применения в реальной клинической практике.
Материалы и методы. Сбор материалов включал анкетирование 488 больных с заболеваниями гепатопан-креатодуоденальной зоны на базе стационаров г. Курска. 203 пациента страдали холециститом, у 285 человек диагноз холецистита был исключен. Анализ данных о факторах риска (поле, возрасте, вредных привычках, профессии, семейных отношениях и пр.) проводили с применением искусственной нейронной сети собственной разработки типа «многослойный персептрон с активационной функцией гиперболический тангенс». Программа для ЭВМ «Система интеллектуального анализа и диагностики заболеваний» была зарегистрирована в установленном порядке (свидетельство № 2017613090).
Результаты. Применение нейросетевого анализа данных о факторах риска в сравнении с обработкой сведений, формирующих клиническую картину, позволяет осуществлять диагностику потенциального заболевания холециститом до момента проявления симптоматики.
Обучение искусственной нейронной сети с количественным выходом, кодирующим возраст вероятной госпитализации, позволило генерировать массив значений, значимо (а < 0,001) не отличающийся от эмпирических данных. Разность средних расчетных и средних эмпирических значений составляла 0,45 для обучающего множества и 1,75 для группы клинической апробации. Значение средней абсолютной ошибки находилось в пределах 1,87-2,07 года.
Заключение. 1. Предложенный новый подход к диагностике и прогнозированию холецистита продемонстрировал свою эффективность, что подтверждается в клинической апробации уровнями чувствительности (94,44%, т = 2,26) и специфичности (80,6%, т = 3,9) методики.
2. Ошибка прогноза возраста вероятной госпитализации больных по поводу холецистита не превышала 2,29 и 2,38 года для р = 0,95 и р = 0,99 соответственно.
Ключевые слова:
искусственная нейронная сеть, нейросеть, многослойный персептрон, диагностика, холецистит, искусственный интеллект, прогнозирование
Оформление ссылки для цитирования статьи
Лазаренко В.А., Антонов А.Е. Диагностика и прогнозирование вероятности возникновения холецистита на основе нейросетевого анализа факторов риска. Исследования и практика в медицине. 2017; 4(4): 67-72. DOI: 10.17709/2409-2231-2017-4-4-7
Для корреспонденции
Антонов Андрей Евгеньевич, к.м.н., помощник ректора по общим вопросам, доцент кафедры хирургических болезней ФПО ФГБОУ ВО «Курский государственный медицинский университет» Минздрава России
Адрес: 305041, Россия, г. Курск, ул. К. Маркса, д. 3. E-mail: [email protected]. ORCID: http://orcid.org/0000-0001-5745-3586
Информация о финансировании. Исследование проведено на личные средства авторов. Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.
Статья поступила 01.09.2017 г., принята к печати 30.11.2017 г.
Резюме
DIAGNOSIS AND PREDICTION OF CHOLECYSTITIS DEVELOPMENT ON THE BASIS OF NEURAL NETWORK ANALYSIS OF RISK FACTORS
Research'n Practical Medicine Journal. 2017, v.4, №4, p. 67-72
ORIGINAL ARTICLE. BIOINFORMATICS
DOI: 10.17709/2409-2231-2017-4-4-7
V.A.Lazarenko, A.E.Antonov
Kursk State Medical University, 3, K. Marksa str., Kursk, 305041, Russia
Abstract
Purpose. To develop an artificial neural network for diagnosing and predicting the development of cholecystitis based on an analysis of data on risk factors, and to explore the possibilities of its application in real clinical practice. Materials and methods. The collection of materials was held in at the hospitals of the city of Kursk and included a survey of 488 patients with hepatopancreatoduodenal diseases. 203 patients were suffering from cholecystitis, in 285 patients the diagnosis of cholecystitis was excluded. Analysis of risk factors' data (such as sex, age, bad habits, profession, family relationships, etc.) was carried out using an internally developed artificial neural network (multilayer perceptron with hyperbolic tangent as the activation function). The computer program "System of Intellectual Analysis and Diagnosis of Diseases" was registered in accordance with established procedure (Certificate No. 2017613090). Results. The use of neural network analysis of data on risk factors in comparison with the processing of information that forms a clinical picture allows the diagnosis of a potential disease with cholecystitis before the onset of symptoms. The training of the artificial neural network with a quantitative output coding the age of probable hospitalization made it possible to generate an array of values, signifficantly (a < 0.001) not differing from the empirical data. The difference between the mean calculated and mean empirical values was 0.45 for the training set and 1.75 for the clinical approbation group. The mean absolute error was within the range of 1.87-2.07 years.
Conclusion. 1. The proposed new approach to the diagnosis and prognosis of cholecystitis has demonstrated its effectiveness, which is confirmed in clinical approbation by the levels of sensitivity (94.44%, m = 2.26) and specificity (80.6%, m = 3.9).
2. The error in predicting the age of probable hospitalization of patients with cholecystitis did not exceed 2.29 and 2.38 years for p = 0.95 and p = 0.99, respectively.
Keywords:
artificial neural network, neuronet, multilayer perceptron, diagnosis, diagnostics, cholecystitis, artificial intelligence, prognosis.
For citation
Lazarenko V.A., Antonov A.E. Diagnosis and prediction of cholecystitis development on the basis of neural network analysis of risk factors. Research'n Practical Medicine Journal. 2017; 4(4): 67-72. DOI: 10.17709/2409-2231-2017-4-4-7
For correspondence
Andrey E. Antonov, PhD, assistant to the rector for general matters, associate professor of the surgical diseases department, Kursk State Medical University Address: 3 K. Marksa str., Kursk, 305041, Russia. E-mail: [email protected]. ORCID: http://orcid.org/0000-0001-5745-3586
Information about funding. The study was funded by the authors. Conflict of interest. All authors report no conflict of interest.
The article was received 01.09.2017, accepted for publication 30.11.2017
Холецистит и сопутствующий ему холелитиаз ежегодно поражает до 6% населения, что делает его одним из наиболее распространенных заболеваний человечества [1-3]. Стратегия борьбы с распространенными неинфекционными патологическими состояниями подразумевает поиск оптимальных управленческих решений [4-6], в особенности с учетом того, что традиционная медицинская диагностика, основывающаяся на анализе клинической картины сформировавшегося заболевания, является запоздалой для целей первичной профилактики. Одним из перспективных направлений совершенствования организации лечебной и профилактической помощи населению является оценка комплекса факторов риска, воздействующих на здоровье пациента и попытка их модификации [7-9]. Однако реализация такого подхода сопряжена с необходимостью изучения сложных данных, что способствует внедрению в медицинскую практику машинных методов интеллектуального анализа [10, 11], развития систем поддержки принятия решений [12, 13]. Известны специализированные программные комплексы, позволяющие анализировать данные о факторах риска развития заболеваний гепатопанкреатодуоденальной зоны с применением биостатистических методов [14-16], тем не менее, в силу наличия их фундаментальных математических ограничений, представляется целесообразным предпринять попытку диагностики и прогнозирования холециститов на основе анализа данных такого рода с применением искусственных нейронных сетей (ИНС).
Цель нашего исследования — разработать ИНС для диагностики и прогнозирования развития холециститов на основе анализа данных о факторах риска, а также изучить возможности ее применения в реальной клинической практике.
МАТЕРИАЛЫ И МЕТОДЫ
Работа проведена на базе стационаров г. Курска. Сбор материалов включал анкетирование 488 больных с заболеваниями гепатопанкреатодуоденальной зоны. Среди них было 203 больных с холециститом и 285 пациентов, у которых диагноз холецистита был исключен. Анализ данных о факторах риска основывался на применении ИНС собственной разработки типа «многослойный персептрон с акти-вационной функцией гиперболический тангенс». Программа для ЭВМ «Система интеллектуального анализа и диагностики заболеваний» была зарегистрирована в установленном порядке, получено свидетельство № 2017613090 [17].
Обучение ИНС осуществлялось на материалах 385 больных, проходивших стационарное лечение до 1 января 2011 г. 167 из них страдали холециститом, 218 имели иное заболевание гепатопанкреатодуоденальной зоны.Апробация функционирования нейросети осуществлялась на группе пациентов (п = 103), госпитализированных в более поздние сроки — 36 человек с холециститом и 67 — с язвенной болезнью или панкреатитом.
Оценивались следующие факторы риска: пол, возраст (дата рождения), состояние при поступлении, наличие инвалидности, стрессы, злоупотребление алкоголем, курение, соблюдение или несоблюдение диеты (объективно и субъективно), трудовая занятость, факт одиночества, отношения в семье, частота ссор, место питания (дома, в столовой и пр.), обращение в медицинские организации с профилактической целью, выполнение рекомендаций врачей.
Данные, полученные в результате работы ИНС, обрабатывались с применением описательной и индуктивной статистики, вычислялись уровни чув-
Таблица 1. Результаты обучения и практического применения ИНС в диагностике холецистита Table 1. Learning outcomes and practical application of ANN in the diagnosis of cholecystitis
Показатель Обучающая группа (n = 385) Клиническая апробация (n = 103)
Чувствительность (+/+) P = 91,62, m = 1,41% P = 94,44, m = 2,26%
Ложноотрицательные результаты (-/+) P = 4,19, m = 1,02% P = 2,78, m = 1,62%
Специфичность (-/-) P = 83,03, m = 1,91% P = 80,6, m = 3,9%
Ложноположительные результаты (+/-) P = 12,39, m = 1,68% P = 10,45, m = 3,01%
Итого
подтвержденных случаев (n = 203), чел. 167 36
исключенных случаев (n = 285), чел. 218 67
ствительности, специфичности, ложноположитель-ных и ложноотрицательных результатов, вычислялись ошибки прогноза.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
Обучение ИНС позволило достичь удовлетворительных показателей диагностики холецистита. Для этих целей использовался логический выход, принимающий значения «истина» или «ложь», а также «не определено». Показатели чувствительности (доля положительного решения сети о наличии холецистита при его фактическом присутствии у больного), специфичности (доля отрицательных решений у больных, не страдавших холециститом), а также ложноположительных и ложноотрицательных результатов находились на уровне традиционных методов лабораторной и инструментальной диагностики заболеваний гепатопанкреатодуоде-нальной зоны (табл. 1). При этом в ходе клинической апробации показатели чувствительности и специфичности превышали 90 и 80% соответственно.
Обучение ИНС с количественным выходом, кодирующим возраст вероятной госпитализации, продемонстрировало результаты, которые представлены в таблице 2.
Как следует из таблицы, массив значений прогнозируемого возраста госпитализации значимо (а < 0,001) не отличался от эмпирических данных. Разность средних расчетных и средних эмпирических значений составляла 0,45 для обучающего множества и 1,75 для группы клинической апробации. Значение средней абсолютной ошибки (среднее значение модуля разности расчетного и эмпирического возраста госпитализации) находилось в пределах 1,87-2,07 года. Как показывает вычисление персентилей, ошибка прогноза не превысит в ходе клинической апробации 2,29 (для р = 0,05) и 2,38 (для р = 0,01).
Характерными как для качественного, так и для количественного выхода являются несколько худшие показатели работы нейросети для группы клинической апробации в сравнении с обучающей совокупностью. Данное наблюдение является ожидаемым
Таблица 2. Результаты обучения и практического применения ИНС в прогнозировании возраста вероятной госпитализации
Table 2. Learning outcomes and the practical application of ANN in the prediction of the probable age of admission
Показатель Обучающая группа (n = 385) Клиническая апробация (n = 103)
Среднее значение фактическое, My, лет 52,86 54,79
Средняя ошибка, ту, лет 0,83 1,47
Среднее значение расчетное, М^ лет 53,31 53,04
Средняя ошибка, т^, лет 0,83 1,42
Критерий х2 47,13 12,11
Значимость, а <0,001 <0,001
Средняя ошибка прогноза, ME, лет -0,45 1,75
Средний квадрат ошибки прогноза, MSE, лет2 6,02 6,04
Средняя абсолютная ошибка, MAE, лет 1,87 2,07
Средняя ошибка, mMAE, лет 0,08 0,13
Ошибка прогноза не превысит (персентиль p95), лет 2,00 2,29
Ошибка прогноза не превысит (персентиль p99), лет 2,06 2,38
Средняя абсолютная процентная ошибка, MPAE, % 4,03 3,98
Средняя процентная ошибка, MPE, % -1,01 2,90
и связано с наличием неучтенных факторов, изменившихся в обществе в целом. Тем не менее, уровни булевых значений и количественных оценок находятся на уровне традиционных диагностических методик.
Таким образом, показана принципиальная возможность осуществления диагностики и прогнозирования холецистита, основывающаяся не на анализе традиционных данных клинической картины, результатов лабораторных и инструментальных методов исследования, а на нейросетевой обработке сведений о факторах риска. Такой подход позволяет осуществлять диагностику потенциального заболевания до момента проявления симптоматики, что потенциально может позволить индивидуализировать профилактическую стратегию у конкретного больного.
Нейросеть продемонстрировала удовлетворительные уровни чувствительности и специфичности в отношении диагностики холециститов. Расчетные показатели возраста вероятной госпитализации
Список литературы
1. Strasberg SM. Clinical practice. Acute calculous cholecystitis. N Engl J Med. 2008 Jun 26;358 (26):2804-11. DOI: 10.1056/NE-JMcp0800929
2. Friedman LS. Liver, Biliary Tract, & Pancreas Disorders. In Pa-padakis MA, McPhee SJ, Rabow MW, editors. Current Medical Diagnosis & Treatment. McGraw-Hill, 2015.
3. Diseases and Conditions. Cholecystitis [Internet] Available at: http://www.mayoclinic.org/diseases-conditions/cholecysti-tis/basics/risk-factors/con-20034277 Accessed 2.06.2016
4. Светый Л. И., Лопухова В. А., Тарасенко И. В., Климкин А. С. Применение системы оценки технологий здравоохранения в принятии эффективных управленческих решений. Здоровье и образование в XXI веке. 2013; 15 (1-4): 234-235.
5. Лопухова В. А., Тарасенко И. В., Кайланич Г. А., Кайла-нич Е. А. Изучение качества внебольничной медицинской помощи в медицинских организациях города Орла. Современные проблемы науки и образования. 2016; 5: 137. Доступно по: http://www.science-education.ru/ru/article/view?id=25383. Дата обращения 28.11.2016.
6. Симонян Р. З., Кайланич Г. А., Лопухова В. А., Тарасенко И. В. Изучение качества медицинской помощи при оценке технологий здравоохранения. Международный журнал прикладных и фундаментальных исследований. 2016; 8-2: 185-187.
7. Дотдаева А. А., Хасанова З. Б., Егорова Л. А., Шиганова Г. М., Собенин И. А., Постнов А. Ю., Бойцов С. А. Генетические факторы риска развития атеросклероза и их взаимосвязь с традиционными факторами риска атеросклероза у пациентов, страдающих ишемической болезнью сердца и проживающих в условиях высокогорья (на примере Карачаево-Черкесии). Атеросклероз и дислипидемии. 2015; 2 (19): 35-40.
8. Бойцов С. А., Самородская И. В., Семёнов В. Ю. Влияние экономических кризисов на общественное здоровье. Профилактическая медицина. 2016; 19 (2): 4-10. DOI: 10.17116/profmed20161924-10
значимо не отличались от эмпирических. Дополнительными преимуществами использования ИНС явились следующие факторы: неинвазивность, нетребовательность к уровню подготовки медицинского работника, возможность применения на малопроизводительных персональных компьютерах.
ЗАКЛЮЧЕНИЕ
1. Предложенный новый подход к диагностике и прогнозированию холецистита, основанный на анализе данных о факторах риска с применением ИНС, продемонстрировал свою эффективность, что подтверждается в клинической апробации уровнями чувствительности (94,44%, т = 2,26) и специфичности (80,6%, т = 3,9) методики.
2. Ошибка прогноза возраста вероятной госпитализации больных по поводу холецистита не превышала 2,29 и 2,38 года для р = 0,95 и р = 0,99 соответственно.
9. Каприн А. Д., Александрова Л. М., Старинский В. В. Профилактика злокачественных новообразований в Российской Федерации как составная часть международной стратегии профилактики неинфекционных заболеваний. Онкология. Журнал им. П. А. Герцена. 2016; 5 (5): 42-50. DOI: 10.17116/onkolog20165542-50
10. Жариков О. Г., Литвин А. А., Ковалёв В. А. Экспертные системы в медицине. Медицинские новости. 2008; 10: 15-18.
11. Щепин В. О., Расторгуева Т. И., Проклова Т. Н. К вопросу о перспективных направлениях развития здравоохранения Российской Федерации. Бюллетень Национального научно-исследовательского института общественного здоровья имени Н. А. Семашко. 2012; 1: 147-152.
12. Скворцова В. И. Семь принципов модернизации здравоохранения. Вопросы экономики и управления для руководителей здравоохранения. 2010; 5: 7-14.
13. Greenes RA. Clinical decision support: the road ahead. Amsterdam; Boston: Elsevier; 2007.
14. Лазаренко В. А., Антонов А. Е., Новомлинец Ю. П. Визуальная среда непараметрического корреляционного анализа факторов риска у больных с хирургической патологией. Здоровье и образование в XXI веке. 2017; 19 (4): 34-37.
15. Лазаренко В. А., Антонов А. Е., Прасолов А. В., Чури-лин М. И. Проблема оптимизации регрессионного анализа в оценке факторов риска, влияющих на развитие хирургических заболеваний гепатопанкреатодуоденальной зоны. Здоровье и образование в XXI веке. 2017; 19 (5): 24-27.
16. Лазаренко В. А., Антонов А. Е. Роль социальных факторов риска в развитии язвенной болезни в курской области. Человек и его здоровье. 2016; 2: 35-39. DOI: 10.21626/vestnik/2016-2/06
17. Роспатент. Зарегистрировано 10.03.2017. Свидетельство о государственной регистрации программы для ЭВМ № 2017613090. Лазаренко В. А., Антонов А. Е. Система интеллектуального анализа и диагностики заболеваний.
References
1. Strasberg SM. Clinical practice. Acute calculous cholecystitis. N Engl J Med. 2008 Jun 26;358 (26):2804-11. DOI: 10.1056/NE-JMcp0800929
2. Friedman LS. Liver, Biliary Tract, & Pancreas Disorders. In Pa-padakis MA, McPhee SJ, Rabow MW, editors. Current Medical Diagnosis & Treatment. McGraw-Hill, 2015.
3. Diseases and Conditions. Cholecystitis [Internet] Available at: http://www.mayoclinic.org/diseases-conditions/cholecystitis/ basics/risk-factors/con-20034277 Accessed 2.06.2016
4. Svetyy LI, Lopukchova VA, Tarasenko IV, Klimkin AS. The use of health technology assessment in making effective management decisions. Health & Education Millemmium. 2013; 15 (1-4): 234235. (In Russian).
5. Lopukhova VA, Tarasenko IV, Kaylanich GA, Kaylanich EA. The study of outpatient care quality in medical institutions of the Orel-city. Modern Problems of Science and Education. 2016; 5: 137. Available at: http://www.science-education.ru/ru/article/ view?id=25383. Accesed 28.11.2016. (In Russian).
6. Simonyan RZ, Kailanich GA, Lopukhova VA, Tarasenko IV. The study of medical care quality in the health technology assessment. International Journal of Applied and Fundamental Research. 2016; 8-2: 185-187. (In Russian).
7. Dotdaeva AA, Khasanova ZB, Egorova LA, Shiganova GM, Sobe-nin IA, Postnov AYu, Boytsov SA. The association of genetic risk factors of atherosclerosis with traditional risk factors of atherosclerosis in patients with coronary heart disease living in highlands (at the example of Karachay-Cherkessia). The Journal of Atherosclerosis and Dyslipidemias (Ateroskleroz i Dislipidemii). 2015; 2 (19): 35-40. (In Russian).
8. Boytsov SA, Samorodskaya IV, Semenov VYu. The impact of economic crisises on population health. Profilakticheskaya med-itsina (The Russian Journal of Preventive Medicine and Public Health). 2016; 19 (2): 4-10. DOI: 10.17116/profmed20161924-10 (In Russian).
9. Kaprin AD, Aleksandrova LM, Starinsky VV. Malignancy prophylaxis in the Russian Federation as part of global strategy for the prevention of noncommunicable diseases. Onkologiya. Zhur-nal imeni P. A. Gerzena (P. A. Herzen Journal of Oncology). 2016; 5 (5): 42-50. DOI: 10.17116/onkolog20165542-50 (In Russian).
10. Zharikov O. G., Litvin A. A., Kovalev V. A. Ekspertnye sistemy v meditsine. Meditsinskie novosti. 2008;10:15-18. (In Russian).
11. Schepin VO, Rastorguyeva TI, Proklova TN. Towards prospective directions of healthcare development in the Russian Federation. Bjulleten' Nacional'nogo nauchno-issledovatel'skogo insti-tuta obshhestvennogo zdorov'ja imeni N. A. Semashko. 2012; 1: 147-152. (In Russian).
12. Skvortsova VI. Sem' printsipov modernizatsii zdravookhraneniya. Voprosy ekonomiki i upravleniya dlya ru-kovoditelei zdravookhraneniya. 2010; 5: 7-14. (In Russian).
13. Greenes RA. Clinical decision support: the road ahead. Amsterdam; Boston: Elsevier; 2007.
14. Lazarenko VA, Antonov AE, Novomlinets UP. Visual environment for nonparametric correlation analysis of risk factors in patients with surgical diseases. Health & Education Millemmium. 2017; 19 (4): 34-37. (In Russian).
15. Lazarenko VA, Antonov AE, Prasolov AV, Churilin MI. The problem of regression analysis optimization in evaluation of risk factors influencing the development of surgical diseases of hepa-topancreatoduodenal zone. Health & Education Millemmium. 2017; 19 (5): 24-27. (In Russian).
16. Lazarenko VA, Antonov AE. The role of social risk factors in peptic ulcer development in Kursk region. Man and his health. 2016; 2: 35-39. DOI: 10.21626/vestnik/2016-2/06 (In Russian).
17. Ruspatent. Registered on 10.03.2017. The certificate of state registration of computer programs № 2017613090. Lazarenko VA, Antonov AE. System of Intellectual Analysis and Diagnosis of Diseases.a
Информация об авторах:
Лазаренко Виктор Анатольевич, д.м.н., профессор, заведующий кафедрой хирургических болезней ФПО, ректор ФГБОУ ВО «Курский государственный медицинский университет» Минздрава России. ORCID: http://orcid.org/0000-0002-2069-7701
Антонов Андрей Евгеньевич, к.м.н., помощник ректора по общим вопросам, доцент кафедры хирургических болезней ФПО ФГБОУ ВО «Курский государственный медицинский университет» Минздрава России. E-mail: drantonov@mai[.ru. ORCID: http://orcid.org/0000-0001-5745-3586
Information about authors:
Viktor A. Lazarenko, MD, professor, head of the department of surgical diseases of FPE, rector Kursk State Medical University. ORCID: http://orcid.org/0000-0002-2069-7701
Andrey E. Antonov - PhD, assistant to the rector for general matters, associate professor of the surgical diseases department, Kursk State Medical University. E-mail: [email protected]. ORCID: http://orcid.org/0000-0001-5745-3586