УДК 004.891.3
СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ПЕРВИЧНОЙ ДИАГНОСТИКИ
ЗАБОЛЕВАНИЯ
Булгак Д.А., студент группы 16ИСТ(м)ИСНИ, Оренбургский государственный университет, Оренбург
e-mail: robinhood777x@gmail.com
Научный руководитель: Горбачев Д.В., канд. техн. наук, доцент кафедры ПОВТАС, Оренбургский государственный университет, Оренбург
Интеллектуальная поддержка врача на этапах принятия диагностических и лечебных решений необходима для снижения вероятности ошибок. Актуальность выбранной темы обуславливается необходимостью совершенствования процедур поддержки принятия решений врачом на этапе постановки предварительного диагноза. В качестве метода решения данной задачи используется модель на основе ассоциативных правил. Полученная модель позволяет с высокой степенью достоверности делать вывод о предварительном диагнозе и является основой математического обеспечения системы поддержки принятия решений.
Ключевые слова: система поддержки принятия решений, лечебно-диагностический процесс, медицинская диагностика, информационные технологии в медицине, анализ данных, поиск ассоциативных правил, Data Mining, системы основанные на знаниях.
Компьютеризация клинической деятельности предназначена для повышения качества оказания медицинской помощи. Качество медицинской помощи (КМП) - совокупностью характеристик, отражающих своевременность оказания медицинской помощи, правильность выбора методов профилактики, диагностики, лечения и реабилитации при оказании медицинской помощи, степень достижения запланированного результата [4]. Из определения следует, что качество медицинской помощи во многом зависит от правильных и своевременных действий врача. Задача врача - правильно организовать лечебно-диагностический процесс (ЛДП). Основная проблема, которая может возникнуть при организации ЛДП это неверная постановка диагноза, в дальнейшем определяющая ход лечения.
Лечебно-диагностический процесс начинается с диагностики состояния пациента. Диагностика заболевания разделяется на два процесса: первичная диагностика и постановка диагноза. В результате первичной диагностики получаем предварительный диагноз, который нужно подтвердить. Первичная диагностика состоит из сбора анамнеза (опрос) и анализа симптомов. При первом визите пациента к врачу, специалист оценивает состояние больного по внешним проявлениям болезни. Собрав всю необходимую информацию, врач принимает решение о дальнейших действиях.
Второй процесс - постановка диагноза. По результатам предварительного диагноза проводят инструментальную и лабораторную диагностику, и в итоге делается заключение об окончательном диагнозе.
Согласно [3] для решения задач лечебно-диагностического процесса врач использует различную клинико-диагностическую информацию: жалобы больного, данные анамнеза, осмотра и физикального обследования (пальпация, перкуссия, аускультация), результаты инструментальных и лабораторных методов исследования.
Врач, как лицо принимающее решение, на каждом этапе ЛДП, вырабатывает решение в сложных или нечетко сформулированных условиях, сопровождающиеся недостатком информации и времени, основываясь на своей квалификации, опыте и интуиции. Принятия
неправильного (ошибочного) решения на первом этапе (первичная диагностика) ЛДП, может иметь критические последствия для пациента, так как на этом этапе определяется дальнейший ход лечения.
Для снижения вероятности ошибки, и повышения надежности при принятии решений, предлагается внедрение решений, осуществляющих интеллектуальную поддержку врача. Интеллектуальная поддержка врача представляет собой внедрение систем поддержки принятия решений (СППР) в организацию лечебно-диагностического процесса. Существует класс систем поддержки решений, реализующиеся как интеллектуальные. Интеллектуальные СППР основываются на знаниях экспертов, знаниях, извлеченных из различных хранилищ или литературных источников.
На основе проведенного анализа можно сформулировать ход рассуждений врача. Врач распознает признаки заболевания и выделяет из них значимые наборы симптомов, которые могут однозначно идентифицировать заболевание. В результате можно составить выражение вида: Ci + С2 + ... + Cn ^ D, где C1_n это обнаруженные симптомы, D - диагноз, сопровождаемый симптомами C1.n. На ранних этапах диагностического поиска (опрос, осмотр) врачу доступны специфические симптомы. Предположим, что специфические симптомы С1 и С2 обосновывают болезни D1, D2 и D3. Врач должен оценить, какое число симптомов позволяет объяснить каждая из нозологических форм: D1 и D3 объясняют наличие отдельно симптомов С1 и С2 соответственно, а болезнь D2 объясняет присутствие сразу обоих симптомов - С1 и С2 у больного. Следовательно, достаточно одной нозологической формы D2, и на этом основании болезни D1 и D3 можно не принимать в расчет, и тем самым отбросить (дифференцировать) D2 от D1 и D3.
Получаем модель вида: X ^ Y, где X - совокупность признаков, которые с высокой достоверностью приводят к появлению заболеванию Y. Данную модель хорошо описывают ассоциативные правила. Ассоциация - одна из задач Data Mining. Целью поиска ассоциативных правил является нахождение закономерностей между связанными событиями в базах данных.
Обозначим: S - поддержка; C - достоверность.
Поддержка ассоциативного правила - это число транзакций, которые содержат как условие, так и следствие [2]. Например, для ассоциации A ^ B можно записать как на формуле 1:
cs . _ количество транзакций,содержащих А и В
¿(Л ^ —---;- (1)
общее количество транзакций
Достоверность ассоциативного правила A ^ B представляет собой меру точности правила и определяется как отношение количества транзакций, содержащих и условие, и следствие, к количеству транзакций, содержащих только условие как представлено в формуле 2:
С(д ^ в) _ количество транзакций,содержащих А и В (2)
количество транакций,содержащих только А
Если поддержка и достоверность достаточно высоки, можно с большой вероятностью утверждать, что любая будущая транзакция, которая включает условие, будет также содержать и следствие.
К сожалению, достоверность не позволяет оценить полезность правила. Если процент наличия в транзакциях набора B при условии наличия в них набора A меньше, чем процент безусловного наличия B, то есть, как видно на формуле 3:
C(A ^ B) — ^ < (3)
Это значит, что вероятность случайно угадать наличие в транзакциях набора B больше, чем предсказать это при помощи правила A ^ B. Для исправления такой ситуации вводиться мера улучшение.
Улучшение - показывает, полезнее ли правило случайного угадывания [2].
Улучшение правила является отношением числа транзакции, содержащих наборы A и B, к произведению количества транзакций, содержащих набор A и количество транзакций, содержащих набор B, формула 4:
imPr(-^) = ^ (4)
Если улучшение больше 1, то это значит, что с помощью правила предсказать наличия набора B вероятнее, чем случайное угадывание. Если меньше единицы, то наоборот.
Можно отдавать предпочтение правилам, которые имеют только высокую поддержку или только высокую достоверность либо, оба показателя. Правила, для которых значения поддержки или достоверности превышают определенный, заданный пользователем порог, называются сильными правилами. Для всех построенных правил, необходимо найти корреляцию - меру лифт(ИЙ). Лифт - это отношение частоты появления условия в транзакциях, которые также содержат и следствие, к частоте появления следствия в целом, как в формуле 5:
lift(A, B) = ^^ = lift(A ^ B) (5)
Значения лифта оценивается по следующему правилу:
- если lift <1: А и В имеют отрицательную корреляцию (наличие А подразумевает
отсутствие В);
- если lift> 1: А и В имеют положительную корреляцию (наличие А подразумевает
наличие В);
- если lift = 1: А и В независимы.
Основным алгоритмом, который применяется для получения ассоциативных правил, является алгоритм apriori [5].
На основе представленного метода, разрабатывается приложение, которое будет осуществлять поиск ассоциативных правил в базе клинических данных, формируя правила, для дальнейшей их обработки и использования для принятия медицинских решений. Архитектура приложения представлена на рисунке 1.
Предположим, что следующие транзакции соответствуют набору признаков, выявленных у пациентов во время диагностики: Т = {5ъ S2, S4}; Т2 =№, S3,}; Т3 = {Sb S3, S4}. Далее задаются минимальные значения для поддержки и достоверности правил. Минимальные значения задаются специалистами, для того, чтобы алгоритм отбирал редко встречающиеся наборы и не включал их в дальнейший анализ.
Следующим шагом, будет поэтапное построение дерева из k - элементных наборов, начиная с пустого множества, затем на 1 - уровне дерева 1 -элементные наборы, на 2 уровне 2 - элементные наборы и т.д. На k уровне k - элементные наборы, связанные со всеми своими (k-1) - элементными подмножествами.
База клинических данных
Рисунок 1 - Архитектура приложения
Предположим, что набор из элементов {Б1, S2} имеет поддержку ниже заданного порога и, соответственно, не является часто встречающимся. Тогда, согласно свойству антимонотонности [5], все его множества также не являются часто встречающимися и отбрасываются. Вся эта ветвь, начиная с ^1, S2}, выделена фоном на рисунке 2.
На основе найденных частых наборов строятся ассоциативные правила - это следующий шаг алгоритма. Например, для набора {5ъ 5з, £4} могут быть построены следующие правила: если (Б1), то (Б3); если (Б1), то (Б4); если (Б1), то (Б3, Б4); если (Б3, Б4), то (Б1); если (бЗ), то (Б4); если (Бз), то (Б1, Б4) и т.д.
Такое количество комбинаций, может быть трудно воспринимаемыми и малоинформативными, так как не все построенные комбинации несут в себе полезную информацию. Поэтому происходит оценка их полезности по следующим критериям: поддержка, достоверность и улучшение [2].
Построенные правила, можно использовать как базу знаний при диагностике заболеваний. После обработки данных, полученные правила сохраняются в базу знаний. Подав на вход системы список наблюдаемых симптомов, получим на выходе перечень наиболее вероятных диагнозов. Например, специалист наблюдает у пациента такие признаки как: высокую температуру тела в пределах 37-38 градусов, сухой кашель, боли в груди при кашле. Система может выдать такие заболевания как бронхит с вероятностью 0,6 % и свиной грипп с вероятностью 0,5 %. При добавлении новых симптомов, диагнозы, менее соответствующие отбрасываются, остаются более достоверные диагнозы, при этом, стоит отметить, у достоверного диагноза вероятность будет постоянно расти.
Литература
1. Agrawal, R. Fast algorithms for mining association rules/ R. Agrawal, R. Srikant // Proceedings of the 20th International Conference on Very Large Data Bases. September 12-15, 1994, Santiago, Chile. - 1994. - pp. 487-499.
2. Барсегян, А.А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP: учеб. пособие / A.A. Баргесян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. - СПб.: БХВ - Петербург, 2007. - 384 с.
3. Борщук, Е.Л. Моделирование процессов в медицине и здравоохранение: монография / Е.Л. Борщук, Д.В. Горбачев, В.М. Боев, Н.В. Зайцева, Д.Н. Бегун, Н.А. Баянова. - Оренбург: ОАО «ИПК «Южный Урал», 2015. - 204 с.
4. Кобринский, Б.А. Медицинская информатика: учебник / Б.А. Кобринский, Т.В. Зарубина. - Москва: Академия, 2009. - 192 с.
5. Линденбратен, А.Л. Формализация клинического мышления как один из путей повышения качества медицинской помощи / А.Л. Линденбратен, И.Н. Котонскии // Вестник Росздравнадзора. - 2016. - № 2. - C. 42-45.
6.Stilou, S. Mining Association Rules from Clinical Databases: An Intelligent Diagnostic Process in Healthcare / S. Stilou, P.D. Bamidis, N. Maglaveras, C. Pappas // Stud Health Technol Inform. - 2001. - Vol. 84. - № 8. - pp. 1399-1403.