Научная статья на тему 'Структура информационного хранилища системы поддержки принятия клинических решений'

Структура информационного хранилища системы поддержки принятия клинических решений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
онтология / клинические рекомендации / система поддержки принятия решений / продукционные правила / база знаний / информационное хранилище / ontology / clinical guidelines / decision support system / production rules / knowledge base / information repository

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Богданова Диана Радиковна, Шахмаметова Гюзель Радиковна, Ниязгулов Альберт Минниахметович

Рассматривается построение на основе онтологического подхода информационного хранилища системы поддержки принятия клинических решений слабо-формализуемой предметной области лечения бронхолѐгочных заболеваний. Приведѐн обзор подходов к созданию баз знаний в этой предметной области. Описан метод извлечения знаний, основанный на правилах из клинических рекомендаций и поиске зависимостей между словами в предложениях с учѐтом последовательности применения правил. Информационное хранилище системы поддержки принятия клинических решений наполняется онтологической и продукционной базами знаний при помощи предложенного метода извлечения знаний. Разработана онтология выбранной предметной области, проведены исследования еѐ качества на основе анализа топологии графа при помощи метрик когнитивной эргономичности. Показана эффективность описанного метода извлечения знаний. Разработана оригинальная архитектура системы поддержки принятия клинических решений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The structure of the CDSS information repository based on the ontological approach

The construction of an information repository for a clinical decision support system (CDSS) in the weakly formalized subject area of treating bronchopulmonary diseases is considered. An overview of approaches to creating knowledge bases in this subject area is provided. A method for extracting knowledge is described, which is based on rules from clinical recommendations and the search for dependencies between words in sentences, taking into account the sequence of rule application. The information repository of the CDSS is populated with ontological and production knowledge bases using the proposed knowledge extraction method. An ontology for the selected subject area was developed, and studies of its quality were conducted through an analysis of the graph topology using cognitive ergonomics metrics. The effectiveness of the described knowledge extraction method is demonstrated. An original architecture for a clinical decision support system has been developed.

Текст научной работы на тему «Структура информационного хранилища системы поддержки принятия клинических решений»

МЕТОДЫ И ТЕХНОЛОГИИ ПРИНЯТИЯ РЕШЕНИЙ

УДК 004.891.2 Научная статья DOI: 10.18287/2223-9537-2024-14-2-270-278

Структура информационного хранилища системы поддержки принятия клинических решений

© 2024, Д.Р. Богданова И, Г.Р. Шахмаметова, А.М. Ниязгулов

Уфимский университет науки и технологий (УУНиТ), Уфа, Россия

Аннотация

Рассматривается построение на основе онтологического подхода информационного хранилища системы поддержки принятия клинических решений слабо-формализуемой предметной области лечения бронхолёгочных заболеваний. Приведён обзор подходов к созданию баз знаний в этой предметной области. Описан метод извлечения знаний, основанный на правилах из клинических рекомендаций и поиске зависимостей между словами в предложениях с учётом последовательности применения правил. Информационное хранилище системы поддержки принятия клинических решений наполняется онтологической и продукционной базами знаний при помощи предложенного метода извлечения знаний. Разработана онтология выбранной предметной области, проведены исследования её качества на основе анализа топологии графа при помощи метрик когнитивной эргономичности. Показана эффективность описанного метода извлечения знаний. Разработана оригинальная архитектура системы поддержки принятия клинических решений.

Ключевые слова: онтология, клинические рекомендации, система поддержки принятия решений, продукционные правила, база знаний, информационное хранилище.

Цитирование: Богданова Д.Р., Шахмаметова Г.Р., Ниязгулов А.М. Структура информационного хранилища системы поддержки принятия клинических решений // Онтология проектирования. 2024. Т. 14, №2(52). С. 270-278. Б01:10.18287/2223-9537-2024-14-2-270-278.

Финансирование: исследование поддержано грантом РНФ № 22-19-00471.

Конфликт интересов: авторы заявляют об отсутствии конфликта интересов.

Введение

В медицине особенно актуальна организация процесса обработки, хранения и использования данных ввиду большого объёма накопленной информации в области диагностики и лечения пациентов.

Онтология предметной области (ПрО) - формализованное описание структуры медицинских знаний и терминологии используется для описания знаний о заболеваниях, процедурах лечения, симптомах, физиологии, патологиях и др. Клинические рекомендации - согласованные рекомендации для диагностики и лечения пациентов, основанные на методах с доказанной эффективностью. Информация о пациенте - личные данные, диагноз, история болезни, результаты анализов, результаты функциональной диагностики.

Указанные данные применяются для создания медицинских информационных, экспертных или рекомендательных систем, в которых накопленную информацию объединяют в базы знаний (БЗ), формируя на их основе методы решения задач (диагностика пациента или назначение лечения). Эффективность использования сформированной БЗ зависит от типа хранимой информации, её структурированности и связей между элементами системы поддержки принятия решений (СППР). По данным исследования [1] лишь 10-20% информации, используемой в медицинских учреждениях, представлено в структурированной форме. Примером представления информации в неструктурированном виде являются тексты клиниче-

ских рекомендаций. При формировании структуры БЗ необходим анализ таких текстов, который в медицинских учреждениях выполняют специалисты.

Для структурирования данных в текстах клинических рекомендаций разработан алгоритм и программное обеспечение (ПО) [2], которые позволяют структурировать текст для последующего использования в БЗ СППР. Разработанные средства автоматически выделяют ключевые слова и строят на их основе карты понятий. Результатом является сформированный набор продукционных правил (ПП), который может применяться при построении СППР. В общем виде ПП можно представить как логические правила, описывающие связи между медицинскими симптомами и заболеваниями, а также определяющие эффективные методы лечения в зависимости от представленных входных данных. Такие правила интегрируются в БЗ и могут быть использованы при диагностике пациента или назначении лечения.

В области построения БЗ клинических рекомендаций используются несколько различных подходов, на основе которых разработаны ПО. В работе [3] предложена архитектура БЗ системы поддержки принятия врачебных решений, основанная на графовой базе данных (БД). В качестве источника знаний использованы клинические рекомендации, из них выделены типы связей и понятий, на их основе создана метамодель для БЗ СППР. В работе [4] представлена медицинская экспертная система на основе БЗ, построенная с использованием семантических сетей и нечёткой логики. Разработанное ПО позволяет врачу на основе данных о диагнозе пациента и течении болезни получать список рекомендаций. СППР, ориентированная на пациента и использование отзывов из социальных сетей, предложена в [5]. Отзывы пациентов анализируются на предмет тональной окраски и преобразуются в структурированные данные, которые используются для создания БЗ о пациенте. В рамках исследования проблемы избыточной массы тела у детей в [6] представлены разработки в области создания БЗ для медицинских экспертных систем. Для формирования БЗ экспертных диагностических систем предложено использовать нечёткие нейронные сети [7]. Перечисленные и другие СППР применяются для решения конкретных задач или затрагивают определённую сферу медицины. Большинство предложенных реализаций находятся на стадии проекта либо прототипа. Зарубежные разработки не обладают поддержкой русского языка, что затрудняет обработку информации и построение БЗ с их помощью.

Возможным средством решения задачи построения информационного хранилища СППР ПрО лечения бронхолёгочных заболеваний может стать онтология [8]. Онтологический подход позволяет связать терминологию и клинические рекомендации и на их основе разработать деревья принятия решений, из которых формируются ПП. Совокупность правил позволит объединить в единую БЗ клинические рекомендации [9].

1 Извлечение знаний для формирования информационного хранилища

1.1 Структура метода

В СППР объектами исследования являются рентгенологические снимки, истории болезней, симптомы заболеваний, клинические рекомендации, представленные в описательном виде. Для их описания необходимо использование специальных технологий обработки слабоструктурированных и слабоформализованных данных [10]. Одной из таких технологий является метод извлечения знаний, определяемый построенными деревьями зависимостей между словами в предложении с учётом использования последовательности применения ПП. В процессе построения БЗ клинических рекомендаций при помощи метода извлечения знаний необходимо выполнить следующие этапы обработки данных [11]:

1) создание онтологий ПрО - описание концептуальной структуры медицинских знаний [12];

2) автоматическое выявление текстов клинических рекомендаций по конкретным заболеваниям (например, бронхолёгочным болезням) [13];

3) программная генерация деревьев принятия решений на основе онтологии ПрО и клинических рекомендаций [14];

4) формирование набора ПП, на основе которых составляется БЗ СППР.

1.2 Онтологическая БЗ

Онтологическая БЗ разрабатываемого информационного хранилища СППР реализована на языке OWL. В качестве языка запросов к данным онтологии используется SPARQL. Моделирование онтологий осуществляется на базе Protégé 1. Фрагмент дерева классов онтологии, разработанного при помощи плагина OntoGraf, представлен на рисунке 1.

Рисунок 1 - Фрагмент дерева классов онтологии (Protégé - OntoGraf)

1.2.1 Иерархия классов

Иерархия классов онтологической БЗ разрабатываемого информационного хранилища СППР представлена в виде дерева (часть иерархии классов разработанной онтологии представлена на рисунке 2). Среди множества его ветвей для примера можно выделить следующие классы.

■ «Диагноз по COVID-19» включает степени тяжести болезни (лёгкая, среднетяжёлая, тяжёлая).

■ «Диагностика» подразделяется (со всеми дополнительными подклассами и подпунктами) на инструментальную, лабораторную, подробную оценку (анамнез заболевания, жалобы, эпидемиологический анализ) и физикальное обследование.

■ «Лабораторное оборудование» включает инструменты, необходимые для диагностики и лечения указанного заболевания (аппарат ИВЛ, бронхоскоп, 12-канальный ЭКГ и др.).

1.2.2 Метрики качества онтологии

Исследования качества онтологии проводилось на основе анализа топологии графа. В качестве основных метрик были использованы метрики когнитивной эргономичности [15]:

1) Глубина онтологии. Путь графа - последовательность соединённых вершин от корня до листа. Этот параметр необходимо учитывать при оценке относительной, средней или максимальной глубины графа. Максимальная глубина в четыре ветви (последовательности) является доступной для восприятия и легко анализируемой.

2) Ширина онтологии определяет количество вершин и оценивается с трёх точек зрения - как абсолютная (сумма вершин), средняя или максимальная (количество вершин на самом большом уровне иерархии гра-

1 Protégé (the Stanford Center for Biomedical Informatics Research at the Stanford University School of Medicine). Официальный сайт. https://protege.stanford.edu.

3)

фа). Средняя ширина онтологии разрабатываемой системы - 4,3 вершины. По этому показателю онтология является хорошо проработанной и разделённой на иерархии с точки зрения когнитивной эргономики.

Запутанность онтологии рассматривается с ^

позиции множественного наследования - как количество вершин графа онтологии, у которых есть несколько непосредственных суперклассов. Поскольку в рассматриваемой онтологии такого наследования нет, данная метрика имеет оптимальный нулевой показатель. 4) Количество анонимных классов также равняется нулю, что позволяет улучшить воспринимаемость и читаемость разработанной онтологии. Оценка онтологии проводится на всех этапах разработки ПО.

1.3 Деревья принятия решений

В основе разрабатываемого информационного хранилища СППР лежат деревья решений - иерархические структуры, состоящие из ПП, которые могут быть сгенерированы во время обучения модели [16]. Как правило, деревья применяются для анализа массивов информации и решения задач классификации [17]. Структура дерева принятия решений может быть описана как совокупность «ветвей» (с описанием признаков и условий) и узлов - значений целевой функции («листьев»). Классификация новых признаков происходит при перемещении по ветвям с последующим получением значений из узлов. Ключевой особенностью деревьев принятия решений является про-

Т §Диагноз_по_СОУт_19 Т-ШСтепень_тяжести_болезни (| Легкаястепень \ ê Средне-Тяжёлая_степень 1 ёТяжёлая_степень V- ^Диагностика

У Инструментальная_диагностика лучевая_диагностика г #пульсоксиметрия

[......#ЭКГ

Ла6ораторная_диагностика ! ¿■■■■•Общая Т Этилогическая

BbiflBfleHne_aH™reHa_SARS-CoV-2

Bыявлeниe_и^lмyнoглyблинoв_клaca_A1M_и_G_к_SARS-CoV-2 BbiflBfleHHe_PHK_SARS-CoV-2 Подробная_оценка анамнез_заболевания г Фжалобы

эпидемиологичкий_анамнез Т Физикальное_обследование

■■■♦аускультация_и_перкусия_легких

• Измерение_5р02

• измерение_ЧСС,ДД,ЧДД

• иследование_органсв_6рк)шной_полости_с_определением_разчеров_печени •оценка_слизистых_оболочек

оценка_уровня_сознания пальпация_лимфатических_узлов ■■■•термометрия Ла6ораторное_о6орудование \ #12-канальный_ЭКГ

|......#Bipap

Аппарат^ВЛ Бронхоскоп Видеобронхоскоп [ • Гелевая_подушка_для_прон-позиции Гематологический_анализатор Градусник

\......^Дефибриллятор

Инфузионный_насос f • Кислородный_концентратор |......4 Монитор_пациента

Рисунок 2 - Часть иерархии классов онтологической базы знаний информационного хранилища СППР

(Protégé)

стота генерации ПП, описываемых на естественном языке. В качестве примера приведён фрагмент одной из ветвей дерева принятия решений, построенного на базе структурированных текстов клинических рекомендаций (рисунок 3).

Рисунок 3 - Фрагмент одной из ветвей дерева принятия решений по диагностике бронхиальной астмы

Из представленного фрагмента ветви дерева принятия решений можно сформировать ряд ПП по диагностике бронхиальной астмы у пациента с соответствующими симптомами.

Структура 1111 на основе дерева принятия решений в формате, подходящем для использования в БЗ клинических рекомендаций СППР в общем виде выглядит как связка двух блоков - «Условий и симптомов» (начинается с ключевого слова ЕСЛИ) и «Лечения» (ключевое слово ТО). Примеры разработанных ПП:

■ ЕСЛИ у пациента объём форсированного воздуха за первую секунду маневра форсированного выдоха меньше 60% И колебания пиковой скорости выдоха больше 30%, ТО может быть поставлен диагноз «Ступень 4: Персистирующая бронхиальная астма тяжёлого течения»;

■ ЕСЛИ у пациента объём форсированного воздуха за первую секунду маневра форсированного выдоха меньше 60% И колебания пиковой скорости выдоха от 20 до 30%, ТО может быть поставлен диагноз «Ступень 3: Персистирующая бронхиальная астма средней степени тяжести»;

■ ЕСЛИ у пациента объём форсированного воздуха за первую секунду маневра форсированного выдоха меньше 60% И колебания пиковой скорости выдоха менее 20%, ТО диагноз «астма» не подтверждён.

1.4 Построение деревьев принятия решений

Наиболее затратным с точки зрения ресурсов вычислительных устройств является этап автоматической генерации деревьев принятия решений на основе текстов клинических рекомендаций и онтологии, т. к. массивы обрабатываемых данных могут быть большими.

Порядок построения деревьев принятия решений показан на рисунке 4. Сформированные деревья принятия решения используются для наполнения соответствующих БЗ клинических рекомендаций СППР.

2 Реализация системы Рисунок 4 - Порядок построения деревьев

Реализация медицинской СППР находится на решений

этапе прототипирования, разработки и тестирования отдельных компонентов. Предложено создание единого информационного хранилища путём объединения отдельных элементов:

■ БД - общее хранилище информации о пациентах (история болезни, личные данные);

■ онтологическая БЗ;

■ продукционная БЗ - хранилище ПП и деревьев принятия решений, сформированных на основе текстов клинических рекомендаций;

■ метаданные - дополнительная информация о содержимом или объектах БЗ.

Разработана общая структура информационного хранилища, представленная на рисунке 5.

Фрагмент модели БД информационного хранилища представлен на рисунке 6.

На выходе СППР формирует отчёт для специалиста с рекомендациями по лечению пациента, полученный на основе анализа данных.

Рисунок 5 - Общая структура информационного хранилища

Физ лицо

Код физ лицо

Паспортные данные ФИО (Назначает

Соц номер Адрес

11азнач. проц. специалистов /*Код специалиста

Код назначенной проц Код пациента (FK)

Кабинет процедуры

Входит _ _ '

Врач ^ Код врача

Дата Запись

Код врача (FK) Код методики (FK)

Код кабинета

Количество аппаратов Код процедуры

Управляет

График работы кабинетов ХКод графика работы ^ Код кабинета (ПС)

. Ограничивает

Входит

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Код Звание Категория Разряд

Код физ лицо (FK)

Ведет ^Р История болезни

/''Код истории Код врача (РК) Код пациента (РК) Код специалиста (РК) Код назначенной проц (РК)

1

Дата Запись

1

Пациент

Код пациента

Код физ лица (ПС) Код

Дата заезда Дата выезда Стоимость лечения

L

Получает

За ЮС ЕГГСЯ

Зан эс* гея

и

Мед. тех. ограничения и методики

Код методики

Определяет Р

Г

Код календаря (РК) День недели Обед начало Обед конец Время начало Уу^Время окончание

г

Р Ограничивают

Составление расписания ''Код графика отпуска процедур^ Код специалиста (БК) Код кабинета (РК) Код методики (РК) Код графика работы (Ж) Код пациента (РТС) Код назначенной проц (РК)

Определяет

Упра:

Календарь

Код календаря (РК) День недели Время начало Обед начало Обед конец Л^ремя окончания

Определяет

Код календаря

Число Месяц Год

Неделя День недели

Критерии эффективности расписания

Определяет/

Код критерия

Определяет 1

Карта_

/^Код карты Код специалиста (РК) Код назначенной проц (РК) Код пациента (РК)

Определяет

Результаты анализа У^Заболевания

_Получает

Оказание мед. услуг /1(од медуслуги

Код специалиста (Ж) Код кабинета (РК) Код графика работы (РК) Код методики (РК) Код графика отпуска процедур (РК) Код пациента (РК) Код назначенной проц (РК)

одержание лечения

J

Рисунок 6 - Фрагмент модели базы данных информационного хранилища

Заключение

Разрабатываемое информационное хранилище может стать основой медицинской СППР, применяемой для постановки диагноза и назначения лечения пациентов.

Предложенный метод отличает использование автоматического формирования деревьев принятия решений на основе текстов клинических рекомендаций и онтологии.

Список источников

[1] Why unstructured data holds the key to intelligent healthcare systems. HIT Consultant; 2015. https://hitconsultant.net/2015/03/31/tapping-unstructured-data-healthcares-biggest-hurdle-realized/.

[2] Shakhmametova G., Yusupova N., Zulkarneev R., Khudoba Y. Concept Map for Clinical Recommendations Data and Knowledge // Proc. of the 8th International Conference on Applied Innovations in IT (ICAIIT). 2020. P.71-76. EDN: PXBUZZ.

[3] Киселев К.В., Ноева Е.А., Выборов О.Н., Зорин А.В. Разработка архитектуры базы знаний системы поддержки принятия врачебных решений, основанной на графовой базе данных. Медицинские технологии. Оценка и выбор. 2018. № 3(33). С.42-48. DOI: 10.31556/2219-0678.2018.33.3.042-048.

[4] Жулева С.Ю., Крошилин А.В., Крошилина С.В. Формирование базы знаний в экспертных системах медицинского назначения // Современные проблемы науки и образования. 2015. № 2-2. С.23. EDN: UZIYCF.

[5] Yang, J., Xiao, L. & Li, K. Modelling clinical experience data as an evidence for patient-oriented decision support // BMC Medical Informatics and Decision Making. 2020. № 20. DOI: 10.1186/s12911-020-1121-4.

[6] Бурцева А.Л., Берестнева Е. В., Степаненко Н. П. Создание базы знаний для медицинской экспертной системы. Современные наукоёмкие технологии. 2016. № 3 (часть 1). С. 14-17. EDN: VSYAGP.

[7] Катасёв А.С. Ахатова Ч.Ф. Гибридная нейронечёткая модель интеллектуального анализа данных для формирования баз знаний мягких экспертных диагностических систем. Наука и образование: научное издание МГТУ им. Н.Э. Баумана. 2012. № 12. С.34-42. EDN: PMKDOP.

[8] Sim I., Gorman P., Greenes R.A., Haynes R.B., Kaplan B., Lehmann H., et al. Clinical decision support systems for the practice of evidence-based medicine. J Am Med Inform Assoc. 2001. № 8(6). P.527-534. DOI: 10.1136/jamia.2001.0080527.

[9] Григорьев Л. Ю., Заблоцкий А. А., Кудрявцев Д. В. Технология наполнения баз знаний онтологического типа. Информатика, телекоммуникации и управление. 2012. №3 (150). С.27-36.

[10] Кобринский Б.А. Системы поддержки принятия врачебных решений: история и современные решения.

Методология и технология непрерывного профессионального образования. 2020. №4 (4). С.21-36. DOI: 10.24075/MTCPE.2020.022.

[11] Дармахеева Т.А., Хаптахаева Н.Б. Моделирование системы управления активацией продукционных правил с использованием автоматного программирования. Вестник БГУ. Математика, информатика. 2018. №3. С.40-59. DOI: 10.18101/2304-5728-2018-3-40-59.

[12] Грибова В.В., Петряева М.В., Окунь Д.Б., Шалфеева Е.А. Онтология медицинской диагностики для интеллектуальных систем поддержки принятия решений. Онтология проектирования. 2018. Т.8. №1(27). С.58-73. DOI: 10.18287/2223-9537-2018-8-1-58-73.

[13] Вафин Р.Р. Автоматическое извлечение информации из клинических рекомендаций с применением интеллектуального анализа текста // Мавлютовские чтения: материалы XIII Всероссийской молодежной научной конференции. 2019. Т. 4. Ч. 2. С. 74-77.

[14] Зайцева Т.В., Васина Н.В., Пусная О.П., Смородина Н.Н. Программная реализация метода деревьев решений для решения задач классификации и прогнозирования. Экономика. Информатика. 2013. №8-1. С.121-127. EDN: RPYDEL.

[15] Гаврилова Т.А., Горовой В.А., Болотникова Е.С., Голенков В.В. Субъективные метрики оценки онтоло-гий // Материалы Всероссийской конференции с международным участием «Знания-Онтологии-Теории» (З0НТ-2009), Новосибирск, 22-24 октября 2009 года. С.178-186. EDN: YMWMYT.

[16] Жаркова О.С., Шаропин К.А., Сеидова А.С., Берестнева Е.В., Осадчая И.А. Построение систем поддержки принятия решений в медицине на основе деревьев решений // Современные наукоемкие технологии. 2016. №6 (часть 1). С.33-37. EDN: WCDUOD.

[17] Кафтанников И.Л., Парасич А.В. Особенности применения деревьев решений в задачах классификации // Вестник ЮУрГУ. Серия: Компьютерные технологии, управление, радиоэлектроника. 2015. №3. С.26-31. DOI: 10.14529/ctcr150304.

Сведения об авторах

Богданова Диана Радиковна, 1983 г. рождения. Окончила Уфимский государственный авиационный технический университет (УГАТУ) в 2005 г. Доцент кафедры вычислительной математики и кибернетики (ВМиК) УУНиТ. К.т.н. (2008). В списке научных трудов более 150 работ в области СППР и ИИ. ORCID: 0000-0001-9887-2875; Author ID (РИНЦ): 182812; Author

ID (Scopus): 57188707438; Researcher ID (WoS): ABD-4816-2020. dianoch-ka7bog@mail.ru. И

Шахмаметова Гюзель Радиковна, 1970 г. рождения. Окончила Уфимский

авиационный институт им. С. Орджоникидзе в 1992 г., д.т.н. (2013), профессор, заведующий кафедрой ВМиК УУНиТ. В списке научных трудов более 160 работ в области интеллектуальной поддержки принятия решений и ИИ. ORCID: 0000-0002-7742-793Х; Author ID (РИНЦ): 122831; Author ID (Scopus): 6504057483. shakhgou-zel@mail.ru.

Ниязгулов Альберт Минниахметович, 1987 г. рождения. Окончил УГАТУ в 2022 г. Инженер кафедры ВМиК УУНиТ. Аспирант по специальности «Математическое и программное обеспечение вычислительных систем, комплексов и компьютерных сетей». Автор трёх статей в сборниках научных работ, индексируемых в Scopus. ORCID: 0009-0008-0725-3971; alertu-fa@gmail.com.

Поступила в редакцию 26.12.2023, после рецензирования 10.04.2024. Принята к публикации 08.05.2024.

Scientific article DOI: 10.18287/2223-9537-2024-14-2-270-278

The structure of the CDSS information repository based on the ontological approach

© 2024, D.R. Bogdanova El, G.R. Shakhmametova, A.M. Niiazgulov

Ufa University of Science and Technology, Ufa, Russia Abstract

The construction of an information repository for a clinical decision support system (CDSS) in the weakly formalized subject area of treating bronchopulmonary diseases is considered. An overview of approaches to creating knowledge bases in this subject area is provided. A method for extracting knowledge is described, which is based on rules from clinical recommendations and the search for dependencies between words in sentences, taking into account the sequence of rule application. The information repository of the CDSS is populated with ontological and production knowledge bases using the proposed knowledge extraction method. An ontology for the selected subject area was developed, and studies of its quality were conducted through an analysis of the graph topology using cognitive ergonomics metrics. The effectiveness of the described knowledge extraction method is demonstrated. An original architecture for a clinical decision support system has been developed.

Keywords: ontology, clinical guidelines, decision support system, production rules, knowledge base, information repos-

For citation: D.R. Bogdanova, G.R. Shakhmametova, A.M. Niiazgulov. The structure of the CDSS information repository based on the ontological approach [In Russian]. Ontology of designing. 2024; 14(2): 270-278. DOI:10.18287/2223-9537-2024-14-2-270-278.

Financial Support: This work was supported by the Russian Science Foundation grant No. 22-19-00471. Conflict of interest: The authors declare no conflict of interest.

List of figures

Figure 1 - Fragment of the ontology class tree (Protégé - OntoGraf)

Figure 2 - Part of the class hierarchy of the ontological knowledge base of the DSS information repository (Protégé)

Figure 3 - A fragment of a branch of the decision tree for diagnosing bronchial asthma

Figure 4 - Decision tree construction order

Figure 5 - General structure of the information repository

Figure 6 - Fragment of the information repository database model

References

[1] Why unstructured data holds the key to intelligent healthcare systems. HIT Consultant; 2015. https://hitconsultant.net/2015/03/31/tapping-unstructured-data-healthcares-biggest-hurdle-realized/.

[2] Shakhmametova G, Yusupova N, Zulkarneev R, Khudoba Y. Concept Map for Clinical Recommendations Data and Knowledge. In: Proc. of the 8th International Conference on Applied Innovations in IT, (ICAIIT). (Koethen, Germany, March 10th 2020). Anhalt University of Applied Sciences, 2020: 71-76. EDN: PXBUZZ.

[3] Kiselev K, Noeva E, Vyborov O, Zorin A, et al. Development of the knowledge base architecture of the system of medical decision support based on the graph database [In Russian]. Medical technologies. Evaluation and Choice. 2018; 3(33): 42-48. DOI: 10.31556/2219-0678.2018.33.3.042-048.

[4] Kroshilin A, Kroshilina S, Zhuleva S. Formation of knowledge base in expert systems of medical purpose [In Russian]. Modern problems of science and education. 2015; 2-2: 23. EDN: UZIYCF.

[5] Yang J, Xiao L, Li K. Modelling clinical experience data as an evidence for patient-oriented decision support. United Kingdom: BMC Medical Informatics and Decision Making; 2020; 20. DOI: 10.1186/s12911-020-1121-4.

[6] Burtseva A, Berestneva E, Stepanenko N. Creating a knowledge base for medical expert system [In Russian]. Modern Science-Intensive Technologies. 2016; 3(1): 14-17. EDN: VSYAGP.

[7] Katasev A, Akhatova Ch. Hybrid neuro-fuzzy model of intellectual data analysis for the formation of knowledge bases of soft expert diagnostic systems [In Russian]. Science and Education: scientific edition of Bauman Moscow State Technical University. 2012; 12: 34-42. EDN: PMKDOP.

[8] Sim I, Gorman P, Greenes RA, Haynes RB, Kaplan B, Lehmann H, et al. Clinical decision support systems for the practice of evidence-based medicine. Washington, D.C.: J Am Med Inform Assoc. 2001; 8(6): 527-534. DOI: 10.1136/jamia.2001.0080527.

[9] Grigoriev L, Zablotsky A, Kudryavtsev D. Technology of ontology-type knowledge bases filling [In Russian]. Informatics, Telecommunications and Management; 2012; 3(150): 27-36.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[10] KobrinskyB. Support systems for medical decision making: history and modern solutions [In Russian]. Methodology and Technology of Continuing Professional Education; 2020; 4(4): 21-36. DOI: 10.24075/MTCPE.2020.022.

[11] Darmakheeva T, Khaptakhaeva N. Modeling of the control system of the product-rules activation using automata-based programming [In Russian]. BSU Vestnik. Mathematics, Informatics; 2018; 3: 40-59. DOI: 10.18101/2304-5728-2018-3-40-59.

[12] Gribova V, Petryaeva M, Okun D, Shalfeeva E. Medical diagnosis ontology for intelligent decision support systems. [In Russian]. Ontology of Designing. 2018; 8(1): 58-73. DOI: 10.18287/2223-9537-2018-8-1-58-73.

[13] Vafin R. Automatic information extraction from clinical guidelines using intelligent text analysis [In Russian]. In: Mavlyutov's readings: proc. of the XIII All-Russian youth scientific conference (Ufa, Russia, October 22-24th 2019). Ufa State Aviation Technical University. 2019; 4(2): 74-77.

[14] Zaitseva T, Vasina N, Pusnaya O, Smorodina N. Program realization of the decision tree method for solving the classification and forecasting problems [In Russian]. Economics. Informatics. 2013; 8-1(151): 121-127. EDN: RPYDEL.

[15] Gavrilova T, Gorovoy V, Bolotnikova E, Golenkov V. Subjective metrics for evaluating ontologies [In Russian]. In: Proc. of the All-Russian Conference with international participation "Knowledge-Ontology-Theories" (ZONT-2009) (Novosibirsk, October 22-24th 2009). Sobolev Institute of Mathematics, 2009: 178-186. EDN: YMWMYT.

[16] Zharkova O, Sharopin K, Seidova A, Berestneva E, Osadchaya I. Building decision support systems in medicine based on decision trees [In Russian]. Modern Science-Intensive Technologies. 2016; 6(1):33-37. EDN: WCDUOD.

[17] Kaftannikov I, Parasich A. Features of decision trees application in classification tasks [In Russian]. Vestnik SUSU. Series: Computer technologies, management, radio electronics. 2015; 3: 26-31. DOI: 10.14529/ctcr150304.

About the authors

Diana Radikovna Bogdanova, (b. 1983) graduated from the Ufa State Aviation Technical University (UGATU) in 2005, certified mathematical economist. PhD in Management in Social and economic systems. She is an Associate Professor at the Ufa University of Science and Technology (Department of Computational Mathematics and Cybernetics). The list of scientific papers includes more than 150 works in the field of DSS and AI. ORCID: 0000-0001-9887-2875; Author ID (RSCI): 182812; Author ID (Scopus): 57188707438; Researcher ID (WoS): ABD-4816-2020. dianoch-ka7bog@mail.ru. El

Gyuzel Radikovna Shakhmametova, (b. 1970) graduated from the Ufa Aviation Institute named after S. Ordzhonikidze in 1992 (engineer in information systems), PhD (2013). She is professor and the Head of the Department of Computational Mathematics and Cybernetics at the Ufa University of Science and Technology. Her list of scientific works includes more than 160 papers in the field of intelligent decision support and AI. ORCID: 0000-0002-7742-793X; Author ID (RSCI): 122831; Author ID (Scopus): 6504057483. shakhgouzel@mail.ru.

Albert Minniakhmetovich Niiazgulov, (b. 1987) graduated from the UGATU in 2022. He is an engineer at the Ufa University of Science and Technology (Department of Computational Mathematics and Cybernetics). Postgraduate student of the 2nd year of study at the "Mathematical and software of computer systems, complexes and computer networks" specialty. ORCID: 0009-0008-0725-3971; alertufa@gmail.com.

Received December 26, 2023. Revised April 10, 2024. Accepted May 08, 2024.

i Надоели баннеры? Вы всегда можете отключить рекламу.