Научная статья на тему 'МЕТОДИКА РАЗРАБОТКИ ЭКСПЕРТНЫХ СИСТЕМ С ИСПОЛЬЗОВАНИЕМ ГРАФОВОЙ СУБД И ОНТОЛОГИЧЕСКОГО ПОДХОДА'

МЕТОДИКА РАЗРАБОТКИ ЭКСПЕРТНЫХ СИСТЕМ С ИСПОЛЬЗОВАНИЕМ ГРАФОВОЙ СУБД И ОНТОЛОГИЧЕСКОГО ПОДХОДА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
110
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭКСПЕРТНАЯ СИСТЕМА / СППВР / БАЗА ЗНАНИЙ / ОНТОЛОГИЯ / ИНТЕЛЛЕКТУАЛЬНЫЙ РЕДАКТОР БАЗЫ ЗНАНИЙ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Осмоловский И.С., Зарубина Т.В.

Экспертные системы являются сложными программными комплексами, аккумулирующими знания специалистов в конкретных предметных областях и тиражирующими этот эмпирический опыт для консультаций менее квалифицированных пользователей, что позволяет снизить количество врачебных ошибок, вызванных, в частности, недостатком врачей-специалистов на местах, и время, необходимое на одну консультацию.Цель исследования. Создание и представление современной методики разработки экспертных систем на основе инженерии знаний с использованием онтологического подхода и графовых СУБД.Материалы и методы. Применялись методы системного анализа, включая аналитический и описательный, методы инженерии знаний: структурирования, представления знаний и нечеткой логики. В качестве хранилища БЗ методика предполагает использование графовой СУБД.Результаты. Методика описывает процесс разработки экспертных систем на основе графовой СУБД с использованием онтологического подхода. Методика включает в свой состав описание следующих компонентов: базы знаний, интеллектуального редактора базы знаний, решателя и подсистемы объяснений. Методика предполагает участие в разработке ЭС группы экспертов, совместно с которыми осуществляется разработка двух компонентов: терминологической базы предметной области и промежуточных информационных объектов, описывающих логику решения поставленной задачи. Оба компонента должны формироваться автоматизировано, посредством интеллектуального решателя базы знаний, как и наполнение базы знаний, что позволит облегчить последующее ее ведение и поддерживать актуальность. В соответствии с методикой решатель и подсистема объяснений работают с графовой СУБД, являющейся средством хранения базы знаний, с целью поиска оптимального пути, в котором узлы используются для решения задачи экспертной системы, например, поддержка врача-специалиста в части установки предварительного\заключительного диагноза, а путь используется подсистемой объяснения с целью аргументации предложенного экспертной системой решения.Выводы. Разработана и представлена методика создания ЭС с использованием графовой СУБД и онтологического подхода. Методика описывает разработку двух компонентов: базы знаний и объединенного компонента, состоящего из решателя и подсистемы объяснения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Осмоловский И.С., Зарубина Т.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODOLOGY FOR DEVELOPING MEDICAL EXPERT SYSTEMS USING GRAPH DATABASES AND ONTOLOGICAL APPROACH

Expert systems are a complex software system that accumulates the knowledge of specialists in specific subject areas and disseminates this empirical experience for consultations with less qualified users, which reduces the number of medical errors caused, in particular, by a lack of specialist doctors in local areas and the time required for a single consultation.Purpose of the study is to present a modern methodology for developing expert systems based on knowledge engineering using an ontological approach and graph databases.Materials and methods. System analysis methods were applied during the creation of the methodology for developing expert systems, including analytical and descriptive methods, knowledge engineering methods such as structuring methods, knowledge representation, and fuzzy logic. The methodology assumes the use of a graph database as a storage for the knowledge base.Results. The methodology describes the process of developing expert systems based on a graph database using an ontological approach. It includes the following components: a knowledge base, an intelligent editor of the knowledge base, a problem solver, and explanation subsystem. The methodology assumes the participation of a group of experts in the development of the expert system, with whom the development of two artifacts is carried out: a terminological database of the subject area and intermediate information objects describing the logic of solving the problem. Both artifacts should be formed automatically using the intelligent solver of the knowledge base, as well as filling the knowledge base, which will facilitate the subsequent maintenance of the knowledge base and keep it up-to- date. According to the methodology, the solver and explanation subsystem work with a graph database, which is a means of storing the knowledge base, in order to find the optimal path in which nodes are used to solve the problem of the expert system, for example, supporting a specialist doctor in establishing a preliminary/final diagnosis, and the path is used by the explanation subsystem to argue the proposed solution of the expert system.Findings. A methodology for creating expert systems using a graph database and an ontological approach has been developed and presented. The methodology describes the development of two components: a knowledge base and a combined component consisting of a solver and an explanation subsystem.

Текст научной работы на тему «МЕТОДИКА РАЗРАБОТКИ ЭКСПЕРТНЫХ СИСТЕМ С ИСПОЛЬЗОВАНИЕМ ГРАФОВОЙ СУБД И ОНТОЛОГИЧЕСКОГО ПОДХОДА»

оригинальная статья

DOI: 10.21045/1811-0185-2023-6-70-79 УДК: 614.2

МЕТОДИКА РАЗРАБОТКИ МЕДИЦИНСКИХ ЭКСПЕРТНЫХ СИСТЕМ С ИСПОЛЬЗОВАНИЕМ ГРАФОВОЙ СУБД И ОНТОЛОГИЧЕСКОГО ПОДХОДА

И.С. Осмоловский аТ.В. Зарубина ь

ь Кафедра медицинской кибернетики и информатики им. С.А. Гаспаряна медико-биологического факультета ФГАОУ ВО РНИМУ им. Н.И. Пирогова Минздрава России, г. Москва, Россия. а https://orcid.org/0000-0002-8974-8183; ь https://orcid.org/0000-0002-4403-8049.

И Автор для корреспонденции: Осмоловский И.С.

АННОТАЦИЯ

Экспертные системы являются сложными программными комплексами, аккумулирующими знания специалистов в конкретных предметных областях и тиражирующими этот эмпирический опыт для консультаций менее квалифицированных пользователей, что позволяет снизить количество врачебных ошибок, вызванных, в частности, недостатком врачей-специалистов на местах, и время, необходимое на одну консультацию.

Цель исследования. Создание и представление современной методики разработки экспертных систем на основе инженерии знаний с использованием онтологического подхода и графовых СУБД.

Материалы и методы. Применялись методы системного анализа, включая аналитический и описательный, методы инженерии знаний: структурирования, представления знаний и нечеткой логики. В качестве хранилища БЗ методика предполагает использование графовой СУБД.

Результаты. Методика описывает процесс разработки экспертных систем на основе графовой СУБД с использованием онтологического подхода. Методика включает в свой состав описание следующих компонентов: базы знаний, интеллектуального редактора базы знаний, решателя и подсистемы объяснений. Методика предполагает участие в разработке ЭС группы экспертов, совместно с которыми осуществляется разработка двух компонентов: терминологической базы предметной области и промежуточных информационных объектов, описывающих логику решения поставленной задачи. Оба компонента должны формироваться автоматизировано, посредством интеллектуального решателя базы знаний, как и наполнение базы знаний, что позволит облегчить последующее ее ведение и поддерживать актуальность. В соответствии с методикой решатель и подсистема объяснений работают с графовой СУБД, являющейся средством хранения базы знаний, с целью поиска оптимального пути, в котором узлы используются для решения задачи экспертной системы, например, поддержка врача-специалиста в части установки предварительного\заключительного диагноза, а путь используется подсистемой объяснения с целью аргументации предложенного экспертной системой решения.

Выводы. Разработана и представлена методика создания ЭС с использованием графовой СУБД и онтологического подхода. Методика описывает разработку двух компонентов: базы знаний и объединенного компонента, состоящего из решателя и подсистемы объяснения.

Ключевые слова: экспертная система, СППВР, база знаний, онтология, интеллектуальный редактор базы знаний.

Для цитирования: Осмоловский И.С., Зарубина Т.В. Методика разработки экспертных систем с использованием графовой

СУБД и онтологического подхода. Менеджер здравоохранения. 2023; 6:70-79. DOI: 10.21045/1811-0185-2023-6-70-79

Введение

Технологии на базе искусственного интеллекта становятся все более востребованными в современной медицине и здравоохранении, поскольку способствуют улучшению качества оказываемой помощи пациенту. Повышение качества помощи, среди прочего, достигается путем снижения числа врачебных ошибок. Так, в соответствии с работой Е.Ю. Лудуповой, 2016 [1], количество умерших пациентов из-за врачебных ошибок в Российской Федерации оценивается в 50 тысяч человек в год.

Дефицит медицинских работников в медицинских организациях относят к одной из причин врачебных ошибок. Так, согласно Постановлению Правительства Российской Федерации № 2161 от 19.11.2022 «О внесении изменений в государственную программу Российской Федерации «Развитие здравоохранения»», расчетный дефицит специалистов сферы здравоохранения в Российской Федерации на 2022 год составил 26,4 тыс. врачей и 58,2 тыс. средних медицинских работников. По данным доклада Всемирной организации здравоохранения (ВОЗ)

© Осмоловский И.С, Зарубина Т.В, 2023 г.

Менеджер

здравоохранения /

Мападег № Б

2с1гт\/оосЬгвпвп'1в 2023

«A Universal Truth: No health without a workforce», к 2035 году дефицит медицинских специалистов в мире достигнет 12,9 млн. специалистов [2].

К другой причине появления врачебных ошибок относят недостаток времени, отводимого врачу-специалисту на осмотр пациента. В соответствии с Приказом Министерства Здравоохранения Российской Федерации № 290н от 02.06.2015 «Об утверждении типовых отраслевых норм времени на выполнение работ, связанных с посещением одним пациентом врача-педиатра участкового, врача-терапевта участкового, врача общей практики (семейного врача), врача-невролога, врача-оториноларинголога, врача-офтальмолога и врача-акушера-гинеколога» были введены временные нормы на одно посещение пациента врача-специалиста, в том числе врача-терапевта участкового и врача-педиатра участкового - 15 минут для обоих. Нормы на повторное посещение определяются до 80% от исходного времени. Авторы статьи [3] отмечают, что среднее время, требуемое для врача-педиатра участкового на первичный прием 17,14±2,1 минут, на повторный - 13,42±1,8 минуты. В другой статье [4] авторы указывают, что врачу-терапевту участковому требуется 16,41±2,1 и 13,08±1,8 минуты.

Существующие технологические решения никогда не заменят врачей-специалистов, однако могут, путем сбора и анализа информации, оказать помощь в принятии врачом решения при обследовании пациента, диагностике, назначении лечения с целью снижения числа ошибок и повышения качества оказываемой медицинской помощи. Этому служат системы поддержки принятия врачебных решений (СППВР) [5].

На данный момент отсутствует общепринятая классификация СППВР. Различные авторы предлагают свои классификации, построенные на разных принципах. Наиболее общая классификация включает в себя системы, основанные на знаниях, и системы, основанные на машинном обучении [6, 7].

К СППВР, основанным на знаниях, относят экспертные системы (ЭС), представляющие собой сложные программные комплексы, аккумулирующие знания специалистов в конкретных предметных областях и тиражирующие этот эмпирический опыт для консультаций менее квалифицированных пользователей [7]. В условиях недостаточной укомплектованности медицинских организаций врачами-специалистами использование ЭС позволяет не только помочь непрофильным медицинским работникам

заподозрить диагноз, назначить рекомендуемые исследования и консультации, но и персонализировано подходить к диагностике и лечению пациента.

Главным компонентом ЭС является база знаний (БЗ). Для ее разработки обычно используются методы инженерии знаний - извлечение и структурирование знаний специалистов для последующей разработки интеллектуальных систем или систем управления знаниями [7]. Одним из методов структурирования предметной области является онтологический подход, где онтология представляет собой формальную спецификацию разделяемой концептуальной модели [7]. То есть онтология - это абстрактная модель предметной области, которая исчерпывающе описывает в явном виде систему понятий данной области, принятую определенным профессиональным сообществом и представленную в формализованном виде.

Существенное влияние на структуру БЗ оказывают программные средства, которые в дальнейшем выступают в качестве хранилища знаний, с которым взаимодействует решатель. В частности, таким средством могут быть графовые системы управления базами данных (СУБД). Несмотря на длительное существование графовой модели представления знаний, графовые СУБД впервые появились в 2007 году. Данный инструмент эффективно используется для хранения графовых моделей, коими являются семантические сети. В литературе распространен графовый подход к отображению БЗ, построенной на основе онтологического подхода, что подтверждает эффективность использования графовой СУБД в качестве инструмента хранения БЗ. Таких СУБД в настоящее время насчитывается более десятка, среди которых наиболее проработанными являются СУБД с открытым кодом Neo4j и ORIENT DB.

С учетом изложенного, целью данной работы является представление современной методики разработки экспертных систем на основе инженерии знаний с использованием онтологического подхода и графовых СУБД.

Материалы и методы

В ходе создания методики разработки экспертных систем применялись методы системного анализа, включая аналитический и описательный, методы инженерии знаний: структурирования, представления знаний и нечеткой логики. В качестве хранилища БЗ методика предполагает использование графовой СУБД.

С

#хс

№ В Manager

2023 Zdravoochranania

/Менеджер

здравоохранения

Результаты и обсуждение

В классическом представлении ЭС является многокомпонентной системой (рис. 1), включающей в свой состав следующие блоки [7]:

1. БЗ - формализованная совокупность знаний предметной области.

2. Решатель, представляющий собой программу, моделирующую рассуждение врача-специалиста на основании БЗ.

3. Подсистема объяснений - программа, интерпретирующая решения системы с целью их объяснения врачу-специалисту. Это позволяет понять логику, оценить качество и безопасность решений, предлагаемых ЭС для окончательного обоснованного выбора.

4. Интерфейс пользователя, который позволяет сформировать диалог между врачом-экспертом и ЭС.

5. Интеллектуальный редактор БЗ, представляющий собой программу, позволяющую инженеру по знаниям совместно с командой экспертов разрабатывать и поддерживать БЗ.

БЗ представляет собой главный компонент ЭС, который в связи со сложностью извлечения, структурирования и последующей формализации медицинских знаний определяет архитектуру всей ЭС. Трудоемкость работы с медицинскими знаниями обусловлена слабой структурированностью предметной области в целом. Различные клинические школы определяют схожие сущности по-разному. Существующие стандартные терминологические решения, включая Международную статистическую классификацию болезней и проблем, связанных со здоровьем, 10-ого пересмотра (МКБ-10), Федеральный справочник лабораторных исследований (ФСЛИ), Федеральный справочник инструментальных диагностических исследований (ФСИДИ),

Systematized Nomenclature of Medicine - Clinical Terms (SNOMED CT), Logical Observation Identifiers Names and Codes (LOINC) лишь отчасти решают имеющиеся проблемы.

При формировании ЭС, целью которой является помощь врачу-специалисту в постановке диагноза пациента или назначении ему персонализированного лечения, разработчики все больше отдают предпочтение использованию онтологического подхода [8-12]. Данный подход предполагает формирование терминологической базы предметной области, что в свою очередь снижает неопределенность собираемых знаний и облегчает их структурирование и формализацию. Наличие терминологической базы позволяет на ее основе разработать структуру БЗ, что обеспечивает возможность создания стандартного и масштабируемого решения. Использование онтологического подхода находит свое применение не только в рамках ЭС, но и в других интеллектуальных решениях, связанных с медициной [13,14].

Помимо формирования терминологической базы, для улучшения качества структурирования предметной области каждое понятие требуется типизировать. Типы понятий рекомендуется определять в соответствии с существующими клиническими терминами, что позволяет в дальнейшем инженерам по знаниям общаться с экспертами на одном языке. Однако на практике разработчики вынуждены работать с различными группирующими сущностями, которые в медицине разделены не полностью. В качестве примера можно выделить следующий набор: «Признак», «Синдром», «Симптомокомплекс», «Типовой патологический процесс», «Диагноз» и другие. Разница между ними в явном виде не описана, а различные клинические школы трактуют данные термины отличным друг от друга образом, что находит свое отражается в разрабатываемых ЭС:

f Эксперт \

V J

Рис. 1. Концептуальная схема ЭС

Менеджер

здравоохранения /

Manager № В

ZdrevoochreneniB 2023

• Например, в работах В.В. Грибовой и соавторов, 2018 [10] используются в качестве типов понятия «Заболевание», «Симптомокомплекс», «Синдром» и «Признак». При этом тип «Признак» условно разделяется на простые и составные, то есть понятия, которые включают в свой состав другие понятия. Отличие между типами «Синдром» и «Симптомокомплекс» и составным типом «Признак» авторы в явном виде не определяют. В соответствии со статьей [10], тип «Симптомоком-плекс» используется с целью связи понятий типа «Признак» с понятиями типа «Заболевание». Тип понятия «Синдром» связан только с понятиями типа «Признак» и не связан с понятиями типа «Заболевание» напрямую. Тип понятия «Признак» также не связан с понятиями типа «Заболевание».

• Другим примером являются работы [8, 9], в которых выделяется тип понятия «Диагноз», «Клинический признак» и «Диагностический признак». Понятия, которые являются агрегирующими сущностями («Синдром», «Симптомокомплекс» и прочие), в данных работах отсутствуют. В данных работах предполагается, что понятия «Клинический признак», «Диагностический признак» и их сочетания напрямую связаны с понятиями типа «Диагноз». Все синдромы и симптомокомплексы в полном объеме расписываются внутри таких связей.

• Нами в своих работах [12] используется следующий набор понятий: «Симптом», «Синдром» (как агрегирующий тип) и «Диагноз». Такой подход позволяет более гибко формализовать клинические сведения, необходимые для постановки диагноза, избежать использования схожих типов понятий и уменьшить объем БЗ.

Другим, не менее важным этапом, необходимым для формирования полноценной терминологической базы, является определение синонимичных групп понятий. Синонимичная группа понятий объединяет в своем составе эквивалентные по смыслу понятия, которые в дальнейшем могут быть использованы в качестве единицы построения связей между понятиями в БЗ. Техническая реализация синонимичных групп может отличаться, однако она должна обеспечить ее неограниченное расширение понятиями одного типа без логических изменений в БЗ.

На уровне терминологических баз также рекомендуется определять родовидовые отношения между синонимичными группами понятий [11, 12]. На данном уровне также рекомендуется объединять группы понятий одного типа, что позволит снизить противоречивость и неопределенность формализуемых знаний. Пример приведен на рис. 2.

На основе терминологической базы разработчики, совместно с врачами-специалистами, прорабатывают логику принятия решений. В результате

Рис. 2. Пример визуализации родовидовых и синонимичных связей в виде графа (понятия красного цвета - синонимичные понятия, понятие зеленого цвета - основные понятия)

С

#хс

их работы формируются промежуточные информационные объекты [11,12], которые понятны всем участникам процесса: разработчикам, в том числе инженерам по знаниям, и врачам-экспертам, консультирующим разработчиков и валидирующим их результаты. На уровне таких объектов определяется перечень понятий, которые врачи-специалисты действительно используют в своей практике для постановки диагноза. Замечено, что в ходе описания логики постановки диагнозов врачи-специалисты используют до 50-60 понятий. Могут использовать меньше, но не используют больше. Важно обратить внимание, что специалисты могут обобщать понятия. Такой подход позволяет уменьшить используемый для диагностики объем сущностей, но одновременно с этим снижает определенность.

На уровне промежуточных информационных объектов, определяющих логику диагностики заболевания, инженеры по знаниям внедряют элементы нечеткой логики. Нечеткая логика является эффективным инструментом для структурирования неопределенности и неточности предметной области [15]. Наиболее используемым инструментом является определение степеней уверенности группы экспертов в однозначности связей между элементами БЗ.

Не менее важным объектом для формирования БЗ и всей архитектуры ЭС в целом является определение структуры БЗ. Структура должна предусматривать единообразие в формализации извлеченных инженерами знаниях, что позволяет разрабатывать решатель и подсистему объяснений. Требуется обратить внимание, что в структуре БЗ нужно предусматривать явную связь между знанием и его источником информации. Это позволяет в дальнейшем использовать данные сведения для взаимодействия между инженером по знаниям и группой экспертов и для обоснования принятого системой решения.

В зависимости от структуры БЗ разработчики ЭС подбирают оптимальный метод представления БЗ. Например, в работах авторов [8, 9] используются семантические сети. Другим методом представления БЗ, построенной на онтологическом подходе, является фреймовый, который описан в работах В.В. Грибовой и соавт., 2018 [10]. Существуют работы, которые используют сочетания данных методов представления [11].

Помимо описанных в графовой модели элементов, еще одним важным элементом выступают атрибуты как понятий, так и их отношений. Атрибуты позволяют получить существенную информацию об объекте, влияющую на выбор решения ЭС.

Отдельно требуется обратить внимание, что масштабируемость ЭС может быть достигнута путем формирования одной интегральной базы, которая объединяет несколько БЗ по различным но-зологиям. Важной особенностью таких БЗ является их единая структура, которая позволяет использовать стандартные принципы построения решателя и подсистемы объяснения [16]. Существует ограниченный набор описанных структур, претендующих на исчерпывающее описание всей медицины, например SNOMED CT, The Unified Medical Language System (UMLS) или XML in Clinical Research and Healthcare Industries (OASIS). Однако на их основе отсутствуют решения, которые без дополнительной адаптации сведений, представленных в этих системах, смогли бы обеспечить разработку ЭС и интегрировать ее в лечебно-диагностический процесс.

Для разработки и ведения БЗ предпочтительно использовать интеллектуальный редактор базы знаний. Данный специализированный инструмент позволяет снизить количество ошибок, связанных с формализацией и последующей поддержкой БЗ [11]. Инструмент должен охватывать все аспекты деятельности инженера по знаниям.

Обычно инженер по знаниям начинает свою деятельность с погружения в медицинскую область. Для этой цели изучаются различные валидные текстологические источники информации, к которым относятся федеральные клинические рекомендации по нозологиям и существующие нормативно-правовые акты, связанные с предметной областью. Дополнительно инженер по знаниям может изучать методические рекомендации, статьи, монографии и другие литературные источники, которые могут быть предложены группой экспертов [7].

Рекомендуется уже на этом уровне организовать работу по формализации знаний через интеллектуальный редактор с целью извлечения знаний и фиксирования источника информации этих знаний. На данном этапе уже может быть сформирована предварительная версия терминологической базы, включая определение синонимичных групп и родовидовых связей между понятиями, и промежуточных информационных объектов для описания логики постановки диагноза пациента, медикаментозного лечения или любой другой поставленной цели [11, 12].

Интеллектуальный редактор БЗ должен поддерживать работу с текстологическими источниками знаний, обеспечивать извлечение значимых с точки зрения поставленной цели фрагментов текста и группировать их удобным для инженера по

Менеджер

здравоохранения /

Manager № 6

ZdrevoochrBnenÍB 2023

знаниям образом. Такой подход позволяет глубоко прорабатывать отдельные аспекты предметной области, сохранить однозначную связь каждой выделенной информации с первоисточником, к которому в дальнейшем инженер будет апеллировать, и ускорить погружение в работу новых специалистов. Данный инструмент будет востребован на этапе ведения БЗ в случае обновления текстологических источников. Примеров подобных интеллектуальных редакторов немного, например, РгоШдй с плагинами Оп^Т или DOG4DAG или OBO-Edit с плагином DOG4DAG [17, 18], однако их функционал не охватывает все аспекты деятельности инженера по знаниям.

На этапе формирования терминологической базы знаний инженер по знаниям должен обладать технической возможностью формирования синонимичных групп и родовидовых связей [11, 12]. После создания синонимичной группы синонимичные понятия инженером по знаниям при работе с экспертами не используются, поэтому целесообразно исключать их из последующих этапов работы. На этапе активного взаимодействия инженера по знаниям и группы экспертов возникает потребность не только фиксировать консолидированное мнение врачей экспертов, но и демонстрировать им промежуточный результат работы.

Интеллектуальный редактор БЗ должен иметь возможность формализовать структуру БЗ, которая в дальнейшем используется для проверки БЗ на соответствие структуре. В случае выявления отклонений интеллектуальный редактор должен информировать об этом инженера по знаниям. Такой инструмент, помимо технической валидации БЗ, позволяет масштабировать разработку ЭС, путем формирования нескольких независимых команд, разрабатывающих БЗ по различным нозологиям. Рекомендуется использовать ограничения на вносимые инженером изменения в БЗ в соответствии со структурой БЗ, что позволит существенно снизить количество ошибок, накапливающихся в БЗ. Дополнительно такой инструмент способен обратить внимание инженера на фрагменты БЗ, которые требуют коррекции в случае изменения исходной структуры БЗ.

Завершается разработка БЗ ее валидацией группой экспертов. Поскольку БЗ обычно представляет собой крупный объект, то существует несколько вариантов такой валидации:

1. Валидация промежуточных информационных объектов, отражающих логику БЗ. Обычно представлены объектами, с которыми у экспертов

имеется опыт работы. Такие объекты могут быть изучены и валидированы специалистами.

2. Валидация собственно БЗ. Такой подход может быть использован, когда объем БЗ сравнительно небольшой. Однако если БЗ содержит в своем составе десятки тысяч связей и больше, то полноценная валидация врачами экспертами такого объекта невозможна.

3. Валидация БЗ на основе эмулированного рабочего места врача-специалиста. Такой инструмент воспроизводит условия работы врача и позволяет апробировать работу системы на основании опыта врача-специалиста. Апробация требует разработанного решателя и интерфейса, что не всегда доступно на этапе разработки ЭС, однако может быть применимо на этапе расширения БЗ в рамках существующей ЭС.

Разработка правил решателя ведется на основе структуры БЗ для реализации поставленной цели и начинается с создания функциональных требований к программному компоненту ЭС. Первоначально требуется определить способ получения сведений о пациенте. В зависимости от поставленной задачи сведения могут быть получены напрямую из электронных медицинских карт или структурированных электронных медицинских документов, могут вноситься врачом-специалистом посредством интерфейса программного средства или иным способом.

Далее требуется определиться, в каком виде сведения собираются. Так, сведения могут собираться в структурированном или неструктурированном виде. В случае получения неструктурированных сведений требуется прорабатывать вопрос их конвертации в структурированный вид. Для этих целей могут быть использованы специализированные программные средства, в том числе системы обработки естественного языка [19, 20].

После получения структурированных сведений о пациенте они могут быть использованы в качестве входных данных для решателя. В зависимости от задачи решатель, который разрабатывается для работы с графовыми СУБД, ищет кратчайший путь от стартовых точек БЗ к конечным. Движение решателя по БЗ осуществляется с помощью различных связей, удовлетворяющих условиям перехода. По окончанию перемещения решателя формируется путь, конечной точкой которого является решение ЭС, рекомендуемое врачу-специалисту. Сам путь используется подсистемой объяснения для обоснования принятого системой решения. Пример работы решателя представлен на рис. 3.

С

#хс

№ 6 Мападег

2023 2с1гв^/оос1-1гвпеп1а

/Менеджер

здравоохранения

Рис. 3. пример построенного решателем пути с целью определения предварительного диагноза и методов дополнительной диагностики

Таким образом, нами была разработана и представлена методика разработки ЭС, построенная с использованием графовой СУБД и онтологического подхода.

Выводы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Разработана методика создания ЭС с использованием графовой СУБД и онтологического

подхода. Методика описывает разработку двух компонентов: базы знаний и объединенного компонента, состоящего из решателя и подсистемы объяснения. Используемый онтологический подход предполагает формирование терминологической базы и промежуточных информационных объектов, описывающих логику решения поставленной задачи. Схема подхода приведена на рис. 4.

Рис. 4. концептуальная схема предлагаемого подхода к разработке Эс

Менеджер

здравоохранения /

Мапедег № 6

2с1гт\/оосЬгвпвп'1в 2023

СПИСОК ИСТОЧНИКОВ

1. Лудупова Е.Ю. Врачебные Ошибки. Литературный Обзор. // Вестник Росздравнадзора. 2016 г.; 2:6-15.

2. A Universal Truth: No Health Without a Workforce. - 2006. - С. 1-8.

3. Люцко В.В., Сон И.М, Иванова М.А., Перхов И.В., Зимина Э.В., Данишевский К.Д. Затраты рабочего времени врачей-педиатров участковых при посещении одним пациентом. // Современные проблемы здравоохранения и медицинской статистики. 2019 г.;1:210-22.

4. Люцко В.В., Сон И.М, Иванова М.А., Дежурный Л.И., Кудрина В.Г. Затраты рабочего времени врачей-терапевтов участковых при посещении одним пациентом. // Терапевтический архив.

2019 г.;1:19-23.

5. Реброва О.Ю. Жизненный цикл систем поддержки принятия врачебных решений как медицинских технологий. // Врач и информационные технологии. 2020 г.;(1):27—37.

6. Berner E.S. Clinical Decision Support Systems Theory and Practice. New York: Springer Science + Business Media. New York: Springer Science + Business Media; 2007. - 313 с.

7. Гаврилова Т.А, Кудрявцев Д.В, Муромцев Д.И. Инженерия знаний. Модели и методы. СПб.: Издательство «Лань»; 2016. - 324 с.

8. Будыкина А.В., Киселев К.В., Раузина С.Е., Зарубина Т.В., Федоров Е.Д., Юдин О.И. и др. Онтология диагностики и лечения желудочно-кишечных кровотечений с неустановленным источником. Знания-Онтологии-Теории (ЗОНТ-2019). 2019. - C. 88-93.

9. Киселев К.В., Ноева Е.А., Выборов О.Н., Зорин А.В., Потехина А.В., Осяева М.К. и др. Разработка архитектуры базы знаний системы поддержки принятия врачебных решений, основанной на графовой базе данных. // Медицинские технологии Оценка и выбор. 2018 г.;33(3):42-48.

10. Грибова В.В., Петряева М.В., Окунь Д.Б., Шалфеева Е.А. Онтология медицинской диагностики для интеллектуальных систем поддержки принятия решений. // Ontology of Designing.

2018 г.;1(8):58-73.

11. Kadim F.B., Othman Z.I. AsthmaONTO: An Ontology System for Diagnosing asthma disease. // Journal of Al-Qadisiyah for Computer Science and Mathematics. 2022 г.;14(2):81-90.

12. Осмоловский И.С., Зарубина Т.В., Шостак Н.А., Кондрашов А.А., Клименко А.А. Разработка номенклатуры понятий и логических схем по амбулаторному ведению пациентов с подагрой. // Вестник РГМУ. 2021 г.;2:55-62.

13. Naithani S, Dikeman D, Garg P., AI-Bader N, Jaiswal P. Beyond gene ontology (GO): Using biocuration approach to improve the gene nomenclature and functional annotation of rice S-domain kinase subfamily. // PeerJ. 2021 г.;9.

14. Castellano-Escuder P., González-Domínguez R, Wishart D.S., Andrés-Lacueva С., Sánchez-Pla A. FOBI: An ontology to represent food intake data and associate it with metabolomic data. // Database.

2020 г.;2020:1-8.

15. Uzun Ozsahin D, Uzun B, Ozsahin I., Mustapha M.T., Musa M.S. Fuzzy logic in medicine. Biomedical Signal Processing and Artificial Intelligence in Healthcare. // Academic Press; 2020. С. 153-182.

16. Демушкина К.М., Демушкин М.О., Кузьмин А.В. Обзор методов проектирования систем поддержки принятия врачебных решений. Models, systems, networks in economics, technology, nature and society. 2022 г.;2(42):75-89.

17. Wächter T, Fabian G, Schroeder M. DOG4DAG: semi-automated ontology generation in OBO-Edit and Protégé. Proceedings of the 4th International Workshop on Semantic Web Applications and Tools for the Life Sciences - SWAT4LS '11. 2011 г.;119-20.

18. Buitelaar P., Sintek M. OntoLT Version 1.0: Middleware for Ontology Extraction from Text. В: Proc of the Demo Session at the International Semantic Web Conference. 2004. - С. 1-4.

19. Osborne J.D., Booth J.S., O'Leary Т., Mudano A, Rosas G, Foster P.J. и др. Identification of Gout Flares in Chief Complaint Text Using Natural Language Processing. AMIA Annual Symposium Proceedings - American Medical Informatics Association. 2020 г.;(2020):973-82.

20. Polpinij J Ontology-based knowledge discovery from unstructured and semi-structured text. // University of Wollongong. - 2014. - 223 с.

№ B Manager

2023 Zdravoochranania

/Менеджер

здравоохранения

ORIGINAL PAPER

METHODOLOGY FOR DEVELOPING MEDICAL EXPERT SYSTEMS USING GRAPH DATABASES AND ONTOLOGICAL APPROACH

I.S. Osmolovsky - T.V. Zarubina b

a b department chair of medical cybernetics and informatics named after S.A. Gasparyan Pirogov Russian National Research Medical University, Moscow, Russia. a https://orcid.org/0000-0002-8974-8183; b https://orcid.org/0000-0002-4403-8049

H Corresponding author: Osmolovsky I.S.

ABSTRACT

Expert systems are a complex software system that accumulates the knowledge of specialists in specific subject areas and disseminates this empirical experience for consultations with less qualified users, which reduces the number of medical errors caused, in particular, by a lack of specialist doctors in local areas and the time required for a single consultation.

Purpose of the study is to present a modern methodology for developing expert systems based on knowledge engineering using an ontological approach and graph databases.

Materials and methods. System analysis methods were applied during the creation of the methodology for developing expert systems, including analytical and descriptive methods, knowledge engineering methods such as structuring methods, knowledge representation, and fuzzy logic. The methodology assumes the use of a graph database as a storage for the knowledge base.

Results. The methodology describes the process of developing expert systems based on a graph database using an ontological approach. It includes the following components: a knowledge base, an intelligent editor of the knowledge base, a problem solver, and explanation subsystem. The methodology assumes the participation of a group of experts in the development of the expert system, with whom the development of two artifacts is carried out: a terminological database of the subject area and intermediate information objects describing the logic of solving the problem. Both artifacts should be formed automatically using the intelligent solver of the knowledge base, as well as filling the knowledge base, which will facilitate the subsequent maintenance of the knowledge base and keep it up-to-date. According to the methodology, the solver and explanation subsystem work with a graph database, which is a means of storing the knowledge base, in order to find the optimal path in which nodes are used to solve the problem of the expert system, for example, supporting a specialist doctor in establishing a preliminary/final diagnosis, and the path is used by the explanation subsystem to argue the proposed solution of the expert system.

Findings. A methodology for creating expert systems using a graph database and an ontological approach has been developed and presented. The methodology describes the development of two components: a knowledge base and a combined component consisting of a solver and an explanation subsystem.

Keywords: expert system, CDSS, knowledge base, ontology, intelligent knowledge base editor.

For citation: Osmolovsky I.S., Zarubina T. V. Methodology for developing medical expert systems using graph databases and ontological approach. Manager Zdravookhranenia. 2023; 6:70-79. DOI: 10.21045/1811-0185-2023-6-70-79

REFERENCES

1. Ludupova E.Y. Medical errors. Literature review. // Vestnik Roszdravnadzora. 2016;2:6-15.

2. A Universal Truth: No Health Without a Workforce. - 2006. - P. 1-8.

3. Liutsko V.V, Son I.M., Ivanova M.A., Perchov V.I., Zimina E.V, Danishevsky K.D. Working time costs of doctors-therapists of divisionals on a patient. // Current problems of health care and medical statistics. 2019;1:210-222.

4. Liutsko V.V, Son I.M., Ivanova M.A., Dezhurny L.I, Kudrina V.G. Working time costs of doctors-therapists of divisionals on a patient. // Therapeutic Archive. 2019;1:19-23.

5. Rebrova O.Yu. Life cycle of decision support systems as medical technologies. // Information technologies for the Physician. 2020;(1):27-37.

6. Berner E.S. Clinical Decision Support Systems Theory and Practice. New York: Springer Science + Business Media. New York: Springer Science + Business Media; 2007. - 313 p.

7. Gavrilova T.A., Kudryavtsev D. V, Muromtsev D. I., Knowledge engineering. Models and methods, St. Petersburg: Lan', 2016, 324 p. (In Russ.).

8. Budykina A.V., Kiselev K.V., Rauzina S.E., Zarubina T.V., Fedorov E.D., Yudin O.I. et al. Ontology of diagnosis and treatment of gastrointestinal bleeding with an unidentified source. Znaniya-Ontologii-Teoril (ZONT-2019). 2019. - P. 88-93. (In Russ).

9. Kiselev K.V., Noeva E.A., Vyborov O.N., Zorin A.V., Potekhina A.V., Osyaeva M.K. et al. Development of knowledge base architecture for clinical decision support system based on graph database. // Medical Technologies. Assessment and Choice. 2018;33(3):42-48.

10. Gribova V.V, Petryaeva M.V., Okun D.B., Shalfeeva E.A. Medical diagnosis ontology for intelligent decision support systems. // Ontology of Designing. 2018;1(8):58-73.

11. Kadim F.B., Othman Z.I. AsthmaONTO: An Ontology System for Diagnosing asthma disease. // Journal of Al-Qadisiyah for Computer Science and Mathematics. 2022;14(2):81-90.

Менеджер

здравоохранения /

Maneger № 6

ZdrevoochreneniB 2023

12. Osmolovsky I.S., Zarubina T.V, Shostak N.A., Kondrashov A.A. Klimenko A.A. Development of medical nomenclature and algorithms for diagnosis and treatment of gout in outpatient settings. // Bulletin of Russian State Medical University. 2021;2:55-62.

13. Naithani S, Dikeman D, Garg P., Al-Bader N, Jaiswal P. Beyond gene ontology (GO): Using biocuration approach to improve the gene nomenclature and functional annotation of rice S-domain kinase subfamily. // PeerJ. 2021;9.

14. Castellano-Escuder P., González-Domínguez R, Wishart D.S., Andrés-Lacueva C, Sánchez-Pla A. FOBI: An ontology to represent food intake data and associate it with metabolomic data. // Database. 2020;2020:1-8.

15. Uzun Ozsahin D, Uzun B, Ozsahin I., Mustapha M.T., Musa M.S. Fuzzy logic in medicine. Biomedical Signal Processing and Artificial Intelligence in Healthcare. Academic Press; 2020. - P. 153-182.

16. Demushkina K.M., Demushkin M.O., Kuzmin A.V. Review of methods for designing clinical decision support systems. Models, systems, networks in economics, technology, nature and society. 2022;2(42):75-89.

17. Wächter T, Fabian G, Schroeder M. DOG4DAG: semi-automated ontology generation in OBO-Edit and Protiégié. Proceedings of the 4th International Workshop on Semantic Web Applications and Tools for the Life Sciences - SWAT4LS '11. 2011;119-20.

18. Buitelaar P., Sintek M. OntoLT Version 1.0: Middleware for Ontology Extraction from Text. B: Proc of the Demo Session at the International Semantic Web Conference. - 2004. - P. 1-4.

19. Osborne J.D., Booth J.S., O'Leary T, Mudano A., Rosas G, Foster P.J. et al. Identification of Gout Flares in Chief Complaint Text Using Natural Language Processing. AMIA Annual Symposium Proceedings - American Medical Informatics Association. 2020;(2020):973-82.

20. Polpinij J. Ontology-based knowledge discovery from unstructured and semi-structured text. University of Wollongong. - 2014. - 223 p.

ИНФОРМАЦИЯ ОБ АВТОРАХ / ABOUT THE AUTHORS

Осмоловский Иван Сергеевич — аспирант кафедры медицинской кибернетики и информатики им. С.А. Гаспаряна медико-биологического факультета ФГАОУ ВО РНИМУ им. Н.И. Пирогова Минздрава России, г. Москва, Россия.

Ivan S. Osmolovsky — Ph. D. student of the Department of medical Cybernetics and Informatics named after S.A. Gasparyan of the Pirogov Russian National Research Medical University (Pirogov Medical University), Moscow, Russia. E-mail: Osmolovsky_Ivan@bk.ru

Зарубина Татьяна Васильевна — д-р мед. наук, профессор, член-корр. РАН, заведующий кафедрой медицинской кибернетики

и информатики им. С.А. Гаспаряна ФГАОУ ВО РНИМУ им. Н.И. Пирогова Минздрава России, Moscow, Russia.

Tatiana V. Zarubina — DMS, Professor, corresponding member of the Russian Academy of Sciences, department chair of medical

cybernetics and informatics named after S.A. Gasparyan Pirogov Russian National Research Medical University (Pirogov Medical

University), Moscow, Russia.

E-mail: tv.zarubina.57@gmaii.com

3дравоохранение-2023

ФАЦ РАСКРЫЛ САМЫЕ ЧАСТЫЕ ПРИЧИНЫ НЕДОПУСКА К АККРЕДИТАЦИИ МЕД- И ФАРМСПЕЦИАЛИСТОВ

Самой частой причиной недопуска врачей к аккредитации в 2023 году был неполный комплект документов. На втором месте по частоте отказов - подача пакета документов почтовым отправлением, если сведения об аккредитуемом имеются в Федеральном регистре медицинских работников (ФРМР).

Источник: Медвестник.ру

№ B Manager /Менеджер

2023 ZdrevoochrBnenie / здравоохранения

i Надоели баннеры? Вы всегда можете отключить рекламу.