Научная статья на тему 'РАЗРАБОТКА СТРУКТУРЫ БАЗЫ ЗНАНИЙ В ОБЛАСТИ ДИАГНОСТИКИ ПОДАГРЫ'

РАЗРАБОТКА СТРУКТУРЫ БАЗЫ ЗНАНИЙ В ОБЛАСТИ ДИАГНОСТИКИ ПОДАГРЫ Текст научной статьи по специальности «Науки о здоровье»

CC BY
60
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОНТОЛОГИЯ / БАЗА ЗНАНИЙ / СЕМАНТИЧЕСКАЯ СЕТЬ / ФРЕЙМ / ЭКСПЕРТНАЯ СИСТЕМА / СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ / ПОДАГРА / РЕВМАТОЛОГИЯ

Аннотация научной статьи по наукам о здоровье, автор научной работы — Осмоловский И.С., Зарубина Т.В., Шостак Н.А., Клименко А.А., Кондрашов А.А.

Подагра относится к группе микрокристаллических артритов и представляет собой системное тофусное заболевание, проявляющееся воспалением различных тканей в результате накопления кристаллов моноурата натрия. Верификация диагноза подагры с момента появления первых симптомов в среднем по России составляет от 4 до 8 лет. Этого времени достаточно для развития различных осложнений (например, подагрической нефропатии) и инвалидизации пациента, в связи с чем возникает потребность пересмотра существующей стратегии диагностики заболевания. К одному из вариантов улучшения оказываемой медицинской помощи можно отнести создание системы поддержки принятия врачебных решений (СППВР), которая построена на знаниях экспертов, формализованных в виде базы знаний. Цель: разработка структуры базы знаний для СППВР в области диагностики подагры. Материал и методы. В качестве материала использовалась клиническая информация по диагностике подагры, представленная в виде номенклатуры медицинских понятий и логических схем, которые были собраны на основе федеральных клинических рекомендаций, различных источников литературы и экспертных знаний. В качестве метода структурирования знаний применялся онтологический метод, в качестве методов представления - совместное использование семантической сети и фреймов. Результаты. При разработке структуры базы знаний использовалось сочетание двух методов представления знаний: семантическая сеть и фреймы, в части структурирования знаний онтологический подход. Структура построена на основе собранных совместно с экспертами клинических знаний в части диагностики подагры. Основная особенность разработанной нами структуры базы знаний по сравнению с похожими работами в части диагностики заболеваний с применением методов инженерии знаний заключается в использовании отдельного типа понятия «Синдром», выступающего в качестве принятого в медицине агрегатора, существенно снижающего объем базы знаний для заболеваний. Заключение. Разработана структура базы знаний, в рамках которой использовано 7 типов понятий и 11 типов связей. В структуре применялся онтологический подход и сочетание двух моделей представления знаний: семантической сети и фреймовой модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о здоровье , автор научной работы — Осмоловский И.С., Зарубина Т.В., Шостак Н.А., Клименко А.А., Кондрашов А.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF KNOWLEDGE BASE STRUCTURE FOR GOUT DIAGNOSIS

Gout belongs to the group of microcrystalline arthritides and is a systemic tophus manifested by inflammation of various tissues caused by deposition of monosodium urate crystals. Verification of gout diagnosis in Russia takes on average four to eight years from the beginning of the disease. This period is sufficient for the development of various complications (for example, gouty nephropathy) and disability of patient, and, therefore, it is necessary to revise the existing strategy for the diagnosis of this disease. One of the options for improving the provision of medical care can be attributed to the creation of a clinical decision support system (CDSS), which is based on the knowledge of experts, formalized as a knowledge base (KB).Aim. To develop a KB structure for CDSS for gout diagnosis. Material and Methods. Clinical information for gout diagnosis, presented as a nomenclature of medical concepts and logical schemes, which were collected on the basis of federal clinical recommendations, various literature sources and expert knowledge were used as materials. The ontological method was used as a method of knowledge structuring. Combined semantic network and frames were used as the methods of representation. Results. While developing KB structure, a combination of two methods of knowledge representation including semantic network and frames was used. An ontological approach was used in terms of knowledge structuring. The structure was built on the clinical knowledge collected in cooperation with experts in gout diagnosis. Compared with similar developments of diagnosing diseases based on knowledge engineering methods, the main feature of developed KB structure was the use of a separate type “Syndrome” concept as an aggregator accepted in medicine, significantly reducing the volume of KB for diseases. Conclusion. The KB structure was developed comprising the use of seven types of concepts and 11 types of relationships. The structure involved the use of ontological approach and combination of two models of knowledge representation, namely: a semantic network and a frame model.

Текст научной работы на тему «РАЗРАБОТКА СТРУКТУРЫ БАЗЫ ЗНАНИЙ В ОБЛАСТИ ДИАГНОСТИКИ ПОДАГРЫ»



ОРГАНИЗАЦИЯ ЗДРАВООХРАНЕНИЯ И ОБЩЕСТВЕННОЕ ЗДОРОВЬЕ / SOCIAL MEDICINE AND PUBLIC HEALTH ORGANIZING

https://doi.org/10.29001/2073-8552-2022-37-3-149-158 УДК: 616-002.78-07

Разработка структуры базы знаний в области диагностики подагры

И.С. Осмоловский, Т.В. Зарубина, Н.А. Шостак, А.А. Клименко, А.А. Кондрашов, М.С. Осмоловская

Российский национальный исследовательский медицинский университет имени Н.И. Пирогова Министерства

здравоохранения Российской Федерации,

117321, Российская Федерация, Москва, ул. Островитянова, 1

Аннотация

Подагра относится к группе микрокристаллических артритов и представляет собой системное тофусное заболевание, проявляющееся воспалением различных тканей в результате накопления кристаллов моноурата натрия. Верификация диагноза подагры с момента появления первых симптомов в среднем по России составляет от 4 до 8 лет. Этого времени достаточно для развития различных осложнений (например, подагрической нефропатии) и инвалидизации пациента, в связи с чем возникает потребность пересмотра существующей стратегии диагностики заболевания. К одному из вариантов улучшения оказываемой медицинской помощи можно отнести создание системы поддержки принятия врачебных решений (СППВР), которая построена на знаниях экспертов, формализованных в виде базы знаний. Цель: разработка структуры базы знаний для СППВР в области диагностики подагры.

Материал и методы. В качестве материала использовалась клиническая информация по диагностике подагры, представленная в виде номенклатуры медицинских понятий и логических схем, которые были собраны на основе федеральных клинических рекомендаций, различных источников литературы и экспертных знаний. В качестве метода структурирования знаний применялся онтологический метод, в качестве методов представления - совместное использование семантической сети и фреймов.

Результаты. При разработке структуры базы знаний использовалось сочетание двух методов представления знаний: семантическая сеть и фреймы, в части структурирования знаний онтологический подход. Структура построена на основе собранных совместно с экспертами клинических знаний в части диагностики подагры. Основная особенность разработанной нами структуры базы знаний по сравнению с похожими работами в части диагностики заболеваний с применением методов инженерии знаний заключается в использовании отдельного типа понятия «Синдром», выступающего в качестве принятого в медицине агрегатора, существенно снижающего объем базы знаний для заболеваний.

Заключение. Разработана структура базы знаний, в рамках которой использовано 7 типов понятий и 11 типов связей. В структуре применялся онтологический подход и сочетание двух моделей представления знаний: семантической сети и фреймовой модели.

Ключевые слова: онтология, база знаний, семантическая сеть, фрейм, экспертная система, система поддержки принятия врачебных решений, подагра, ревматология.

Конфликт интересов: авторы заявляют об отсутствии конфликта интересов.

Прозрачность финансовой деятельности: никто из авторов не имеет финансовой заинтересованности в предоставленных материалах или методах.

Для цитирования: Осмоловский И.С.,Зарубина Т.В., Шостак Н.А., Клименко А.А., Кондрашов А.А., Осмоловская М.С. Разработка структуры базы знаний в области диагностики подагры. Сибирский журнал клинической и экспериментальной медицины. 2022;37(3):149-158. https://doi. org/10.29001/2073-8552-2022-37-3-149-158.

Н Осмоловский Иван Сергеевич, e-mail: Osmolovsky_Ivan@bk.ru.

Development of knowledge base structure for gout diagnosis

Ivan S. Osmolovsky, Tatiana V. Zarubina, Nadezhda A. Shostak, Alesya A. Klimenko, Artem A. Kondrashov, Maria S. Osmolovskaya

Pirogov Russian National Research Medical University, 1, Ostrovityanova str., Moscow, 117997, Russian Federation

Abstract

Gout belongs to the group of microcrystalline arthritides and is a systemic tophus manifested by inflammation of various tissues caused by deposition of monosodium urate crystals. Verification of gout diagnosis in Russia takes on average four to eight years from the beginning of the disease. This period is sufficient for the development of various complications (for example, gouty nephropathy) and disability of patient, and, therefore, it is necessary to revise the existing strategy for the diagnosis of this disease. One of the options for improving the provision of medical care can be attributed to the creation of a clinical decision support system (CDSS), which is based on the knowledge of experts, formalized as a knowledge base (KB). Aim. To develop a KB structure for CDSS for gout diagnosis.

Material and Methods. Clinical information for gout diagnosis, presented as a nomenclature of medical concepts and logical schemes, which were collected on the basis of federal clinical recommendations, various literature sources and expert knowledge were used as materials. The ontological method was used as a method of knowledge structuring. Combined semantic network and frames were used as the methods of representation.

Results. While developing KB structure, a combination of two methods of knowledge representation including semantic network and frames was used. An ontological approach was used in terms of knowledge structuring. The structure was built on the clinical knowledge collected in cooperation with experts in gout diagnosis. Compared with similar developments of diagnosing diseases based on knowledge engineering methods, the main feature of developed KB structure was the use of a separate type "Syndrome" concept as an aggregator accepted in medicine, significantly reducing the volume of KB for diseases.

Conclusion. The KB structure was developed comprising the use of seven types of concepts and 11 types of relationships. The structure involved the use of ontological approach and combination of two models of knowledge representation, namely: a semantic network and a frame model.

Keywords: ontology, knowledge base, semantic network, frame, expert system, CDSS, gout, rheumatology.

Conflict of interest: the authors do not declare a conflict of interest.

Financial disclosure: no author has a financial or property interest in any material or method mentioned.

For citation: Osmolovsky I.S., Zarubina T.V., Shostak N.A., Klimenko A.A., Kondrashov A.A., Osmolovskaya M.S. Development of knowledge base structure for gout diagnosis. The Siberian Journal of Clinical and Experimental Medicine. 2022;37(3):149-158. https://doi.org/10.29001/2073-8552-2022-37-3-149-158.

Введение

Подагра является системным заболеванием пури-нового обмена, сопровождающимся отложением кристаллов моноурата натрия и приводящим к воспалению различных тканей организма [1-3]. В долгосрочной перспективе подагра приводит к развитию осложнений и ин-валидизации пациента вследствие рецидивирующих приступов острого артрита, формированию подагрических тофусов и отложению кристаллов моноурата натрия. Подагра является неизлечимым заболеванием, но в случае быстрой и адекватной диагностики и правильной тактики лечения появляется возможность не только снизить риск возникновения рецидивов, но и полностью предотвратить их появление [1, 3].

На текущий момент среднее время с момента появления первых симптомов до установления диагноза со-

ставляет 4,6 года [4]. Этого времени достаточно, чтобы у пациента начали развиваться необратимые изменения в суставах и внесуставные осложнения, затрудняющие последующее лечение заболевания. Причины столь длительной диагностики различны: в частности, наблюдается явная нехватка специалистов (в соответствии с приказом Минздравсоцразвития от 15.05.2012 г. № 543н «Об утверждении Положения об организации оказания первичной медико-санитарной помощи взрослому населению», медицинским организациям рекомендуется иметь одного врача-ревматолога на 30000 человек прикрепленного населения, что в реальности, согласно ряду исследований, не выполняется) [5, 6].

Другим важным вопросом является сложность диагностики заболевания, поскольку принятый золотой стандарт - поляризационная микроскопия [1, 3] - не является распространенным методом в Российской Федерации [4],

что приводит к тому, что врачи-специалисты вынуждены устанавливать диагноз на основе менее точных методов, что часто бывает причиной возникновения врачебных ошибок [7].

В настоящее время среди публикаций, посвященных клинической практике, имеется все больше статей, направленных на минимизацию числа врачебных ошибок [8], в том числе посредством систем поддержки принятия врачебных решений (СППВР) [9], в частности, СППВР, основанных на знаниях [10-12].

Разработка базы знаний включает в себя ряд важных этапов: извлечение, структуризацию и формализацию экспертных знаний и знаний, полученных в ходе изучения литературных источников, рассматривающихся в рамках отдельного научного направления - инженерии знаний. Она изучает различные модели представления знаний, одной из разновидностей которой является семантическая сеть, которую принято определять как ориентированный граф, узлы которого представляют понятия предметной области, связи - отношения между понятиями [10]. Основными достоинствами семантической сети являются ее универсальность и простота восприятия информации. К недостаткам модели относят представление всех узлов на одном уровне, что значительно затрудняет понимание крупных семантических сетей. Другим примером представления знаний является фрейм, который позволяет создать набор типовых структур и определить правила их наполнения [10, 13]. Однако фреймы тяжело использовать для представления понятий одного уровня и связей между ними.

Помимо представления знаний специалисты в области инженерии знаний сталкиваются с проблемами неоднозначности используемой информации (модульность, противоречивость, неполнота знаний и другие), формированием единой системы хранения и использования знаний, достижения интероперабельности разрабатываемых баз знаний [10, 14]. Использование онтологического подхода направлено на решение этих проблем. Описание общепринятой системы понятий предметной области является сложной задачей, которая требует формирования исчерпывающего словаря предметной области, главной особенностью которого должна стать однозначная трактовка каждого из понятий. Таким словарем в рамках данной работы стала разработанная нами номенклатура медицинских понятий в области диагностики подагры [15].

Цель настоящего исследования: разработка базы знаний в области диагностики подагры, которая позволит в дальнейшем формализовать накопленную медицинскую информацию и использовать ее в системе поддержки принятия врачебных решений.

Материал и методы

В качестве материалов для данной работы использовались разработанные ранее информационные объекты, в частности, номенклатура медицинских понятий и логическая схема по подагре в области диагностики [15], создание которых осуществлялось при поддержке высококвалифицированных специалистов кафедры факультетской терапии им. акад. А.И. Нестерова лечебного факультета Российского национального медицинского исследовательского университета им. Н.И. Пирогова.

Номенклатура медицинских понятий включает в свой состав более 500 типизированных понятий, которые, с одной стороны, содержат в полном объеме термины, необ-

ходимые для диагностики пациента, с другой - включают в свой состав синонимичные понятия, перечень которых может быть неограниченно расширен без существенного изменения логики.

Логические структуры представлены в виде 40 схем, содержащих описание правил постановки диагноза на основе минимально допустимого набора понятий, ограниченных обобщенными сущностями и конкретными понятиями, которые невозможно уложить в рамках обобщенных сущностей. Например, для постановки диагноза подагры может быть использовано более 60 понятий, связанных с воспалением различных суставов. Для некоторых случаев (например, «Воспаление плюснефалан-гового сустава I пальца стопы») описана логика установки диагноза, однако для остальных понятий подобная логика отсутствует в явном виде. Поскольку, по мнению экспертов, связанные с этими суставами понятия принципиально не отличаются по логике использования в ходе диагностики заболевания, то они были обобщены с помощью понятия «Воспаление периферического сустава» и не были включены в логическую структуру, в то время как понятие «Воспаление I плюснефалангового сустава» имеет уникальную логику для диагностики подагры, представленную в явном виде, и требует отдельного формализованного описания.

В ходе работы использовались методы инженерии знаний (методы структурирования и представления знаний) и методы системного анализа (методы декомпозиции, анализа и синтеза), которые применялись для выбора наиболее подходящей модели представления и структуризации знаний, необходимой для последующей формализации предметной области, выделения и описания компонентов будущей структуры базы знаний, которые позволят перенести необходимые текстологические и экспертные знания в рамках диагностики заболевания в базу знаний.

Результаты

Разработка базы знаний представляет собой многостадийный процесс. Ранее осуществлялось изучение предметной области с формированием номенклатуры медицинских понятий и логической структуры, то есть набора правил, необходимых для установки диагноза [15]. Эта информация используется для постановки задачи [11] при создании СППВР Таким образом, СППВР должна оказывать помощь врачу-специалисту в части определения предварительного диагноза, выбора с последующим назначением методов исследований и консультаций, постановки окончательного диагноза.

В рамках работы решалась задача определения структуры базы знаний, которая должна позволить учесть особенности диагностики подагры. Диагностика, с одной стороны, включает в себя оперирование большой терминологической базой, необходимой для описания всех актуальных симптомов и синдромов. Например, для формализации синдрома воспаления требуется использовать не менее 62-64 понятий, описывающих воспаление конкретных периферических суставов, которые могут быть поражены у пациента с подагрой. С другой стороны, диагностика описывается большим количеством комбинаций между симптомами и синдромами, позволяющими установить заболевание и учитывать коморбидные заболевания, в частности, подагрическую нефропатию, метаболические заболевания и прочее.

Выбор модели представления знаний, позволяющей учесть особенности проявлений подагры, определяющей возможности наполнения базы знаний, ее валидации экспертами и последующего ее ведения, являлся важным шагом. В качестве модели было принято решение об использовании семантической сети, каждый узел и связь которой представляют собой отдельный фрейм с собственным набором атрибутов (табл. 1).

Совместное использование семантической сети и фреймового подхода позволяет, с одной стороны, не создавать громоздкие семантические сети, содержащие огромное количество узлов для описания различных однотипных сущностей, перенося их в атрибуты концептов, а с другой стороны, оставить интуитивно понятный графовый метод представления знаний. Такой подход встречается в литературе [10].

Кроме того, в основу базы знаний было решено заложить онтологический подход, что позволило однозначно интерпретировать каждый концепт базы знаний и сформировать иерархию понятий предметной области, а затем и таксономию понятий (табл. 2). Иерархия понятий в разрабатываемой системе формируется через родовидовые связи (рис. 1).

Структура базы знаний разрабатывалась с учетом возможности расширять используемую номенклатуру медицинских понятий по мере появления прецедентов. Связано это с тем, что медицина является сложно формализуемой научной областью [10]. За длительный период ее развития различными медицинскими школами было сформировано значительное терминологическое поле, позволяющее экспертам описывать состояние пациента и его динамику.

Таблица 1. Пример представления понятия в базе знаний Table 1. An example of concept representation in the knowledge base

Название параметра Значение Parameter name Value

Уникальный идентификатор Unique identifier 108

Тип понятия Concept type Диагноз Diagnosis

Наименование Name Подагра, интермиттирующее течение, вне обострения Функциональный класс I Primary chronic gout without tophus. Functional class I

Код МКБ-10 ICD-10 code М10.0

Таблица 2. Типы понятий и связей Table 2. Types of concepts and relationships

№ Тип понятий и связей Type of concepts and relationships Описание типа понятий и связей Description of the type of concepts and relationships

1 Симптом (понятие) Symptom (concept) Используется для описания признаков, которые могут быть выявлены в ходе приема (осмотра, консультации) специалиста, лабораторных и инструментальных исследований. Например, «Сывороточный уровень мочевой кислоты» It is used to describe the signs that can be identified during specialist's appointment (examination, consultation), laboratory tests, and instrumental studies. For example, «Serum uric acid level»

2 Синдром (понятие) Syndrome (concept) В соответствии с приказом Минздрава РФ от 22.01.2001 г. № 12 о принятии отраслевого стандарта синдром определяется как состояние, развивающееся как следствие заболевания и определяющееся совокупностью клинических, лабораторных, инструментальных диагностических признаков, позволяющих идентифицировать его и отнести к группе состояний с различной этиологией, но общим патогенезом, клиническими проявлениями, общими подходами к лечению, зависящих вместе с тем и от заболеваний, лежащих в основе синдрома, например, «Воспаление коленного сустава» According to the order of the Ministry of Health of the Russian Federation dated January 22, 2001 No. 12 on the approval of an industry standard, the syndrome is defined as a condition developing as a consequence of the disease and determined by a set of clinical, laboratory, and instrumental diagnostic signs that allow it to be identified and attributed to a group of conditions with different etiology, but common pathogenesis, clinical manifestations, common approaches to treatment, depending, at the same time, on the diseases underlying the syndrome, for example, «Inflammation of the knee joint»

3 Диагноз (понятие) Diagnosis (concept) Используется для описания клинического диагноза, например, «Подагра. Хроническая тофусная форма. Хронический подагрический артрит, вне обострения» It is used to describe a clinical diagnosis, for example, «Gout. Chronic tophaceous gout. Non-acute chronic gouty arthritis»

4 Инструментальный метод исследования (понятие) Instrumental research method (concept) Хранит в себе методы инструментальных исследований, например, «Ультразвуковое исследование сустава» It stores the methods of instrumental research, for example, «Ultrasound examination of the joint»

5 Лабораторный метод исследования (понятие) Laboratory research method (concept) Хранит в себе методы лабораторных исследований, например, «Клинический анализ крови» It stores laboratory research methods, for example, «Complete Blood Count»

6 Диагностическая манипуляция (понятие) Diagnostic manipulation (concept) Используется для описания методов физикального исследования пациента (пальпация, перкуссия и аускультация) и методов сбора анамнеза и жалоб пациента, например, «Измерение подвижности сустава» It is used to describe the methods of physical examination of patient (palpation, percussion, and auscultation) as well as the methods of collecting patient anamnesis and complaints, for example, «Measurement of joint mobility»

7 Консультация врача-специалиста (понятие) Consultation of a medical specialist (concept) Используется для хранения в себе консультации врачей-специалистов, например, «Консультация врача-нефролога» It is used to store consultations of medical specialists, for example, «Consultation of a nephrologist»

Окончание табл.2 End of table 2

№ Тип понятий и связей Type of concepts and relationships Описание типа понятий и связей Description of the type of concepts and relationships

8 Относится (связь) Relates (relationship) Связывает понятие типа «Симптом» с понятиями типа «Синдром» и «Диагноз». Также связывает понятие типа «Синдром» с понятиями типа «Диагноз» Relates the concept of the «Symptom» type to the concepts of the «Syndrome» and «Diagnosis» types. Relates the concept of the «Syndrome» type to the concepts of the «Diagnosis» type

9 Проявляется (связь) Is manifested (relationship) Связывает понятие типа «Диагноз» с понятиями типа «Синдром» и «Симптом». Также связывает понятие типа «Синдром» с понятием типа «Симптом» Relates the concept of the «Diagnosis» type to the concepts of the «Syndrome» and «Symptom» types. Relates the concept of the «Syndrome» type to the concept of the «Symptom» type

10 Выявляет (связь) Detects (relationship) Связывает понятия типа «Инструментальный метод исследования», «Лабораторный метод исследования», «Диагностическая манипуляция» и «Консультация врача-специалиста» с понятиями типа «Симптом» Relates the concepts of the following types: «Instrumental research method», «Laboratory research method», «Diagnostic manipulation», and «Consultation of a medical specialist» to the concepts of the «Symptom» type

11 Выявляется (связь) Is detected by (relationship) Связывает понятия типа «Симптом» с понятиями типа «Инструментальный метод исследования», «Лабораторный метод исследования», «Диагностическая манипуляция» и «Консультация врача-специалиста» Relates the concepts of the «Symptom» type to the concepts of «Instrumental research method», «Laboratory research method», «Diagnostic manipulation», and «Consultation of a medical specialist» types

12 Род (связь) Superclasses (relationship) Связывает группировочные понятия с уточненными. Связь может быть организована только между понятиями одного типа Relates grouping concepts to specified ones. Relationship can only be organized between concepts of the same type

13 Вид (связь) Subclass (relationship) Связывает уточненные понятия с группировочными. Связь можно организовать только между понятиями одного типа Relates specified concepts with grouping ones. Relationship can be organized only between concepts of the same type

14 Синонимичное понятие (связь) Synonymous concept (relationship) Отходят от основного понятия в сторону синонимичного. Связь можно организовать только между понятиями одного типа They move away from the basic concept towards the synonymous one. Relationship can be organized only between concepts of the same type

15 Основное понятие (связь) Basic concept (relationship) Отходят от синонимичного понятия в сторону основного. Связь можно организовать только между понятиями одного типа They move away from the synonymous concept towards the basic one. Relationship can be organized only between concepts of the same type

16 Повод для выявления (связь) Reason for identifying (relationship) Связывает понятия типа «Симптом» между собой Relates the concepts of «Symptom» type to each other

17 Следствие наличия (связь) Consequence of presence (relationship) Связывает понятия типа «Симптом» между собой Relates the concepts of «Symptom» type to each other

18 Сопутствующее заболевание (связь) Concomitant disease (relationship) Связывает понятия типа «Диагноз» между собой Relates the concepts of «Diagnosis» type to each other

Однако это поле крайне слабо структурировано. Многие термины, описывающие отдельные явления, имеют исторические корни, например, «Симптом простыни» или принятую формулировку как «Бурсит локтевого сустава» (в то время как для описания воспаления других суставов используют термин «Артрит», например, «Артрит коленного сустава»). Существуют и другие лексические особенности, которые требуют учета в рамках разработки. Создание базы знаний, в основе которой используются все имеющиеся понятия предметной области, приводит к значительному увеличению ее объема, усложнению ее разработки и последующего ведения.

Одним из способов, позволяющих сократить количество узлов, используемых в базе знаний, является объединение в синонимичные группы. Каждая группа содержит в себе одно основное понятие, которое используется при формализации логики диагностики заболевания, и неограниченное количество синонимичных понятий, которые находят применение в части описания существующих синонимов. Данный подход направлен на работу с различными медицинскими школами. Выбор основного

понятия осуществлялся экспертами на основе наиболее часто используемого в литературе термина.

В ходе разработки структуры базы знаний использовались типы понятий, выделенные на этапе формирования номенклатуры медицинских понятий [15] с учетом их расширения и существенного изменения. Также были добавлены типы связей, позволяющие детализировать отношения между всеми понятиями, которые используются в номенклатуре медицинских понятий (см. табл. 2). Классификация всех понятий и связей базы знаний позволяет структурировать имеющуюся информацию и типизировать наполнение объектов. Таким образом, атрибуты у каждого типа собственные, но в то же время имеется ряд общих закономерностей: у всех типов понятий имеется атрибут «Наименование», который используется для хранения термина в соответствии с номенклатурой медицинских понятий в области диагностики.

Тип понятия «Симптом» помимо атрибута «Название» включает в себя атрибут «Единицы измерения» в соответствии с федеральным справочником «Единицы измерения».

Рис. 1. Пример семантической сети на основе понятий, связанных родовидовыми связями

Fig. 1. An example of semantic network based on concepts related by genus-species relationships

Этот атрибут используется для указания той единицы измерения, которая будет использоваться в онтологии в дальнейшем. Справочник дополнен значением «Качественный признак» для того, чтобы отличать качественные и количественные параметры.

Тип понятия «Диагноз» включает в себя атрибут «Код по МКБ-10», который устанавливается в соответствии с международной статистической классификацией болезней и проблем, связанных со здоровьем (10-й пересмотр).

Типы понятий «Синдром», «Инструментальный метод исследования», «Лабораторный метод исследования», «Диагностическая манипуляция» и «Консультация врача-специалиста» не содержат каких-либо дополнительных атрибутов.

Типы связей также имеют ряд особенностей. Одной из таковых является парность каждой связи, что позволит в дальнейшем алгоритмам СППВР идти как в прямом направлении для непосредственного решения поставленных задач, так и в обратном направлении для восстановления исходной последовательности действий. Для указания парной связи используется соответствующий атрибут. Наполнение по атрибутам у таких связей идентичное, имеется отличие в типе и направлении связи.

Типы связи «Проявляется» и «Относится» являются парными и связывают типы понятий «Симптом», «Синдром» и «Диагноз» между собой. Они обладают необходимыми атрибутами для кодирования информации о значении признака, связанных понятиях и вероятности того, что связанный диагноз или синдром имеет место быть.

Типы связи «Выявляет» и «Выявляется» используются для указания отношения между симптомами и различными методами исследования, что позволяет в дальнейшем оказывать специалисту поддержку в рамках назначения основных и дополнительных методов исследования в ходе установки и подтверждения диагноза.

Типы связи «Род» и «Вид» используются для обозначения родовидовой связи между разными понятиями одного типа между собой, что позволяет группировать и уточнять каждый из используемых терминов.

Типы связей «Синонимичное понятие» и «Основное понятие» используются для описания синонимичных групп в базе знаний.

Типы связи «Повод для выявления» и «Следствие наличия» являются парными связями и объединяют понятия типа «Симптом» между собой. Эта связь в дальнейшем будет использоваться для того, чтобы система могла рекомендовать специалисту дополнительные методы обследования пациента на предмет наличия или отсутствия симптома при условии определенного ранее симптома.

Тип связи «Сопутствующее заболевание» является парной связью и формируется между понятиями типа «Диагноз». Используется для обозначения связи между разными диагнозами.

Таким образом, была разработана структура базы знаний, построенная на основе сочетания двух методов представления знаний: семантическая сеть и фреймы, использующая в качестве метода структуризации онтологический подход. Структура была описана посредством 7 типов понятий и 11 типов связей, каждый из которых обладает уникальными набором атрибутов, позволяющим в дальнейшем формализовать диагностику подагры.

Обсуждение

Разработанная структура базы знаний, основанная на верифицированных экспертами данных, позволяет в дальнейшем на ее основе осуществлять наполнение базы знаний и создание алгоритмов СППВР, которые будут способны оказывать информационную поддержку специалистам в части постановки предварительного диагноза, выбора методов исследования и подтверждения диагноза.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Использование синонимичных групп позволяет значительно уменьшить количество используемых связей между понятиями без потери информации, а также допускает в дальнейшем расширение номенклатуры медицинских понятий синонимичными терминами без изменения логики работы как алгоритмов СППВР, так и базы знаний.

Применение онтологического подхода определяет однозначное использование каждого понятия и исключает его двоякое понимание. Более того, обеспечивается не только создание базы знаний на основе онтологического подхода, но и ее последующее ведение, что особенно актуально для подагры. Это можно подтвердить тем, что федеральные клинические рекомендации, в том числе и по подагре [1, 3], обновляются каждые 3 года за счет уточнения имеющихся сведений о методах диагностики и лечения заболевания.

Использование сочетания семантической сети и фреймового представления базы знаний в качестве основы для разработки структуры базы знаний с учетом онтологического подхода в области диагностики подагры ранее не использовалось, однако онтологический подход для описания подагры уже применялся с целью разработки базы знаний для обработки естественного языка (NLP) [16].

Сравнение разработанной нами структуры базы знаний с работами А.В. Будыкиной и соавт. (2020) [17], К.В. Киселева и соавт. (2018) [18], использующими похожий принцип, но для заболеваний, отличных от подагры, можно представить следующим образом:

В разработанной структуре используется тип понятия «Симптом», разделенные в работах коллег на отдельные типы «Клинический признак» и «Диагностический признак», критерием разделения которых является метод определения. Так, для «Клинического признака» используются методы физикального обследования и консультации врачей специалистов, а для понятий типа «Диагностический признак» результаты лабораторных и инструментальных методов исследования. Использование единого типа понятий позволяет избежать неоднозначности, связанные с понятиями, которые могут быть определены несколькими способами, например, «Частота сердечных сокращений».

В разработанной структуре выделен тип понятий «Синдром», отсутствующий у коллег, который позволяет, с одной стороны, существенно уменьшить базу знаний путем объединения различных понятий в одну группу, с другой, больше соответствовать принятой в медицине системе понятий.

При сравнении нашего продукта со структурой базы знаний, описанной в работе В.В. Грибовой и соавт. [19], были выявлены следующие отличия:

Структура базы знаний коллег содержит в себе понятия типа «Диагноз» и ряд дополнительных к нему сущностей, детализирующих этот тип понятия: «по форме», «по варианту», «по степени тяжести» и «по стадии». В разработанной

нами структуре данная информация не выделяется отдельно и формализуется посредством создания полного перечня допустимых понятий и их объединением посредством родовидовых связей понятий типа «Диагноз». Такой подход позволяет типизировать процесс, что в свою очередь направлено на упрощение последующей разработки алгоритмов СППВР в рамках поставленной цели.

Структура коллег содержит понятия типа «Признак», которые могут быть представлены как простыми сущностями, так и составными. В разработанной нами структуре существует аналогичное деление, представленное использованием двух типов понятий: «Симптом» и «Синдром». Такой подход семантически ближе к принятой терминологии. С точки зрения использования в структуре коллег дополнительных сущностей для детализации типа понятия «Признак» - ситуация аналогична типу понятий «Диагноз».

В системе, разработанной коллегами, признак не связывается напрямую с заболеванием, и в обязательном порядке требуется использовать симптомокомплекс. В нашей системе симптомокомплекс не выделяется отдельно, однако его аналогом в системе является тип связи «Относится», который используется для описания

связей между типами понятий «Симптом», «Синдром» и «Диагноз». Такая система позволяет уменьшить объем базы знаний без потери хранящихся в нем знаний.

При попытке сравнить разработанную нами структуру базы знаний с другими научными работами, связанными с разработкой или использованием СППВР в области диагностики подагры, не было найдено программного продукта или его компонента, в основе которого бы использовались методы, относящиеся к инженерии знаний.

В ходе поиска были найдены программные решения, построенные на основе методов машинного обучения [16, 20], однако такие системы не обладают базой знаний, что не позволяет использовать их для сравнения.

Заключение

Разработана структура базы знаний в области диагностики подагры, построенная на верифицированных экспертами данных. В структуре используется онтологический подход и сочетание двух моделей представления знаний: семантической сети и фреймовой модели. База знаний содержит разработанные ранее информационные объекты [15], разделенные на 7 типов понятий и 11 типов связей.

Литература

1. Подагра: руководство для врачей обшей практики (семейных врачей). М.; 2015:28.

2. Кондрашов А.А., Клименко А.А., Шостак Н.А. Ведение пациентов с подагрой: фокус на поражение почек. Лечебное дело. 2021;(3):51-56. DOI: 10.24412/2071-5315-2021-12359.

3. Насонов Е.Л. Российские клинические рекомендации. Ревматология. М.: ГЭОТАР-Медиа; 2017:464.

4. Кириллова Э.Р. Возможности ультразвукового исследования в диагностике подагры. Практическая медицина. 2018;16(7):117-118. DOI: 10.32000/2072-1757-2018-16-8-117-118.

5. Руголь Л.В., Сон И.М., Меньшикова Л.И. Влияние кадрового обеспечения первичной медико-санитарной помощи на эффективность ее деятельности. Социальные аспекты здоровья населения. 2020;66(3):34. DOI: 10.21045/2071-5021-2020-66-3-9.

6. Сон И.М., Иванова М.А., Соколовская Т.А., Люцко В.В., Дежурный Л.И. Деятельность и обеспеченность врачами-ревматологами в Российской Федерации. Кардиоваскулярная терапия и профилактика. 2019;18(1):134-142. DOI: 10.15829/1728-8800-2019-1-134-142.

7. Журавлёва В.А., Фёдоров Л.В. Подагра: трудности и ошибки своевременной диагностики. Практикуючийлкар. 2019;3:32-38.

8. Лудупова Е.Ю. Врачебные ошибки. Литературный обзор. Вестник Росздравнадзора. 2016;2:6-15.

9. Фролов С.В., Куликов А.Ю., Остапенко О.А., Стрыгина Е.В. Системы поддержки врачебных решений в медицине. Научный журнал. 2018;9(32):9-16.

10. Гаврилова Т.А., Кудрявцев Д.В., Муромцев Д.И. Инженерия знаний. Модели и методы. СПб.: Издательство «Лань»; 2016:324.

11. Реброва О.Ю. Жизненный цикл систем поддержки принятия врачебных решений как медицинских технологий. Врач и информационные технологии. 2020;1:27-37. DOI: 10.37690/1811-0193-2020-1-27-37.

12. Varghese J., Kleine M., Gessner S.I., Sandmann S., Dugas M. Effects of computerized decision support system implementations on patient outcomes in inpatient care: a systematic review. J. Am. Med. Informatics. Assoc. 2018;25(5):593-602. DOI: 10.1093/jamia/ocx100.

13. Кобринский Б.А., Таперова Л.Н. Модель понятийно-образных (лингво-образных) фреймов для медицинских интеллектуальных систем. В сб.: Тринадцатая национальная конференция по искусственному интеллекту с международным участием: труды конференции. Белгород: Издательство БГТУ; 2012:318-326.

14. Zeshan F., Mohamad R. Medical ontology in the dynamic healthcare environment. Procedia Computer Science. 2012;10:340-348. DOI: 10.1016/j.procs.2012.06.045.

15. Осмоловский И.С., Зарубина Т.В., Шостак Н.А., Кондрашов А.А., Клименко А.А. Разработка номенклатуры понятий и логических схем по амбулаторному ведению пациентов с подагрой. Вестник РГМУ. 2021;(2):51-67. DOI: 10.24075/vrgmu.2021.014.

16. Osborne J.D., Booth J.S., O'Leary T., Mudano A., Rosas G., Foster P.J. et al. Identification of gout flares in chief complaint text using natural language processing. AMIA. Annu. Symp. Proc. 2021;2020:973-982.

17. Будыкина А.В., Тихомирова Е.В., Киселев К.В., Зарубина Т.В., Раузи-на С.Е., Федоров Е.Д. и др. Формализация знаний о желудочно-кишечном кровотечении неясного генеза для использования в интеллектуальных системах поддержки принятия врачебных решений. Вестник новых медицинских технологий. 2020;27(4):98-101. DOI: 10.24411/1609-2163-2020-16741.

18. Киселев К.В., Ноева Е.А., Выборов О.Н., Зорин А.В., Потехина А.В., Осяева М.К. и др. Разработка архитектуры базы знаний системы поддержки принятия врачебных решений, основанной на графовой базе данных. Медицинские технологии Оценка и выбор. 2018;3(33):42-48. DOI: 10.31556/2219-0678.2018.33.3.042048.

19. Грибова В.В., Петряева М.В., Окунь Д.Б., Шалфеева Е.А. Онтология медицинской диагностики для интеллектуальных систем поддержки принятия решений. Онтология проектирования. 2018;8(1):58-73. DOI: 10.18287/2223-9537-2018-8-1-58-73.

20. Bahra G., Wiese L. Classifying leukemia and gout patients with neural networks. In: Database and expert systems applications. Springer International Publishing; 2018:150-160. DOI: 10.1007/978-3-319-991337 12.

References

1. A Guide for general practitioners (family doctors). Moscow; 2015:28. (In Russ.).

2. Kondrashov A.A., Klimenko A.A., Shostak N.A. Management of patients with gout: focus on kidney damage. The Journal of General Medicine. 2021;(3):51-56. (In Russ.). DOI: 10.24412/2071-5315-2021-12359.

3. Eliseev M.S. Rheumatology. Russian clinical guidelines. Moscow: GEO-TAR-Media; 2017:464. (In Russ.).

4. Kirillova E.R. Role of ultrasonography in diagnosing gout. Practical Medicine. 2018;16(7):117-118. (In Russ.). DOI: 10.32000/2072-1757-201816-8-117-118.

5. Rugoll L.V., Son I.M., Menshikova L.I. Influence of primary care staffing on its performance efficiency. Social Aspects of Population Health. 2020;66(3):34. (In Russ.). DOI: 10.21045/2071-5021-202066-3-9.

6. Son I.M., Ivanova M.A., Sokolovskaya T.A., Liutsko V.V., Dezhurny L.I. Activity and the density of rheumatologists in Russian Federation. Car-

diovascular Therapy and Prevention. 2019;18(1):134—142. (In Russ.). DOI: 10.15829/1728-8800-2019-1-134-142.

7. Zhuravljova V.A., Fjodorov L.V. Gout: difficulties and errors of timely diagnosis. Practicing Physician. 2019;3:32-38. (In Russ.).

8. Ludupova E.Y. Medical errors. Literature review. Bulletin of Ro-szdravnadzor. 2016;2:6-15. (In Russ.).

9. Frolov S.V., Kulikov A.Ju., Ostapenko O.A., Strygina E.V. Medical decision support systems in medicine. Scientific Magazine. 2018;9(32):9-16. (In Russ.).

10. Gavrilova T.A., Kudrjavcev D.V., Muromcev D.I. Knowledge Engineering. Models and Methods. Saint Petersburg: Publisher "Lan"; 2016: 324. (In Russ.).

11. Rebrova O.Yu. Life cycle of decision support systems as medical technologies. Medical Вoctor and IT. 2020;1:27-37. (In Russ.). DOI: 10.37690/1811-0193-2020-1-27-37

12. Varghese J., Kleine M., Gessner S.I., Sandmann S., Dugas M. Effects of computerized decision support system implementations on patient outcomes in inpatient care: a systematic review. J. Am. Med. Informatics. Assoc. 2018;25(5):593-602. DOI: 10.1093/jamia/ocx100.

13. Kobrinskij B.A., Taperova L.N. A model of conceptual-figurative (lin-guo-figurative) frames for medical intelligent systems. In: The Thirteenth national conference on artificial intelligence with international participation): Proceedings of the conference. Belgorod: Publisher BSTU; 2012:318-326. (In Russ.).

14. Zeshan F., Mohamad R. Medical ontology in the dynamic healthcare environment. Procedia Computer Science. 2012;10:340-348. DOI: 10.1016/j.procs.2012.06.045.

15. Osmolovsky I.S., Zarubina T.V., Shostak N.A., Kondrashov A.A., Kli-menko A.A. Development of medical nomenclature and algorithms for diagnosis and treatment of gout in outpatient settings. Bulletin of Russian State Medical University. 2021;2:55-62. (In Russ.). DOI: 10.24075/ vrgmu.2021.014.

16. Osborne J.D., Booth J.S., O'Leary T., Mudano A., Rosas G., Foster P.J. et al. Identification of gout flares in chief complaint text using natural language processing. AMIA. Annu. Symp. Proc. 2021;2020:973-982.

17. Budykina A.V., Tikhomirova E.V., Kiselev K.V., Zarubina T.V., Rauzina S.E., Fedorov E.D. et al. Formalization of knowledge about gastrointestinal bleeding of unknown origin for use in intelligent clinical decision support systems. Journal of New Medical Technology. 2020;27(4):98-101. (In Russ.). DOI: 10.24411/1609-2163-2020-16741.

18. Kiselev K.V., Noeva E.A., Vyborov O.N., Zorin A.V., Potekhina A.V., Osy-aeva M.K. et al. Development of knowledge base architecture for clinical decision support system based on graph database. Medical Technology. Assess Choice. 2018;3(33):42-48. (In Russ.). DOI: 10.31556/22190678.2018.33.3.042-048.

19. Gribova V.V., Petryaeva M.V., Okun D.B., Shalfeeva E.A. Medical diagnostics ontology for intelligent decision support systems. Ontology Decision. 2018;8(1):58-73. (In Russ.). DOI: 10.18287/2223-9537-20188-1-58-73.

20. Bahra G., Wiese L. Classifying leukemia and gout patients with neural networks. In: Database and expert systems applications. Springer International Publishing; 2018:150-160. DOI: 10.1007/978-3-319-991337 12.

Информация о вкладе авторов

Осмоловский И.С. - формирование информационных объектов (структура базы знаний), анализ предоставленной информации от экспертов, техническая верификации информационных объектов, написание рукописи и формирование таблиц и рисунков.

Зарубина Т.В. - руководство работой, разработка дизайна исследования, подготовка рукописи.

Шостак Н.А., Клименко А.А., Кондрашов А.А. - помощь в написании клинической части текста рукописи.

Осмоловская М.С. - помощь в написании рукописи, приведение статьи в вид, соответствующий требованиям журнала.

Information on author contributions

Osmolovsky I.S. - creation of information objects (knowledge base structure), analysis of information provided by the experts, technical verification of information objects, writing the manuscript, and creation of tables and figures.

Zarubina T.V. - supervision over the study, contribution to study design, and contribution to preparing the manuscript.

Shostak N.A., Klimenko A.A., and Kondrashov A.A. - contribution to writing the clinical part of the manuscript.

Osmolovskaya M.S. - contribution to writing the manuscript and formatting the paper according to the requirements of the journal.

Сведения об авторах

Осмоловский Иван Сергеевич, аспирант кафедры медицинской кибернетики и информатики медико-биологического факультета, Российский национальный исследовательский медицинский университет имени Н.И. Пирогова Министерства здравоохранения Российской Федерации. ORCID 0000-0002-8974-8183.

Е-mail: Osmolovsky Ivan@bk.ru.

Зарубина Татьяна Васильевна, д-р мед. наук, профессор, заведующий кафедрой медицинской кибернетики и информатики, Российский национальный исследовательский медицинский университет имени Н.И. Пирогова Министерства здравоохранения Российской Федерации; главный внештатный специалист по информационным системам в здравоохранении. ORCID 0000-0002-4403-8049.

E-mail: tv.zarubina.57@gmail.com.

Шостак Надежда Александровна, д-р мед. наук, профессор, заведующий кафедрой факультетской терапии имени академика А.И. Нестерова, Российский национальный исследовательский медицинский университет имени Н.И. Пирогова Министерства здравоохранения Российской Федерации. ORCID 0000-0003-4669-1006.

E-mail: nshostak44@mail.ru.

Клименко Алеся Александровна, д-р мед. наук, доцент, профессор кафедры факультетской терапии имени академика А.И. Нестерова, Российский национальный исследовательский медицинский университет имени Н.И. Пирогова Министерства здравоохранения Российской Федерации. ORCID 0000-0002-7410-9784.

E-mail: aaklimenko@yandex.ru.

Information about the authors

Ivan S. Osmolovsky, Postgraduate Student, Department of Medical Cybernetics and Informatics, Pirogov Russian National Research Medical University. ORCID 0000-0002-8974-8183.

E-mail: Osmolovsky Ivan@bk.ru.

Tatiana V. Zarubina, Dr. Sci. (Med.), Professor, Head of Department of Medical Cybernetics and Informatics, Pirogov Russian National Research Medical University (Pirogov Medical University); Chief External Expert for Information Systems in Healthcare. ORCID 0000-0002-4403-8049.

E-mail: tv.zarubina.57@gmail.com.

Nadezhda A. Shostak, Dr. Sci. (Med.), Professor, Head of the Department of Faculty Therapy named after academician A.I. Nesterov, Pirogov Russian National Research Medical University. ORCID 0000-0003-4669-1006.

E-mail: nshostak44@mail.ru.

Alesya A. Klimenko, Dr. Sci. (Med.), Associate Professor, Professor of the Department of Faculty Therapy named after academician A.I. Nesterov, Pirogov Russian National Research Medical University. ORCID 0000-00027410-9784.

E-mail: aaklimenko@yandex.ru.

Artem A. Kondrashov, Assistant Professor, Department of Faculty Therapy named after academician A.I. Nesterov, Pirogov Russian National Research Medical University. ORCID 0000-0001-9152-3234.

E-mail: kaartenm@gmail.com.

Кондрашов Артем Александрович, ассистент кафедры факультетской терапии имени. академика А.И. Нестерова, Российский национальный исследовательский медицинский университет имени Н.И. Пирогова Министерства здравоохранения Российской Федерации. ORCID 00000001-9152-3234.

E-mail: kaartenm@gmail.com.

Осмоловская Мария Сергеевна, студент педиатрического факультета, Российский национальный исследовательский медицинский университет имени Н.И. Пирогова Министерства здравоохранения Российской Федерации. ORCID 0000-0003-2989-2447.

E-mail: osmolovskaya.masha@mail.ru.

H Осмоловский Иван Сергеевич, е-mail: Osmolovsky Ivan@ bk.ru.

Поступила 04.04.2022

Maria S. Osmolovskaya, Student, Faculty of Paediatrics, Pirogov Russian National Research Medical University. ORCID 0000-0003-29892447.

E-mail: osmolovskaya.masha@mail.ru. H Ivan S. Osmolovsky, e-mail: Osmolovsky Ivan@bk.ru.

Received April 04, 2022

i Надоели баннеры? Вы всегда можете отключить рекламу.