Научная статья на тему 'Разработка номенклатуры понятий для системы поддержки принятия врачебных решений в области диагностики стенокардии I-IV функциональных классов'

Разработка номенклатуры понятий для системы поддержки принятия врачебных решений в области диагностики стенокардии I-IV функциональных классов Текст научной статьи по специальности «Клиническая медицина»

CC BY
179
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТЕНОКАРДИЯ / ANGINA / СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ / CLINICAL DECISION SUPPORT SYSTEMS / СППВР / ОНТОЛОГИЯ / ONTOLOGY / КЛИНИЧЕСКИЕ РЕКОМЕНДАЦИИ / CLINICAL GUIDELINES / CDSS

Аннотация научной статьи по клинической медицине, автор научной работы — Киселев К.В., Потехина А.В., Осяева М.К., Ноева Е.А., Выборов О.Н.

Обоснование исследования. С 2000 года в России растёт число случаев заболеваемости ИБС, в частности, стенокардией. Увеличение нагрузки на врачей в связи с большим количеством пациентов приводит к врачебным ошибкам, заставляет искать пути оптимизации использования врачебных ресурсов. Одним из возможных путей является разработка систем поддержки принятия врачебных решений, в частности, систем, основанных на онтологиях. Такие онтологии должны обладать семантической интероперабельностью понятий, чтобы однозначно быть интерпретируемыми врачами, использующими синонимию при описании одних тех же явлений. Цель исследования. Разработать номенклатуру понятий для построения онтологической модели стенокардии. Материал и методы. Для первичного выделения понятий использовались федеральные клинические рекомендации «Стабильная ишемическая болезнь сердца» от 2016 г. Разработка и наполнение номенклатуры осуществлялись в программах MS Excel и MS Excel Online. Проработка выделенных понятий велась совместно с экспертами-кардиологами методом кросс-валидации и общим голосованием о включении понятия в итоговую номенклатуру. Валидация полученной номенклатуры проводилась полуавтоматическим методом на электронных медицинских картах 610 пациентов. Результаты. После первичной проработки клинических рекомендаций без экспертов удалось выделить 336 корневых понятий и 144 синонима с учётом особенностей разрабатываемой онтологии. Совместная проработка данной номенклатуры с экспертами-кардиологами позволила расширить список корневых понятий до 401 и синонимов до 619. Валидация номенклатуры на электронных медицинских картах показала полное соответствие используемых понятий в части назначаемых дополнительных методов диагностики и выписываемых лекарственных средств и 92% соответствие диагностическим признакам, указываемым в текстах диагностических заключений. Процентные соотношения первично выделенных позиций номенклатуры и проработанных экспертами, а также результаты валидации номенклатуры на медицинских картах пациентов позволили сделать вывод о том, что клинические рекомендации могут быть использованы для первичного выделения понятий, но полученный результат должен быть доработан с учётом расширения возможных синонимов с помощью экспертов и привлечения дополнительных литературных источников знаний о стенокардии, после чего номенклатура может быть использована для разработки онтологии стенокардии. Заключение. Использование клинических рекомендаций оправдано с точки зрения первичного выделения понятий предметной области. Однако, полученная номенклатура должна быть уточнена и расширена с учётом возможных синонимов, а также провалидирована на данных электронных медицинских карт. После этого выделенные понятия и их синонимы можно использовать для наполнения онтологии предметной области.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по клинической медицине , автор научной работы — Киселев К.В., Потехина А.В., Осяева М.К., Ноева Е.А., Выборов О.Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF CONCEPTS NOMENCLATURE FOR CLINICAL DECISION SUPPORT SYSTEM IN DIAGNOSTICS OF ANGINA PECTORIS

Introduction. Since 2000th CHD morbidity in Russia is growing constantly, especially, angina pectoris morbidity. Increasing workload on physicians due to high number of patients makes us find the ways to optimize human resource applying. One of the possible ways is development of clinical decision support systems, particularly, ontology-based systems. These ontologies must adopt semantic interoperability for the concepts included, to be clearly interpreted by physicians of different medical schools. Research target. Develop the concepts nomenclature for building of angina pectoris ontology. Methods. For primary concepts extraction we used state clinical recommendations “Stable coronary heart disease” issued in 2016. Development and filling of the nomenclature were performed in MS Excel and MS Excel Online. The work through the primarily extracted concepts was performed with expert-cardiologists by cross-validation method and common voting on final inclusion of the concept in the nomenclature. The final nomenclature validation was performed by semi-automatic method on anonymized 610 electronic health records of the patients. Results. After primary extraction of the concepts without experts, we could extract 336 basic concepts and 144 synonyms, keeping in mind the aspects of this nomenclature development. The shared work through this nomenclature with the expert-cardiologists let us increase the number of the basic concepts up to 409 and the number of the synonyms up to 619. The nomenclature validation on electronic health records showed compliance of the concepts in aspects of diagnostics methods and medicine prescriptions and 92% compliance in diagnostic signs, which doctors evaluate in diagnostics results. Percentages of primarily extracted concepts in draft nomenclature and after being worked through by the experts and also validation results based on electronic health records, let us make a conclusion that clinical recommendations can be used as a basic data source for concepts extraction, but the draft result must be evaluated by the experts and also filled up with the usage of additional knowledge sources about angina pectoris, and after that the nomenclature can be used for angina pectoris ontology development. Conclusion. The usage of clinical recommendations is proved to be the basic data source for concepts of subject area extraction. However, the draft nomenclature must be evaluated and filled up with additional synonyms and validated on electronic health records. After that, the extracted concepts and their synonyms can be used for ontology development.

Текст научной работы на тему «Разработка номенклатуры понятий для системы поддержки принятия врачебных решений в области диагностики стенокардии I-IV функциональных классов»

Киселев К.В.1, Потехина А.ВЯ Осяева М.К.2, Ноева Е.А.2, Выборов О.Н.2, Зорин А.ВДШвырев С.Л.1, Мартынюк Т.В.2, Зарубина Т.В.1, Чазова И.Е.2

РАЗРАБОТКА НОМЕНКЛАТУРЫ ПОНЯТИЙ ДЛЯ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ В ОБЛАСТИ ДИАГНОСТИКИ СТЕНОКАРДИИ !-№ ФУНКЦИОНАЛЬНЫХ КЛАССОВ

1ФГБОУ ВО Российский национальный исследовательский медицинский университет имени Н.И. Пирогова Министерства здравоохранения Российской Федерации, 2ФГБУ «Национальный медицинский исследовательский центр кардиологии» Министерства здравоохранения Российской Федерации, г. Москва, Российская Федерация

РЕЗЮМЕ

Обоснование исследования. С 2000 года в России растёт число случаев заболеваемости ИБС, в частности, стенокардией. Увеличение нагрузки на врачей в связи с большим количеством пациентов приводит к врачебным ошибкам, заставляет искать пути оптимизации использования врачебных ресурсов. Одним из возможных путей является разработка систем поддержки принятия врачебных решений, в частности, систем, основанных на онтологиях. Такие онтологии должны обладать семантической интероперабельностью понятий, чтобы однозначно быть интерпретируемыми врачами, использующими синонимию при описании одних тех же явлений.

Цель исследования. Разработать номенклатуру понятий для построения онтологической модели стенокардии.

Материал и методы. Для первичного выделения понятий использовались федеральные клинические рекомендации «Стабильная ишемическая болезнь сердца» от 2016 г. Разработка и наполнение номенклатуры осуществлялись в программах MS Excel и MS Excel Online. Проработка выделенных понятий велась совместно с экспертами-кардиологами методом кросс-валидации и общим голосованием о включении понятия в итоговую номенклатуру. Валидация полученной номенклатуры проводилась полуавтоматическим методом на электронных медицинских картах 610 пациентов.

Результаты. После первичной проработки клинических рекомендаций без экспертов удалось выделить 336 корневых понятий и 144 синонима с учётом особенностей разрабатываемой онтологии. Совместная проработка данной номенклатуры с экспертами-кардиологами позволила расширить список

корневых понятий до 401 и синонимов до 619. Валидация номенклатуры на электронных медицинских картах показала полное соответствие используемых понятий в части назначаемых дополнительных методов диагностики и выписываемых лекарственных средств и 92% соответствие диагностическим признакам, указываемым в текстах диагностических заключений. Процентные соотношения первично выделенных позиций номенклатуры и проработанных экспертами, а также результаты валидации номенклатуры на медицинских картах пациентов позволили сделать вывод о том, что клинические рекомендации могут быть использованы для первичного выделения понятий, но полученный результат должен быть доработан с учётом расширения возможных синонимов с помощью экспертов и привлечения дополнительных литературных источников знаний о стенокардии, после чего номенклатура может быть использована для разработки онтологии стенокардии.

Заключение. Использование клинических рекомендаций оправдано с точки зрения первичного выделения понятий предметной области. Однако, полученная номенклатура должна быть уточнена и расширена с учётом возможных синонимов, а также провалидирована на данных электронных медицинских карт. После этого выделенные понятия и их синонимы можно использовать для наполнения онтологии предметной области.

Ключевые слова: стенокардия, системы поддержки принятия врачебных решений, СППВР, онтология, клинические рекомендации.

И kirillkiselev@pm.me

Для цитирования: Киселев К.В., Потехина А.В., Осяева М.К., Ноева Е.А., Выборов О.Н., Зорин А.В., Швырев С.Л., Мартынюк Т.В., Зарубина Т.В., Чазова И.Е. Разработка номенклатуры понятий для системы поддержки принятия врачебных решений в области диагностики стенокардии I-IV функциональных классов. Евразийский кардиологический журнал. 2018, Сентябрь 20; 3:14-19 [Trans. into Eng. ed.: Kiselev K.V., Potekhina A.V., Osyaeva M.K., Noeva E.A., Vyborov O.N., Zorin A.V., Shvyrev S.L., Martynyuk T.V., Zarubina T.V., Chazova I.Ye. Development of concepts nomenclature for clinical decision support system in diagnostics of angina pectoris. Eurasian cardiological journal. 2018, September 20; 3:20-24]

Сведения об авторах:

Потехина Александра Викторовна к.м.н., младший научный сотрудник отдела легочной гипертензии и заболеваний сердца института клинической кардиологии им. А.Л. Мясникова

Осяева Мария Константиновна лаборант-исследователь отдела легочной гипертензии и заболеваний сердца института клинической кардиологии им. А.Л. Мясникова

Ноева Елена Александровна к.м.н, старший научный сотрудник отдела ХИБС института клинической кардиологии им. А.Л. Мясникова

Выборов Олег Николаевич к.м.н., научный сотрудник отдела легочной гипертензии и заболеваний сердца института клинической кардиологии им. А.Л. Мясникова

Зорин Андрей Владимирович к.м.н., научный сотрудник отдела легочной гипертензии и заболеваний сердца института клинической кардиологии им. А.Л. Мясникова

Швырев Сергей Леонидович к.м.н., доцент кафедры медицинской кибернетики и информатики ФГБОУ ВО РНИМУ им. Н.И. Пирогова

Мартынюк Тамила Витальевна д.м.н., руководитель отдела легочной гипертензии и заболеваний сердца института клинической кардиологии им. А.Л. Мясникова

Чазова Ирина Евгеньевна академик РАН, д.м.н., профессор, директор института клинической кардиологии им. А.Л. Мясникова, ФГБУ «Национальный медицинский исследовательский центр кардиологии» Министерства здравоохранения Российской Федерации, 3-я Черепковская ул., дом 15а, г. Москва, 121552, Российская Федерация

Зарубина Татьяна Васильевна д.м.н., профессор, заместитель директора по информатизации в здравоохранении ЦНИИОИЗ Минздрава РФ, заведующая кафедрой медицинской кибернетики и информатики ФГБОУ ВО РНИМУ им. Н.И. Пирогова

Автор, ответственный за контакты с редакцией: Киселев Кирилл Владимирович аспирант кафедры медицинской кибернетики и информатики ФГБОУ ВО РНИМУ им. Н.И. Пирогова; 117997, г. Москва, ул. Островитянова, д. 1; тел.+7-964-515-68-86; e-mail: kirillkiselev@pm.me

Список сокращений

БСК - болезни системы кровообращения ИБС - ишемическая болезнь сердца КР - клинические рекомендации СК - стенокардия

Определения

База знаний - информационный объект, содержащий медицинскую информацию и её интерпретацию

Валидация - процесс проверки соответствия между полученной моделью и реальным данным

Онтология - формализованное описание предметной области, содержащее сведения о связях между формализованными понятиями

Продукционная модель - набор условных переходов «если-то», позволяющий осуществлять переход от одних медицинский понятий к другим на этапах диагностического поиска, обосновании диагностических и лечебных назначений

СППВР - компьютерные программы, используемые врачами для осуществления консультативной помощи в принятии решений

ВВЕДЕНИЕ

В структуре заболеваемости населения России доля болезней системы кровообращения (БСК) неуклонно растёт с 2000 года и в 2016 году составила 4 649тыс. человек или 31.7 случай на 1000 человек населения [1]. Одним из основных заболеваний в структуре БСК является ишемическая болезнь сердца (ИБС), в т.ч. стенокардия (СК). Увеличивающееся из года в год количество пациентов означает растущую нагрузку на врачей-терапевтов и кардиологов, которые непосредственно занимаются

диагностикой и лечением СК, что может приводить к снижению общего количества времени, уделяемого одному пациенту, и падению качества оказываемой помощи. Одним из способов улучшить данную ситуацию является применение систем поддержки принятия врачебных решений (СППВР), которые предназначены для консультативной помощи врачу и призваны облегчить процесс диагностики и лечения заданной патологии [2].

В качестве базы знаний СППВР, на основании которой программа предлагает врачу возможные варианты решений, в последнее время всё чаще стали использоваться не простые продукционные модели, а онтологии выбранной клинической области. В частности, группой учёных была подтверждена эффективность данного подхода к построению базы знаний СППВР на примере разработки подобной системы для диагностики и антибиотикотерапии инфекционных заболеваний [3].

В контексте высокой заболеваемости СК и современными подходами к поддержке принятия врачебных решений мы поставили перед собой цель разработать СППВР для диагностики и лечения стенокардии, основанной на онтологии СК. Но, для того, чтобы обеспечить семантическую интероперабель-ность разрабатываемой онтологии, необходимо было осуществить работу по первичному наполнению онтологической модели и учёту возможных вариантов наименования тех понятий, которые являются для неё ключевыми. В связи с этим нами были поставлены следующие цель и задачи.

ЦЕЛЬ И ЗАДАЧИ

Цель: разработать номенклатуру понятий для построения онтологической модели стенокардии.

Задачи:

1. Определить основной источник знаний о СК для первичного выделения понятий.

-1 15 I

2. Осуществить первичное выделение понятий с учётом возможных синонимов.

3. Уточнить полученную номенклатуру с помощью экспертов.

4. Сделать вывод о возможности использования полученной номенклатуры в качестве основы наполнения онтологии стенокардии.

МАТЕРИАЛ И МЕТОДЫ

В качестве основного источника знаний о СК нами были использованы федеральные клинические рекомендации (КР) «Стабильная ишемическая болезнь сердца» от 2016 года [4]. В качестве определения «понятия» использовалось следующее: это совокупность признаков, которые все вместе достаточны и каждый в отдельности необходим для того, чтобы отделить данный класс предметов от других [5]. На данном определении базировались правила выделения понятий из КР.

Выделение понятий и ведение номенклатуры осуществлялось с использованием программы MS Excel и MS Excel Online. В команду экспертов-кардиологов, с помощью которых осуществлялось уточнение номенклатуры, вошли 6 человек, представляющих «ФГБУ Национальный медицинский исследовательский центр кардиологии Министерства здравоохранения Российской Федерации». Методика верификации и дополнения первично выделенных понятий экспертами заключалась в закреплении за конкретным экспертом набора значений из первичной номенклатуры, которые эксперт проверял и дополнял вариантами названий, если было необходимо. На общих собраниях индивидуальная работа проверялась методом кросс-валидации, после чего принималось окончательное решение о внесении понятия и его синонимов в разрабатываемую номенклатуру методом общего голосования. При необходимости дополнения номенклатуры новыми понятиями, которые не были выделены первично, экспертами вносилось соответствующее предложение с вариантами названий понятия, после чего следовала стандартная процедура кросс-валидации и принятия решения о включении новой позиции в номенклатуру.

Для проверки валидности номенклатуры и вынесении решения о возможности её использования в качестве источника наполнения онтологии СК в полуавтоматическом режиме была осуществлена сверка выделенных понятий и синонимов с понятиями, использованными в описании клинических случаев 610 пациентов, проходивших лечение во втором лечебном отделении института клинической кардиологии им. А. Л. Мясникова в 2017 году. Электронные медицинские карты были деперсонифицированны и переведены в формат MS Word для дальнейшей обработки. Модель пациента для подбора медицинских карт включала:

• пол - мужской и женский;

• возраст - от 35 лет;

• код МКБ основного заболевания - I20.8, I20.9, I20.1;

• в группу сопутствующих патологий входили: сахарный диабет 2 типа, артериальная гипертензия, перенесённый инфаркт миокарда.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Проанализировав возможность использования в качестве первичного наполнения различные типы литературы: учебники, монографии, статьи, данные электронных медицинских карт пациентов, - мы, понимая, что выбор должен быть определён не только семантической полнотой, но и учётом синонимии, остановили свой выбор на федеральных клинических

рекомендациях по стабильной ишемической болезни сердца от 2016 года. В данном случае, семантическая полнота должна обеспечиваться требованиями к наполнению КР (приложение к письму главным внештатным специалистам от Первого заместителя министра здравоохранения РФ №17-4/10/1-4939 от 1 сентября 2016 года). А решение проблемы синонимии - проработкой используемых в тексте КР понятий сообществом авторов-разработчиков клинических рекомендаций, представляющих собой экспертов Российского кардиологического общества, Национального общества по изучению атеросклероза и Национального общество по атеротромбозу. Таким образом, КР являются на текущий момент наиболее «легитимным» источником сведений для наполнения номенклатуры понятий и разработки онтологии СК, несмотря на то, что характер их использования врачами в клинической практике остаётся рекомендательно-информационным.

Клинические рекомендации по стабильной стенокардии содержат в себе как разделы, направленные на донесение общей информации о заболевании (этиология, факторы риска, патогенез), так и разделы, определяющие диагностические мероприятия и лечебные назначения. В связи с данной особенностью наполнения КР, нам было необходимо разработать систему правил, по которым то или иное понятие попадает в номенклатуру. С учётом определения «понятия», а также области разработки онтологии, нами были приняты следующие принципы:

1. в номенклатуру попадают только понятия, имеющие отношение к клинической составляющей описания СК и не имеют отношения к описанию вспомогательных и административно-отчётных аспектов. Например, «инфаркт миокарда», «гиперхолестеринемия», «коронароангиография», - входят в номенклатуру. «МКБ 10», «Диагностика», «Уровень убедительности рекомендаций» - не входят в номенклатуру;

2. в номенклатуру попадают понятия из разделов КР, описывающих инструментальную диагностику, лабораторную диагностику и лечение. Причём, названия лекарственных препаратов не выделяются в номенклатуру, а берутся только названия групп этих препаратов. Ограничение по разделам определяется областью действия СППВР - поддержка принятия решений врача-клинициста на этапе уточнения первичной диагностической гипотезы с помощью дополнительных методов инструментальной и лабораторной диагностики, а также назначения лечения. Т.е. разделы, описывающие жалобы, патогенез, этиологию, факторы риска, физикальное обследование, не прорабатывались на первичных этапах выделения понятий;

3. выделение понятий осуществляется на принципах отсутствия фоновых знаний по кардиологии: если специалист, выделяющий понятия, знает о синонимах для данного понятия из других источников информации, то он не включает их в номенклатуру. В номенклатуру попадает только та информация, источником которой являются КР;

4. на основании предыдущего пункта было сформулировано ещё одно правило: если в тексте КР нет явного указания на то, что очередное понятие является синонимом уже выделенного понятия, то это понятие вносится в номенклатуру в качестве обособленного;

5. в качестве синонимов понятий рассматриваются не только лингвистические синонимы, например, «стенокардия» и «грудная жаба», но и общепринятые варианты написания понятий, например: «ишемическая болезнь сердца» и «ИБС». В таком случае, в качестве основного понятия использовалось полное наименование без аббревиатур, а все сокращения считались синонимами.

Таблица 1. Пример заполнения номенклатуры синонимов и понятий для онтологической модели стенокардии

Идентификатор понятия Понятие Синоним понятия Комментарий эксперта Статус понятия/ синонима Дата изменения статуса Эксперт Статус утверждения понятия/ синонима

187 Атеросклероз Просмотрено 15.05.2017 Выборов Утверждено

188 Атеросклеротические бляшки Добавлено 28.05.2017 Выборов Утверждено

189 Атеросклеротическое поражение Добавлено 28.05.2017 Выборов Утверждено

190 АСБ Просмотрено 28.05.2017 Выборов Утверждено

191 Атеросклеротические бляшки Является синонимом вышележащего Удалено 28.05.2017 Выборов Утверждено

понятия

Таким образом, из текста КР были выделены 336 корневых понятий и 144 синонима к ним. Выделенные понятия вносились в программу MS Excel, где была сделана разметка номенклатуры, состоящая из трёх атрибутов:

1. идентификатор понятия;

2. понятие;

3. синоним понятия.

Полученный файл был использован для дальнейшей проработки номенклатуры совместно с экспертами-кардиологами.

Для этого файл был размещён в облачном сервисе MS Excel Online, чтобы обеспечить параллельный доступ к редактированию необходимых значений номенклатуры экспертами и избежать необходимости сведения нескольких файлов в один, если бы редактирование осуществлялось каждым экспертом в офлайн режиме.

Изменения претерпела и структура номенклатуры. Для обеспечения контроля за изменениями тех или иных пунктов, были введены дополнительные атрибуты, после чего структура номенклатуры приобрела следующий вид:

1. идентификатор понятия;

2. понятие;

3. синоним понятия;

4. комментарий эксперта;

5. статус понятия/синонима;

6. дата изменения статуса;

7. эксперт;

8. статус утверждения понятия/синонима.

В колонке «Комментарий эксперта» врачи давали указания для специалиста по извлечению понятий относительно изменения/удаления/добавления понятия или его синонима с объяснением причины. Также в данном поле делалась пометка, если понятие или синоним требовалось рассмотреть на общем собрании, т.к. эксперт сомневался в необходимости включения данного пункта в итоговую номенклатуру. В атрибуте «Статус понятия/синонима» указывалось одно из следующих значений:

1. добавлено - новая позиция в номенклатуре. Добавлена экспертом на основе собственного опыта в необходимости использования данного понятия или синонима в клинической практике;

2. изменено - понятия с данным статусом имели орфографические правки, либо были перемещены из синонимов в корневые понятия и наоборот;

3. просмотрено - эксперт просмотрел данное понятие или синоним и не имеет дополнительных правок и предложений;

4. удалено - эксперт посчитал, что данное понятие или синоним является избыточным в описании онтологии СК. Понятие или синоним относится большей частью к смежной патологии, либо практически не используется в клинической

практике. Также данным статусом маркировались встречавшиеся повторы корневых понятий или синонимов

Дата изменения статуса фиксировалась, чтобы отслеживать временные параметры изменения значения из номенклатуры. В колонке «Эксперт» указывался ответственный специалист, прорабатывавший указанное понятие или синоним. «Статус утверждения понятия/синонима» имел два возможных текстовых значения: «Утверждено», - если понятие прошло кросс-валидацию и включено в конечную версию номенклатуры, и «Не включено» если понятие не было включено в номенклатуру. Для понятий, в отношении которых кросс-валидация не была осуществлена, данное поле оставалось пустым. Пример заполнения номенклатуры представлен в таблице 1.

Результат проработки номенклатуры с экспертами представлен в таблице 2.

Сравнение данных показателей с первичным наполнением номенклатуры показывает, что число коневых понятий, которые вошли в конечную номенклатуру, увеличилось с 336 до 401 (не учитываются 42 удалённых понятия из общего числа в 443 понятия), но гораздо больше увеличилось число синонимов данных понятий: со 144 до 619 (число синонимов без учёта удалённых позиций). Процентные показатели для корневых понятий указывают на то, что первичная проработка КР по извлечению информации в их отношении позволяет создать прочный первичный каркас для разрабатываемой онтологии. Но процентные показатели для синонимов указывают на то, что КР не обладают достаточным объёмом знаний в отношении распространения корневых понятий на возможные варианты написания и наименования. После наполнения

Таблица 2. Количественные показатели результата проработки первичного наполнения номенклатуры понятий экспертами

Параметр Значение % от общего числа

Количество корневых понятий 443 100.0

Из них:

Оставлено без изменения 290 65.5

Изменено 45 10.2

Добавлено 66 14.9

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Удалено 42 9.5

Количество синонимов 665 100.0

Из них:

Оставлено без изменения 122 18.3

Изменено 13 2.0

Добавлено 484 72.8

Удалено 46 6.9

номенклатуры первичной информацией из КР требуется дополнительная проработка полученной информации с помощью экспертов и вовлечения дополнительных литературных источников знаний о СК.

После проработки номенклатуры понятий с экспертами мы приступили к валидации выделенных понятий и их синонимов на основании их сверки в полуавтоматическом режиме с понятиями, использованными в электронных медицинских картах 610 пациентов. Результаты сверки показали, что понятия номенклатуры, означающие инструментальные исследования, на 100% покрывают потребности врачей в описании назначений пациентам; понятия, означающие диагностические признаки, которые выделяют у пациента с помощью дополнительной инструментальной диагностики, совпали на 92%, - несовпадения вызваны большим количеством вариабельных показателей в таких исследованиях, как эхокарди-ография, коронароангиография; понятия, используемые для описания лабораторных исследований совпали на 100%. В части групп назначаемых лекарственных препаратов несовпадений по понятиям номенклатуры и медицинских карт не выявлено. Таком образом, разработанная номенклатура, с учётом доработки по несовпадающим показателям диагностических исследований на 100% соответствовала понятиям, использованным врачами в электронных медицинских картах пациентов. Данный факт позволяет сделать заключение о семантической полноте разработанной номенклатуры и возможности её использования в качестве источника наполнения онтологии СК.

ЗАКЛЮЧЕНИЕ

Увеличивающееся количество случаев заболеваемости ишемической болезнью сердца и стенокардией заставляет искать пути более эффективного использования врачебных ресурсов. Одним из таких путей является разработка специализированных систем поддержки принятия врачебных решений. В последнее время особое внимание уделяется СППВР, которые оперируют онтологиями выбранных клинических областей. Для создания такой онтологии необходимо предусмотреть возможность семантической интероперабельности понятий, которые наполняют онтологию и используются в модулях объяснения врачу предлагаемых решений.

Семантическая интероперабельность возможна, благодаря разработке специализированной номенклатуры понятий о СК с учётом синонимов выделенных понятий.

В качестве первичного источника наполнения номенклатуры понятий возможно использование федеральных клинических рекомендаций по стабильной ишемической болезни сердца, т.к. КР являются наиболее полным официальным руководством о данной патологии.

Первичная проработка КР позволила создать номенклатуру из 336 корневых понятий и 144 синонима. Однако, дальнейшая проработка данного перечня с экспертами-кардиологами позволила дополнительно выделить 66 корневых понятий и существенно расширить количество синонимов до 619.

Это указывает на то, что даже такой источник информации о СК, как федеральные клинические рекомендации, не обладает всеобъемлющим охватом знаний по заданной патологии. КР хорошо показали себя в качестве источника знаний для первичного наполнения номенклатуры понятий. Но то, что получается при первичной проработке вопроса, нельзя сразу использовать в качестве наполнения каркаса онтологии СК, выделенные понятия требуют всесторонней проработки со-

вместно с экспертами и привлечением дополнительных источников литературных знаний о данной патологии.

Валидация разработанной номенклатуры позволила понять, что расхождения в понятиях, использованных врачами в электронных медицинских картах незначительны и касаются только вариабельных параметров некоторых диагностических исследований. После доработки номенклатура соответствовала использованным врачами понятиям на 100%, что позволило использовать её для разработки онтологической модели стенокардии.

Особо стоит отметить важность полученного результата для врачебного сообщества как в практическом применении, так и в научном. Синонимия является серьёзной проблемой при описании клинической информации. Врачи могут использовать различную терминологию при формировании диагностических заключений, медицинских рекомендаций, интерпретации тех или иных клинических показателей, использовать более или менее общеупотребимые сокращения терминов, вводить неологизмы. Возникающая словесная путаница может ввести в заблуждение врачей смежных специальностей, экспертов оценки качества оказываемой медицинской помощи, разработчиков информационных медицинских систем, которые отвечают в том числе за отображение на экранных формах информации в привычном для врача виде. Создание номенклатур понятий предметной области с учётом возможных вариаций названий выделенных понятий позволяет решить проблему синонимии и существенно снизить случаи неправильной трактовки терминов врачами и другими специалистами с разными уровнями подготовки. Кроме этого, номенклатура понятий, положенная в основу СППВР, позволит системе поддержки врачебных решений функционировать с учётом возможных вариаций в использовании понятий при выполнении врачом работы по формированию диагностических гипотез, назначений дополнительных исследований и лечения и т.д. Это делает возможными перспективы полностью автоматического анализа данных электронных медицинских карт, помощи врачу при ведении электронной медицинской документации, а также поиску новых скрытых взаимосвязей между различными клиническими явлениями, которые в том числе могли ускользать от внимания исследователей, что описывались сходными словами, для которых не были выявлены синонимичные связи. Продемонстрированный в настоящей работе результат полного соответствия разработанной номенклатуры понятиям, использованным в тестовых электронных медицинских картах, подтверждает, что подобное решение проблемы синонимии, позволяющее врачам продолжать оперировать привычными для них терминами, имеет под собой достаточные основания и может быть расширено на создание номенклатур понятий других областей клинических знаний.

ВЫВОДЫ

1. В качестве основного источника знаний о СК возможно использование федеральных клинических рекомендаций о стабильной ишемической болезни сердца. Данный источник является официальным изданием Министерства здравоохранения, отвечающим требованиям по наполнению и учитывающим решение проблемы синонимов.

2. Проработка клинических рекомендаций позволила выделить 336 корневых понятий и 144 синонима, что позволило создать основу разрабатываемой номенклатуры и начать совместную доработку перечня понятий с экспертами.

3. Проработка первичной номенклатуры с экспертами позволила существенно расширить количество синонимов корневых понятий, а процентное соотношение количества первично выделенных позиций номенклатуры и добавленных экспертами показало, что клинические рекомендации обладают достаточным набором сведений о СК для создания каркаса разрабатываемой онтологии в части корневых понятий, но при этом крайне малым количеством информации относительно их синонимов.

4. Полученная номенклатура, основанная на извлечении понятий из федеральных клинических рекомендаций с учётом доработки экспертами и дополнительными изменениями после валидации с использованием электронных медицинских карт пациентов, может быть использована для наполнения онтологии стенокардии и последующего использования в системе поддержки принятия врачебных решений.

СПИСОК ЛИТЕРАТУРЫ

1. Федеральная служба государственной статистики. Российский статистический ежегодник [Интернет]. 2017 [Дата обращения 31 марта 2018 г.]. Доступно на: http://www.gks. ru/bgd/regl/b17_13/IssWWW.exe/Stg/08-12-23.doc / Federal statistics service. Russian statistical yearbook [Internet]. 2017 [cited 2018 Mar 31]. Available from: http://www.gks.ru/bgd/ regl/b17_13/IssWWW.exe/Stg/08-12-23.doc. [In Russian]

2. Гусев А.В, Зарубина Т.В. Поддержка принятия врачебных решений в медицинских информационных системах медицинской организации. Врач и информационные технологии. 2017 г.;2:60-72. / Gusev A.V., Zarubina T.V. Clinical decision support in medical information systems. Physician and information technologies. 2017;2:60-72. [In Russian]

3. Shen Y, Yuan K, Chen D, Colloc J, Yang M, Li Y, Lei K. An ontology-driven clinical decision support system (IDDAP) for infectious disease diagnosis and antibiotic prescription. Artif Intell Med. 2018 г.;86:20-32.

4. Министерство Здравоохранения Российской Федерации. Стабильная ишемическая болезнь сердца: Клинические рекомендации [Интернет]. 2016 [дата обращения 3 апреля 2018 г.]. Доступно на: http://cr.rosminzdrav.ru/#!/ recomend/133 / Ministry of health of Russian Federation/ Stable coronary heart disease: clinical guidelines [Internet]. 2016 [cited2018 Apr3]. Available from: http://cr.rosminzdrav. ru/#!/recomend/133. [In Russian]

5. Стожок ЕВ. Термин, понятие и значение. Омский научный вестник. [Интернет]. 2011 г. [дата обращения 3 апрель 2018 г.];(95). Доступно на: https://cyberleninka.ru/ article/n/termin-ponyatie-i-znachenie / Stozhok EV. Concept, semantics and meaning. ONV [Internet]. 2011 [cited 2018 Apr 3];(95). Available from: https://cyberleninka.ru/article/n/ termin-ponyatie-i-znachenie. [In Russian]

Принята к публикации: 27.07.2018 г.

Kiselev K.V.1, Potekhina A.V.2, Osyaeva M.K.2, Noeva E.A.2, Vyborov O.N.2, Zorin A.V.2, Shvyrev S.L.1, Martynyuk T.V.2, Zarubina T.V.1, Chazova I.Ye.2

DEVELOPMENT OF CONCEPTS NOMENCLATURE FOR CLINICAL DECISION SUPPORT SYSTEM IN DIAGNOSTICS OF ANGINA PECTORIS

1Pirogov Russian National Research Medical University, 2Russian Cardiology Research and Production Complex, Moscow, 121552, Russian Federation

SUMMARY

Introduction. Since 2000th CHD morbidity in Russia is growing constantly, especially, angina pectoris morbidity. Increasing workload on physicians due to high number of patients makes us find the ways to optimize human resource applying. One of the possible ways is development of clinical decision support systems, particularly, ontology-based systems. These ontologies must adopt semantic interoperability for the concepts included, to be clearly interpreted by physicians of different medical schools.

Research target. Develop the concepts nomenclature for building of angina pectoris ontology.

Methods. For primary concepts extraction we used state clinical recommendations "Stable coronary heart disease" issued in 2016. Development and filling of the nomenclature were performed in MS Excel and MS Excel Online. The work through the primarily extracted concepts was performed with expert-cardiologists by cross-validation method and common voting on final inclusion of the concept in the nomenclature. The final nomenclature validation was performed by semi-automatic method on anonymized 610 electronic health records of the patients.

Results. After primary extraction of the concepts without experts, we could extract 336 basic concepts and 144 synonyms, keeping in mind the aspects of this nomenclature development.

The shared work through this nomenclature with the expert-cardiologists let us increase the number of the basic concepts up to 409 and the number of the synonyms up to 619. The nomenclature validation on electronic health records showed compliance of the concepts in aspects of diagnostics methods and medicine prescriptions and 92% compliance in diagnostic signs, which doctors evaluate in diagnostics results. Percentages of primarily extracted concepts in draft nomenclature and after being worked through by the experts and also validation results based on electronic health records, let us make a conclusion that clinical recommendations can be used as a basic data source for concepts extraction, but the draft result must be evaluated by the experts and also filled up with the usage of additional knowledge sources about angina pectoris, and after that the nomenclature can be used for angina pectoris ontology development.

Conclusion. The usage of clinical recommendations is proved to be the basic data source for concepts of subject area extraction. However, the draft nomenclature must be evaluated and filled up with additional synonyms and validated on electronic health records. After that, the extracted concepts and their synonyms can be used for ontology development.

Keywords: angina, clinical decision support systems, CDSS, ontology, clinical guidelines.

И kirillkiselev@pm.me

For citation: Киселев К.В., Потехина А.В., Осяева М.К., Ноева Е.А., Выборов О.Н., Зорин А.В., Швырев С.Л., Мартынюк Т.В., Зарубина Т.В., Чазова И.Е. Разработка номенклатуры понятий для системы поддержки принятия врачебных решений в области диагностики стенокардии I-IV функциональных классов. Евразийский кардиологический журнал. 2018, Сентябрь 20; 3:14-19 [Trans. into Eng. ed.: Kiselev K.V., Potekhina A.V., Osyaeva M.K., Noeva E.A., Vyborov O.N., Zorin A.V., Shvyrev S.L., Martynyuk T.V., Zarubina T.V., Chazova I.Ye. Development of concepts nomenclature for clinical decision support system in diagnostics of angina pectoris. Eurasian cardiological journal. 2018, September 20; 3:20-24]

Information about authors:

Alexandra Potekhina Ph. D., Junior researcher of the Department of pulmonary hypertension and heart diseases of the Russian Cardiology Research and Production Complex

Maria Osyaeva laboratory researcher of the Department of pulmonary hypertension and heart diseases of the Russian Cardiology Research and Production Complex

Elena Noeva Ph. D., senior researcher of the Department of pulmonary hypertension and heart diseases of the Russian Cardiology Research and Production Complex

Oleg Vyborov Ph. D., researcher of the Department of pulmonary hypertension and heart diseases of the Russian Cardiology Research and Production Complex

Andrey Zorin Ph. D., researcher of the Department of pulmonary hypertension and heart diseases of the Russian Cardiology Research and Production Complex

Sergey Shvyrev Ph. D., associate professor of medical cybernetics and informatics department of the Pirogov Russian National Research Medical University

Tamila Martynyuk MD, head of the Department of pulmonary hypertension and heart diseases of the Russian Cardiology Research and Production Complex

Irina Chazova academician of Russian Academy of Sciences, M.D., professor, director of Russian Cardiology Research and Production Complex, 3rd Cherepkovskaya st., 15a, Moscow, 121552, Russian Federation

Tatiana Zarubina M.D., professor, deputy director on health informatics of Federal research institute for health organization and informatics of ministry of health of Russian Federation, head of the Department of medical Cybernetics and Informatics of the Pirogov Russian National Research Medical University

Corresponding author: Kirill Kiselev Ph. D. student of the Department of medical Cybernetics and Informatics of the Pirogov Russian National Research Medical University, tel.+7-964-515-68-86; e-mail: kirillkiselev@pm.me, Ostrovityanova st., 1, Moscow, 117997, Russian Federation

Abbreviations

CSD - circulatory system diseases CHD - coronary heart disease CG - clinical guidelines AP - angina pectoris

Definitions

Knowledge base - information object containing medical data and its interpretation

Validation - act of model data compliance approve with real-world data

Ontology - formalized description of subject area, containing information about formalized concepts connections

Production model - set of conditional transitions "if-then", which let to make transitions from one medical concept to another when making diagnostics and explaining diagnostic and treatment procedures appointment

CDSS - computer programs used by doctors to get advice when making clinical decisions

INTRODUCTION

In the structure of morbidity of the Russian population, the share of diseases of the circulatory system (CSD) has been growing steadily since 2000 and in 2016 amounted to 4 649 thousand number of people or 31.7 per 1000 population [1]. One of the main diseases in the structure of CSD is coronary heart disease (CHD), including angina pectoris (AP). The increasing number of patients from year to year means a growing burden on therapists and cardiologists who are directly involved in AP diagnosis and treatment, which can lead to a decrease in the total amount of time

spent on one patient and a drop in the quality of care. One way to improve this situation is to use clinical decision support systems (CDSS), which are designed to advise the doctor and are designed to facilitate the diagnosis and treatment of a given pathology [2].

As a knowledge base of the CDSS, on the basis of which the program offers the doctor possible solutions, in recent years have increasingly been used not simple production models, but ontology of selected clinical area. In particular, a group of scientists confirmed the effectiveness of this approach to build a knowledge base of CDSS on the example of the development of such a system for the diagnosis and antibiotic therapy of infectious diseases [3].

In the context of high AP morbidity and modern approaches to support clinical decision-making, we have set a goal to develop a CDSS for the diagnosis and treatment of angina based on AP ontology. But, in order to ensure the semantic interoperability of the developed ontology, it was necessary to carry out work on the primary content of the ontological model and taking into account the possible options for naming those concepts that are key to it. In this regard, we have set the following goals and objectives.

GOALS AND OBJECTIVES

Goal: to develop a nomenclature of concepts for building an ontological model of angina

Objectives:

1. Identify the main source of knowledge about the AP for the primary allocation of concepts.

2. To make an initial selection of concepts taking into account possible synonyms.

3. Clarify the resulting nomenclature with the help of experts.

4. To draw a conclusion about the possibility of using the resulting nomenclature as the basis for filling the ontology of angina.

MATERIAL AND METHODS

As the main source of knowledge about AP, we used the Federal clinical guidelines (CG)" Stable coronary heart disease " from 2016 [4]. As a definition of "concept" the following was used: it is a set of features that are all together sufficient and each separately necessary to separate this class of objects from the other [5]. on this definition the rules of the concept separation from the CG were based.

The concepts extraction and maintenance of the nomenclature were carried out using the program MS Excel and MS Excel Online. The team of experts-cardiologists, with the help of which the specification of the nomenclature was carried out, included 6 people representing the Russian cardiology research and production center. The method of verification and addition of the primary concepts by the experts was to assign to a specific expert a set of values from the primary nomenclature, which the expert checked and supplemented with the options of names, if necessary. At general meetings, individual work was checked by cross-validation, after which the final decision was made to introduce the concept and its synonyms into the developed nomenclature by general voting. If it was necessary to add new concepts to the nomenclature, which were not selected initially, experts made a corresponding proposal with options for the names of the concepts, followed by a standard procedure of cross-validation and decision on the inclusion of a new item in the nomenclature.

To check the validity of the nomenclature and to make a decision on the possibility of its use as a source of filling the AP ontology in semi-automatic mode, the authors compared the selected concepts and synonyms with the concepts used in the description of clinical cases of 610 patients treated in the second medical Department of the Russian Cardiology Research and Production Complex in 2017. Electronic health records were depersonalized and translated into MS Word format for further processing. The patient model for the selection of medical records included:

• Gender - male and female

• Age - from 35 years

• ICD code of the underlying disease - I20.8, I20.9, 20.1

• The group of comorbidities included: type 2 diabetes, hypertension, myocardial infarction.

RESULTS

After analyzing the possibility of using different types of literature as primary content: textbooks, monographs, articles, data ofelectronic health records of patients, - we, realizing that the choice should be determined not only by semantic completeness, but also considering synonymy, chose the Federal clinical recommendations for stable coronary heart disease from 2016. In this case, semantic completeness should be provided by the requirements for the content of the CG (Annex to the letter to the chief specialists from the first Deputy Minister of health of the Russian Federation №17-4/10/1-4939 from 1 September 2016). And the solution to the problem of synonymy is the elaboration of the concepts used in the text of the CG by the community of authors-developers of clinical guidelines, which are experts of the Russian cardiological society, the National society for the study of atherosclerosis and the National society for atherothrombosis. Thus, the CG is currently the most "legitimate" source of information for filling the nomenclature of concepts and development of AP ontology, despite the fact that the nature of their use by doctors in clinical practice remains recommendatory and informational.

Clinical guidelines for stable angina contain both sections aimed at reporting general information about the disease (etiology, risk

factors, pathogenesis), and sections that determine diagnostic measures and therapeutic purposes. In connection with this feature of filling the CG, we had to develop a system of rules by which a particular concept falls into the range. Considering the definition of "concept", as well as the development of ontology, we have adopted the following principles:

1. The nomenclature includes only concepts related to the clinical component of the AP description and are not related to the description of auxiliary and administrative reporting aspects. For example," myocardial infarction"," hypercholesterolemia"," coronary angiography " - are included in the nomenclature. "ICD 10", "Diagnostics", "level of persuasiveness of recommendations" -are not included in the nomenclature;

2. The nomenclature includes the concepts from the sections of the CG describing instrumental diagnostics, laboratory diagnostics and treatment. Moreover, the names of drugs are not allocated to the nomenclature, but only the names of groups of these drugs. The restriction on the sections is determined by the scope of the CDSS - support for decision-making of the clinician at the stage of clarifying the primary diagnostic hypothesis using additional methods of instrumental and laboratory diagnosis, as well as the appointment of treatment. It means that the sections describing complaints, pathogenesis, etiology, risk factors, physical examination were not worked out at the primary stages of the concept identification;

3. The concepts are distinguished on the principles of the absence of background knowledge in cardiology: if a specialist who distinguishes concepts knows about synonyms for this concept from other sources of information, he does not include them in the nomenclature. The nomenclature gets only the information, the source of which are the CG;

4. On the basis of the previous paragraph, another rule was formulated: if there is no explicit indication in the text of the CG that the next concept is synonymous with an already selected concept, then this concept is included in the nomenclature as a separate one;

5. As synonyms of the concepts are considered not only linguistic synonyms, for example, "angina pectoris" and "thoracic toad", but also the generally accepted versions of the concepts, for example: "coronary heart disease" and "CHD". In this case, the full name without abbreviations was used as the basic concept, and all abbreviations were considered synonyms.

Thus, from the text CG has been extracted 336 root concepts and 144 synonymous to them. Highlighted concepts were made in MS Excel, where was made a markup item, which consists of three attributes:

1. Concept ID

2. Concept

3. Concept synonym

The resulting file was used for further development of the nomenclature in cooperation with experts-cardiologists.

To do this, the file was placed in the cloud service MS Excel Online, to provide parallel access to the editing of the required values of the nomenclature of experts and avoid the need for information merge of several files in one, if the editing was carried out by each expert in offline mode.

The structure of the nomenclature has also undergone changes. To ensure control over the changes of certain items, additional attributes were introduced, after which the structure of the nomenclature acquired the following form:

1. Concept ID

2. Concept

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Concept synonym

Table 1. Example of filling in the nomenclature of synonyms and concepts for the ontological model of angina

Concept ID Concept Concept synonym Expert commentary Concept/ synonym status Status date change Expert name Concept/ synonym approved mark

187 Atherosclerosis Reviewed 15.05.2017 Vyborov Approved

188 Atherosclerotic plaque Added 28.05.2017 Vyborov Approved

189 Atherosclerotic lesion Added 28.05.2017 Vyborov Approved

190 AThP Reviewed 28.05.2017 Vyborov Approved

191 Atherosclerotic plaque Synonym of previous root concept Deleted 28.05.2017 Vyborov Not approved

4. Expert commentary

5. Concept/synonym status

6. Status date change

7. Expert name

8. Concept/synonym approved mark

In the "Expert commentary" column, doctors provided guidance to the expert on the extraction of concepts regarding the modification/deletion/addition of a concept or its synonym with an explanation of the reason. Also, in this field was made a note if the concept or synonym was required to consider at the general meeting, because the expert doubted the need to include this item in the final nomenclature. The "concept/synonym status" attribute specified one of the following values:

1. Added - new item in the nomenclature. Added by an expert based on his own experience in the need to use this concept or synonym in clinical practice;

2. Changed - the concept with the given status had spelling changes, or has been moved from its synonyms in the root of the concept and vice versa;

3. Reviewed - the expert has reviewed this concept or synonym and has no additional edits or suggestions;

4. Deleted - the expert considered that this concept or synonym is redundant in the description of the AP ontology. The concept or synonym refers mostly to related pathology, or is not used in clinical practice. Also, this status was marked by duplicates of root concepts or synonyms

Date of the status change is recorded to keep track of time when nomenclature items were changed. In the column "Expert name" mentioned executive specialist, who worked out this concept or synonym. "Concept/synonym approved mark" had two possible text values: "Approved" if the concept was cross - validated and included in the final version of the nomenclature, and "Not approved" if the concept was not included in the final nomenclature. For concepts for which cross-validation was not performed, this field was left blank. An example of filling the nomenclature is presented in Table 1.

The summary of nomenclature working out with the experts is shown in the Table 2.

Comparison of these indicators with the primary content of the nomenclature shows that the number of root concepts that were included in the final nomenclature increased from 336 to 401 (42 deleted concepts are not considered from the total number in 443 concepts), but the number of synonyms of these concepts increased much more: from 144 to 619 (the number of synonyms without deleted positions). The percentages for root concepts indicate that the primary work of the CG to extract information on them allows to build a solid primary framework for the ontology being developed. But the percentage of synonyms indicates that CG do not possess sufficient knowledge concerning the distribution

of the root concepts of the possible spellings, and names. After filling in the nomenclature with primary information from the CG, additional study of the information obtained with the help of experts and involvement of additional literary sources of knowledge about the AP is required.

After working through the nomenclature of concepts with experts, we started to validate the selected concepts and their synonyms on the basis of their verification in semi-automatic mode with the concepts used in the electronic health records of 610 patients. The results of the verification showed that the nomenclature concepts, meaning instrumental studies, 100% cover the needs of doctors in the description of appointments to patients; the concepts of diagnostic signs that are isolated from the patient by means of additional instrumental diagnostics have coincided by 92% - the discrepancies are caused by a large number of variable indicators in such studies as echocardiography, coronary angiography; the concepts used to describe laboratory studies have coincided by 100%. No discrepancies in the concepts of nomenclature and medical records were found in the groups of prescribed drugs. Thus, the developed nomenclature, considering the refinement of the mismatched indicators of diagnostic studies, 100% corresponded to the concepts used by doctors in the electronic health records of patients. This fact allows us to make a conclusion about the semantic completeness of the developed nomenclature and the possibility of its use as a source of content of the AP ontology.

SUMMARY

The increasing number of cases of coronary heart disease and angina makes us look for ways to use medical resources more effectively. One such way is to develop specialized systems to

Table 2. Quantitative indicators of the result of working out the primary filling of the nomenclature of concepts by experts

Parameter Value % of all

Root concepts 443 100.0

In particular:

Unchanged 290 65.5

Changed 45 10.2

Added 66 14.9

Deleted 42 9.5

Synonyms 665 100.0

In particular:

Unchanged 122 18.3

Changed 13 2.0

Added 484 72.8

Deleted 46 6.9

support clinical decision-making. Recently, special attention has been paid to CDSS, which operate on ontologies of selected clinical areas. To create such an ontology, it is necessary to provide the possibility of semantic interoperability of concepts that fill the ontology and are used in the modules of explaining the proposed solutions to the doctor.

Semantic interoperability is possible due to the development of a specialized nomenclature of concepts about AP considering the synonyms of the selected concepts.

As a primary source of filling the nomenclature of concepts, it is possible to use federal clinical guidelines for stable coronary heart disease, as the CG is the most complete official guide about this pathology.

Primary work out of CG has allowed to create the nomenclature with 336 root concepts and 144 synonyms. However, further elaboration of this list with experts-cardiologists allowed to identify 66 additional root concepts and significantly expand the number of synonyms to 619.

This indicates that even a source of information about the AP, such as federal clinical guidelines, does not have a comprehensive coverage of knowledge on a given pathology. The CG has proved to be a good source of knowledge for the primary filling of the nomenclature of concepts. But what is obtained in the initial study of the issue, cannot be immediately used as the filling of the framework of the ontology of the AP, the selected concepts require comprehensive study in joint with the experts and the involvement of additional sources of literary knowledge about this pathology.

The validation of the developed nomenclature made it possible to understand that the differences in the concepts used by doctors in electronic health records are insignificant and relate only to the variable parameters of some diagnostic procedures. After completion of the nomenclature, it corresponded to the concepts used by doctors by 100%, which allowed to use it to develop an ontological model of angina.

It is particularly worth noting the importance of the result for the medical community both in practical application and in scientific way. Synonymy is a significant problem in the description of clinical information. Doctors can use different terminology in the formation of diagnostic conclusions, medical recommendations, interpretation of certain clinical indicators, use more or less commonly used abbreviations of terms, introduce neologisms.

Emerging verbal confusion may mislead doctors with allied specialties, experts who assess the quality of care, developers of health information systems who must provide medical information for the doctors in proper way. The creation of nomenclatures of concepts of the subject area considering the possible variations of the names of the selected concepts allows to solve the problem of synonymy and significantly reduce the cases of misinterpretation of terms by doctors and other specialists with different levels of training. In addition, the nomenclature of concepts, which is the basis of the CDSS, will allow the clinical decision support systems to function considering possible variations in the use of concepts in the performance of the doctor's work on the formation of diagnostic hypotheses, appointments of additional diagnostics and treatment, etc. This makes possible the prospects of fully automatic analysis of data from electronic health records, medical assistance in the management of electronic health records, as well as the search for new hidden relationships between different clinical phenomena, which could escape the attention of researchers, which were described in similar words, for which synonymous connections were not identified. The result of full compliance of the developed nomenclature with the concepts used in the test electronic health

records, demonstrated in this work, confirms that such a solution to the problem of synonymy, allowing doctors to continue to operate with the terms familiar to them, has sufficient grounds and can be expanded to create nomenclatures of concepts in other areas of clinical knowledge.

CONCLUSIONS

1. As the main source of knowledge about AP, it is possible to use federal clinical guidelines on stable coronary heart disease. This source is an official publication of the Ministry of health, meeting the requirements for filling and considering the solution of the problem of synonyms;

2. The study of clinical guidelines allowed to identify 336 root concepts and 144 synonyms, which allowed to create the basis of the developed nomenclature and to begin joint revision of the list of concepts with experts;

3. The study of the primary nomenclature with experts allowed to significantly expand the number of synonyms of root concepts, and the percentage ratio of the number of primary items of the nomenclature and added by experts showed that clinical guidelines have a sufficient set of information about the AP to create a framework of the developed ontology in terms of root concepts;

4. The resulting nomenclature, based on the extraction of concepts from the federal clinical guidelines, concerning the revision by experts and additional changes after validation using electronic health records of patients, can be used to fill the ontology of angina and subsequent use in the clinical decision support systems.

REFERENCES

1. Federal statistics service. Russian statistical yearbook [Internet]. 2017 [cited 2018 Mar 31]. Available from: http:// www.gks.ru/bgd/regl/b17_13/IssWWW.exe/Stg/08-12-23. doc. [In Russian]

2. GusevA.V., Zarubina T.V. Clinical decision support in medical information systems. Physician and information technologies. 2017;2:60-72. [In Russian]

3. Shen Y, Yuan K, Chen D, Colloc J, Yang M, Li Y, Lei K. An ontology-driven clinical decision support system (IDDAP) for infectious disease diagnosis and antibiotic prescription. Artif Intell Med. 2018 r.;86:20-32.

4. Ministry of health of Russian Federation/ Stable coronary heart disease: clinical guidelines [Internet]. 2016 [cited 2018 Apr 3]. Available from: http://cr.rosminzdrav.ru/#!/recomend/133. [In Russian]

5. Stozhok EV. Concept, semantics and meaning. ONV[Internet]. 2011 [cited 2018 Apr 3];(95). Available from: https:// cyberleninka.ru/article/n/termin-ponyatie-i-znachenie. [In Russian]

Accepted for publication: 27.07.2018

i Надоели баннеры? Вы всегда можете отключить рекламу.