Научная статья на тему 'Создание онтологий в медицине с использованием программы protege'

Создание онтологий в медицине с использованием программы protege Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
873
132
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ / БАЗА ЗНАНИЙ / ОНТОЛОГИЧЕСКАЯ МОДЕЛЬ / PROTéGé

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Берестнева Ольга Григорьевна, Жаркова Оксана Станиславовна, Маклакова Таисия Глебовна, Шухарев Сергей Олегович

Основным побудительным мотивом работы по внедрению компьютерных технологий в систему здравоохранения является высокая общественная значимость улучшения ситуации в этой сфере, включая повышение качества и скорости лечения, снижение затрат на предоставление услуг и приобретение эффективных средств обеспечения соответствия нормативным документам и прочим требованиям. Медицинские информационные технологии приобретают все большую актуальность, а программное обеспечение для медицины становится все более востребованным. Актуальность данной работы состоит в том, что разработанная онтология будет использована для создания базы знаний системы научных исследований психогенных форм бронхиальной астмы, разрабатываемой коллективом сотрудников ТПУ и СибГМУ в рамках проекта Российского фонда фундаментальных исследований. Отличительной особенностью данной системы является то, что она будет содержать в себе не только данные о признаках и формах бронхиальной астмы, но и медицинский справочник.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Берестнева Ольга Григорьевна, Жаркова Оксана Станиславовна, Маклакова Таисия Глебовна, Шухарев Сергей Олегович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The main incentive motive of work on implementation of computer technologies in a health care system is the high public importance of improvement of a situation in this sphere, including improvement of quality and speeds of treatment, cost reduction on provision of services and acquisition of effective remedies of ensuring compliance to regulating documents and other requirements. Medical information technologies acquire all big relevance, and the software for medicine becomes all more demanded. Relevance of this work consists that the developed ontology will be used creations of the knowledge base of system of scientific researches of psychogenic forms of the bronchial asthma developed by group of employees of Tomsk Polytechnic University and Siberian State Medical University within the project of the Russian fund of basic researches. Distinctive feature of this system is what it will comprise not only data on signs and forms of bronchial asthma, but the medical reference book.

Текст научной работы на тему «Создание онтологий в медицине с использованием программы protege»

УДК 519.711.2

СОЗДАНИЕ ОНТОЛОГИЙ В МЕДИЦИНЕ С ИСПОЛЬЗОВАНИЕМ ПРОГРАММЫ PROTEGE Берестнева Ольга Григорьевна

Д.т.н., профессор, e-mail: ogb@tpu.ru Жаркова Оксана Станиславовна Научный сотрудник, e-mail: osz@tpu.ru Маклакова Таисия Глебовна

аспирант, mclakova.t@gmail.com Шухарев Сергей Олегович

студент, e-mail: shukharev.sergey@m ail.ru Национальный исследовательский Томский политехнический университет, 634050 г. Томск, ул. Ленина 30

Аннотация. Основным побудительным мотивом работы по внедрению компьютерных технологий в систему здравоохранения является высокая общественная значимость улучшения ситуации в этой сфере, включая повышение качества и скорости лечения, снижение затрат на предоставление услуг и приобретение эффективных средств обеспечения соответствия нормативным документам и прочим требованиям. Медицинские информационные технологии приобретают все большую актуальность, а программное обеспечение для медицины становится все более востребованным. Актуальность данной работы состоит в том, что разработанная онтология будет использована для создания базы знаний системы научных исследований психогенных форм бронхиальной астмы, разрабатываемой коллективом сотрудников ТПУ и СибГМУ в рамках проекта Российского фонда фундаментальных исследований. Отличительной особенностью данной системы является то, что она будет содержать в себе не только данные о признаках и формах бронхиальной астмы, но и медицинский справочник.

Ключевые слова: система поддержки принятия решений, база знаний, онтологическая модель, Protégé.

Введение. Медицинские информационные технологии приобретают все большую актуальность, а программное обеспечение для медицины становится все более востребованным. Медицинская информационная система (МИС) - комплексная автоматизированная информационная система, в которой объединены электронные медицинские записи о пациентах, данные медицинских исследований в цифровой форме, данные мониторинга состояния пациента с медицинских приборов, средства общения между сотрудниками, финансовая административная информация, напрямую связанная с медицинской деятельностью. Отличительной особенностью интеллектуальных МИС является наличие базы знаний [2, 5].

База знаний, БЗ (англ. Knowledge base, KB) - это особого рода база данных, разработанная для управления знаниями, т.е. для сбора, хранения, поиска и выдачи знаний. Под базами знаний понимают совокупность фактов и правил, допускающих логический вывод и осмысленную обработку информации [2].

Чаще всего выделяют три стратегии получения знаний [5]:

• приобретение знаний;

• извлечение знаний;

• обнаружение знаний.

Под приобретением знаний (acquisition) понимается способ автоматизированного наполнения базы знаний посредством диалога эксперта и специальной программы. Извлечением знаний (elicitation) называют процедуру взаимодействия инженера по знаниям с источником знаний (экспертом). Термины «обнаружение знаний» (knowledge discovery) и DataMining связывают с созданием компьютерных систем, реализующих методы автоматического обнаружения знаний [5]. В данной работе рассмотрен пример использования стратегии «обнаружение знаний» для построения медицинских баз знаний.

В настоящее время для создания баз знаний все чаще применяются онтологии предметной области [1, 9 - 12, 14, 15].

Онтологии в информатике. Онтология в информатике — это попытка всеобъемлющей и подробной формализации некоторой области знаний с помощью концептуальной схемы. Обычно такая схема состоит из структуры данных, содержащей все релевантные классы объектов, их связи и правила. Понятия в онтологии должны быть близки к объектам (физическим или логическим) и отношениям в интересующей предметной области. Современные онтологии строятся по большей части одинаково, независимо от языка написания [10, 12, 14]. Обычно они состоят из экземпляров, понятий, атрибутов и отношений.

Специализированные (предметно-ориентированные) онтологии — это представление какой-либо области знаний или части реального мира. В такой онтологии содержатся специфические для этой области значения терминов [1, 9, 10, 12, 14]. Общие онтологии используются для представления понятий общих для большого числа областей. Такие онтологии содержат базовый набор терминов, глоссарий или тезаурус, используемый для описания терминов предметных областей.

Под языком описания онтологий — понимают формальный язык, используемый для кодирования онтологии. Существует несколько подобных языков [6]:

• OWL — Web Ontology Language

KIF (Knowledge Interchange Format — формат обмена знаниями)

• Common Logic (CL) — преемник KIF (стандартизован — ISO/IEC 24707:2007).

CycL — онтологический язык, использующийся в проекте Cyc. Основан на

исчислении предикатов с некоторыми расширениями более высокого порядка.

• DAML+OIL (FIPA).

Для работы с языками онтологий существует несколько видов технологий: редакторы онтологий (для создания онтологий), СУБД онтологий (для хранения и обращения к онтологии) и хранилища онтологий (для работы с несколькими онтологиями).

Основные редакторы онтологий: Ontolingua; Protege; DOE; OntoEdit; OilEd; WebOnto; ODE, WebODE. В последнее время количество общедоступных редакторов онтологий превышает lOO, которые, однако, не являются универсальными.

Aвторами был выбран редактор Protege, поскольку с момента его создания он чаще всего использовался экспертами различных предметных областей [7 - 11], в том числе, и для концептуального моделирования в области медицины. Protege - это свободно распространяемая Java-программа, предназначенная для построения (создания, редактирования и просмотра) онтологий той или иной прикладной области. Она включает редактор онтологий, позволяющий проектировать онтологии, разворачивая иерархическую структуру абстрактных и конкретных классов и слотов. На основе сформированной онтологии Protege позволяет генерировать формы получения знаний для введения экземпляров классов и подклассов. Кроме того, данный инструмент поддерживает использование языка OWL и позволяет генерировать HTML-документы, что дает возможность адаптировать его и для редактирования моделей предметных областей, представленных не в OWL, а в других форматах (UML, XML, SHOE, DAML+OIL, RDF/RDFS и т.п.). Практическая разработка онтологии включает: определение классов в онтологии; расположение классов в таксономическую иерархии; определение слотов и описание их допустимых значений; создание экземпляров - заполнение слотов значениями

[4, 6].

Построение онтологии психогенных форм бронхиальной астмы. В качестве примера рассмотрим построение онтологии форм бронхиальной астмы ^A). Объектом исследования являются физиологические, психофизиологические и личностные особенности пациентов с различными формами бронхиальной астмы, подробно описанные в [3]. Группу, условно названную психогенно индуцированная БA (BAPI), составили лица, у которых ведущий элемент болезни, первый приступ удушья развился после перенесенного эмоционального стресса, психотравмирующего жизненного события. Дальнейшее резкое ухудшение течения болезни было связано с психологическими проблемами негативного характера. Во вторую группу больных с БA непсихогенной (BANP) вошли лица с "классической" БA, преимущественно с атопической формой заболевания, у которых в начале болезни наблюдались различные проявления атопии (риниты, конъюнктивиты, кожные высыпания). К обострению болезни приводили чаще аллергия, вирусные инфекции, физические факторы (холодовые, колебания метеоусловий), а не психологические факторы. Третья группа - БA соматопсихогенная (BASP). У представителей BASP «обычное» течение болезни было нарушено жизненным стрессом, после которого психо- эмоциональные триггеры вызывали тяжелые приступы удушья, обострение болезни. Четвертую группу, исходно условно отмеченную как «психогенная одышка» (PO), образовали пациенты, направляемые к пульмонологу для исключения астмы, с жалобами на приступы удушья и одышку, связанные с психотравмирующими жизненными событиями, у которых многочисленными обследованиями была исключена бронхиальная обструкция и другие признаки астмы и органической патологии.

Для построения онтологии БA воспользуемся возможностями редактора Protégé. Пользовательский интерфейс Protege состоит из главного меню и нескольких вкладок для редактирования различных частей базы знаний и ее структуры. Набор и названия вкладок зависят от типа проекта (языка представления) и могут быть настроены вручную. Обычно

имеются следующие основные вкладки: Классы, Слоты (или Свойства для OWL), Экземпляры, Метаданные. Назначение основных вкладок - предоставить набор форм для заполнения базы знаний. Вкладка "Классы" предназначена для создания классов, слотов для данного класса, отображения иерархии классов, добавления текстовых примечаний к классам, поиска класса по шаблону. Вкладка "Слоты" предназначена для создания Функции: создание слотов, назначение домена и диапазона для данного слота, отображение иерархии и свойств слотов, добавление текстовых описаний слотов, поиск слота по шаблону, задание ограничений на значения слота. Вкладка "Экземпляры" предназначена для создания экземпляров класса, отображения и редактирования свойств экземпляра, отображение иерархии классов, связывание экземпляров слотами, добавление текстовых описаний экземпляров, поиск слота по шаблону, задание ограничений на значения слота [6].

Ниже приведены некоторые результаты, полученные с помощью Protégé 4.3 на первом этапе создания онтологии: основные классы (рис. 1); свойства экземпляров классов (рис. 2); онтологический граф (рис. 3).

Class hierarchy: Thing [EBEJE 1

\%\ Г й

Y Thing

Обследуемые

..... BANP

..... BAPI

BASP

PO

Data property hierarchy:

» w

top Data Property ш личностные

- Ш антиципация

■ гн б ко сть_м ышлен и я

■ нон сер ватизм I сти л ь_м ы шлен и я

■ тревожность психофизиологические

- ■вегетативный_баланс ш работоспособность

■■ Шуронень_сгресса ■ физиологические (f—■Ш о6"ьемные_показатели IK- ш показаттель_работы Ш растяжимость

Рис. 1. Вид диалогового окна«Class hierarchy»

Рис. 2. Подсвойства свойств объекта

Рис. 3. Онтологический граф

Полученные результаты были использованы при создании расширенной базы знаний системы поддержки научных исследований психогенных форм бронхиальной астмы.

Заключение. Опыт использования программы Protégé показал, что применение данной технологии является достаточно эффективным инструментом для решения задач построения онтологий в области медицины.

Следует отметить, что разработка онтологии - это всегда итеративный процесс, и не существует единственно правильного способа моделирования предметной области. Лучшее решение почти всегда зависит от предполагаемого приложения и ожидаемых расширений. После того как определена начальная версия онтологии, необходимо оценить и отладить ее (совместно с экспертами предметной области).

Полученную на данном этапе начальную онтологию психогенных форм бронхиальной астмы планируется в дальнейшем исправлять и дополнять, т.е. процесс итеративного проектирования будет продолжаться в течение всего жизненного цикла онтологии.

Исследование выполнено при частичной финансовой поддержке РФФИ в рамках научных проектов № 15-07-08922, № 14-07-00675

СПИСОК ЛИТЕРАТУРЫ

1. Бахвалов С.В., Берестнева О.Г., Марухина О.В. Применение онтологического моделирования в задачах организации учебного процесса вуза // Онтология проектирования. 2015. T. 5. № 418). С. 387-398.

2. Берестнева О.Г., Шаропин К.А., Старикова А.В., Кабанова Л.И. Технология формирования баз знаний в медицинских и информационных системах // Известия Южного федерального университета. Технические науки. 2010. №8 (109). С. 32-37.

3. Берестнева О.Г., Осадчая И.А., Немеров Е.В. Методы исследования структуры медицинских данных // Вестник науки Сибири. 2012. № 1 (2). С. 333-338.

4. Добров Б. В., Иванов В.В., Лукашевич Н.В., Соловьев В.Д. Онтологии и тезаурусы: модели, инструменты, приложения. М.: Бином. Лаборатория знаний. 2009. 173 с.

5. Дюк В., Эмануэль В. Информационные технологии в медико - биологических исследованиях. СПб.: Питер. 2003. 528 с.

6. Онтологии. Система Protege. URL: http://www.studfiles.ru/dir/cat32/subj146/file2888/view3934.html

7. Разин В.В., Тузовский А.Ф. Метод принятия решений на основе анализа ситуаций и семантических технологий // Известия Томского политехнического университета. 2012. Т. 321. №. 5. C. 188-193

8. Разин В.В., Тузовский А.Ф. Представление знаний о времени с учётом неопределённости в онтологиях SemanticWeb // Доклады Томского государственного университета систем управления и радиоэлектроники. 2013. №. 2(28). C. 157-163.

9. Тарасова Л.П., Берестнева О.Г. Разработка онтологической модели для описания различных форм бронхиальной астмы // Молодежь и современные информационные технологии: Сборник трудов XIII Международной научно-практической конференции студентов, аспирантов и молодых учёных: в 2 томах. Национальный исследовательский Томский политехнический университет, Институт кибернетики (ИК); Под редакцией Т. Е. Мамоновой. 2016. С. 268-269.

10. Темникова Е.А., Асламова В.С., Берестнева О.Г. Онтологическое моделирование предметной области учреждения дополнительного профессионального образования // Онтология проектирования. 2015. T. 5. № 418). С. 369-386.

11. Терехин Д.Э., Тузовский А.Ф. Системы ситуационного управления на основе технологий SEMANTIC WEB // Знания - Онтологии - Теории (ЗОНТ-2015) : материалы

Всероссийской конференции с международным участием. В 2-х томах. М :Технотрейд. 2015. Т. 2. C. 151-155.

12. Тузовский А.Ф. Разработка систем управления знаниями на основе единой онтологической базы знаний // Известия Томского политехнического университета. 2007. Т. 310. № 2. С. 182-185.

13. Тузовский А.Ф., Чириков С.В., Ямпольский В.З. Системы управления знаниями (методы и технологии); под общ.ред. В.З. Ямпольского . Ин-т "Кибернет. центр" ТПУ, Отд. проблем информатизации ТНЦ СО РАН. Томск. 2005.

14. Тузовский А.Ф. Метод объединения онтологий предметных областей знаний // Известия Томского политехнического университета. 2006. Т. 309. № 7. С. 138-141.

15. Тузовский А.Ф. Архитектура систем управления знаниями на основе семантических технологий // Современные системы искусственного интеллекта и их приложения в науке: материалы II Всероссийской научной Интернет конференции с международным участием, Казань, 14 Мая 2014. Казань: Сервис виртуальных конференций PaxGrid. 2014. C. 103-107.

UDK 519.711.2

CREATION OF ONTOLOGIES IN MEDICINE WITH USE OF THE PROTEGE PROGRAM

Olga G. Berestneva

Dr., Professor, e-mail: ogb@tpu.ru Oksana S. Zharkova Research Officer, e-mail: osz@tpu.ru

Taisiya G. Maklakova Graduate student, e-mail: ogb@tpu.ru Sergey O. Shukharev Student, e-mail: shukharev.sergey@mail.ru National Research Tomsk Polytechnic University634050 , Tomsk, Lenin St. 30

Abstract. The main incentive motive of work on implementation of computer technologies in a health care system is the high public importance of improvement of a situation in this sphere, including improvement of quality and speeds of treatment, cost reduction on provision of services and acquisition of effective remedies of ensuring compliance to regulating documents and other requirements. Medical information technologies acquire all big relevance, and the software for medicine becomes all more demanded. Relevance of this work consists that the developed ontology will be used creations of the knowledge base of system of scientific researches of psychogenic forms of the bronchial asthma developed by group of employees of Tomsk Polytechnic University and Siberian State Medical University within the project of the Russian fund of basic researches. Distinctive feature of this system is what it will comprise not only data on signs and forms of bronchial asthma, but the medical reference book.

Keywords: system of decision support, knowledgebase, ontology model, Protégé

References

1. Bahvalov S., Berestneva O., Marukhina O. Primenenie ontologicheskogo modelirovaniya v zadachah organizacii uchebnogo processa vuza [The use of ontological modeling in problems of the educational process of high school] // Ontologiya proektirovaniya = Ontology of designing. 2015. V. 5. № 418. Pp. 387-398. (in Russian)

2. Berestneva O., Sharopin K., Starikova A., Kabanov L. Tekhnologiya formirovaniya baz znaniy v medicinskih informatsionnyh sistemah [Technology of formation of bases of knowledge in medical and information systems] // Izvestiya Yuzhnogo federal'nogo universiteta. Tekhnicheskie nauki = Izvestiya SFedU. Engineering Sciences. 2010. №. (8) 109. Pp. 32-37. (in Russian)

3. Berestneva O., Osadchaya I., Nemerow E. Metody issledovaniya struktury medicinskih dannyh [Methods of studying the structure of medical data] // Vestnik nauki Sibiri = Bulletin of Siberian science. 2012. № 1 (2). Pp. 333-338. (in Russian)

4. Dobrov B., Ivanov V., Lukashevich N., Solovyov V. Ontologii I tezaurusy: modeli, instrumenty, prilozheniya [Ontologies and thesauri: models, tools and applications]. M . Bean. Knowledge Laboratory. 2009. 173 p. (in Russian)

5. B. Duke, Emanuel V. Informatsionnye tekhnologii v medico - biologicheskih issledovaniyah [Information technologies in medical - biological research]. SPb . Peter. 2003. 528 p. (in Russian)

6. Ontologies. Protege system.

URL: http://www.studfiles.ru/dir/cat32/subj146/file2888/view3934.html (in Russian)

7. Razin V.V., Tuzovskiy A.F. Metod prinyatiya resheniiy na osnove analiza situatsiy I semanticheskih tekhnologiiy [The method of decision-making based on the analysis of situations and semantic technologies] // Bulletin of Tomsk Polytechnic University. 2012. T. 321. №. 5. Pp. 188-193. (in Russian)

8. Razin V.V., Tuzovskiy A.F. Predstavlenie znaniiy o vremeni s uchetom neopredelennosti v ontologiyah SemanticWeb [Representation of knowledge of time taking into account the uncertainty in ontologies SemanticWeb] // Reports of the Tomsk State University of Control Systems and Radio Electronics. 2013. №. 2(28). Pp. 157-163. (in Russian)

9. Tarasova L.P., Berestneva O.G. Razrabotka ontologicheskoiy modeli dlya opisaniya razlichnyh form bronhialnoiy astmy [Development of the ontological model for describing different forms of asthma] // Youth and modern information technologies: Proceedings of XIII International scientific-practical conference of students, graduate students and young scientists. Tomsk. 2016. Pp. 268-269. (in Russian)

10. Temnikova E., Aslamova V., Berestneva O. Ontologicheskoe modelirovanie predmetnoiy oblasti uchrezhdeniya dopolnitelnogo professionalnogo obrazovaniya [Ontological modeling domain institutions of additional professional education] // Ontologiya proektirovaniya = Ontology of designing. 2015. V. 5. № 418. Pp. 369-386. (in Russian)

11. Terekhin D.E., Tuzovskiiy A.F. Sistemy situacionnogo upravleniya na osnove tekhnologiiy SEMANTIC WEB [Systems of situational management based on Semantic Web technologies] // Knowledge - Ontology - Theory (KONT-2015): materials of All-Russian conference with international participation. In 2 vols. M: TECHNOTRADE. 2015. T. 2. Pp. 151-155. (in Russian)

12. Tuzovskiiy A.F. Razrabotka system upravleniya znaniyami na osnove edinoiy ontologicheskoiy bazy znaniiy [The development of knowledge management systems based on unified ontological knowledge base] // Bulletin of Tomsk Polytechnic University 2007. T. 310. № 2. Pp. 182-185. (in Russian)

13. Tuzovskiiy A.F., Chirikov S.V., Yampolskiiy V.Z Sistemy upravleniya znaniyami (metody I tekhnologii) [Knowledge Management Systems (methods and technologies)]; edited V.Z. Yampolsky; Cybernetic Center of TPU, Tomsk Scientific Center SB RAS. Tomsk.2005. (in Russian)

14. Tuzovskiiy A.F. Metod obedineniya ontologiiy predmetnyh oblasteiy znaniiy [The method of of association the knowledge domain ontologies] // Bulletin of Tomsk Polytechnic University, 2006. T. 309. № 7. Pp. 138-141. (in Russian)

15. Tuzovskiiy A.F. Arkhitektura system upravleniya znaniyami na osnove semanticheskih tekhnologiiy [The architecture of knowledge management systems based on semantic technologies] // Modern system of artificial intelligence and its applications in science: Proceedings of the II All-Russian scientific Internet conference with international participation, Kazan, 14 May 2014. Kazan: Service of virtual conferences PaxGrid. 2014. Pp. 103-107. (in Russian)

i Надоели баннеры? Вы всегда можете отключить рекламу.