Научная статья на тему 'Применение теоретико-модельных методов и онтологического моделирования для автоматизации диагностирования заболеваний'

Применение теоретико-модельных методов и онтологического моделирования для автоматизации диагностирования заболеваний Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
279
68
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОНТОЛОГИЯ / ОНТОЛОГИЧЕСКАЯ МОДЕЛЬ / ПРЕЦЕДЕНТНАЯ МОДЕЛЬ / НЕЧЕТКАЯ МОДЕЛЬ / ФОРМАЛЬНЫЙ КОНТЕКСТ / ФОРМАЛЬНОЕ ПОНЯТИЕ / ДИАГНОСТИРОВАНИЕ ЗАБОЛЕВАНИЙ / ONTOLOGY / ONTOLOGICAL MODEL / CASE-BASED MODEL / FUZZY MODEL / FORMAL CONTEXT / FORMAL CONCEPT / DIAGNOSIS OF DISEASES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пальчунов Дмитрий Евгеньевич, Яхъяева Гульнара Эркиновна, Ясинская Ольга Владимировна

Статья посвящена разработке автоматизированных методов порождения знаний о возможном диагнозе пациента на основе анализа историй болезни других пациентов. Эти методы основаны на теоретико-модельном подходе к формализации предметной области. На основе интеграции знаний, извлечённых из историй болезней, строится онтологическая модель данной предметной области. Формализация оценочных (нечетких) суждений производится на языке теории нечетких моделей. Для получения формульного описания диагнозов пациентов используется методология анализа формальных понятий.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пальчунов Дмитрий Евгеньевич, Яхъяева Гульнара Эркиновна, Ясинская Ольга Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF MODEL-THEORETIC METHODS AND ONTOLOGICAL MODELING TO AUTOMATE THE DIAGNOSIS OF DISEASES

The article is devoted to developing automated methods of generating knowledge about possible diagnosis of the patient based on the analysis of clinical records of other patients. These methods are based on the model-theoretic approach to the formalization of the domain. An ontological model of the domain is constructed on the base of integration of knowledge extracted from clinical rec-ords. Formalization of estimated statements is described in the language of the fuzzy model theory. We use methodology of the formal concept analysis to obtain formular descriptions of diagnoses of patients.

Текст научной работы на тему «Применение теоретико-модельных методов и онтологического моделирования для автоматизации диагностирования заболеваний»

УДК 004.4

Д. Е. Пальчунов 1 2, Г. Э. Яхъяева \ О. В. Ясинская 1

1 Новосибирский государственный университет ул. Пирогова, 2, Новосибирск, 630090, Россия

2 Институт математики им. С. Л. Соболева СО РАН пр. Акад. Коптюга, 4, Новосибирск, 630090, Россия

palch@math.nsc.ru, gul_nara@mail.ru,yasinskaya.olga@gmail.com

ПРИМЕНЕНИЕ ТЕОРЕТИКО-МОДЕЛЬНЫХ МЕТОДОВ И ОНТОЛОГИЧЕСКОГО МОДЕЛИРОВАНИЯ ДЛЯ АВТОМАТИЗАЦИИ ДИАГНОСТИРОВАНИЯ ЗАБОЛЕВАНИЙ *

Статья посвящена разработке автоматизированных методов порождения знаний о возможном диагнозе пациента на основе анализа историй болезни других пациентов. Эти методы основаны на теоретико-модельном подходе к формализации предметной области. На основе интеграции знаний, извлечённых из историй болезней, строится онтологическая модель данной предметной области. Формализация оценочных (нечетких) суждений производится на языке теории нечетких моделей. Для получения формульного описания диагнозов пациентов используется методология анализа формальных понятий.

Ключевые слова: онтология, онтологическая модель, прецедентная модель, нечеткая модель, формальный контекст, формальное понятие, диагностирование заболеваний.

Введение

Успешное лечение больного в значительной степени зависит от быстрого и правильного диагностирования. Для исключения ошибок в диагностике и своевременного назначения лечения необходима последовательность в проведении обследования больного. На сегодняшний день существует множество различных технологий диагностики. Однако врачи (особенно поликлинического звена, а также работающие в небольших городах и районных больницах) ежедневно сталкиваются с проблемой постановки диагноза, определения необходимых диагностических процедур и консультаций смежных специалистов. Врачу необходимо на основании клинических и лабораторных исследований определить предварительный (рабочий) диагноз, на основании которого направить пациента на дополнительные и, зачастую, дорогостоящие исследования.

Поэтому критически важно и экономически обоснованно разработать такую программную систему, которая позволяла врачам на основе статистических данных определять предварительный диагноз и максимально быстро получать информацию о необходимости проведения тех или иных дополнительных диагностических процедур для постановки заключительного диагноза и выбора оптимальной тактики лечения.

* Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта №14-07-00903_а.

Пальчунов Д. Е., Яхъяева Г. Э., Ясинская О. В. Применение теоретико-модельных методов и онтологического моделирования для автоматизации диагностирования заболеваний // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2015. Т. 13, вып. 3. С. 42-51.

ISSN 1818-7900. Вестник НГУ. Серия: Информационные технологии. 2015. Том 13, выпуск 3 © Д. Е. Пальчунов, Г. Э. Яхъяева, О. В. Ясинская, 2015

В данной работе мы описываем методологию разработки программной системы, помогающей лечащему врачу пристраивать индивидуальный план диагностирования пациента. Данная методология основана на статистической обработке историй болезней пациентов, прошедших полный цикл диагностирования и лечения конкретного заболевания. В разработанной методологии для представления знаний, извлечённых из различных текстов на естественном языке (историй болезней), используется прецедентный подход к представлению знаний [1; 2]. Он основан на разработанном теоретико-модельном подходе к формализации онтологий предметных областей [3]. Для обработки представленных в системе знаний используется методология анализа формальных понятий [4; 5].

Теоретико-модельная формализация предметной области

Одним из важнейших направлений инженерии знаний является представление знаний (knowledge representation). Еще в середине 70-х годов прошлого столетия появились первые прикладные интеллектуальные системы, использующие различные способы представления знаний - экспертные системы. Экспертные системы являются программными системами, имитирующими принятие решений квалифицированным специалистом в данной предметной области. Однако постепенно пришло понимание необходимости моделирования не эксперта, а непосредственно самой предметной области.

С теоретико-модельной точки зрения онтологическое моделирование предметной области и построение теории предметной области содержит следующие этапы [3].

1. Определение множества ключевых понятий предметной области. Множество ключевых понятий мы рассматриваем как сигнатуру онтологии и онтологической модели. На этом этапе мы получаем логическую теорию данной предметной области, т. е. теорию класса всех моделей рассматриваемой сигнатуры.

2. Описание смысла ключевых понятий предметной области (наиболее просто - в виде глоссария, наиболее полно - в виде множества явных и неявных определений ключевых понятий). На этом этапе мы получаем онтологию данной предметной области; в идеале - аналитическую теорию предметной области, т. е. теорию класса всех моделей, представляющих все мыслимые случаи этой предметной области.

3. Задание аксиом, эмпирических постулатов, то есть, предложений, которые должны быть истинны на всей предметной области. На этом шаге мы получаем в большей или меньшей степени полное описание всех реальных примеров предметной области, т. е. на этом этапе строится теория предметной области.

Кроме онтологии и теории предметной области онтологическая модель содержит множество конкретных прецедентов предметной области, а также нечёткую теорию предметной области - множество предложений, истинность которых оценивается числом из промежутка [0; 1].

4. Формальное представление множества реальных прецедентов предметной области. Безусловно, множество имеющихся прецедентов не покрывает все возможные ситуации, оно представляет лишь то частичное знание о конкретных примерах предметной области, которое нам уже известно. На этом этапе строится булевозначная прецедентная модель предметной области.

5. Порождение оценочных, нечётких знаний о предметной области на основе анализа множества имеющихся прецедентов. На этом этапе строится нечёткая модель предметной области, или класс нечетких моделей, представляемый обобщённой нечёткой моделью предметной области.

Далее мы более подробно рассмотрим построение онтологической модели предметной области диагностики заболеваний позвоночника.

Сигнатура предметной области

В данной работе рассматривается предметная область, содержащая сведения о пациентах с заболеваниями только из одного фиксированного класса заболеваний (например, класс заболеваний позвоночника, представленных в МКБ-10 [6]). Мы не рассматриваем механизмы

взаимодействия пациентов друг с другом и с медицинским персоналом. Следовательно, в формализации данной предметной области используются только понятия-свойства, описывающие конкретных пациентов. Все понятия делятся на три класса:

• Р - класс первичных диагностических процедур (например, различные клинические или лабораторные исследования). Понятия этого класса используются для постановки предварительного (рабочего) диагноза пациента;

• ^ - класс дополнительных диагностических процедур (например, набор инструментальных исследований). Понятия этого класса используются для уточнения рабочего диагноза и постановки заключительного диагноза;

• В - класс различных диагнозов, рассматриваемых в рамках данного класса заболеваний.

Таким образом, мы рассматриваем сигнатуру, состоящую из конечного числа одноместных предикатных символов. Далее, сигнатуру предметной области А будем обозначать через сд . Как указано выше, сА = Р и ^ и В . Предикаты Р (х) е сА будем называть сигнатурными предикатами.

Через S (сд) будем обозначать множество всех одноместных бескванторных формул сигнатуры Сд . Заметим, что каждая формула ф(х) е S(сд) является булевой комбинацией сигнатурных предикатов.

Онтология предметной области

Для описания онтологии предметной области задается конечное множество аксиом Ах (А) с S (сд). В данной статье мы рассматриваем три вида аксиом: аксиомы общего-

частного, аксиомы исключения и аксиомы полноты.

Аксиомы общего-частного. Иерархическая упорядоченность некоторых понятий должна быть отображена аксиоматически (например, иерархия диагнозов, приведенная в МКБ-10). Схема таких аксиом следующая:

(Р ( х Р ( х )).

Например: «ЕслиМ48.0 Спинальный стеноз, тоМ48 Стеноз».

Аксиомы исключения. Некоторые понятия являются взаимоисключающими (например, различные результаты лабораторных исследований). Схема таких аксиом следующая:

(Р (х)^Р, (х)).

Например: «Если Уровень гемоглобина в крови превышает норму, то не верно, что Уровень гемоглобина в крови в норме».

Аксиома полноты. Для описания предметной области мы рассматриваем истории болезней пациентов прошедших полный цикл диагностирования, для которых установлен окончательный диагноз и проведено соответствующее лечение. При этом мы считаем, что в каждой рассматриваемой истории болезни отражено хотя бы по одному признаку из каждого из трех рассматриваемых классов. Таким образом, мы имеем следующую аксиому полноты:

[ V Р (х)] & [ V Р (х) & [ V Р (х)

V РеР ) V Ре^ ) V РеВ

Упорядоченная пара ^сд, Ах (д) образует онтологию предметной области д . Эта онтология является подмножеством аналитической теории предметной области д .

Онтологическая модель предметной области

Рассмотрим теперь конечное множество {в1,..., еп } историй болезней пациентов. История болезни е{ - это полуструктурированный текст, написанный на естественном языке. Заметим, что в каждой истории болезни однозначно указаны все проведенные диагностические

исследования, их результаты, а также заключительный диагноз для данного пациента. Следовательно, для каждой истории болезни е1 мы можем описать множество признаков (сигнатурных предикатов), истинных на ei. Таким образом, по каждой истории болезни ei мы строим одноэлементную модель е1 = ({е!}, , которую будем называть прецедентом предметной области А.

Для построения онтологической модели нам необходимо рассмотреть конечное множество Е = {е!,...,ет} прецедентов предметной области. Заметим, что мы не исключаем случая,

когда для некоторых ] е{1,...,т} ( Ф ]) модели е1 и е^ будут изоморфны. Тем не менее

мы будем учитывать эти модели как формализации различных прецедентов.

Необходимым условием, накладываемым на прецеденты, является истинность на них аналитической теории предметной области. С теоретико-модельной точки зрения это, в частности, означает, что на каждой модели е1 должно быть истинным множество аксиом Ах (А),

т. е. ei \=Ах(А).

Однако, не каждая одноэлементная модель аналитической теории, является прецедентом предметной области. Выбор тех или иных моделей в качестве прецедентов и задает структуру онтологической модели А а = (Е, Ста) . В онтологической модели А а для каждого сигнатурного предиката Р (х )естА и для каждого прецедента е! е Е имеем А а N Р (е1) тогда и только тогда, когда е1 N Р (е1) .

Заметим, что если формула ф(х)е ^ (са) принадлежит множеству аксиом предметной области А (т. е. ф(х) е Ах (А)), то для любого е1 е Е имеет место Аа N ф(е!) . Таким образом, на онтологической модели является истинной онтология данной предметной области, более того, онтологическая модель принадлежит классу моделей аналитической теории предметной области.

Формализация оценочных знаний

Для решения задач статистической обработки данных нам понадобятся прецедентная и нечеткая модели рассматриваемой предметной области [7, 8]. Эти модели мы будем строить на основе онтологической модели.

Для дальнейшего рассмотрения нам понадобится понятие прецедентной модели, которая является частным случаем булевозначной модели.

ОПРЕДЕЛЕНИЕ 1 [7]. Пусть В - полная булева алгебра и т: ^(стА В. Тогда упорядоченная тройка Ат =(А,ст, т) называется булевозначной моделью, если истинностная функция т замкнута относительно логических операций.

ОПРЕДЕЛЕНИЕ 2 [7]. Упорядоченную тройку АЕ ^ ^{а},ста , тЕ) назовем прецедентной

моделью предметной области А, порожденной онтологической моделью Аа = (Е,ста), если для любой формулы ф(х) е ^ (ста) имеем тЕ (ф(а)) = {е е Е|Аа N ф(е)}.

В прецедентной модели каждой формуле ставится в соответствие множество прецедентов, для которых она является истинной.

Таким образом, по множеству прецедентов Е мы определяем булевозначную модель АЕ. В этой булевозначной модели каждому предложению ставится в соответствие элемент булевой алгебры р(Е).

Данное описание основано на следующем результате.

ТЕОРЕМА О ДВОЙСТВЕННОСТИ [7]. Пусть В - полная атомная булева алгебра, АВ -булевозначная модель, Е = {А6|б е А1 (В)} и АЕ - прецедентная модель. Тогда АВ = АЕ.

В большинстве методик статистической обработки данных используются объективные и / или субъективные вероятности. Под объективной вероятностью понимается относительная частота появления какого-либо события в общем объеме наблюдений или отношение числа благоприятных исходов к общему количеству наблюдений. Под субъективной вероятностью имеется в виду мера уверенности некоторого эксперта или группы экспертов в том, что данное событие в действительности будет иметь место.

В рассматриваемом подходе, для описания объективных вероятностей используется понятие нечеткой модели [7].

ОПРЕДЕЛЕНИЕ 3. Упорядоченную тройку АМе ^ ^{а}, ад, назовем нечеткой моделью предметной области Д, порожденной онтологической моделью Ад = (Е,сд^, если

\\{e е E| Ад N ф(е)}||

для любой формулы ф(х)е S (сд) имеем цЕ (ф) = --й—¡¡--.

11Е11

Значениями истинности предложений (понятий) в нечеткой модели являются числа из интервала [0,1], которые отражают объективную вероятность наличия того или иного понятия

у случайно выбранного прецедента. Более подробное описание свойств прецедентных и нечетких моделей можно найти в работах [7; 2; 9; 10].

Алгоритмы обработки знаний

Формальное описание предварительных диагнозов

Для формального описания предварительных диагнозов была использована техника анализа формальных понятий (АФП). Анализ формальных понятий - это прикладная ветвь алгебраической теории решеток. На сегодняшний день АФП считается одним из мощнейших методов интеллектуального анализа данных. Более подробно с этим направлением можно ознакомиться в работах [4; 11; 12].

Центральным понятием АФП являются понятие формального контекста. С теоретико-модельной точки зрения формальный контекст задается классом моделей K с K (с) фиксированной сигнатуры с и множеством предложений S с S (с) этой же сигнатуры и является упорядоченной тройкой (K,S,N [5].

В данной работе будем рассматривать формальный контекст Кд = (Е, сд, 1=), порожденный онтологической моделью A д.

Пусть Ае и АЦе - прецедентная и нечеткая модели, порожденные онтологической моделью Aд. Тогда пара множеств (A, B) , таких что A с Е, B ссд, является формальным понятием контекста Кд, если выполняются следующие условия:

1) М Е (&ф)ев ф(а))>МЕ (у(а)&(&ф)ев ф(а))), для любого x) е S (сд)/B;

2) A = Те (&ф(х)ев ф(а)),

где {а} - основное множество нечеткой модели А^е .

Множество B называется содержанием формального понятия (A, B) . Для удобства изложения мы вместо множества B будем называть содержанием формального понятия (A, B) формулу &^)eB ф(X).

Формальное понятие (A1, B1) называется более общим понятием, чем понятие (A2, B2 ) (и обозначается (A1, B1) □ (A2, B2 )) если A2 с A1. Заметим, что если (A1, B1) □ (A2, B2 ) , то B1 с B2.

Для постановки предварительного диагноза мы будем использовать формальный контекст Хр = (Е,Р, N), где Р соА - класс первичных диагностических процедур. Заметим, что формальный контекст Хр является подконтекстом контекста ХД.

Формальное понятие (A,B) контекста Хр будем называть положительной гипотезой для диагноза D (x)еВ, если выполняется условие

^E (&ф)eB ф(°D (a^^

где 0<а<1, т. е. здесь а - коэффициент допустимой погрешности. Этот коэффициент определяется эмпирически, в зависимости от специфики рассматриваемого класса заболеваний. Он отражает допустимую долю прецедентов (историй болезни), в которых рабочий диагноз не был впоследствии подтвержден.

Рассмотрим множество G (D) всех положительных гипотез для диагноза D. Заметим, что

может случиться так, что для некоторого диагноза D (x)е В множество G (D) является пустым. Это означает, что класс Р первичных диагностических процедур является недостаточно информативным для определения рабочего диагноза D (x). Если таких диагнозов много,

то необходимо произвести пересмотр класс Р первичных диагностических процедур на уровне определения сигнатуры предметной области.

Допустим, что множество G(D) не пусто. Определим множество Gmax (D)с G(D) максимальных положительных гипотез для диагноза D(x), т. е. таких гипотез, что для любого понятия (A, B) е Gmax (D) не существует более общего понятия, принадлежащего множеству G (D) . Тогда формулу

FD (x)= V &Ф)eB Ф(x),

(A,B )eGmax (D)

будем называть формульным описанием диагноза D (x). Коэффициент

= цe (FD (x) & D (a)) D" He (D (a ))

отражает степень полноты формульного описания диагноза D (x). Очевидно, что 0 < kD < 1. При этом выполнение условия kD = 1 означает, что в формульном описании FD (x) учтены все прецеденты, на которых предикат D (x) истинен.

Алгоритм определения рабочего диагноза

Рассмотрим пациента Pat. Предположим, что проведено частичное диагностирование этого пациента, и необходимо установить предварительный диагноз. Это означает, что имеется информация об истинности некоторых, но возможно не всех, предикатов из множества Р . Обозначим через True (Pat) множество сигнатурных предикатов из множества Р, истинность которых для пациента Pat известна. Обозначим через Th (Pat) замыкание относительно выводимости множества True(Pat) (т. е. теорию, порожденную множеством True (Pat)). По теории Th (Pat) будем строить модель пациента Pat.

ОПРЕДЕЛЕНИЕ 4. Упорядоченную тройку APat = ({Pat},сд,Цра^ будем называть нечеткой моделью пациента Pat, если для любой формулы ф(x) е S(^д) истинностная функция ^Pai определяется следующим образом:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4pat ((Pat)) =

1, ф( х ) е Th (Pat); 0, —ф(х) е Th (Pat);

[ 0,1] в противном случае.

Модель APat является обобщенной нечеткой моделью сигнатуры сд. Формальное определение и описание свойств таких моделей можно найти в работах [7; 9].

Далее, для определения предварительного диагноза (или нескольких предварительных диагнозов) нам необходимо проверять истинность на модели APat формульных описаний

Fd (х) всех диагнозов D из множества В. Диагнозы, для которых выполняется условие ^Pat (Fd (Pat)) = 1, объявляются предварительными диагнозами для данного пациента.

Однако может сложиться ситуация, когда рабочие диагнозы не определены, т. е. для любого D(х)еВ мы имеем ^Pat(FD (Pat)) Ф1. Тогда если найдется хотя бы один диагноз

D (х) такой, что ^Pat (FD (Pat)) = [0,1], то система предлагает произвести дополнительное обследование пациента. Если же складывается ситуация, когда для любого D (х) е В имеем ^Pat (Fd (Pat)) = 0, то мы имеем дело с нестандартной ситуацией, т. е. диагностировать такого пациента при помощи разработанной системы невозможно.

Алгоритм назначения дополнительного диагностирования

Допустим, что в ходе первичного обследования пациента Pat были выдвинуты предварительные диагнозы D1 (х),...,Dk (х) е В. Дальнейшей задачей системы является подбор наиболее оптимального набора дополнительных диагностических процедур для постановки заключительного диагноза.

Из множества прецедентов Е выберем подмножество прецедентов Е', для которых был определен хотя бы один из диагнозов D1 (х),...,Dk (х), т. е.

Е' = {е е Е|Aд N D1 (e)v... v Aд N Dk (e)j.

Рассмотрим формальный контекст Kq =( Е', Q, N), являющийся подконтекстом контекста Кд . Содержанием этого контекста является класс Q дополнительных диагностических процедур. В этом контексте будем искать наибольшее формальное понятие (A, B) по отношению □ - «быть более общим понятием». Если содержание B этого понятия не пусто, то оно является искомым набором инструментальных средств исследования с учетом рабочих диагнозов D1 (х),...,Dk (х).

При этом может оказаться, что наибольшее понятие (A, B) имеет пустое содержание B.

Поскольку рассматриваемое множество формальных понятий образует конечную решетку, существует конечное множество максимальных формальных понятий среди формальных понятий с непустым содержанием. Пусть |(A1,B1),...,(Al,Bl)j - множество таких максимальных формальных понятий с непустым содержанием для контекста KQ . Тогда система предлагает альтернативные решения: B1,..., Bt.

Несложно проверить, что множество понятий |(A1,B1),...,(Al,Bl)j обладает следующими свойствами:

1) A U...U A = Е';

2) для любого формального понятия (A,B) контекста KQ найдется такое i = 1,...,l, что B, с B.

Таким образом, предлагая набор альтернативных решений B1,..., Bt, мы, с одной стороны, обеспечиваем охват всех рассматриваемых прецедентов, а с другой стороны, минимизируем количество дополнительных диагностических процедур, необходимых для постановки заключительного диагноза.

Апробация разработанных алгоритмов

Разработанные методы реализованы в программной системе «Diagnostic Panel». Программная система апробирована на предметной области «деформации позвоночника и дегенеративные заболевания позвоночника».

Онтологическая модель является ядром программы и реализуется в базе данных MS SQL Server 2014. Для описания историй болезни в базе данных было создано 12 таблиц и организованы связи между таблицами. Они описывают 7 категорий рассматриваемых признаков в историях болезни - Пол, Возрастная категория, Диагноз, Жалобы, Первичный осмотр, Анализы и Инструментальные средства. Каждая из этих категорий признаков, применяемых для описания историй болезни, представлена в базе данных в виде отдельной таблицы, связанной с главной таблицей, описывающей историю болезни с помощью связей по внешнему ключу («один ко многим») и вспомогательных таблиц («многие ко многим»). Каждая история болезни в базе характеризуется наличием определенных признаков из каждой категории.

На основании проведенных клинических и лабораторных исследований пациента с заболеваниями позвоночника система выдает множество предварительных (рабочих) диагнозов для данного пациента. На основании имеющихся предварительных диагнозов, система помогает пользователю (лечащему врачу) выбрать минимальный необходимый набор инструментальных средств диагностирования пациента с заболеванием позвоночника с целью определения заключительного диагноза.

Заключение

В статье разработаны автоматизированные методы порождения знаний о возможном диагнозе пациента на основе анализа историй болезней других пациентов. Данные методы основаны на применении теоретико-модельного подхода к разработке онтологий, теории нечетких моделей и анализа формальных понятий.

Для формализации знаний о предметной области используется множество историй болезней пациентов, т. е. множество полуструктуированных текстов, написанных на естественном языке. По каждой истории болезни строится одноэлементная алгебраическая система - формальный прецедент предметной области. На основе множества всех прецедентов строится онтологическая модель рассматриваемой предметной области.

По онтологической модели предметной области определяется формальный контекст. В построенном формальном контексте выделяются формальные понятия, подтверждающие диагнозы пациентов. Исходя из этого, строятся формульные описания диагнозов. На основе оценочных знаний о предметной области определяется степень полноты формульного описания каждого диагноза.

Далее строится нечеткая модель пациента, прошедшего частичное обследование. На этой модели проверяется истинность формульных описаний различных диагнозов, формируется множество предварительных диагнозов для данного пациента. Рассматривается формальный контекст диагнозов, являющийся подконтекстом формального контекста предметной области. В этом формальном контексте ищется множество максимальных формальных понятий с непустым содержанием. Содержания этих понятий являются альтернативными наборами необходимых дополнительных диагностических процедур.

Разработанные методы были апробированы на деперсонифицированных историях болезни реальных пациентов.

Мы выражаем признательность сотрудникам Новосибирского НИИТО им. Я. Л. Цивьяна, любезно предоставившим нам необходимую медицинскую информацию.

Список литературы

1. Pulchunov D., Yakhyaeva G. Interval fuzzy algebraic systems // Proceedings of the Asian Logic Conference. 2005. Р. 23-37.

2. Пальчунов Д. Е., Яхъяева Г. Э. Нечеткие логики и теория нечетких моделей // Алгебра и логика. 2015. Т. 54, № 1. С. 109-118.

3. Пальчунов Д. Е. Моделирование мышления и формализация рефлексии. Ч. 2: Онтологии и формализации понятий // Философия науки. 2008. Т. 37, № 2. С. 62-99.

4. Ganter B., Wille R. Formal Concept Analysis: Mathematical Foundations. Heidelberg: Springer, 1999.

5. Pal'chunov D. Lattices of Relatively Axiomatizable Classes // ICFCA. 2007. Vol. LNAI 4390. Р. 221-239.

6. Международная статистическая классификация болезней и проблем, связанных со здоровьем. 10-й пересмотр. Женева, 1995.

7. Пальчунов Д. Е., Яхъяева Г. Э. Нечеткие алгебраические системы // Вестн. Новосиб. гос. ун-та. Серия: Математика, механика, информатика. 2010. Т. 10, № 3. С. 75-92.

8. Yakhyaeva G. Fuzzy model truth values // Proc. of the 6th International Conference Aplimat. Bratislava, 2007. Р. 423-431.

9. Яхъяева Г. Э., Ясинская О. В. Методы согласования знаний по компьютерной безопасности, извлеченных из различных документов // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2013. Т. 11, № 3. Р. 63-73.

10. Yakhyaeva G. Logic of Fuzzifications // Proc. of the 4th Indian International Conference on Artificial Intelligence (IICAI-09). Tumkur, India, 2009. Р. 222-239.

11. Gartner S., Ruhroth T., Burger J., Schneider K., Jurjens J. Maintaining requirements for long-living software systems by incorporating security knowledge // IEEE 22nd International Requirements Engineering Conference. 2014. Р. 103-112.

12. Priss U. Formal Concept Analysis in Information Science // Annual Review of Information Science and Technology. 2006. Vol. 40. Р. 521-543.

Материал поступил в редколлегию 10.06.2015

D. E. Palchunov, G. E. Yakhyaeva, O. V. Yasinskaya

Novosibirsk State University, 2 Pirogov Str., Novosibirsk, 630090, Russia

Sobolev Institute of Mathematics SB RAS 4 Acad. Koptyug avenue, Novosibirsk, 630090, Russia

palch@math.nsc.ru, gul_nara@mail.ru,yasinskaya.olga@gmail.com

APPLICATION OF MODEL-THEORETIC METHODS AND ONTOLOGICAL MODELING TO AUTOMATE THE DIAGNOSIS OF DISEASES

The article is devoted to developing automated methods of generating knowledge about possible diagnosis of the patient based on the analysis of clinical records of other patients. These methods are based on the model-theoretic approach to the formalization of the domain. An ontological model of the domain is constructed on the base of integration of knowledge extracted from clinical records. Formalization of estimated statements is described in the language of the fuzzy model theory. We use methodology of the formal concept analysis to obtain formular descriptions of diagnoses of patients.

Keywords: ontology, ontological model, case-based model, fuzzy model, formal context, formal concept, diagnosis of diseases.

References

1. Pal'chunov D.E., Yakhyaeva G.E. Interval fuzzy algebraic systems. Proceedings of the Asian Logic Conference , pp. 23-37, 2005.

2. Pal'chunov D.E., Yakhyaeva G.E. Fuzzy logic and the theory of fuzzy models. Algebra and Logic, vol. 54, no. 1, 2015, pp. 74-80.

3. Palchunov D.E. Simulation of thinking and formalization of reflection: II. Ontologies and formalization of concepts. Filosofiya nauki, 37(2), pp. 62-99, 2008 (in Russian).

4. Ganter B., Wille R. Formal Concept Analysis: Mathematical Foundations. Heidelberg: Springer, 1999.

5. Pal'chunov D.E. Lattices of Relatively Axiomatizable Classes. ICFCA 2007, LNAI 4390, p. 221-239, 2007.

6. The international statistical classification of the diseases and problems connected with health; 10th revision. Medecina, Geneva, 1995.

7. Palchunov D.E., Yakhyaeva G.E. Fuzzy algebraic systems. Vestnik NGU. Seriya: Matematica, mexanica, informatica. 2010. V.10, № 3. p. 75-92.

8. Yakhyaeva G. Fuzzy model truth values. Proceedings of the 6-th International Conference Aplimat, February 6-9, 2007, Bratislava, Slovak Republic, p. 423-431.

9. Yakhyaeva G., Yasinskaya O. Methods of coordination of knowledge on computer security, taken from various documents. Vestnik NGU. Seriya: Informacionnie texnologii, V. 11, № 3, pp.63-73, 2013.

10. Yakhyaeva G. Logic of Fuzzifications. Proceedings of the 4th Indian International Conference on Artificial Intelligence (IICAI-09), Tumkur, India, pp. 222-239.

11. Gartner S., Ruhroth T., Burger J., Schneider K., Jurjens J. Maintaining requirements for long-living software systems by incorporating security knowledge. IEEE 22nd International Requirements Engineering Conference, pp. 103-112, 2014.

12. Priss U. Formal Concept Analysis in Information Science. Annual Review of Information Science and Technology, t. 40, pp. 521-543, 2006.

i Надоели баннеры? Вы всегда можете отключить рекламу.