Научная статья на тему 'ПРИОБРЕТЕНИЕ МЕДИЦИНСКИХ ЗНАНИЙ В ДИСТАНЦИОННОЙ МЕДИЦИНСКОЙ ЭКСПЕРТНОЙ СИСТЕМЕ ПРЕДВАРИТЕЛЬНОЙ ДИАГНОСТИКИ'

ПРИОБРЕТЕНИЕ МЕДИЦИНСКИХ ЗНАНИЙ В ДИСТАНЦИОННОЙ МЕДИЦИНСКОЙ ЭКСПЕРТНОЙ СИСТЕМЕ ПРЕДВАРИТЕЛЬНОЙ ДИАГНОСТИКИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
62
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕДИЦИНСКАЯ ДИАГНОСТИКА / ЭКСПЕРТНАЯ СИСТЕМА / БАЗА ЗНАНИЙ / МОДЕЛЬ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ / ФРЕЙМЫ / НЕЧЕТКО-ПРОДУКЦИОННЫЕ ПРАВИЛА / ГЕНЕТИЧЕСКИЙ АЛГОРИТМ / ЭКСПЕРТНЫЙ ОПРОС / ИЗВЛЕЧЕНИЕ ЗНАНИЙ ИЗ БАЗ ДАННЫХ / АССОЦИАТИВНЫЕ ПРАВИЛА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ле Нгуен Виен, Садовникова Наталья Петровна

В статье представлен подход к формированию базы знаний в медицинской диагностической экспертной системе. Поскольку в настоящее время в базах данных накоплен очень большой объем информации, связанной с заболеваниями, то наряду с экспертным опросом, пополнение баз знаний целесообразно осуществлять с использованием технологий извлечения знаний из статистических данных. В качестве модели представления знаний авторами предложена гибридная структура, объединяющая фреймовую и нечетко-продукционную модели. Такое объединение обеспечивает легкость и модульность управления знаниями, упрощает и ускоряет процедуры вывода диагностических решений. Для настройки параметров функции принадлежности лингвистических термов переменных и весовых коэффициентов нечетких правил применен генетический алгоритм. Предложен механизм отсроченной консультации, который обеспечивает возможность пополнения базы знаний на основе дополнительного опроса эксперта в случае спорного диагноза. Рассмотрены особенности программной реализации предложенных моделей и алгоритмов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE ACQUISITION OF MEDICAL KNOWLEDGE IN REMOTE MEDICAL EXPERT SYSTEM FOR PRELIMINARY DIAGNOSIS

In this article, an approach to developing the knowledge base in medical diagnostic expert system is presented. In modern times, databases have accumulated a very large amount of information related to diseases, along with the expert survey updating knowledge bases, it is advisable to use technology for knowledge extraction from statistical data. As a model of knowledge representation, a hybrid framework combining frame and fuzzy-production model is proposed. Such integration provides the ease and modularity of knowledge management, simplifies and speeds up the procedure of output diagnostic solutions. To configure the parameters of the membership functions of linguistic terms of variables and weights of fuzzy rules, genetic algorithm is applied. The mechanism of delayed consultation, which provides the ability to replenish the knowledge base based on additional polling expert is proposed in controversial diagnosis. Peculiarities of implementation of proposed models and algorithms are considered.

Текст научной работы на тему «ПРИОБРЕТЕНИЕ МЕДИЦИНСКИХ ЗНАНИЙ В ДИСТАНЦИОННОЙ МЕДИЦИНСКОЙ ЭКСПЕРТНОЙ СИСТЕМЕ ПРЕДВАРИТЕЛЬНОЙ ДИАГНОСТИКИ»

ПРИКАСПИЙСКИЙ ЖУРНАЛ: управление и высокие технологии № 4 (28) 2014 ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ, ИНФОРМАЦИОННО-СПРАВОЧНЫЕ, ЭКСПЕРТНО-АНАЛИТИЧЕСКИЕ СИСТЕМЫ

УДК: 004.891

ПРИОБРЕТЕНИЕ МЕДИЦИНСКИХ ЗНАНИЙ В ДИСТАНЦИОННОЙ МЕДИЦИНСКОЙ ЭКСПЕРТНОЙ СИСТЕМЕ ПРЕДВАРИТЕЛЬНОЙ ДИАГНОСТИКИ1

Статья поступила редакцию 31.10.2014, в окончательном варианте 15.11.2014.

Ле Нгуен Виен, аспирант, Волгоградский государственный технический университет, 400005, Российская Федерация, г. Волгоград, пр. им. В.И. Ленина, 28, e-mail: nvien.vstu@gmail.com

Садовникова Наталья Петровна, доктор технических наук, доцент, Волгоградский государственный технический университет, 400005, Российская Федерация, г. Волгоград, пр. им. В.И. Ленина, 28, e-mail: npsnl@yandex.ru

В статье представлен подход к формированию базы знаний в медицинской диагностической экспертной системе. Поскольку в настоящее время в базах данных накоплен очень большой объем информации, связанной с заболеваниями, то наряду с экспертным опросом, пополнение баз знаний целесообразно осуществлять с использованием технологий извлечения знаний из статистических данных. В качестве модели представления знаний авторами предложена гибридная структура, объединяющая фреймовую и нечетко-продукционную модели. Такое объединение обеспечивает легкость и модульность управления знаниями, упрощает и ускоряет процедуры вывода диагностических решений. Для настройки параметров функции принадлежности лингвистических термов переменных и весовых коэффициентов нечетких правил применен генетический алгоритм. Предложен механизм отсроченной консультации, который обеспечивает возможность пополнения базы знаний на основе дополнительного опроса эксперта в случае спорного диагноза. Рассмотрены особенности программной реализации предложенных моделей и алгоритмов.

Ключевые слова: медицинская диагностика, экспертная система, база знаний, модель представления знаний, фреймы, нечетко-продукционные правила, генетический алгоритм, экспертный опрос, извлечение знаний из баз данных, ассоциативные правила

THE ACQUISITION OF MEDICAL KNOWLEDGE IN REMOTE MEDICAL EXPERT SYSTEM FOR PRELIMINARY DIAGNOSIS

Le Nguen Vien, post-graduate student, Volgograd State Technical University, 28 Lenin Avenue, Volgograd, 400005, Russian Federation, e-mail: nvien.vstu@gmail.com

Sadovnikova Natalya P., D.Sc. (Engineering), Associate Professor, Volgograd State Technical University, 28 Lenin Avenue, Volgograd, 400005, Russian Federation, e-mail: npsnl@yandex.ru

In this article, an approach to developing the knowledge base in medical diagnostic expert system is presented. In modern times, databases have accumulated a very large amount of information related to diseases, along with the expert survey updating knowledge bases, it is advisable to use technology for knowledge extraction from statistical data. As a model of knowledge representation, a hybrid framework combining frame and fuzzy-production model is proposed. Such integration provides the ease and modularity of knowledge management, simplifies and speeds up the procedure of output diagnostic solutions. To configure the parameters of the membership functions of linguistic terms of variables and weights of fuzzy rules, genetic algorithm is applied. The mechanism of delayed consultation, which provides the ability to replenish the

1 Работа выполнена при финансовой поддержке со стороны Минобрнауки России в рамках проектной части (проект № 2.1917.2014К_2014),

knowledge base based on additional polling expert is proposed in controversial diagnosis. Peculiarities of implementation of proposed models and algorithms are considered.

Keywords: medical diagnosis, expert system, knowledge base, knowledge representation model, frames, fuzzy production rules, genetic algorithm, expert survey, extraction of knowledge from databases, association rales

Введение. Для улучшения доступности и качества оказания медицинской помощи населению могут использоваться различные методы, связанные с информационными технологиями [4, 11]. Одним из них является применение медицинских экспертных систем для диагностики заболеваний - преимущественно в тех случаях, когда врач вынужден делать заключение (в том числе и в дистанционном режиме) на основе информации о симптоматике заболеваний и не может оперативно получить результаты дополнительных исследований с использованием инструментальных средств. Информация о симптоматике может быть получена врачом, который ставит диагноз, в основном следующими способами: путем личного общения с пациентом, в том числе и дистанционно - с применением программных средств типа Skype, специализированных телемедицинских систем [15]; на основании информации, предоставленной пациентом или его родственниками в письменной или вербальной форме; за счет изучения данных, внесенных пациентами в персональные медицинские информационные системы, размещенные на их домашних ПЭВМ или серверах медицинских учреждений [7].

Системы предварительной диагностики необходимы также для повышения эффективности медицинского обслуживания пациентов на дому. В этом случае они могут использоваться для сбора информации о состоянии пациентов, о потребностях в медицинском обслуживании, для формирования планов обследования и графиков посещения врачей [3].

Тенденции развития современных медицинских экспертных систем связаны с внедрением технологий, позволяющих автоматизировать процесс пополнения и оптимизации баз знаний. Для этого необходимо найти пути интеграции различных моделей формирования и представления знаний, разработать алгоритмы, обеспечивающие возможность эффективной настройки баз знаний.

Несмотря на то, что на сегодняшний день разработаны многочисленные программные средства, реализующие разные подходы к приобретению знаний, до сих пор отсутствуют универсальные методики, описывающие процедуры автоматизации этого процесса. Вопросам разработки таких методик посвящены работы Г.В. Рыбиной [13], Т.А. Гавриловой [5], В.В. Курейчика [8], S.M. Easterbrook [17], R. Dieng [18] и др.

Наиболее актуальными на сегодняшний день являются системы приобретения знаний, основанные на интеграции технологий, использующих знания экспертов и методы извлечения знаний из баз данных (KDD - knowledge discovery in databases) [12, 19]. Существует несколько проблем реализации данного подхода. Во-первых, отсутствуют эффективные методики интеграции знаний, полученных из разнотипных источников. Во-вторых, существующие методы приобретения знаний, как правило, обладают низкой адаптивностью и не подразумевают использование механизмов обратной связи для установления новых зависимостей и корректировки правил в базе знаний.

Поэтому целью настоящей статьи была разработка подходов (методов), направленных на преодоление указанных трудностей.

Приобретение медицинских знаний в медицинской экспертной системе предварительной диагностики. Система автоматизированного приобретения знаний позволяет повысить эффективность работы инженера по знаниям и, следовательно, сократить время формирования базы знаний и повысить ее качество.

В качестве модели представления знаний предлагается использовать объединение фреймовой и нечеткой модели знаний. Такое объединение обеспечивает легкость и модульность управления знаниями, упрощает и ускоряет реализацию процедур вывода диагностического решения.

ПРИКАСПИЙСКИЙ ЖУРНАЛ: управление и высокие технологии N° 4 (28) 2014 ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ, ИНФОРМАЦИОННО-СПРАВОЧНЫЕ, ЭКСПЕРТНО-АНАЛИТИЧЕСКИЕ СИСТЕМЫ

Фреймовая база знаний (ФБЗ) используется для описания области медицинской диагностики (специальности врачей, заболевания, группы симптомов, симптомы), а также для представления статистических сведений о состоянии пациента (количественные оценки проявления симптомов; количественные интегральные оценки вероятностей для различных заболеваний, оцененные на основе симптоматики). Нечетко-продукционная база знаний (НПБЗ) содержит описания причинно-следственных отношений, связывающих заболевания всего симптомокомплекса [9].

Процесс формирования базы медицинских данных (БМЗ) может быть представлен следующим образом (рис. 1).

Организация экспертного опроса

2

...................[..................

Врачи узкой специальности

Врач-эксперт

-2-*

Генерирование векторов параметров НПБЗ

Заполнение таблиц БМЗ —1-1

Фреймовая база знаний

Нечетко-продукционная база

Обучение НПБЗ

1-4--

Г

I

I

5

I

I

Извлечение знаний из базы данных

Источники статистических данных «Open data»

1 - Специальности, заболевания, группы симптомов, симптомы, симптомокомплексы;

2 - Экспертные оценки проявления симптомов при обнаружении заболеваний;

3 - Медицинские статистические данные;

4 - Зависимости между ЛТ переменных симптомов и заболеваний;

5 - Зависимости между ЛП симптомов и заболеваний;

6 - Обучающиеся НПБЗ;

7 - Обученная НПБЗ.

Рис. 1. Схема формирования базы медицинских знаний (БМЗ)

Для заполнения таблиц базы медицинских знаний врач-эксперт определяет основные понятия, описывающие область медицинской диагностики и взаимосвязи между ними: заболевания и специальности врачей по ним; отдельные симптомы и их группы; симптомокомплексы для заболеваний.

На следующем этапе врач-эксперт определяет основные лингвистические переменные (ЛП): переменные симптомов - входные; переменные заболеваний - выходные. Для оценки значений ЛП используется единая качественная шкала: Н - низкий; НС - ниже среднего; С - средний; ВС - выше среднего; В - высокий. Соответствующие лингвистические термы (ЛТ) представляют нечеткое множество, заданное с помощью соответствующих функций принадлежности (ФП). Функции принадлежности ЛП представлены в виде симметричных треугольных функций, которые описываются двумя параметрами (Ь, с), где Ь -центр ФП. В табл. 1 приведены числовые интервалы центров ФП в соответствии с оценками значений ЛП по вербально-числовой шкале Харрингтона [1]. Второй параметр («с») задается в числовом интервале [О, 1].

Таблица 1

Числовые интервалы центров ФП в соответствии с ЛТ_

№ Наименование ЛТ Числовой интервал центра ФП

1 Низкий [0, 0.2]

2 Ниже среднего [0.2, 0.37]

3 Средний [0.37, 0.63]

4 Выше среднего [0.63, 0.8]

5 Высокий [0.8. 1]

Причинно-следственные отношения между ЛП формализуются в виде нечетких правил типа «R: ЕСЛИ А, ТО В (со)», где А - предпосылка, В - заключение, со - весовой коэффициент нечеткого правила (берется из числового интервала [0, 1]).

Для извлечения знаний из базы данных строятся модели, которые описывают близость различных одновременно наблюдаемых категориальных характеристик и могут быть представлены в виде простых правил. В данном случае такими характеристиками являются диагнозы наблюдаемых у пациентов болезней или их симптомы. Для реализации данного подхода используются алгоритмы построения ассоциативных правил (АП), в частности алгоритм Apriori [16].

В общем случае АП имеет вид «Из множества характеристик «X» следует множество характеристик «Y»». Основными характеристиками АП являются «поддержка» и «достоверность» правила. Под «достоверностью» АП понимается доля транзакций из исходного множества, содержащих «X», которые также содержат «Y». А под «поддержкой» - доля транзакций из исходного множества, которые содержат пересечение множеств «X» и «Y».

Достоверность ассоциативного правила вычисляется по следующей формуле:

с(Х Y) = s(X Y)/s(X), где s(X —» Y) - поддержка ассоциативного правила; s(X) - поддержка множества «X».

Необходимо выполнить двухуровневую обработку данных следующим образом:

• выявление зависимостей между множеством ЛП симптомов и каждым заболеванием;

• выявление зависимостей между множеством ЛТ переменных симптомов и ЛТ переменной каждого заболевания.

Пусть имеется нормализованный вид множества транзакций для всех ЛП заболеваний, которые после предварительной обработки, представлены в табл. 2.

Таблица 2

Нормализованный вид множества транзакций для всех ЛП заболеваний

Номер транзакции ЛП

-Л - Y

1 1 1 1 А

2... 1 1 0 D2

к 1 0 0 Dk

Примечание, к - количество транзакций для всех ЛП заболеваний; п - количество всех ЛП

симптомов; X = \..п - входные ЛП симптомов; У — /) ,/ — 1..к - выходная ЛП заболевания при

г-ой транзакции. На пересечении строки транзакции и столбца ЛП симптомов ставится «1», если данная ЛП симптома присутствует в транзакции, и «О» - в противном случае.

На первом этапе необходимо вычислить значения уровня поддержки и достоверности АП для X = {Хг ,...,Хп} и 7 = {Д }.

Для каждой ЛП заболеваний необходимо определить одно АП, ранжировав сгенерированные правила в соответствии с их значимостью. Значимость одного правила вычисляется перемножением его значений поддержки и достоверности.

Результаты первичной обработки применяются для дальнейшего уровня выявления зависимостей между ЛТ, переменных симптомов и заболеваний, а также для расширения базы медицинских знаний при появлении новых зависимостей между ЛП.

Пусть имеется нормализованный вид множества транзакций для ЛП 7-го заболевания, представленный в табл. 3.

ПРИКАСПИЙСКИЙ ЖУРНАЛ: управление и высокие технологии № 4 (28) 2014 ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ, ИНФОРМАЦИОННО-СПРАВОЧНЫЕ, ЭКСПЕРТНО-АНАЛИТИЧЕСКИЕ СИСТЕМЫ

Таблица 3

Нормализованный вид множества транзакций для ЛП /-го заболевания

ЛТ переменных

Номер транзакции У

< \5 А

1 1 1 1 0 1 0 1 1 1

2... 1 1 0 1 1 1 0 1 1 Л]

н 1 0 0 0 1 0 0 0 1 $

Примечание. Н - количество транзакций для ЛП /-го заболевания; q - количество ЛП сим-

птомов для ЛП/-го заболевания; ЛТ входной переменной симптома X ; ¿¡Г - ЛТ выходной

переменной заболевания У = А. .

На втором этапе необходимо вычислить значения поддержки и достоверности АП

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

для X = {х, = = и г = ¡р,= }.

Сгенерированные правила, имеющие достоверность выше, чем у принятого минимального порога (60 % и больше), составляют базу нечетких правил. В зависимости от значимости АП можно определить весовой коэффициент нечеткого правила, который характеризует его достоверность.

Обучение нечетко-продукционной базы знаний. Обучение нечетко-продукционной базы знаний (НПБЗ) осуществляется с применением генетического алгоритма [10].

Для обучения необходимо сформировать базу обучающих выборок и базу обучающихся нечетких правил базы знаний.

НПБЗ однозначно определяет некоторые параметры, которые сводятся в следующий

вектор:

где я] - параметры функции принадлежности 1-го ЛТ переменной /-го симпто-

ма; <%) = [ь^ 11 - параметры функции принадлежности 1-го ЛТ переменной 7-го заболевания; ©^ - весовой коэффициент А:, -го нечеткого правила 7-го заболевания.

Для создания начальной базы обучающихся НПБЗ выполняется генерирование определенного количества векторов параметров НПБЗ со случайной инициализацией параметров функций принадлежности ЛТ и весов нечетких правил в соответствующих интервалах.

База обучающих выборок может быть создана лишь путем использования процедуры экспертного опроса, позволяющего получить от экспертов информацию о специфичности и степени выраженности того или иного симптома для конкретного заболевания (табл. 4).

PRIKASPIYSKIY ZHURNAL: Upravlenie i Vysokie Tekhnologii (CASPIAN JOURNAL: Management and High Technologies), 2014, 4 (28) INFORMATION-MEASURING, REFERENCE, EXPERT-ANALYTICAL SYSTEMS

Таблица 4

Описание структуры базы обучающих выборок

№ выборки Симптомы Заболевание

XJ х„

1 Р\ Pi Р\ А

M PÍ Р3 г m Л Dm

Примечание, р. - экспертная оценка проявления/-го симптома при обнаружении /-го заболевания. На рис. 2 представлена схема обучения нечеткой базы правил.

Кодирование НПБЗ

База обучающихся НПБЗ

Декодирование НПБЗ

Популяция хромосом

Формирование новой популяции

Вычисление оценок приспособленности хромосом в популяции

Селекция хромосом

Применение генетических операторов к хромосомам

■* -5—

База обучающих выборок

1 - Обучающиеся векторы параметров нечетких правил;

2 - Хромосомы;

3 - Родители-хромосомы;

4 - Потомки-хромосомы;

5 Обучающие выборки;

6 - Хромосомы с приспособленностью;

7 - Лучшие хромосомы;

8 - Векторы параметров нечетких правил после настройки

Рис. 2. Схема обучения НПБЗ

При кодировании/декодировании НПБЗ в хромосомы используется код Грея [3]. Каждой хромосоме из популяции ставится в соответствие оценка ее приспособленности в популяции по следующей формуле:

где р, - обучающая выборка; - вектор декорированных генов хромосомы; - ре-

альный выход модели; с/г - желаемый выход модели.

Оценка приспособленности хромосомы для всех обучающих выборок вычисляется по следующей формуле:

ррщ^/Чр.^/Ы

где Х - количество обучающих выборок.

Селекция хромосом, основанная на принципе колеса рулетки, заключается в выборе по вычисленным оценкам приспособленности хромосом для генерации очередного поколения. К хромосомам применяются три следующих оператора с определенной вероятностью: скрещивание; мутация и инверсия [6].

Для формирования нового популяции необходимо сокращение популяции до исходного количества хромосом с применением оператора редукции. Процесс обучения считается законченным, если достигнуто пороговое значение оценки приспособленности хромосомы или достигнуто ограничение на максимальное число эпох функционирования, т.е. не превышен заданный порог для числа эпох.

После обучения выбирается лучшая хромосома с максимальной оценкой приспособленности, которая после декодирования используется для формирования БМЗ

ПРИКАСПИЙСКИЙ ЖУРНАЛ: управление и высокие технологии N° 4 (28) 2014 ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ, ИНФОРМАЦИОННО-СПРАВОЧНЫЕ, ЭКСПЕРТНО-АНАЛИТИЧЕСКИЕ СИСТЕМЫ

Для установления новых зависимостей и корректировки правил в базе знаний предлагается механизм «обратной связи», который основан на идее «отсроченной медицинской консультации». Реализуется возможность пополнения базы статистических данных на основе анализа информации, полученной после обработки анкет, решения по которым не были приняты автоматически. На рис. 3 представлена схема отсроченной медицинской консультации, состоящей из пяти основных этапов.

Заполнение и отправление анкеты врачам по специальности I 1

_4_

Принятие анкеты от пациента

—3-

Анализ симптоматики пациента в анкете

Занесение в базу данных

Отправление пациенту рекомендаций для обследования

1 - Отправленная пациентом анкета;

2 - Принятая врачом анкета;

3 - Симптоматика пациента и заключение врача

4 - Рекомендации пациенту для обследования.

Рис. 3. Схема отсроченной медицинской консультации

Все поля анкеты, необходимые для описания симптоматики пациента (например, персональная информация, список вопросов-ответов по симптомам и т.д.), заполняются автоматически в соответствии с ее структурой (см. рис. 4). Затем заполненная анкета отправляется врачам узкой специализации.

Анкета

Заголовок

Л

Дата консультации

1

Специальность

Персональная информация пациента

Основная часть

* г

Вопросы-ответы Объяснительная , информация

Предполагаемое диагностическое заключение

Рис. 4. Структура подготовленной анкеты При получении письма с такой анкетой врач может принять решение о постановке предварительного диагностического заключения или передать письмо врачам другой специализации. После анализа симптоматики пациента и получения результатов обследования врач добавляет диагностическое заключение в базу данных.

Проверка базы медицинских знаний. В предлагаемом способе построения БМЗ ошибки в экспертной информации ведут к возникновению противоречий как в составлении симптомокомплексов для заболеваний, так и в экспертной оценке проявлений симптомов при обнаружении заболеваний. Проверка базы медицинских знаний (ПБМЗ) предназначена для поиска и исключения противоречий. Для этого необходимо сопоставлять информацию, получаемую от эксперта, с полученной ранее и проверять их на непротиворечивость. В задачу поиска и исключения противоречий входит выявление следующих правил:

• конфликтные правила (два разных заболевания имеют схожие симптомокомплексы);

• избыточные правила (одинаковые симптомокомплексы присутствуют у сходных заболеваний).

Каждый симптомокомплекс заболевания представляет собой дескриптивное множество, каждому элементу которого поставлено в соответствие путем экспертной оценки проявления симптома при обнаружении заболевания. Для количественного определения степени сходства двух симптомокомплексов применяется бинарный коэффициент сходства Куль-чинского [14], значения которого находятся в диапазоне от «О» (сходство отсутствует) до «1» (полное сходство). Ниже приведен алгоритм поиска и исключения противоречий в БМЗ.

Переменные:

• создаваемый симптомокомплекс для нового заболевания;

• множество симптомокомплексов для всех заболеваний.

Шаг 1. Для каждого /-ого симптомокомплекса из уже имеющегося множества «./» для всех заболеваний:

Шаг 1.1. Вычислить коэффициент сходства вновь создаваемого (т.е. симптомоком-плекса-кандидата на добавление в множество) и /-ого рассматриваемого симптомокомплекса из имеющегося множества по следующей формуле:

к=(Vir (д ))-1>ь(д,д.)/2,

где Д - экспертная оценка проявления 7-го симптома в создаваемом симптомокомплексе А ; Bi - экспертная оценка проявления 7-го симптома в рассматриваемом симптомокомплексе В ; р - количество симптомов в симптомокомплексе А ; q - количество симптомов в симптомокомплексе В ; р - количество симптомов, общих в симптомокомплексах А и В .

Шаг 1.2. Сравнить вычисляемый коэффициент сходства для вновь создаваемого симптомокомплекса, который является кандидатом на добавление в множество, с у-ым, рассматриваемым в отношении превышения заданного порогового значения.

а) Если коэффициент сходства превышает заданный порог и заболевания различны, то правила создаваемого симптомокомплекса конфликтны, тогда создаваемый симптомокомплекс добавляется в список для модификации. При редактировании симптомокомплекса необходимо перейти к началу цикла проверки.

б) Если коэффициент сходства превышает заданный порог и заболевания сходны, то правила создаваемого симптомокомплекса избыточны, тогда симптомокомплекс-кандидат в БМЗ не добавляется. Перейти к окончанию алгоритма.

в) Если коэффициент сходства не превышает заданный порог и заболевания сходны, то рассматриваемый симптомокомплекс добавляется в список для модификации. При редактировании симптомокомплекса необходимо повторить текущий цикл проверки.

г) Если коэффициент сходства не превышает заданный порог и заболевания различны, то создаваемый симптомокомплекс до сих пор непротиворечив.

Шаг 2. Добавление симптомокомплекса-кандидата в БМЗ после успешной проверки на непротиворечивость.

На рис. 5 представлена блок-схема алгоритма поиска и исключения противоречий в БМЗ.

ПРИКАСПИЙСКИЙ ЖУРНАЛ: управление и высокие технологии N° 4 (28) 2014 ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ, ИНФОРМАЦИОННО-СПРАВОЧНЫЕ, ЭКСПЕРТНО-АНАЛИТИЧЕСКИЕ СИСТЕМЫ

Программная реализация подсистемы приобретения медицинских знаний. На

основании описанной модели был разработан прототип программного комплекса, который предназначен для создания, модификации и расширения БМЗ (см. рис. 6).

Реляционные базы данных необходимы для хранения информации о медицинских данных (таблицы заболеваний, симптомов, симптомокомплексов и т.д.), отправленных анкетах, обучающихся НПБЗ и статистических данных (таблиц вопросов-ответов, диагностических заключений и т.д.).

База медицинских знаний состоит из фреймовой базы знаний и нечетко-продукционной базы знаний.

Подсистема пополнения БМЗ предназначена для заполнения таблиц основных понятий области медицинской диагностики и задания функций принадлежности лингвистических термов переменных.

Подсистема извлечения знаний из статистических данных предназначена для выявления взаимосвязи между ЛП «симптомов и заболеваний» и их ЛТ, на основании которых сформированы нечеткие правила.

Врачи-эксперты

Инженер по знаниям

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пользовательский интерфейс

Подсистема пополнения БМЗ

Подсистема обучения НПБЗ

Подсистема отсроченной консультации

Подсистема извлечения знаний

База медицинских знаний

Базы обучающихся НПБЗ

База отправленных анкет

База статистических данных

База медицинских данных

Реляционные базы данных Рис. 6. Структурная схема программного комплекса

Подсистема обучения НПБЗ предназначена для генерирования и настройки параметров функций принадлежности и весов правил в НПБЗ.

Подсистема отсроченной консультации реализует следующие функции: заполнения анкеты; обмена сообщениям между пациентом и врачом; внесения информации в базу данных.

Для разработки прототипа были использованы следующие программные средства: язык программирования С#; среда разработки Microsoft Visual 2010; система управления базами данных Microsoft SQL Server 2008.

Заключение. Предложенная модель формирования базы знаний обладает следующими достоинствами:

• обеспечивает возможность создания и модификации БМЗ по критериям полноты и непротиворечивости;

• позволяет легко добавлять как новые симптомы, так и заболевания при необходимости расширения БМЗ;

• позволяет быстро генерировать нечеткие правила на основании статистических данных, а также добавлять новые симптомы в симптомокомплексы заболеваний;

• обеспечивает настройку параметров функции принадлежности лингвистических термов переменных и весовых коэффициентов нечетких правил;

• позволяет организовать процедуру отсроченной медицинской консультации, на основе которой осуществляется сбор статистической информации и пополнение базы знаний.

Таким образом, в перспективе рассмотренный прототип может послужить базой для создания медицинских экспертных систем, предназначенных для предварительной постановки диагноза на основе симптоматики; оценки динамики состояния пациентов и дистанционных консультаций. При этом набор симптомов должен быть выбран таким образом, чтобы обеспечивалась достаточная дифференцирующая способность в отношении диагностируемых заболеваний.

ПРИКАСПИЙСКИЙ ЖУРНАЛ: управление и высокие технологии № 4 (28) 2014 ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ, ИНФОРМАЦИОННО-СПРАВОЧНЫЕ, ЭКСПЕРТНО-АНАЛИТИЧЕСКИЕ СИСТЕМЫ

Список литературы

1. Ахаев А. В. Алгоритмы и программные средства построения web-ориентированных экспертных систем выбора программных продуктов на примере «1С:Предприятие 8» / А. В. Ахаев // Информационные и математические технологии в науке и управлении : XVIII Байкальская Всерос. конф. с междунар. участием. - Иркутск, 2013. - С. 78-84.

2. Базанова, Е. П. Способы бинарного кодирования в генетическом алгоритме // Молодежь и наука : сб. мат-лов IX Всерос. науч.-техн. конф. студентов, аспирантов и молодых ученых с международным участием, посвященной 385-летию со дня основания г. Красноярска. - Красноярск : Сибирский федеральный ун-т, 2013. - Режим доступа: http://conf.siu-kras.ru/sites/mn2013/section093.html (дата обращения 23.10.2014), свободный. - Заглавие с экрана. - Яз. рус.

3. Брумштейн Ю. М. Анализ направлений и методов информационно-коммуникационной поддержки процессов надомного медицинского обслуживания / Ю. М. Брумштейн, Н. И. Гуськова, Е. А. Генералова // Прикаспийский журнал: управление и высокие технологии. - 2011. - № 4. - С. 72-78.

4. Брумштейн Ю. М. Системный анализ направлений и особенностей информатизации сферы здравоохранения России / Ю. М. Брумштейн, Е. В. Скляренко, А. С. Мальвина, Ю. Ю. Аксенова, А. Б. Кузьмина // Прикаспийский журнал: управление и высокие технологии. - 2013. - № 4 (24). - С. 73-86.

5. Гаврилова Т. А. Базы знаний интеллектуальных систем / Т. А. Гаврилова, В. Ф. Хорошевский. - Санкт-Петербург : Питер, 2000. - 384 с.

6. Катасёв А. С. Нейронечеткая модель формирования баз знаний экспертных систем с генетическим алгоритмом обучения / А. С. Катасёв, Ч. Ф. Ахатова // Проблемы управления и моделирования в сложных системах : тр. ХП Междунар. конф. - Самара: Самарский научный центр РАН, 2010. - С. 615-621.

7. Комплексная медицинская информационная система (КМИС). - Режим доступа: http://vs.ramec.ru/computer/ram_med/kmis&printable (дата обращения 06.11.2014), свободный. - Заглавие с экрана. - Яз. рус.

8. Курейчик В. В. Анализ современного состояния автоматизированных систем приобретения и представления знаний / В. В. Курейчик, П. В. Сороколетов, П. С. Щеглов // Известия ЮФУ. Технические науки. - 2008. - № 9. - С. 120-125.

9. Jle Нгуен Виен. Модель представления знаний при создании медицинской экспертной системы дифференциальной диагностики / Ле Нгуен Виен, В. А. Камаев, Д. П. Панченко, О. А. Трушки-на // Известия ВолгГТУ. Серия. Актуальные проблемы управления, вычислительной техники и информатики в технических системах - 2014. - Вып. 20, № 6 (133). - С. 41-50.

10. Мальвина А. С. Автоматизация, диспетчеризация и информатизация высокотехнологичных медучреждений как средство повышения эффективности их работы / А. С. Мальвина, Ю. М. Брумштейн, Е. В. Скляренко, А. Б. Кузьмина // Прикаспийский журнал: управление и высокие технологии. -2014. -№ 1.-С. 122-138.

11. Митюшкин Ю. И. Soft-Computing: Идентификация закономерностей нечеткими базами знаний / Ю. И. Митюшкин, Б. И. Мокин, А. П. Ротштейн. - Винница : УНШЕРСУМ-Вшниця, 2002. - 145 с.

12. Нестерова Е. В. Проблемы извлечения знаний из баз данных / Е. В. Нестерова, И. Г. Жукова // VII Регион, конф. молодых исследователей Волгоградской области, г. Волгоград, 12-15 ноября 2002 / ВолгГТУ [и др.] - Волгоград, 2003. - С. 208-210.

13. Рыбина Г. В. Основы построения интеллектуальных систем : учеб. пос. / Г. В. Рыбина. -Москва : Финансы и статистика ; ИНФРА-М, 2010. - 432 с.

14. Семкин Б. И. О связи между средними значениями двух мер включения и мерами сходства / Б. И. Семкин // Бюллетень Ботанического сада-института ДВО РАН. - 2009. - Вып. 3. - С. 91-101.

15. Телемедицинский консультативно-образовательный центр. - Режим доступа: http://bonum.info/telemedicine-center (дата обращения 06.11.2014), свободный. - Заглавие с экрана. - Яз. рус.

16. Apriori - масштабируемый алгоритм поиска ассоциативных правил. - Режим доступа: http://www.basegroup.ru/library/analysis/association_rules/apriori/ (дата обращения 06.11.2014), свободный. - Заглавие с экрана. - Яз. рус.

17. Easterbrook S. М. Distributed Knowledge acquisition as a model for requirements elicitation / S. M. Easterbrook // Proc. of EKAW. - 1989. - P. 530-543.

18. Knowledge acquisition for explainable, multiexpert, knowledge-based design systems / R. Di-eng, A. Giboin, P. Tourtier, О. Corby // EKAW. - 1992. - P. 298-317.

19. Sadovnikova N. P. Intelligent support for target marketing of telecommunication companies / N. P. Sadovnikova, Yu. E. Benetskaya // 23rd International Crimean Conference Microwave and Telecommunication Technology: Conference Proceedings. -2013. - P. 370-371.

References

1. Akhaev A. V. Algoritmy i programmnye sredstva postroeniya web-orientirovannykh ekspertnykh sistem vybora programmnykh produktov na primere «lS:Predpriyatie 8» [Algorithms and software tools for developing web-based expert systems for the selection of software products on the example of "lC:Enterprise 8"]. Informatsionnye i matematicheskie tekhnologii v nauke i upravlenii: XVIII Baykalskaya Vserossiyskaya konferentsiya s mezhdunarodnym uchastiem [Information and mathematical technologies in science and management: XVIII Baikal Russian Conference with International Participation], Irkutsk, 2013, pp. 78-84.

2. Bazanova Ye. P. Sposoby binarnogo kodirovaniya v geneticheskom algoritme [Method of binary encoding in genetic algorithm], Molodezh i nauka: sbornik materialov IKh Vserossiyskoy nauchno-tekhnicheskoy konferentsii studentov, aspirantov i molodykh uchenykh s mezhdunarodnym uchastiem [Youth and science: Proceedings of the IX All-Russian Scientific-Technical Conference of Students, Postgraduates and Young Scientists with International Participation], Krasnoyarsk: Siberia Federal Univ. Publ., 2013. Available at: http://conf.slu-kras.ru/sites/mn2013/section093.html (accessed 23 October 2014).

3. Brumshteyn Yu. M., Guskova N. I., Generalova Ye. A. Analiz napravleniy i metodov informat-sionno-kommunikatsionnoy podderzhki protsessov nadomnogo meditsinskogo obsluzhivaniya [Analysis of trends and methods of information and communication processes for supporting home-based medical care]. Prikaspiyskiy zhurnal: upravlenie i vysokie tekhnologii [Caspian Journal: Management and High Technologies], 2011, no. 4, pp. 72-78.

4. Brumshteyn Yu. M., Sklyarenko Ye. V., Malvina A. S., Aksenova Yu. Yu., Kuzmina A. B. Sis-temnyy analiz napravleniy i osobennostey informatizatsii sfery zdravookhraneniya Rossii [A systematic analysis of trends and characteristics of informatisation in the sphere of health of Russia]. Prikaspiyskiy zhurnal: upravlenie i vysokie tekhnologii [Caspian Journal: Management and High Technologies]. 2013, no. 4 (24), pp. 73-86.

5. Gavrilova T. A., Khoroshevskiy V. F. Bazy znaniy intellektualnykh sistem [Knowledge base of intelligent systems]. Saint Petersburg, Piter. 2000. 384 p.

6. Katasev A. S., Akhatova Ch. F. Neyronechetkaya model formirovaniya baz znaniy ekspertnykh sistem s geneticheskim algoritmom obucheniya [Neuroptera model of formation of the knowledge bases of expert systems with genetic learning algorithm], Problemy upravleniya i modelirovaniya v slozhnykh siste-makh: trudy XII Mezhdunarodnoy konferentsii [Problems of control and modeling in complex systems]. Samara, 2010, pp. 615-621.

7. Comprehensive medical information system. Available at: http://vs.ramec.ru/computer/ram_med/kmis&printable (accessed 6 November 2014).

8. Kureychik V. V., Sorokoletov P. V., Shcheglov P. S. Analiz sovremennogo sostoyaniya avtomatizi-rovannykh sistem priobreteniya i predstavleniya znaniy [The analysis of the current state of automated systems of acquisition and knowledge representation], Izvestiya Yuzhnogo federalnogo universiteta. Tekhnicheskie nauki [News of South Federal University. Technical Science], 2008, no. 9, pp. 120-125.

9. Le Nguen Vien, Kamaev V. A., Panchenko D. P., Trushkina O. A. Model predstavleniya znaniy pri sozdanii meditsinskoy ekspertnoy sistemy differentsialnoy diagnostiki [The model of knowledge representation when creating a medical expert system for differential diagnosis]. Izvestiya Volgogradskogo gos-darstvennogo tekhnicheskogo universiteta. Aktualnye problemy upravleniya, vychislitelnoy tekhniki i infor-matiki v tekhnicheskikh sistemakh [News of Volgograd State Technical University. Actual problems of management, computer engineering and informatics in technical systems], 2014, pp. 41-50.

10. Malvina A. S., Brumshteyn Yu. M., Sklyarenko Ye. V., Kuzmina A. B. Avtomatizatsiya, dis-petcherizatsiya i informatizatsiya vysokotekhnologichnykh meduchrezhdeniy kak sredstvo povysheniya ef-fektivnosti ikh raboty [Automatization, dispatchment and informatization of high-tech medical facilities as a means of increasing the effectiveness of their work]. Prikaspiyskiy zhurnal: upravlenie i vysokie tekhnologii [Caspian Journal: Management and High Technologies], 2014, no. 1, pp. 122-138.

11. Mityushkin Yu. I., Mokin B. I., Rotshteyn A. P. Soft-Computing: Identifikatsiya zakonomer-nostey nechetkimi bazami znaniy [Soft-Computing: the Identification of patterns of fuzzy knowledge bases]. Vinnitsa: UNIVYeRSUM-Vinnitsya. 2002, 145 pp.

ПРИКАСПИЙСКИЙ ЖУРНАЛ: управление и высокие технологии № 4 (28) 2014 ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ, ИНФОРМАЦИОННО-СПРАВОЧНЫЕ, ЭКСПЕРТНО-АНАЛИТИЧЕСКИЕ СИСТЕМЫ

12. Nesterova Ye. V., Zhukova I. G. Problemy izvlecheniya znaniy iz baz dannykh [The problem of knowledge extraction from databases]. VII Regionalnaya konferentsiya molodykh issledovateley Volgo-gradskoy oblasti [VII Regional conference of young researchers of the Volgograd region], Volgograd. 2003, pp. 208-210.

13. Rybina G. V. Osnovy postroeniya intellektualnykh sistem [Fundamentals of building intelligent systems], Moskva, Finansy i statistika; INFRA-M, 2010. 432 p.

14. Semkin B. I. O svyazi mezhdu srednimi znacheniyami dvukh mer vklyucheniya i merami skhod-stva [On the relationship between the average values of the two measures, and measures of similarity]. Byul-leten Botanicheskogo sada-instituta Dalneostochnogo otdeleniya RAN [Bulletin of the Botanical Garden-Institute of Far Eastern Branch of RAS], 2009, iss. 3, pp. 91-101.

15. Telemedicine Advisory and education centre. Available at: http://bonum.info/telemedicine-center (accessed 6 November 2014). (In Russ.)

16. Apriori is a scalable algorithm for mining Association rules. Available at: http://www.basegroup.ru/library/analysis/association_rules/apriori/ (accessed 6 November 2014).

17. Easterbrook S. M. Distributed Knowledge acquisition as a model for requirements elicitation. Proc. ofEKAW, 1989, pp. 530-543.

18. Dieng R., Giboin A., Tourtier P., Corby O. Knowledge acquisition for explainable, multiexpert, knowledge-based design systems. EKAW, 1992, pp. 298-317.

19. Sadovnikova N. P., Benetskaya Yu. E. Intelligent support for target marketing of telecommunication companies. 23rd International Crimean Conference Microwave and Telecommunication Technology, Conference Proceedings, 2013, pp. 370-371.

УДК 519.216

МЕТОД ОЦЕНКИ И ОБЕСПЕЧЕНИЯ КАЧЕСТВА ИСПЫТАНИЙ АВТОМАТИЗИРОВАННЫХ СИСТЕМ

Статья поступила редакцию 11.08.2014, в окончательном варианте 06.12.2014.

Старусев Андрей Викторович, кандидат технических наук, Научно-исследовательский испытательный центр, 416540, Российская Федерация, Астраханская область, г. Знаменск, войсковая часть 29139, e-mail: starusev-av@yandex.ru

Предложен метод, позволяющий оптимизировать процессы испытания разработанных автоматизированных систем различного функционального назначения (АСРФН) и эффективно решать актуальные организационные вопросы испытаний. Рассмотрены риски заказчика и разработчика АСРФН с позиций системного анализа. С целью обоснования достижения оптимального компромиссного решения в отношении параметров АСРФН для заказчика и разработчика была установлена взаимосвязь между значениями рисков для них, критерий оптимизации выработки компромисса. Исследованы также риски, связанные с использованием оперативной характеристики, определяющей вероятность того, что применение данного критерия приведет к решению, для которого характеристики АСРФН будут соответствовать условиям технического задания. Определен критерий для минимизации сумм рисков разработчика и заказчика, который целесообразно применять при испытаниях готовых опытных образцов АСРФН. Проведено обоснование достижимости требуемой эффективности работы АСРФН в целом, а также необходимого качества её функционирования, обеспечивающего эту эффективность. Расчеты рисков для заказчика и разработчика - важнейшие с точки зрения системного анализа и обеспечения уверенности в достигаемой точности функционирования АСРФН, оцененной количественно. Чтобы учесть требования разработчика и заказчика, необходимо в техническом задании указывать два значения вероятности успешной работы АСРФН: наименьшее значение вероятности успешной работы, допустимое для заказчика; наибольшее значение вероятности успешной работы, на которое следует «настраивать» разработчику производство создаваемых АСРФН.

i Надоели баннеры? Вы всегда можете отключить рекламу.