Научная статья на тему 'Использование полуструктурированного подхода для построения базы данных региональной телемедицинской информационной системы'

Использование полуструктурированного подхода для построения базы данных региональной телемедицинской информационной системы Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
170
51
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Царегородцев А. Л., Горлов Н. В.

The problem of the data storage and processing in the regional telemedicine system is considered. The conclusion is drawn that the medical data ought to be regarded as semi-structured one. The XML-containers are proposed to be used for their storage and processing. The basic advantages of the semi-structured approach with the XML-container utilizations for the storage of the various medical parameters are shown.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Царегородцев А. Л., Горлов Н. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование полуструктурированного подхода для построения базы данных региональной телемедицинской информационной системы»

А, 120)

момент времени те[0, гс), с начальными условиями

Рй (0) = 1 , р(0) = 0 , г = 1,2,3,4,5 .

В соответствии с размеченным графом составляется система дифференциальных уравнений (сложность которой зависит от количества состояний системы и вида функций распределения времени пребывания системы в заданном состоянии) на вероятности р (т) .

Для заданного графа система уравнений имеет вид

(т (т Р'(т

с начальными условиями Р0 (0) = 1, р (0) = 0 , і = 1, 2, 3, 4, 5 и условием нормировки:

где Ку (т) - параметры процесса, описываемого

размеченным графом состояний, которые являются интенсивностями перехода вещества из состояния в состояние и заключают в себе все наиболее существенные физико-химические особенности вещества и процесса в целом. Функциональный вид параметров (в частности числовые значения интенсивностей перехода) определяют из статистических данных традиционными методами. Сложность возникает в связи с тем, что не для каждого состояния системы сбор статистических данных доступен. Для получения заданных интенсивностей по каждому из состояний системы используется принцип «черного» ящика: по каждому из состояний, находящихся внутри «черного» ящика, для соответствующих интенсивностей находится допустимый интервал значений по известной концентрации на входе и выходе из него.

= -^01 (Т)Р0 (т)>

= V (Т)Р0 (Т) - ( (Т) + ^13 (Т)) (Т) + *21 (Т)Р2 (Т)

= *12 (Т)Р (Т) - (*21 (Т) + *24 (Т) + *25 (Т))Р2 (Т)>

= *13 (Т)Р (Т)>

= *24 (Т)Р2 (Т)>

= *25 (Т)Р2 (Т)>

Если считать *.. (т) = *

1

вР.

, то решение системы

дифференциальных уравнений находится в аналитическом виде [1] стандартными методами.

По найденным вероятностям легко определить среднее число частиц растворенного вещества в каждом из состояний системы, концентрацию и другие показатели эффективности функционирования системы .

Следует заметить, что математическая модель не только основывается на методах теории массового обслуживания, но и использует теорию случайных процессов.

Литература

1. Павский В.А. и др. Применение методов теории массового обслуживания для описания процессов мембранного концентрирования (обзор) // Хранение и переработка сельхозсырья. 2001. № 12.

2 = 0

УДК 004.652

А.Л. Царегородцев, Н.В. Горлов

ИСПОЛЬЗОВАНИЕ ПОЛУСТРУКТУРИРОВАННОГО ПОДХОДА ДЛЯ ПОСТРОЕНИЯ БАЗЫ ДАННЫХ РЕГИОНАЛЬНОЙ ТЕЛЕМЕДИЦИНСКОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ

Югорский научно-исследовательский институт информационных технологий, г. Ханты-Мансийск

Проблема повышения качества медицинской помощи является приоритетной задачей Российского государства. Высокий уровень здравоохранения служит залогом высокого качества жизни населения, что, в свою очередь, является основой безопасности нации. При этом особое значение имеет интеграция информационных систем и систем телекоммуникаций как средство повышения эффективности медицины,

обеспечивающее медицинскому работнику удаленный доступ к современным медицинским ресурсам, в том числе, международным. Одним из главных достоинств телемедицины является возможность приблизить высококвалифицированную и специализированную помощь работников ведущих медицинских центров к отдаленным районам и тем самым существенно сэкономить расходы на лечение. Все вышесказан-

А.Л. Царегородцев, Н.В. Горлов. Использование полуструктурированного подхода для.

ное обусловливает актуальность проведения исследований и разработок региональных телемедицинских информационных систем.

Региональная телемедицинская информационная система Ханты-Мансийского автономного округа (РТИС ХМАО) - это территориально распределенный программно-технический комплекс, позволяющий проводить телеконсультации медицинских видеоизображений и сопроводительной информации о пациенте в режиме отсроченных телеконсультаций посредством электронной почты.

Комплекс состоит из серверной и клиентской частей. Серверная часть обеспечивает работу по организации взаимодействия между консультантами и консультируемыми. Она включает в себя СУБД «Oracle», www-сервер, почтовый модуль «Обработчик почты», сервер обновлений, АРМ «Администратор», а также web-приложения: АРМ «Координатор», АРМ «Консультант On-line» и АРМ «Статистика». Клиентская часть включает в себя АРМ «Консультант/консультируемый», подсистему «Перинатальный аудит» и аппаратную часть, комплектуемую в зависимости от потребностей консультируемого врача. Она может содержать микроскоп, видеокамеру, компьютер с платой видеозахвата и т.д.

Традиционный подход к разработке базы данных РТИС опирается на реляционную модель представления данных. Однако, как известно, реляционная модель предполагает точное знание структуры хранимых данных. При использовании реляционной модели все строки в какой-либо таблице базы всегда имеют одинаковый набор полей; кроме того, заголовки столбцов, первичные ключи в таблицах и т.д. должны быть определены заранее. При появлении данных с новой структурой, не встречавшейся в реляционной базе до этого момента, в схему базы необходимо вносить изменения или даже полностью перестраивать всю ее структуру.

Другая характерная особенность РТИС состоит в том, что она является распределенной системой, в связи с чем возникает задача интеграции распределенных данных. Проблема заключается в том, что даже при объединении источников, данные которых хорошо структурированы, не всегда удается создать жесткую структуру для полученных суммарных данных.

Таким образом, для организации хранения и обработки медицинских данных требуется решить две проблемы:

- проблему управление медицинскими данными, имеющими нечеткую, «размытую» структуру;

- проблему интеграции медицинских данных из различных источников.

Рассмотрим основные особенности медицинских данных.

1.Неправильная структура. В различных источниках данных одни и те же сущности реального мира

могут моделироваться с помощью разных структур и типов данных. Так, запись в медицинской карте для одного пациента может содержать перечень прививок, для другого - показатели роста и веса, для третьего - операции, который ему сделали. Другой пример: технические характеристики медицинских приборов описываются параметрами, качественно отличающимися у разных моделей. При объединении разнородных источников можно попытаться сконструировать новую структуру, включающую в себя все разнородные данные. Однако при большом количестве источников создание такой единой структуры может натолкнуться на непреодолимые технические трудности, либо эта структура окажется настолько сложной, что ее использование станет неэффективным. Если отказаться от попыток создания структуры, общей для всех данных, то интегрированные данные будут иметь неправильную структуру.

2.Неявная структура. Значительное количество медицинских данных хотя и имеет некоторую структуру, но эта структура неявная. Например, медицинские данные подсистемы «Перинатальный аудит» РТИС ХМАО включают в себя очень большое число различных показателей, классификация которых не разработана. Кроме того, медицинские данные иногда имеют неизвестную структуру, примером чего могут служить мультимедийные данные или документы со структурированным текстом.

З.Частичная структурированность. В ряде случаев большая часть медицинских данных, работу с которыми необходимо автоматизировать, имеют четкую структуру. Для хранения этой части данных используют традиционные системы управления базами данных и разрабатывают методы связи структурированных данных с оставшимися данными, которые не удалось структурировать и которые приходится хранить не в базе данных, а в других системах, например в файловой системе.

4.Частое изменение структуры. Структура медицинских данных часто меняется. Примером могут служить медицинские отчеты, в которых каждый год одни показатели добавляются, а другие исчезают.

5.Апостериорная структура медицинских данных. Как известно, традиционные СУБД используют жестко фиксированную структуру данных. В таких СУБД сначала описывается структура базы данных и только затем база наполняется данными. На наш взгляд, при работе с медицинскими данными целесообразно применять обратный подход: сначала заполняется база данных, и в процессе заполнения определяется ее структура. Системы, работающие по последнему принципу, называют системами с апостериорной схемой. Использование такого подхода дает большую гибкость при формировании базы и предоставляет возможность свободно изменять ее структуру.

Проведенный анализ характерных особенностей структуры медицинских данных и предварительное

планирование базы данных РТИС ХМАО с использованием функциональных диаграмм и диаграмм потоков данных позволяет сделать вывод о том, что медицинские данные следует рассматривать как полу-структурированные данные, которые способны динамически изменять свою структуру, свой состав и тип.

Известно, что полуструктурированные данные сложно хранить в реляционной базе данных, поскольку в этом случае возникает либо много различных таблиц, либо проектируется единственная таблица с множеством пустых колонок. И то и другое негативно сказывается на продолжительности времени поиска данных и поддержке их целостности в базе. «Полу-структурированные данные очень легко хранить как XML, и они великолепно подходят для XML-баз данных» [1].

В связи с этим база данных РТИС ХМАО разрабатывалась нами не как реляционная, а как XML-база данных. Данный подход основан на технологии XML (extensible Markup Language - расширяемый язык разметки), которая, по сути, является синтаксисом, позволяющим создавать языки разметки (схемы), описывающие данные.

Использование XML-контейнеров для хранения различных медицинских параметров приводит к резкому сокращению числа таблиц, отпадает необходимость в глубокой иерархии данных, что, в свою очередь, приводит к увеличению скорости доступа к базе данных. В целом при выполнении запросов над иерархическими данными, в которых соединения требуются только для воссоздания иерархии, XML-СУБД являются эффективнее реляционных.

В заключение приведем пример. Диагноз пациента, находившийся в реляционной базе в нескольких десятках таблиц, при использовании XML-контейнеров запишется в виде

<?xml version=”1.0" encoding=”UTF-8"?> <{8D4FA29A-F9D9-4C6B-99E4-D8728C8AE715} Version=”1.0">

<DATA>

<DIAGNOS-ITEMS>

<DIAGNOS ID=”53"/>

<DIAGNOS ID=”56"/>

</DIAGNOS-ITEMS>

<TEK_BEREM_ITEMS>

<TEK_BEREM NN=”0" SROK=”10" DATA_CONS=”29.03.2006" USER_CONS=”1" MESTO_CONS=”1" MESTO_LECH=”1" OPIS=””> <TEK_BEREM_DIAGNOS_ITEMS> <TEK_BEREM_DIAGNOS ID=”16"/> </TEK_BEREM_DIAGNOS_ITEMS>

<TEK BEREM SCHEMA LECH ITEMS>

<TEK_BEREM_SCHEMA_LECH ID=”3"/> </TEK_BEREM_SCHEMA_LECH_ITEMS> </TEK_BEREM>

<TEK_BEREM NN=”1" SROK=”15" DATA_CONS=”29.03.2006" USER_CONS=”3" MESTO_CONS=”5" MESTO_LECH=”3" OPIS=””> <TEK_BEREM_DIAGNOS_ITEMS> <TEK_BEREM_DIAGNOS ID=”13"/> </TEK_BEREM_DIAGNOS_ITEMS> <TEK_BEREM_SCHEMA_LECH_ITEMS> <TEK_BEREM_SCHEMA_LECH ID=”4"/> <TEK_BEREM_SCHEMA_LECH ID=”6"/> </TEK_BEREM_SCHEMA_LECH_ITEMS> </TEK_BEREM>

</TEK_BEREM_ITEMS>

</DATA>

</{8D4FA29A-F9D9-4C6B-99E4-

D8728C8AE715}>

Все XML-контейнеры строятся по общему признаку. В первой декларации указывается тип документа - XML - и приводится дополнительная информация о нем. Сначала указывается версия XML-документа, после версии документа указывается кодировка. Объявление кодировки указывает набор символов документа. По умолчанию считается, что документ XML имеет кодировку UTF-8 (8-разрядный Unicode) или UTF-16 (16-разрядный Unicode). Если у документа одна из названных кодировок, этот атрибут можно не задавать. Атрибут «encoding» должен находиться в самом начале документа. Как и весь документ, объявление чувствительно к регистру символов [2].

Вторая декларация - это идентификатор GUID (Глобальный Уникальный Идентификатор), он создается ядром таким способом, чтобы гарантировать уникальность во времени и пространстве. Последняя декларация - это тоже уникальный идентификатор GUID XML-документа, показывающий, что описание диагноза закончено. Между второй и последней декларацией указаны непосредственно данные по диагнозу пациента.

Таким образом, применение полуструктурирован-ного подхода с использованием XML-контейнеров для хранения различных медицинских параметров позволяет:

- упростить структуру базы данных и, как следствие, увеличить скорость доступа к базе данных;

- уменьшить время поиска данных в базе за счет отсутствия глубокой иерархии данных;

- получить возможность гибкого изменения структуры базы данных;

- упростить приведение медицинских данных к общей структуре при попытке интеграции их из разнородных источников данных.

Литература

1. Bourret R. XML and Databases, http://www.rpbourret.com/xml/XMLAndDatabases.htm

2. Трэвис Б. XML и SOAP: программирование для серверов BizTalk. Новейшие технологии / Пер. с англ. М., 2001.

i Надоели баннеры? Вы всегда можете отключить рекламу.