Научная статья на тему 'К проблеме организации регистров медицинских данных: анализ и определение современного состояния средств хранения и обработки данных регионального диспансерного мониторинга'

К проблеме организации регистров медицинских данных: анализ и определение современного состояния средств хранения и обработки данных регионального диспансерного мониторинга Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
41
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИТИЧЕСКИЕ ТЕХНОЛОГИИ / ANALYTICAL TECHNIQUES / МАТЕМАТИЧЕСКИЕ МЕТОДЫ / MATHEMATICAL METHODS / OLAP СИСТЕМА / OLAP SYSTEM / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / DATA MINING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шаповалов Валентин Викторович, Шерстюк Юрий Михайлович, Кучинская Екатерина Михайловна

Научная задача исследования заключается в разработке методики построения средств информационной поддержки анализа данных медико-диспансерного мониторинга популяции региона на основе применения аналитических информационных технологий. Описывается подход к использованию аналитических технологий в качестве современного средства, которое позволит осуществить аккумуляцию, агрегацию и комплексный анализ данных регионального диспансерного мониторинга из лечебно-профилактических учреждений региона. Существующая система сбора и анализа данных регионального уровня крайне неэффективна, а комплексный анализ данных регионального диспансерного мониторинга с использованием только имеющихся информационных систем регистровой направленности весьма затруднен. Низкий уровень эффективности в данном случае обусловлен противоречием между требованиями по содержанию и характером задач комплексного анализа данных РДМ, оперативности их решения, составу и форме представления необходимых для их решения данных с одной стороны, и локальным характером автоматизированного сбора и хранения информационно несогласованных данных в разнородных автономных информационных системах учетного характера с другой. Задачу обеспечения комплексного анализа данных регионального диспансерного мониторинга на базе аналитических технологий целесообразно рассматривать как двухэтапную -первый этап можно считать этапом создания информационной поддержки комплексного анализа данных регионального диспансерного мониторинга, а второй аналитической.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On The Issue Of The Medical Data Registers’ Organization: Analysis And Determination Of The Current Status Of Funds Data Storage And Processing Dispensary Regional Monitoring

The scientific purpose of the research is the development of IT support’s construction methods for regional outpatient population monitoring data analysis on the basis of analytical information technologies. The approach to the using of analytical technology as a modern tool that will allow the accumulation, aggregation and analysis of regional medical institutions dispensary monitoring data is presented. The present system of data collection and analysis is extremely inefficient at the regional level and comprehensive analysis of the regional dispensary monitoring data using only existing register-oriented information systems is very difficult. The low level of efficiency in this case due to a contradiction between the requirements on the content and nature of the problems of complex analysis for regional outpatient population monitoring data, the efficiency of their solution, the composition and presentation required for their data solutions on the one hand, and the local character of the automated collection and storage of information inconsistent data across heterogeneous autonomous character information accounting systems on the other. The purpose of ensuring an integrated analysis of the regional dispensary monitoring data based on analytical technologies should be viewed as a two-staged process the first step can be considered as the creation of information support of complex analysis of regional dispensary monitoring data, and the second stage is analytical phase

Текст научной работы на тему «К проблеме организации регистров медицинских данных: анализ и определение современного состояния средств хранения и обработки данных регионального диспансерного мониторинга»

УДК 616.155.392.8-036.12:002.6

К ПРОБЛЕМЕ организации РЕГИСТРОВ МЕДИцИНСКИх ДАННых: АНАЛИЗ И ОПРЕДЕЛЕНИЕ СОВРЕМЕННОГО СОСТОяНИя СРЕДСТВ

хранения и обработки данных регионального

ДИСПАНСЕРНОГО МОНИТОРИНГА

© Валентин Викторович Шаповалов, Юрий Михайлович Шерстюк, Екатерина Михайловна Кучинская

Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина). 197376, Россия, Санкт-Петербург, ул. Профессора Попова, д. 5

Контактная информация: Валентин Викторович Шаповалов — д. т. н., профессор, профессор кафедры биотехнических систем СПбГЭТУ «ЛЭТИ». Е-таН: svv@inprosys.ru

РЕЗЮМЕ. Научная задача исследования заключается в разработке методики построения средств информационной поддержки анализа данных медико-диспансерного мониторинга популяции региона на основе применения аналитических информационных технологий. Описывается подход к использованию аналитических технологий в качестве современного средства, которое позволит осуществить аккумуляцию, агрегацию и комплексный анализ данных регионального диспансерного мониторинга из лечебно-профилактических учреждений региона. Существующая система сбора и анализа данных регионального уровня крайне неэффективна, а комплексный анализ данных регионального диспансерного мониторинга с использованием только имеющихся информационных систем регистровой направленности весьма затруднен. Низкий уровень эффективности в данном случае обусловлен противоречием между требованиями по содержанию и характером задач комплексного анализа данных РДМ, оперативности их решения, составу и форме представления необходимых для их решения данных с одной стороны, и локальным характером автоматизированного сбора и хранения информационно несогласованных данных в разнородных автономных информационных системах учетного характера — с другой. Задачу обеспечения комплексного анализа данных регионального диспансерного мониторинга на базе аналитических технологий целесообразно рассматривать как двухэтап-ную -первый этап можно считать этапом создания информационной поддержки комплексного анализа данных регионального диспансерного мониторинга, а второй — аналитической.

КЛЮЧЕВЫЕ СЛОВА: аналитические технологии, математические методы, OLAP система, интеллектуальный анализ данных.

ON THE ISSuE OF THE MEDICAL DATA REGISTERS' ORGANIzATION: ANALYSIS AND DETERMINATION OF THE CuRRENT STATuS OF FuNDS DATA STORAGE AND PROCESSING DISPENSARY REGIONAL MONITORING

© Valentin V. Shapovalov, Yuri M. Sherstyuk, Ekaterina M. Kuchinskaya

Saint Petersburg Electrotechnical University "LETI". ul. Professora Popova 5, 197376 St. Petersburg, Russian Federation.

Contact information: Valentin Viktorovich Shapovalov — doctor of technical sciences, Professor, Department of Biotechnical Systems. E-mail: svv@ inprosys.ru

ABSTRACT: The scientific purpose of the research is the development of IT support's construction methods for regional outpatient population monitoring data analysis on the basis of analytical information technologies. The approach to the using of analytical technology as a modern tool that will allow the accumulation, aggregation and analysis of regional medical institutions dispensary monitoring data is presented. The present system of data collection and analysis is extremely inefficient at the regional level and comprehensive analysis of the regional dispensary monitoring data using only existing register-oriented information systems is very difficult. The low level of efficiency in this case

ОРИГИНАЛЬНЫЕ СТАТЬИ

19

due to a contradiction between the requirements on the content and nature of the problems of complex analysis for regional outpatient population monitoring data, the efficiency of their solution, the composition and presentation required for their data solutions on the one hand, and the local character of the automated collection and storage of information inconsistent data across heterogeneous autonomous character information accounting systems — on the other. The purpose of ensuring an integrated analysis of the regional dispensary monitoring data based on analytical technologies should be viewed as a two-staged process — the first step can be considered as the creation of information support of complex analysis of regional dispensary monitoring data, and the second stage is analytical phase.

KEY WORDS: Analytical techniques, mathematical methods, OLAP system, data mining.

АКТУАЛЬНОСТЬ ПРОБЛЕМЫ

Оперативный и наиболее полный анализ данных регионального диспансерного мониторинга (РДМ) возможен только при автоматизации процессов их сбора, хранения и обработки на базе применения средств вычислительной техники, современных информационных и телекоммуникационных технологий. Однако существующая система сбора и анализа данных РДМ регионального уровня даже при наличии множества эксплуатируемых информационных систем (ИС) крайне неэффективна, а комплексный анализ данных РДМ с использованием только имеющихся (или им подобных) ИС регистровой направленности весьма затруднен. Низкий уровень эффективности в данном случае обусловлен противоречием между требованиями по содержанию и характером задач комплексного анализа данных РДМ, оперативности их решения, составу и форме представления необходимых для их решения данных с одной стороны, и локальным характером автоматизированного сбора и хранения информационно несогласованных данных РДМ в разнородных автономных ИС учетного характера — с другой. Автоматизированные комплексы диспансерного обследования АКДО выполняют только 10% диспансерных обследований [1].

Аналитические технологии могут выступать в качестве современного средства, которое позволит осуществить аккумуляцию, агрегацию и комплексный анализ данных РДМ из лечебно-профилактических учреждений (ЛПУ) региона. Задачу обеспечения комплексного анализа данных РДМ на базе аналитических технологий целесообразно рассматривать как двухэтапную — на первом этапе внедрить витрину данных (ВД) и online analytical processing (OLAP), а на втором — преобразовать ВД в хранилище данных (ХД) и дополнить OLAP средствами интеллектуального анализа данных (ИАД). Учитывая, что OLAP, в отличие от ИАД, не предполагает применения математических методов содержательной обработки данных (методов решения задач анализа и прогнозирования), первый этап можно считать этапом создания информационной поддержки комплексного анализа данных РДМ, а второй — аналитической.

Совокупность указанных факторов привела к осознанию возможности принципиально нового подхода к осуществлению процессов сбора и анализа информации в системах планирования и управления, который находит свое выра-

жение в создании и применении аналитических технологии, ориентированных на решение задач поддержки принятия решении [2].

К таким задачам относятся:

1. оценка текущего и прогнозируемого состояния объекта управления и (или) среды его функционирования;

2. обнаружение и исследование скрытых закономерностеи, факторов, тенденции и взаимосвязеи;

3. обобщение информации как агрегация и интеграция сведении различного характера;

4. формирование альтернативных решений и выбор «оптимального» в соответствии с заданным критерием, а также результатами анализа сценариев развития ситуации;

5. моделирование процесса эволюции состояния объекта в нестационарнои неоднороднои среде и т. д.

В свою очередь, повышение качества процессов обобщения и анализа информации на основе аналитических технологии и их реализующих современных средств достигается автоматизированнои реализациеи процессов:

1. выявления скрытых закономерностей и факторов;

2. количественнои оценки факторов влияния и угроз в сложившейся ситуации;

3. использования опыта на основе автоматизированного формирования и поиска прецедентов анализируемых ситуаций в массивах ретроспективных данных;

4. высокодостоверного прогнозирования эволюции состояния объекта исследования, в т. ч. выявления предпосылок к скачкообразному изменению этого состояния. Информационная поддержка анализа данных РДМ с рядом упрощений может быть представлена как формальная система 1Р вида

1Р = (^> ^М> QDM> SDM, SMD) (1)

где ^ — множество БД {^> ^2> ...> ИС, эксплуатируемых в ЛПУ региона (каждая БД 13. имеет некую логическую структуру физическую структуру и содержит данные 1Ш — витрина данных как реляционная база данных, имеющая логическую структуру 1М, физическую структуру 1шр и содержащая данные 1Ш[1; Ош — оператор переноса данных из БД всех ИС в ВД ^ «) = Ош (^ М ^ № ^ = ^ ^ SDM — оператор выборки данных из ВД; 1т — множество многомерных кубов данных (МКД) (каждый МКД 1Ш имеет некую логическую структуру 1МШ, физическую структуру 1мт и содер-

РОССИЙСКИЕ БИОМВДИЦИНСКИЕ ИССЛЕДОВАНИЯ ТОМ 2 № 1 2017

жит данные (J; QMa — оператор построения i-го МКД, IMDDi = Qmdî OdJ; Smd — оператор выборки данных из МКД.

ЗАДАЧА ИССЛЕДОВАНИя

Заключается в разработке методики построения средств информационной поддержки анализа данных медико-диспансерного мониторинга популяции региона на основе применения аналитических информационных технологий.

Исходя из (1), содержательно научную задачу можно определить как разработку методики построения средств автоматизации решения задачи синтеза

{ISLi' U ^ [(IDML' IDMP)' Q DM' U {IMDLi' IMDPi}' QMD], (2)

причем частные задачи синтеза структуры ВД [и (ISU' ISP}] ^ (IDML' IDMP) и синтеза оператора переноса данных в Вд [и

SPi}, (IDML, IDMP)] ^ QDM должны решатьсЯ При создании

ВД и при каждом изменении множества IS, а задача синтеза структуры МКД

IDMP) ^ (IMDw IMDPi) кажДЫИ ра3 при построении i-го МКД. Поскольку в соответствии с концепцией OLAP МКД могут создаваться в произвольные моменты времени, после решения задачи синтеза структуры МКД должна решаться и задача синтеза оператора построения МКД: {(IDML'

IDMP)' (IMDLi' IMD()} ^ QMOr В ^^ решения последней зЭДачи

должно быть положено использование модели MMD процесса перехода от реляционных данных в ВД к МКД с вычислением агрегированных значений.

Операторы SDM и SMD синтезу не подлежат, так как выполняются штатными средствами систем управления базами данных и OLAP.

Если через T (Z) обозначить временную оценку длительности выполнения оператора Z, то от задачи синтеза (2) можно перейти к следующей оптимизационной задаче, которую должна решать разрабатываемая методика:

[(IDML' IDMP)' QDM' U {IMDLi' IMDPi}' QMD ^ Tmin' (3)

где T = T (Qdm) +L t(Sdm) + t (qJ + T(Smd)(

С учетом (2) и (3) для решения сформулированной научной задачи исследования необходимо решить следующие частные задачи:

1. анализ особенностей синтеза структуры витрин данных, заполняемых данными из информационно несогласованных разнородных ИС учетного типа, с учетом их отображения на модель жизненного цикла ОМ;

2. разработка методики синтеза структуры витрины данных РДМ, охватывающих разные аспекты и стадии жизненного цикла ОМ;

3. разработка алгоритма скорейшего заполнения витрины данных РДМ данными из разнородных информационно несогласованных ИС;

4. разработка модели процесса построения МКД по содержимому витрины данных;

5. формирование общей методики построения средств информационной поддержки анализа данных диспансерного мониторинга популяции региона на основе применения аналитических информационных технологий;

6. оценка эффективности применения разработанной методики.

вывод

Аналитические технологии могут выступать в качестве современного средства, которое позволит осуществить аккумуляцию, агрегацию и комплексный анализ данных РДМ в Медицинский информационно-аналитический центр (МИАЦ). Задачу обеспечения комплексного анализа данных РДМ на базе аналитических технологий целесообразно рассматривать как двухэтапную — на первом этапе внедрить ВД и OLAP, а на втором — преобразовать ВД в ХД и дополнить OLAP средствами ИАД. Учитывая, что OLAP, в отличие от ИАД, не предполагает применения математических методов содержательной обработки данных (методов решения задач анализа и прогнозирования), первый этап можно считать этапом создания информационной поддержки комплексного анализа данных РДМ, а второй — аналитической.

REFERENCES

1. Voroncov I. M., Shapovalov V. V., Sherstjuk Ju.M. Zdorov'e. Soz-danie i primenenie avtomatizirovannyh sistem dlja monitoringa i skrinirujushhej diagnostiki narushenija zdorov'ja [Health. Development and using of automatic systems for the monitoring of screening and diagnosis of health disorders]. SPb.: OOO «IPK Kosta»; 2006 (in Russian).

2. Kopylov D. S., Shapovalov V. V., Sherstjuk Ju. M. Agregacija dannyh avtomatizirovannyh kompleksov [Aggregation of automated data systems]. Biomedicinskaja radiojelektronika. 2013; № 11: 62-4 (in Russian).

ЛИТЕРАТУРА

1. Воронцов И. М., Шаповалов В. В., Шерстюк Ю. М. Здоровье. Создание и применение автоматизированных систем для мониторинга и скринирующей диагностики нарушения здоровья. СПб.: ООО «ИПК Коста»; 2006.

2. Копылов Д. С., Шаповалов В. В., Шерстюк Ю. М. Агрегация данных автоматизированных комплексов. Биомедицинская радиоэлектроника. 2013; № 11: 62-4.

i Надоели баннеры? Вы всегда можете отключить рекламу.