ИСПОЛЬЗОВАНИЕ МЕТОДА АППРОКСИМАЦИИ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ В СИСТЕМЕ ДИСТАНЦИОННОГО МОНИТОРИНГА1
© Воробьева Е.Е.* *, Корсаков И.Н.*, Купцов С.М.*
Национальный исследовательский университет «Высшая школа экономики», г. Москва
В данной статье рассмотрены вопросы использования математических методов аппроксимации пропущенных результатов измерений в системе дистанционного мониторинга здоровья человека. Рассмотренные методы могут быть с успехом применены для восстановления пропущенных данных измерений, что важно при проведении дальнейшего их анализа.
Ключевые слова мониторинг здоровья, метод аппроксимации.
Приверженность - это степень совпадения поведения пациента с рекомендациями врача. Наиболее часто приверженность в отношении лекарственной терапии определяется как прием, по крайней мере, 70-90 % препарата от должного. «Золотого стандарта» для оценки приверженности к лечению не существует. Используются фармакологические, клинические, физические методы оценки приверженности, а также специально разработанные опросники и шкалы. В системе дистанционного мониторинга здоровья в качестве теста хорошей приверженности служит ведение пациентом дневника самоконтроля с отметками приема препаратов и выполненными процедурами. Врачам необходимо соотносить тактику лечения со степенью готовности пациента выдерживать здоровый образ жизни и соблюдать своевременный прием лекарств. При стандартном подходе врачу трудно контролировать ход лечения, зачастую получить достоверную информацию возможно только при прохождении анализов и то в рамкам одного медицинского учреждения. Единственный способ, это увеличить количество посещений медучреждения пациентом, что увеличивает расходы на лечение и нагрузку на врача. В случае использования технологии дистанционного мониторинга этот вопрос решается двумя способами: врач инициирует бизнес процесс - план лечения, по которому пациент производит прием лекарств, лечебные процедуры и измерения, результаты которых поступают в элек-
1 Работа выполнена при финансовой поддержки Министерства образования и науки Российской Федерации (договор № 02.G25.31.0033).
* Заместитель директора НЦ информационных систем мониторинга здоровья человека НИУ ВШЭ.
* Ведущий научный сотрудник НЦ информационных систем мониторинга здоровья человека НИУ ВШЭ, кандидат физико-математических наук.
* Директор НЦ информационных систем мониторинга здоровья человека НИУ ВШЭ.
Информационно-коммуникационные технологии
105
тронную медицинскую карту пациента и сразу становятся доступными лечащему врачу, и второй способ, это сам пациент ежедневно заполняет опросник - дневник самонаблюдения [2, 3]. Пример типового плана ведения пациента представлен на рис. 1.
Рис. 1. Типовой план ведения пациента
И даже при том, что пациенту поступают напоминания о необходимости того или иного действия, 67 % требуемых данных в вопроснике и 55.7 % данных измерений отсутствуют [1]. Основная проблема заключается в том, что нельзя измерить давление или любой другой параметр задним числом, данные потеряны, что значительно затрудняет медикаментозное лечение пациента. Для решения подобного рода задач на практике применяются те или иные методы восстановления данных [4, 7].
Основной задачей данной работы является построение действующего механизма восстановления пропущенных значений в массивах (рядах, таб-
106 УПРАВЛЕНИЕ ИННОВАЦИЯМИ: ТЕОРИЯ, МЕТОДОЛОГИЯ, ПРАКТИКА
лицах) данных, в том числе с практической проверкой восстанавливающей способности на примере данных измерения пациентом артериального давления. В качестве тестовых данных были использованы данные измерений артериального давления хранящиеся в базе данных MIMIC Database Phy-sioNet [9]. Данные были получены с помощью Hewlett Packard CMS («Merlin») в отделении интенсивной терапии Бостонского Beth Israel Hospital. Аналогичный монитор Hewlett Packard Viridia 24C используется в качестве контрольного монитора пациента в проекте дистанционного мониторинга «Монитор Здоровья». Данные измерений, в данном случае систолическое и диастолическое артериальное кровяное давление, записываются в файл с интервалом 1.024 секунды. В базе хранятся записи около 100 пациентов, мы воспользуется данными мониторинга 62 пациентов, т.к. по ним имеется полная 48 часовая запись данных. Существуют различные методы восстановления пропущенных измерений, применяемые в зависимости от механизма, согласно которому данные оказываются пропущенными. В данном исследовании используется случайный механизм пропусков (missing at random - MAR), когда вероятность P (Xj пропущено / прочие X) не зависит от Xj, но может зависеть от других X, в этом случае механизм пропусков несущественен, и к данным применимы вариации методов восстановления пропусков. На рис. 2 приведены результаты измерения артериального давления у пациента № 55, за 48 часов было сделано более 130 000 измерений.
Рис. 2. Плотность распределения диастолического и систолического АД, тренд АД
Информационно-коммуникационные технологии
107
В качестве эмпирической формулы на отрезке изменения аргумента табличной функции чаще всего берут степенной многочлен [6]
Pn (x) = a0 x + aix +... + an,
где a0, a1, an - неизвестные которые должны быть определены из
уравнений.
Допустим, что мы снова располагаем четырьмя наблюдениями. Следовательно, имеем возможность определить четыре коэффициента многочлена третьей степени P3(x) = a0X + a1x2 + a2x + a3. Необходимое условие правильности выбора многочлена: график изменения Pn(x) от аргумента х должен проходить строго через узлы интерполирования (xb yy), (x2, y2), (xn, yn). В
нашем случае это условие приводит к уравнениям:
3 , 2 ,
a0 x0 + aiXo + a2 x0 + аз = y0,
3 2
a0 xi + aixi + a2 xi + a-з = y-y,
32
a0 x2 + aix2 + a2 x2 + a3 = У2,
32
ao x3 + aix3 + a2 x3 + a3 = У3.
Решив эти уравнения относительно a0, a1, a2, a3, получим искомый многочлен. Тогда значение у на значение x = в получим, вычисляя значение Р3(в), например, по схеме Горнера:
108 УПРАВЛЕНИЕ ИННОВАЦИЯМИ: ТЕОРИЯ, МЕТОДОЛОГИЯ, ПРАКТИКА
y(x) = ((а0 в + а )в + a2 )в + a.
Лагранж предложил свой подход к определению степенного многочлена, строго проходящего через точки интерполяции и не требующий определения коэффициентов этого многочлена. Полином Лагранжа имеет вид
n
L ( x ) = Z У
i=0
П( x)
(x - x) n'(Xi)’
где П( x) = ( x - x0)( x - Xj)...( x - xn), П'( xi)
d П( x )
dx
x=x
i
В качестве примера построим степенной полином, проходящий через четыре точки (x0, y0), (x1, y1), (x2, y2), (x3, y3). Имеем
L (x ) = Уо
(x - x)(x - x)(x - x)
( x0 - xi )( x0 - x2 )( x0 - x3 ^ У'
(x - x)(x - x)(x - x)
(xi -xo)(xi -x2)(xi -x3)
+У2
( x - x0 )( x - xi )(x - x3 ^ ^ (x - x0 )(x - xi )(x - x2 )
( x2 - xo ) (x2 - xi )(x2 - x3 ) 3 (x3 - xo ) (x3 - xi ) (x3 - x2 )
Для определения значенияу(в) = Ь(в) нет необходимости вычислять коэффициенты a0, a1, a2, a3. Необходимо подставить x = в в формулу Лагранжа и определить значения, на которые нужно умножить у0, у1, у2, у3.
Рис. 4. Значения диастолического и систолического давления и их интерполирующие функции
Информационно-коммуникационные технологии
109
На рис. 4 представлены точечный график измерения диастолического и систолического артериального давления, а также непрерывные функции, полученные на основе полинома Лагранжа, которые позволяют получить значение диастолического и систолического давления в любой момент времени.
Вместе с восстановленным значением давления нам необходимо знать полученную ошибку (погрешность). Вычислить точное значение погрешности интерполяции невозможно, так как нам неизвестно значение x . Однако можно оценить предельную погрешность интерполяции.
Мы получили формулу, позволяющую определить предельную абсолютную погрешность интерполяции функции y(x) с помощью полинома степени п.
В результате данных исследований был получен практический опыт использования математических методов для восстановления пропущенных результатов измерений кровяного артериального давления пациентом в системе дистанционного мониторинга здоровья. Практический интерес такого подхода важен, когда речь идет о вычисляемых на определенный момент параметрах. Заполнение пропусков отдельных параметров с помощью математических позволяет методов строить диагностическую и прогностическую модели. Особое значение имеет возможность практической реализаций данных алгоритмов на языке программирования Python c использованием библиотек NumPy и SciPy. Восстановление пропущенных данных измерения артериального давления 62 пациентами за 48 часов занимает менее одной секунды на сервере класса HP DL380 G6. Полученный результат позволяет рекомендовать данный подход для использования в системах дистанционного мониторинга здоровья.
Список литературы:
1. Бых А.И., Высоцкая Е.В., Рак Л.И. Выбор метода восстановления пропущенных данных для оценки сердечно-сосудистой деятельности подростков // Восточно-Европейский журнал передовых технологий. - 2010. -№ 4 (45). - C. 4-7.
2. Шалковский А.Г., Купцов С.М., Корсаков И.Н., Атабаева В.Д. Дистанционный мониторинг здоровья пациентов с сахарным диабетом 2 типа // Доктор.Ру. - 2013. - № 7 (85). - С. 61-64.
3. Злоба Е., Яцкив И. Статистические методы восстановления пропущенных данных // Computer Modeling & New Technologies. - 2004. - № 6. -
4. Россиев А.А. Моделирование данных при помощи кривых для восстановления пробелов в данных // Методы нейроинформатики / Под ред. А.Н. Горбаня. - Красноярск: КГТУ, 1998. - С. 6-22.
Обозначим M = max
С. 55-56.
110 УПРАВЛЕНИЕ ИННОВАЦИЯМИ: ТЕОРИЯ, МЕТОДОЛОГИЯ, ПРАКТИКА
5. Myung-kyung Suh, Moin T., Woodbridge J., Lan M., Ghasemzadeh H., Bui A., Ahmadi S. Sarrafzadeh Missing Data Imputation for Remote CHF Patient Monitoring Systems // Engineering in Medicine and Biology Society (EMBC),
2011 Annual International Conference of the IEEE.
6. Myung-kyung Suh, Moin T., Woodbridge J., Lan M., Ghasemzadeh H., Bui A., Ahmadi S., Sarrafzadeh M. Dynamic self-adaptive remote health monitoring system for diabetics // Engineering in Medicine and Biology Society (EMBC),
2012 Annual International Conference of the IEEE. - P. 2223-2226.
7. Suh M., Wanda B. Weight and activity with blood pressure monitoring system for heart failure patients // 2010 IEEE International Symposium on «A World of Wireless, Mobile and Multimedia Networks» (WoWMoM). - P. 1-17.
8. Lei Clifton, David A. Clifton, Marco A.F. Pimentel, Peter J. Watkinsony, Lionel Tarassenko. Gaussian Process Regression in Vital-Sign Early Warning Systems // 34th Annual International Conference of the IEEE EMBS, 2012.
9. George B. Moody, Roger G. Mark. A Database to Support Development and Evaluation of Intelligent Intensive Care Monitoring // Computers in Cardiology Conference. - 1996. - P. 657-660.
ОБЛАЧНЫЕ ТЕХНОЛОГИИ В ГОССЕКТОРЕ
© Ганеева В.М.*, Перова М.В.Ф
Южно-Российский институт управления Российской академии народного хозяйства и государственной службы при Президенте Российской Федерации, г. Ростов-на-Дону
В данной статье рассмотрено понятие и назначение облачных технологий, динамика распространений, а также возможности их применения в госсекторе. Выявлены основные преимущества и недостатки распространения облачных вычислений в органах государственной власти. Рассмотрен зарубежный опыт использования облачных систем в государственных службах.
Ключевые слова облачные технологии (вычисления), «Гособлако», платформа O7, публичные и частные облачные платформы, национальная облачная платформа.
В настоящее время облачные технологии приобретают все большую популярность, а концепция Cloud Computing (концепция облачных вычислений) является одной из основных мировых тенденций развития информационных технологий. Это связано с быстрым ростом развития каналов связи, растущей
Студент.
Студент.