Методы прогнозирования оптимальных доз инсулина для больных сахарным диабетом I типа. Обзор
# 04, апрель 2009
авторы: Гоменюк С. М., Емельянов А. О., Карпенко А. П., Чернецов С. А.
Приводится обзор англоязычных публикаций, посвященных методам прогнозирования оптимальных доз инсулина для больных сахарным диабетом I типа. Рассматриваются математические модели динамики инсулина и глюкозы в теле человека, а также нейросетевые и комбинированные алгоритмы и системы прогнозирования оптимальных доз инсулина.
Ключевые слова: математические модели, нейросетевые системы прогнозирования, сахарный диабет
http://technomag.edu.ru/ doc/119663■html
УДК 519.6
МГТУ им. Н.Э. Баумана, 105005, Москва, 2-я Бауманская ул., д.5., ФГУ«Эндокринологический научный центр», 117036, г.Москва, ул. Дм.Ульянова, д.11
s.gomenyuk@gmail.com serge.a.ch@gmail .com endiab@mail.ru karpenko@nog.ru
ВВЕДЕНИЕ
Сахарный диабет 1 типа - это метаболическое заболевание, вызванное абсолютным дефицитом секреции инсулина и характеризующееся неспособностью организма поддерживать уровень глюкозы в крови (BG - Blood Glucose) в целевом интервале 4-6 ммоль/л - в обычном состоянии и до 9 ммоль/л - после еды. Диабет представляет собой аутоиммунное заболевание, при котором разрушаются в-клетки поджелудочной железы,
отвечающие за секрецию инсулина. Диабет вызывает множество опасных осложнений, избежать которые можно только путем контроля уровня BG и его удержания в физиологичном интервале [].
В настоящее время разработаны препараты (генноинженерные человеческие инсулины), которые могут симулировать действие эндогенного инсулина, вырабатываемого b-клетками здоровой поджелудочной железы. По своим временным характеристикам (времени пика активности, а также временам начала и окончания действия с момента введения) инсулины делятся на перечисленные ниже типы:
• аналоги инсулина ультракороткого действия (rapid-acting) - начало действия через 5-15 минут после введения, окончание действия - через 3-4 часа;
• инсулины короткого действия (short-acting) - начало действия через 30 минут после введения, окончание действия - через 5-8 часов;
• инсулины продленного действия (long-acting) - начало действия через 1-3 часа после введения, окончание действия - через 16-24 часов.
Заметим, что продолжительность действия инсулина, который вырабатывается b-клетками здорового человека равна примерно 30 минутам. В отличие от эндогенного инсулина, который сразу попадает в кровь, искусственные инсулины вводятся в подкожно-жировую клетчатку пациента. Этим обстоятельством в значительной мере объясняет столь существенное различие в продолжительности действия естественного и искусственных инсулинов.
На значения уровня BG влияет множество факторов, которые можно разделить на следующие 4 группы:
• предсказуемые факторы;
• слабопредсказуемые факторы;
• факторы, влияние которых практически невозможно рассчитать;
• случайные факторы.
1). Предсказуемые факторы. Влияние предсказуемых факторов на значения уровня BG можно прогнозировать с достаточно высокой точностью (хотя имеют место небольшие индивидуальные вариации чувствительности пациента к этим факторам). Действие
предсказуемых факторов почти не зависит от остальных факторов. Основные предсказуемые факторы перечислены ниже.
• Базовая потребность в инсулине - это необходимое количество инсулина, которое при отсутствии факторов, повышающих или понижающих уровень глюкозы, обеспечивает ее постоянный уровень. Базовая потребность определяется экспериментально методом проб и ошибок.
• Введение дозы инсулина (понижает уровень BG).
• Прием пищи (точнее - прием углеводсодержащей пищи). Прием пищи повышает уровень BG и приводит к дополнительной потребности в инсулине. Эта потребность обычно полагается пропорциональной количеству хлебных единиц (ХЕ=12 г углеводов) в пище.
2). Слабопредсказуемые факторы. Влияние слабопредсказуемых факторов на уровень BG можно прогнозировать, но на эти факторы существенное влияние оказывают другие факторы. Наиболее существенным слабопредсказуемым фактором является физическая нагрузка. Влияние этого фактора зависит непосредственно от уровня BG: при низких и нормальных значениях уровня BG физическая нагрузка снижает уровень BG, а при высоких - повышает.
3). Факторы, интенсивность которых и/или влияние на уровень BG невозможно оценить. К таким факторам относятся, прежде всего, эмоции и погода (жаркая погода может, как повышать, так и понижать уровень BG).
4). Случайные факторы. Влияние на уровень BG каждого из случайных факторов невелико, но некоторые их комбинации могут существенно искажать влияние на уровень BG предсказуемых факторов.
Таким образом, оптимальные типы и дозы искусственного инсулина (далее -инсулина) зависят от многих факторов. Подбор этих типов и доз является сложной задачей, с которой могут справиться далеко не все пациенты. Для решения указанной задачи созданы системы непрерывного измерения уровня BG - Continuous Glucose Monitoring Systems (CGM-системы), а также системы непрерывного подкожного введения инсулина (инсулиновые помпы - insulin pumps). При этом различают «базальный» (basal) график (профиль) введения инсулина, который обеспечивает фоновое значение уровня BG, и «болюсный» (bolus)
профиль, обеспечивающий дополнительное введение инсулина, как реакцию на прием пищи или на гипергликемию (превышение уровнем BG верхней границы целевого интервала). При реализации базального профиля введение инсулина производится импульсами минимально возможного объема (определяется конструкцией помпы), частота которых определяется требуемой скоростью введения. При реализации болюсного профиля введение инсулина также осуществляется в импульсном режиме.
На основе CGM-систем и инсулиновых помп разработаны и интенсивно разрабатываются системы автоматического управления (САУ) уровнем глюкозы в крови пациента. Центральной проблемой при разработке таких систем является проблема синтеза алгоритмов, обеспечивающих автоматическое определение требуемых доз инсулина. Указанные алгоритмы могут быть построены на основе классической теории автоматического управления, на основе теории нечетких множеств, на основе нейронных сетей, а также на основе комбинаций указанных подходов.
В работе дается обзор математических моделей динамики инсулина и глюкозы в теле пациента, используемых в САУ уровнем глюкозы в крови пациента. Приводится также обзор нейросетевых алгоритмов прогнозирования доз инсулина. Рассмотрены наиболее известные САУ уровнем глюкозы в крови пациента.
1. Математические модели динамики инсулина и глюкозы 1.1. МОДЕЛИ НА ОСНОВЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЙ
1.1.1. Модель Бергмана (M.N.Bergman) []. Среди математических моделей динамики инсулина и глюкозы в теле пациента, построенных на основе обыкновенных дифференциальных уравнений (ОДУ), наиболее известна минимальная модель Бергмана. Модель представляет собой систему ОДУ 3-го порядка
dg (X )
-(ь + x(t)) g (t) + ь gь,
dt
= - Ь2 х()) + Ьз (/(X) - ц),
dt
Й = Ь4(g(t)- Ь5)+1- Ь6(/'(X)- /ь). dt
Здесь приняты следующие обозначения: t > 0 - время; g(t) - концентрация глюкозы в крови; /'(0 - концентрация инсулина в крови; х(^ - вспомогательная переменная, описывающая зависимость концентрации инсулина в крови от количества поглощенной глюкозы; gь - базовый уровень глюкозы в крови (гликемия); /Ь - базовый уровень инсулина в крови; Ь0 - Ь7 - известные константы;
(I )+ =
0, I < 0,
1, I > 0.
Недостатком модели (1) является ее некорректность - неустойчивость при некоторых условиях.
1.1.2. Модель Стариса О^и^) []. Основываясь на двух отрицательных обратных связях, описывающих поглощение глюкозы инсулином и выделение инсулина поджелудочной железой в зависимости от количества поступившей глюкозы, Старис с соавторами разработали математическую модель, которая описывается системой ОДУ 6-го порядка
М) dt
dt йх
= gm - 12 ( g(X))- 1з ( g(0) 14 (Ь (Ф 15 ( Хз(Х)),
= I: (g (0)"
'р (х) ' М)
(х)
'р (Х ) '/(Х )
(X )
^ = 1 (/'р(X)- Х:(Х)),
(2)
dx2(t) =1 (Хl(t) - )),
^ = -( Х2(t) - Хз^)).
е
X
V
V
р
р
е
X
V
V
р
й
В системе ОДУ (2) приняты следующие обозначения: g(t) - масса глюкозы в крови; ip(t), i(t) - масса инсулина в крови и межклеточном пространстве соответственно; vp(t), vt (t) скорости диффузии инсулина в плазме и межклеточном пространстве соответственно;
e - параметр, определяющий последние скорости; tp, tt - временные константы, характеризующие понижение концентрации инсулина в крови и межклеточном пространстве соответственно; x1(t), x2(t), x3(t) - дополнительные переменные, определяющие временные задержки распространения инсулина; f1(g) - функция, моделирующая выработку инсулина поджелудочной железой; f2, f3, f4 - функции, моделирующие поглощение глюкозы различными частями тела f2 - нервными клетками и клетками мозга, f3, f4 - клетками мышц и жировыми клетками); f5 - функция моделирующая расщепление глюкозы и вывод продуктов расщепления в печень. td - время расщепления глюкозы.
Здесь и далее величина gin представляет собой начальное значение уровня BG;
1.1.3. Компартментная модель [] состоит из трех подмоделей, образующих систему
ОДУ
м dx,
du,
П ^ = NHGB( Х1' U1,2 ' u2) - f3( X1) - f4( X1, U1,3) - f5( X1) + Jx (tX
- (m + m + m3.1)u1,1 + m1,1u1,2 + m1,3u1,3 + h (tX
dt
ПП du1,2
н —(m0 2 + m1 2)u1 2 + m2 1u1 1. (3)
П dt
П du13
П —— = m13u1 3 + m31u1 2,
П dt
П du
2 = h0,2U2 + f7(X1, U1,3)-
0 dt
Модель подкожного всасывания инсулина описывает динамику инсулина в подкожной ткани и представляет собой трехкомпартментальную модель, в которой
компартментами являются уровни инсулина ии, и12, и13.
Модель глюкозного метаболизма описывает динамику BG - однокомпартментальная модель с компартментом «уровень глюкозы» х1.
Модель движения глюкозы из крови в подкожную ткань - однокомпартментальная модель с компартментом «уровень глюкагона» u2.
В уравнениях (2) приняты следующие обозначения: NHGB = f1(x1,uu,u2)- f2(x1,u12);
f, iе [1:7] - сигмоидальные функции, описывающие распространение и поглощение
глюкозы и инсулина в организме пациента; uu - измеренный уровень инсулина в плазме
(plasma insulin); u12 - измеренный уровень отработанного инсулина (liver insulin); u13 -
измеренный уровень промежуточного инсулина (interstitial insulin); u2 - уровень глюкагона;
x1 - уровень BG; Ix,Iu - тестовые входы (уровни инсулина и глюкозы в крови); mi j,h0,2 -известные константы.
Таким образом, компартментами модели являются переменные x1, uu, u1>2, u1>3, u2. Вхождение переменных, стоящих под знаком производных в правые части уравнений, обеспечивает связь между компартментами и, тем самым, между указанными подмоделями.
Замечание. Компартментальное моделирование распространено в медицине и биологии. Компартмент — это некоторое количество вещества, выделяемое в биологической системе и обладающее свойством единства, поэтому в процессах транспорта и химических преобразований его можно рассматривать как целое. Например, в качестве особых компартментов рассматривают весь кислород в легких, всю углекислоту в венозной крови, количество введенного препарата в межклеточной жидкости, запас гликогена в печени и т.п. Модели, в которых исследуемая система представляется в виде совокупности компартментов, потоков вещества между ними, а также источников и стоков всех веществ, называются
компартментальными.
1.1.4. Модель Никита (K.S.Nikita) и др. [] включает в себя 3 следующих модели, которые в совокупности описывают уровень содержания BG:
• модель поглощения инсулина ультракороткого действия (СМ1);
• модель поглощения инсулина короткого действия (СМ2);
• модель распространения углеводов (СМ3).
Модели СМ 1, СМ2 описывают концентрацию BG, а модель СМ3 отвечает за изменение концентрации глюкозы, обусловленное приемом пациентом углеводов с пищей. Модели СМ 1, СМ 2 задаются одним и тем же ОДУ
di _ stsT5s0d
d= vtT^ "e
50 ' - ket, (4)
где T50 _ ad + b - время всасывания половины введенного инсулина; d - количество
введенного инсулина; s, a, b, ke - известные константы; Vi - объем распределения введенного инсулина.
Для модели CM3 используется уравнение
dggut _ g - k g (5)
dt & empt gabs ё gut ' * '
где gempt - функция переваривания пищи кишечником, kgabs - коэффициент всасывания глюкозы, ggut - количество потребленной глюкозы.
1.1.5. Модель [] включает в себя 5 следующих моделей в виде ОДУ: модель Mj динамики инсулина ультракороткого действия; модель M2 динамики инсулина короткого действия; модель M3 динамики инсулина среднего действия; модель M4 динамики инсулина продленного действия; модель M5 динамики всасывания углеводов, поступивших с пищей. Здесь модели Mj - M4 описываются уравнением (4), модель M5 - уравнением (5). Модели Mj - M4 отличаются друг от друга только значениями констант, зависящих от типа инсулина.
1.2. МОДЕЛИ НА ОСНОВЕ ОДУ С ЗАПАЗДЫВАЮЩИМ АРГУМЕНТОМ 1.2.1. Модель Энгельборга (K.Engelborghs) [] основана на модели Стариса и существует в двух вариантах.
Первый вариант модели Энгельборга (см. (2)) описывает динамику инсулина, учитывая только временные задержки между выработкой инсулина и расщеплением глюкозы:
= ^- / (8(<))- Л((»(О)]/4('(I))+ /('(I - х г)1, ^=/,(«(I)]- ^. (6)
ш 11
Здесь х 2 - временная задержка между выработкой инсулина и расщеплением глюкозы, 11 - величина, обратная скорости уменьшения количества инсулина в крови. Важной особенностью модели (6) является ее устойчивость.
Во втором варианте модели Энгельборга предпринята попытка моделировать динамику распространения инсулина при его инъекции. Однако при этом авторы модели делают допущение о том, что функция, моделирующая инъекцию инсулина, совпадает с
функцией распространения естественного инсулина / . Модель имеет вид
dg (t) dt
gm - /2(g(t)) - /3((g(t)))/4(/(t))+ /5(i(t- t2)j,
^ =a/1 (g(t))- f + d -a )/ ((g(t -tj)), dt t1
где a - весовой коэффициент, определяющий степень влияния естественного и искусственного инсулина , t 1 -временная задержка выработки естественного инсулина.
1.2.2. Модель 1 Беннета и Гоурли (D.L.Bennet, S.A. Gourley) [] для описания динамики глюкозы и инсулина использует систему ОДУ с запаздывающим аргументом (см. (2))
dip (t) dt
dii (t) dt dg (t) dt
= /1 (g (t))-
iP (t) h (t)
v Vp '
V . /
ip (t)
hp (t) i (t)
V v.
p t
h (t)
g if
/2 ((g(t))- qg(t)/4(h (t))+ /5 (ip (t -t)).
e
t
p
e
t
Здесь х > 0 - временная задержка выработки инсулина, величина q > 0 - определяет скорость расщепления глюкозы инсулином в крови.
1.2.3. Модель 2 Беннета и Гоурли [] представляет собой упрощенную модель (7). Модель также учитывает временную задержку в выработке инсулина по отношению ко времени поступления глюкозы в кровь и имеет вид
dg (t) dt
= gm - /2(g(t))- /3((g(t)))/4(i(t)) + /5(i(t- 12)),
^ = /1 (g(t -Х1))- di(t), dt
где i(0) = i0 > 0, g(0) = g0 > 0, i(t) = i0 для любых t из промежутка [-t 2,0], g(t) = g0 для любых t из промежутка [-t 1з0], 11 - время задержки выработки инсулина, 12 - время задержки расщепления глюкозы, dt - скорость уменьшения количества инсулина в крови.
1.3. МОДЕЛИ НА ОСНОВЕ ИНТЕГРО-ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 1.3.1. Модель де Гаетано и Арино (A.De Gaetano, O.Arino) [] разработана на основе модели Бергмана (1). Выполнив формальный математический анализ этой модели, де Гаетано и Арино предложили ее улучшенный вариант, названной ими динамической моделью (dynamic model):
dg (t) dt di(t)
= - bg(t) - b,i(t)g(t) + b7, К '
- b2i(t) + f Ig(s)ds.
dt Ь5 t-b5
Здесь g(t) = gb, г О [- Ь5,0], ^(0) = gb + Ь0, /'(0) = ¡Ь + Ь3Ь0; значение параметра Ь5 определяется базальным уровнем глюкозы gb, ib- базальный уровень инсулина.
1.4. МОДЕЛИ НА ОСНОВЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ В ЧАСТНЫХ
ПРОИЗВОДНЫХ
1.4.1. В работе [] рассмотрена модель динамики инсулина и глюкозы на основе дифференциальных уравнений в частных производных (ДУЧП), полученная при допущении, что вводимый раствор инсулина распространяется в подкожной ткани только в виде гексамерных и димерных молекул, причем проникать в капилляры могут только димерные молекулы. Модель представляет собой систему двух дифференциальных уравнений в частных производных
^ = р(qd3 - к) + су 2к,
— = - р( дС3 - к) + СУ 2С - ЬС, 3 г
где к и С - концентрация димерного и гексамерного инсулина, соответственно, р -постоянная скорости, д - химическая постоянная равновесия, С - диффузионная постоянная, Ь - постоянная скорости поглощения инсулина.
2. Нейросетевые алгоритмы прогнозирования значений уровня глюкозы в крови 2.1. Алгоритмы на основе нейронных сетей прямого распространения
2.1.1. Сеть с функциями активации в виде обратной квадратичной функции [] является
трехслойной и содержит во входном слое (п1 + п2) нейронов, п1 нейронов - в скрытом слое и один нейрон - в выходном слое.
Входами сети являются значения уровней BG и инсулина у(г- 1),у(г- 2),...,у(г- п1), и (г - 1), и (г - 2),..., у(г - п2), соответственно, в моменты времени: (г - 1),(г - 2),... Значение на выходе нейронной сети интерпретируется как уровень подкожного содержания глюкозы в следующий момент времени.
В качестве функции активации нейронов используется обратная квадратичная функция (reciprocal multiquadric function). Обучение сети реализовано на основе модифицированного алгоритма метода наименьших квадратов.
2.1.2. Опережающая (feed-forward) нейронная сеть (далее FFNN) [] является полносвязной, трехслойной (типы используемых нейронов в публикации не указаны). На
вход сети подаются следующие величины (см. п. 1.1.5):
• последнее измеренное значение BG;
• выходная величина модели M1 в моменты времени (t- 1), (t- 2), (t- 3), (t- 4);
• выходная величина модели M2 в моменты времени (t- 1), (t- 2);
• выходная величина модели M3 в момент времени (t- 1);
• выходная величина модели M4 в момент времени (t- 1);
• выходная величина модели M5 в моменты времени (t- 1), (t- 2), (t - 3), (t- 4)
Выходом сети является прогнозируемое значение уровня BG. Для обучения сети используется алгоритм обратного распространения ошибки.
2.2. Алгоритмы на основе реккурентных нейронных сетей
2.2.1. Реккурентная сеть Элмана [] состоит из входного, скрытого, контекстного и выходного слоев (Рис. 1).
Входной слой сети содержит два нейрона, на входы которых поступают значения уровня инсулина и уровня BG. Скрытый слой может содержать от 1 до 10 нейронов -единственным условием является равенство количества нейронов скрытого и контекстного слоев. Контекстный слой обеспечивает обратную связь. Аксоны скрытого слоя связаны с входами выходного слоя и, одновременно, с входами контекстного слоя. Выходные сигналы контекстного слоя поступают на входы скрытого слоя и с задержкой - на входы контекстного слоя. Выходом сети является прогнозируемое следующее значение уровня BG.
Выходной слой
Контекстный слой
Рис. 1. Схема нейронной сети Элмана: ^"1 - задержка на один временной шаг
В качестве функции активации нейронов используются следующие функции: для нейронов скрытого слоя - гиперболический тангенс; для нейронов выходного слоя -линейная функция. Веса связей скрытого и контекстного слоев равны единице, остальные
веса подбираются в процессе обучения сети.
Для обучения нейронной сети используется алгоритм обратного распространения ошибки. При этом рекуррентная сеть разворачивается в сеть с прямыми связями, у которой входы соответствуют значениям глюкозы и инсулина в крови в предыдущие моменты времени (количество скрытых и контекстных слоев при этом, очевидно, увеличивается).
2.2.2. В работе [] для прогноза уровня BG используется нейронная сеть, аналогичная сети, рассмотренной в п. 2.2.1. Сеть не имеет контекстного слоя, и выход каждого из нейронов рекуррентного слоя через задержку на один временной шаг поступает на входы всех нейронов рекуррентного слоя. На вход нейронной сети поступает 5 векторов:
• вектор, содержащий информацию об инсулине, включая его тип, время и место инъекции;
• вектор, определяющий количество потребленных углеводов;
• вектор, содержащий информацию о физической нагрузке, включая информацию о длительности, интенсивности и подвижности нагрузки;
• уровень BG;
• вектор, включающий в себя информацию о стрессах, болезнях пациента и т.д.
Выходом сети является прогнозируемое значение уровня глюкозы в крови пациента.
Для обучения сети использовались две модификации рекуррентного алгоритма обучения в реальном времени (real time recurrent learning - RTRL) - с учителем (RTRL-TF) и без учителя (RTRL-FR).
2.2.3. Трехслойная рекуррентная сеть [] также состоит из входного, рекуррентного и выходного слоев. Выход каждого из нейронов рекуррентного слоя через задержку на один временной шаг поступает на входы всех этих нейронов (Рис. 2). Число нейронов скрытого слоя выбирается равным 5 - 15. Функция активации нейронов скрытого слоя -сигмоидальные функции, нейронов выходного слоя - линейная функция.
Вх, слой
<4 /-• V V и и и
Рис 2. Схема трехслойной рекуррентной нейронной сети
На вход нейронной сети поступает три выходных значения математической модели пациента (см. п. 1.1.4), а также текущий уровень BG. Выходом сети является прогнозируемое значение уровня BG. Для обучения сети использовались алгоритм RTRL-TF и алгоритм RTRL-FR.
3. Нейросетевые алгоритмы прогнозирования требуемых доз инсулина 3.1. Алгоритмы на основе нейронных сетей прямого распространения
3.1.1. Персептронная сеть с линейными функциями активации [] является трехслойной. В первом слое сети содержится 12 нейронов (по одному на каждый вход), в промежуточном слое - 4 нейрона, в выходном слое - 1 нейрон.
Выход нейронной сети соответствует рекомендуемой дозе инсулина в данный интервал времени. На входы нейронной сети подаются следующие 12 величин:
• уровень глюкозы в крови в данном временном интервале gt;
• уровни глюкозы в крови в два предыдущих момента времени gt- j, gt- 2;
• уровни глюкозы в крови в данный и следующий момент времени прошлого дня
gt- 10 , gt - 9 ;
• бинарная величина, единичное значение которой означает, что имел место дополнительный прием пищи в данном временном интервале st;
• количество инсулина введенного для купирования гипергликемий в данном временном интервале it;
• bolus за два предыдущих интервала времени dt-j, dt_2;
• basal с начала дня dm;
• bolus в данный момент прошлого дня dt_j0;
• нормализованный bolus в данный момент прошлого дня dt j0 (нормализация
учитывает отклонение bolus от стандартных значений, которые определяются диабетологами).
Для обучения сетей используется метод обратного распространения ошибки.
3.1.2. Персептронная сеть с сигмоидальной функцией активации [] является
Ч/ Ч/ 1—1 Ч/ Ч/ г V ч/ ч/
трехслойной. Первый и скрытый слои сети содержат по 5 нейронов, выходной слой - один нейрон. Выходом сети является рекомендуемая доза инсулина. В качестве входов сеть использует следующие величины:
• текущий уровень BG;
• текущая доза каждого из трех типов инсулинов;
• бинарная переменная ^ (см. п. 3.1.1);
• бинарная переменная, принимающая единичное значение в том случае, если в данном временном периоде имела место физическая нагрузка;
• разница во времени между текущим и предыдущим значением BG.
Для обучения сети используется известный алгоритм Левернберга-Марквардта.
3.1.3. Сеть с радиальными базисными функциями [] также является трехслойной. Входной слой содержит 5 нейронов, выходной слой - 1 нейрон. Количество нейронов скрытого слоя рекомендуется подбирать в процессе обучения.
Выходом сети является рекомендуемая доза инсулина. В качестве входов сеть использует величины, аналогичные таким же величинам для нейронной сети, рассмотренной в п. 3.1.2.
Обучение сети осуществляется методом градиентного спуска.
3.1.4. Сеть с функцией активации в виде гиперболического тангенса [] служит для кластеризации входных данных и в системе автоматического управления уровнем BG (см. п. 5.1.3). Сеть используется в качестве промежуточной сети - ее выходы интерпретируются другой сетью, которая имеет в качестве выхода уже уровень BG или следующей дозы инсулина. Сеть является трехслойной и содержит 11 нейронов во входном слое, 16 нейронов в скрытом слое (определено опытным путем) и 6 нейронов в выходном слое. Выходы нейронной сети являются бинарными, и в каждый момент времени только один из них принимает значение 1. Номер выходного нейрона с единичным значением соответствует номеру режима второй сети.
Для обучения сети используется алгоритм обратного распространения ошибки.
3.2. Алгоритмы на основе нечетких нейронных сетей
2.3.1. В работе [] рассматривается семислойная нейронная сеть, структура которой представлена на Рис. 3. Слои сети выполняют следующие функции.
Входной слой (input layer) принимает входные данные.
Слой 1 (input label layer) производит кластеризацию входных данных методами нечеткой логики.
Слой 2 (rule layer). В данном слое из множества входных данных происходит выборка тех данных, которые соответствуют нечетким правилам. Число нейронов в слое равно количеству правил, по которым производится выборка.
Слой 3 (consequent layer). Каждый нейрон этого слоя реализует некоторый логический вывод, определяемый как взвешенная сумма правил предыдущего слоя.
Слой 4 (output possibility layer) производит разделение данных, полученных в предыдущем слое, на группы.
Слой 5 (output label layer) формирует решение задачи, которое интерпретируется следующим слоем.
Рис. 3. Структура нечеткой нейронной сети
Выходной слой (output layer) состоит из одного нейрона и формирует значение дозы инсулина, которую рекомендуется ввести в следующий момент времени.
Для обучения нейронной сети используется двухэтапный алгоритм:
• на первом этапе с помощью многоступенчатого алгоритма квантования векторов (multistage lattice vector quantization - MLVQ) выполняется кластеризации данных и построение нечеткой функции принадлежности (fuzzy membership functions) входов и выходов;
• на втором этапе на основе алгоритма однопроходной идентификации правил (novel one-pass rule-identification algorithm) производится идентификации нечетких правил.
4. Cистемы прогнозирования следующих значений уровня глюкозы в крови пациента 4.1. Системы на основе рекуррентной сети Элмана
4.1.1. Система прогнозирования следующего уровня BG [] построена на основе нейронной сети Элмана (см. п. 2.2.1). Выбор сети Элмана обосновывается рядом преимуществ этой сети по сравнению с сетями с прямыми связями. Прогнозируемое значение уровня инсулина зависит от многих факторов в предыдущие моменты времени, поэтому сеть должна хранить некоторую информацию о них. В прямой сети это достигается использованием «скользящего» окна во входном слое, что требует большого количества нейронов во входном слое и влечет за собой высокую сложность обучения сети. В сети Элмана хранение информации о предыдущих моментах времени реализуется с помощью обратных связей, и сеть лишена указанного недостатка сетей с прямыми связями.
4.1.2. В аналогичной системе [] используется трехслойная нейронная сеть, рассмотренная в п. 2.2.3. Методом проб и ошибок получено оптимальное значение количества нейронов в рекуррентном слое, равное 95.
4.2. Системы, использующие модель в виде ОДУ и рекуррентную нейронную сеть 4.2.1. Система [] состоит из двух следующих основных частей - математическая модель ММ и нейронная сеть NN (см. Рис. 6).
В качестве математической модели пациента (ММ) используется система ОДУ,
рассмотренная в п. 1.1.4.
Используемая в системе нейронная сеть (НС) рассмотрена в п. 2.2.2. Нейронная сеть моделирует кинетику глюкозы в организме. Входами сети являются выходы математических
моделей СМ1, СМ2, СМ3 и содержание глюкозы в крови в предыдущий момент времени
BGt _ 1.
Рис. 6. Структура системы: ММ - математическая модель пациента; НС - нейронная сеть; СМ 1 - СМ3 - компоненты математической модели пациента.
Для экспериментальной проверки системы использовались 275 измерений за 59 дней; 45 измерений, соответствующие 10 дням, использовались для тестирования системы. Наилучшие результаты были получены для двух сетей: сети с 5-ю нейронами в скрытом слое и алгоритмом обучения RTRL-FR; сети с 15-ю нейронами в скрытом слое и алгоритмом обучения RTRL-TF.
4.2.2. Система [] также состоит из математического модуля и нейросетевого модуля. Математический модуль включает в себя 5 моделей в виде ОДУ (см. п. 1.1.5). Все
ОДУ интегрируются методом Рунге-Кутта 4-го порядка с шагом по времени, равным 5 мин.
Нейросетевой модуль используется для прогнозирования уровня BG на основании последнего измерения BG и результатов интегрирования ОДУ. Предполагается непрерывное измерение уровня BG и, как непрерывное, так и дискретное введение инсулина.
Рассматривается 2 варианта архитектуры нейронной сети : полносвязная трехслойной FFNN сеть прямого распространения, рассмотренная в п. 2.1.6; рекуррентная нейронная сеть второго порядка с одной переменной состояния (см. п. 2.2.3).
Для обучения и тестирования нейронной сети использовались данные о 4-х пациентах, наблюдаемых с помощью CGMS в течении 4-5 дней. Данные первых 3-х дней использовались для обучения нейронной сети, последующие данные - для тестирования.
По результатам тестирования система на основе сети FFNN, а также система на основе рекуррентной сети с RTLR-TF обучением показали существенно лучшие результаты по сравнению с системой на основе рекуррентной сети с RTLR-FR обучением. При этом система на основе рекуррентной сети с RTLR-TF обучением продемонстрировала существенные преимущества перед системой на основе сети FFNN, поскольку имеет возможность дополнительно обучаться в процессе функционирования.
5. Нейросетевые системы прогнозирования требуемых доз инсулина 5.1. Системы на основе сетей прямого распространения
5.1.1. В системе [] используется неравномерное дискретное время: сутки делятся на 10 интервалов (окон) длительностью по 2.5-3 часа; каждому из этих интервалов соответствует фиксированное время I измерений BG, а также нейронная сеть, рассмотренная в п. 3.1.1.
Система тестировалась и обучалась на данных о 747 пациентах (в общей сложности 25000 наборов данных). Для бучения использовалась выборка из 10000 наборов данных.
5.1.2. Система прогнозирования следующего значения дозы инсулина при дискретных измерениях BG и инсулиновых инъекциях рассмотрена в работе []. Система строится на основе трехслойной нейронной сети с прямыми связями. Рассматриваются сети, описание которых приведено в пп. 3.1.2, 3.1.3, а также т.н. полиномиальная сеть.
Для обучения системы, ее тестирования и проверки использовалась выборка из более чем 30000 наборов «вход - выход». Для каждого из четырех наборов этой выборки первый и третий наборы использовались для обучения, второй набор - для тестирования, а четвертый набор - для проверки.
Тестирование системы выполнено на данных о более чем 70 пациентов. Результаты тестирования показали, что наиболее удачной является система, построенная на основе нейронной сети, рассмотренной в п. 3.1.2 - на основе трехслойной персептронной нейронной
сети с сигмоидальными функциями активации нейронов.
5.1.3. Система [] состоит из двух нейронных сетей прямого распространения. Первая (кластеризующая) сеть выявляет паттерны в значениях BG и инсулина за день и классифицирует все указанные значения (см. п. 3.1.4).
На основе того, к какому кластеру принадлежит текущее значение BG, устанавливается один из 6 режимов работы второй сети, которая определяет оптимальные дозы инсулина. Таким образом, вторая нейронная сеть в качестве входных использует 6 значений BG, соответствующих каждому из кластеров. В скрытом слое сеть содержит 11 нейронов.
Система тестировалась на данных о 21 пациенте.
5.2. Системы на основе нечеткой нейронной сети
5.2.1. Система прогнозирования доз инсулина [] построена на основе нейронечеткой сети (см. п. 2.3.1). Предполагается, что введение инсулина и измерение уровня BG осуществляется непрерывно, хотя система может применяться и для прогнозирования дискретных доз инсулина. Рассматривается два варианта использования системы - с коррекцией доз инсулина на основе модели метаболизма здорового человека и без этой
модели. В последнем случае на вход сети подаются следующие величины:
• отклонение BG в предыдущий момент времени от целевого значения;
• различные производные от BG в предыдущий момент времени. Тестирование системы осуществлялось на 1500 ежеминутных измерениях в двух
режимах: на данных обучающей выборки; на данных, отсутствующих в обучающей выборке.
5.3. Системы на основе нейронной сети с буферизацией 5.3.1. Система на основе нейронные сети с буферизацией [] функционирует в дискретном времени и состоит из 3-х основных блоков, 2-х вспомогательных блоков и системного блока (Рис. 4). Основными блоками системы являются блок вычисления отклонения нейронной сети ^Е), блок системной модели нейронной сети ^М) и управляющий блок оптимизации нейронной сети (СО). К вспомогательным блокам системы относятся буфер для хранения уровня глюкозы и буфер для хранения значений уровня инсулина (и). На вход системы подается текущее значение глюкозы в крови BLG. Выходом системы является рекомендованное значение дозы инсулина.
Все три основных блока системы DE, SM и СО представляют собой последовательно
BGL
V п V
связанные нейронные сети. В каждый момент времени значения уровня глюкозы и инсулина записываются в соответствующие буферы. Данные из буфера Y поступают на вход сети DE, а данные из буфера и - на входы сетей SM, DE. На входы сетей SM, СО подаются также выходные данные системы.
Рис. 4 Структура системы: DE, SM, CO - нейронные сети; Y, U - буферы; System - системный
блок; BLG - текущее значение BG.
Конкретная архитектура сетей в работе [] не указывается, но отмечается возможность использования, как сетей с прямыми связями, так и рекуррентных сетей. В качестве функций активации нейронов во всех случаях рекомендуется использовать сигмоидальные функции.
Алгоритм обучения сетей DE, SM, СО определяется их архитектурой, но во всех случаях обучение должно производиться в следующем порядке: сначала сеть DE, а затем сети SM, СО.
При экспериментальном исследовании эффективности системы, обучение системы выполнено на данных о 70 пациентах за временной период в 6 месяцев. Система показала удовлетворительные результаты на всех пройденных тестах.
6. Комбинированные системы прогнозирования требуемых доз инсулина 6.1. Системы, использующие модель в виде ОДУ и нейронную сеть прямого
распространения
6.1.1. Комбинированная система [] предназначена для определения необходимых доз
инсулина при непрерывных измерениях BG и непрерывном введении инсулина (Рис. 5). Система состоит из трех основных модулей:
• математическая модель глюкозно-инсулинового метаболизма пациента (ММ);
• нейронная сеть (НС), предсказывающая следующие значения уровня BG;
• предиктор-контроллер (ПК), выходом которого является оптимальная доза инсулина в данный момент времени;
• временные линии задержки (ЛЗ).
Рис. 5. Структура системы: ПК - предиктор-контроллер; ММ - математическая модель пациента; НС - нейронная сеть; ЛЗ - линия задержки; ОС - обратная связь; и(1) - уровень
инсулина в крови, у(0 - уровень BG.
В качестве математической модели пациента используется система ОДУ, рассмотренная в п. 1.1.3. Такая модель позволяет вычислить количество поглощенного инсулина при однократной инъекции. При непрерывном введении инсулина это количество может быть рассчитано как результат нескольких инъекций.
Прогнозирование следующих значений BG реализовано с помощью трехслойной рекуррентной нейронной сетью с радиальной базисной функцией активации нейронов (см. п. 2.2.3).
Поскольку выходные переменные математической модели (компартменты x1, u1Л, u13, u 2) не могут быть использованы непосредственно для обработки указанной нейронной сетью, эти выходы предварительно преобразуются по формулам
xl ^,1 ^,2 U1,3 u2
у, = — У2 = — У3 = —У4 = —У5 = — V , V , V , V , V ,
1 1,1 1,2 1,3 2
где ^- нормированные величины компартментов (процентные отношения к весу пациента).
Предиктор-контроллер реализует алгоритм управления BG в условиях больших временных задержек и высокого уровня шума. Алгоритм основан на минимизации целевой функции, построенной на основе разности между предсказанным и целевым значениями BG.
Схема одного шага алгоритма имеет вид:
• вычисление целевых значений BG в N следующих моментов времени;
• вычисление на основе математической модели пациента и модели глюкозно-инсулинового метаболизма прогнозируемых значения уровня BG в те же N следующих моментов времени;
• вычисление среднеквадратичного отклонения предсказанных значений уровня BG от их целевых значений;
• минимизация указанного среднеквадратичного отклонения;
• реализация управляющего воздействия, соответствующего первому из рассматриваемых моментов времени.
При минимизации среднеквадратичного отклонения в качестве варьируемых
параметров используется Np - длина диапазона прогнозируемых значений BG, Nc - длина
диапазона контролируемых значений BG, Ге - вес прогнозируемого значения BG, Ги - вес контролируемого значения BG.
Временные линии задержки используются для преобразования входных сигналов и(^ и у(^ в вектор, подходящий для обработки нейронной сетью. Здесь и(1) - уровень инсулина в крови, у(1) - уровень BG.
Обучение модели проводилось на выборки из 960 измерений (что соответствует двум дням). Еще 480 измерений (1 день) использовались для тестирования. Наилучшие результаты были достигнуты при использовании нейронной сети с 3 вложенными слоями по 5 нейронов в каждом.
6.2. Системы, использующие модель в виде ОДУ и рекуррентную нейронную сеть
6.2.1. В работе [] рассмотрена система, структуры которой очень близка к структуре системы, рассмотренной в п.6.1.1. Основное отличие заключается в использовании рекуррентной нейронной вместо сети прямого распространения, что позволило избавится от линий задержки. Входами сети являются следующие величины:
• выход сети в предыдущий момент времени (I - 1);
• текущее значение BG (измеренное CGMS);
• скорость введения инсулина в предыдущий момент времени (I- 1) .
Выходом сети является предполагаемое изменение уровня BG в данный момент времени I. Подбор оптимальных доз инсулина обеспечивает нелинейный предиктор-контроллер полностью идентичный контроллеру, рассмотренному в п. 6.1.1. В качестве алгоритма обучения сети используется RTRL-алгоритм.
ЗАКЛЮЧЕНИЕ
Современные САУ уровнем глюкозы в крови пациента используют широкий класс математических моделей динамики инсулина и глюкозы в его теле: модели, построенные на основе ОДУ; модели на основе ОДУ с запаздывающим аргументом; модели на основе интегро-дифференциальных уравнений; модели на основе дифференциальных уравнений в
частных производных. Для прогнозирования оптимальных доз искусственного инсулина эти САУ широко используют нейросетевые алгоритмы, на базе различных нейронных сетей -нейронных сетей прямого распространения, реккурентных нейронных сетей, а также нечетких нейронных сетей.
САУ уровнем глюкозы в крови пациента используют, как правило, неравномерное дискретное время и делятся на два больших класса - системы, не использующие математических моделей пациента и использующие такие модели.
САУ первого класса строятся на основе одной или нескольких прогнозирующих нейронных сетей. Для хранения уровней глюкозы и инсулина в предыдущие дискретные моменты времени могут использоваться специальные буферные устройства.
САУ второго класса включают в себя, как правило, математический и нейросетевой модули, а также, возможно, ряд вспомогательных устройств (контроллер, буферные устройства и т.д.). Математический модуль такой САУ реализует модель пациента в виде ОДУ, интегро-дифференциальных уравнений или уравнений в частных производных, которая предназначена для вычисления количества поглощенного инсулина при однократной инъекции. Нейросетевой модуль реализует модель глюкозно-инсулинового метаболизма, которая предсказывает следующее значение уровня глюкозы в крови пациента.
Особенностью систем автоматического управления уровнем глюкозы в крови пациента, существенно затрудняющей задачу их построения, является то, что эти системы функционируют в условиях больших временных задержек и высокого уровня шума.
В настоящее время происходит интенсивный поиск оптимальных структур САУ уровнем глюкозы в крови пациента. Общепризнанные структуры таких систем в настоящее время отсутствуют. В то же время, многие из реализованных САУ, рассмотренных классов, прошли широкую апробацию в клинических условиях и показали свою эффективность.
В целом, на основе данного обзора можно сделать следующий вывод. В настоящее время актуальными являются разработка и исследование новых, более адекватных моделей
пациента и его глюкозно-инсулинового метаболизма, а также разработка и исследование
методов и алгоритмов синтеза САУ уровнем глюкозы в крови пациента.
ЛИТЕРАТУРА
1. C.Binder, T.Lauritzen, O.Faber, S.Pramming. Insulin pharmacokinetics // Diabetes Care, vol. 7, 1984, pp. 188-199.
2. A. Makroglou, J. Li, Y. Kuang. Mathematical models and software tools for the glucose-insulin regulatory system and diabetes: an overview. // Proceedings of the 2005 IMACS, pp. 561 -565.
3. Z.Trajanoski, P.Wach. Neural predictive controller for insulin delivery using the subcutaneous route // IEEE Transaction on Biomedical Engeneering, vol. 45, No 9, 1998, pp. 11221134.
4. S.G.Mougiakakou, K.Prountzou, K.S.Nikita. A Real Time Simulation Model of Glucose-Insulin Metabolism for Type I Diabetes Patients. // 27th Annual International Conference of the Engineering in Medicine and Biology Society, 2005, pp. 298 - 301.
5. S. G. Mougiakakou, K. Prountzou et al. A Neural Network based Glucose-Insulin Metabolism Models for Children with Type I. // Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Proceedings, 2005.
6. E.Teufel, M.Kletting, W.G.Teich, H.-J.Pfleiderer, C.Tarin-Sauer. Modeling the Glucose Metabolism with Backpropagation through Timetrained Elman Nets. // Proceedings of the 13th IEEE Workshop on Neural Network for Signal Processing, 2003, pp 789 - 798.
7. W.A.Sandham, D.J.Hamilton, A.Jappx, K.Pattersod. Neural network and neuro-fuzzy systems for improving diabetes therapy. // Proceedings of the 20th Annual International Conference of the IEEE Engineering in Medicine and Biology Society, Vol. 20, No 3, 1998, pp 14381441.
8. F.Andrianasy, M.Milgram. Applying neural networks to adjust insulin pump doses. // Proceedings of the 1997 IEEE Workshop «Neural Networks for Signal Processing», pp. 182 - 188.
9. R.A.Z.Towards. Neural Network Model for Insulin/Glucose in Diabetics-II // Informatica, No 29, 2005, pp. 227-232.
10. S.G.Mougiakakou, K.S.Nikita. Neural network system for outpatient management of insulin dependent patients. // Proceedings of the First Joint BMES/EMES Conference Serving Humanity, Advancing Technology, 1999, pp. 697.
11. H.K.Phee, W.L.Tung, C.Quek. A Personalized Approach to Insulin Regulation Using Brain-Inspired Neural Semantic Memory in Diabetic Glucose Control. // Proceedings of the IEEE Congress «Evolutionary Computation 2007», pp 2644 - 2651.
12. M.F.Alamaireh. A Predictive Neural Network Control Approach in Diabetes Management by Insulin Administration. // Proceedings of the IEEE Conference «Information and Communication Technologies», 2006, pp 1618 - 1623.
13. K. Zarkogianni, S. G. Mougiakakou et al. An Insulin Infusion Advisory System for Type 1 Diabetes Patients based on Non-Linear Model Predictive Control Methods. // Proceedings of the 29th Annual International Conference of the IEEE EMBS, 2007, pp. 5971 - 5974.