Логинов Д.С., Волкова Н.А., Бодин О.Н. ПУТИ ПОВЫШЕНИЯ КАЧЕСТВА ОБУЧЕНИЯ НЕЙРОННЫХ СЕТЕЙ В КДС «КАРДИОВИД»
Компьютерная диагностика состояния сердечно-сосудистой системы (ССС) призвана помочь врачу-кардиологу в анализе кардиографической информации. Разработанная в Пензенском государственном университете компьютерная диагностическая система (КДС) «Кардиовид» [1] обеспечивает повышение оперативности, чувствительности и специфичности диагностики состояния ССС в условиях скорой и неотложной помощи по сравнению с традиционным амплитудно-временным анализом электрокардиосигнала (ЭКС). В основе работы КДС лежит анализ ЭКС пациента, моделирование состояния сердечно-сосудистой системы пациента и синтез реалистичного трехмерного изображения смоделированного состояния сердечно-сосудистой системы пациента.
Повышение оперативности, чувствительности и специфичности диагностики состояния ССС достигается благодаря использованию нейронных сетей (НС) для анализа ЭКС. Преимуществом нейросетевых методов анализа ЭКС является более эффективная адаптация к нестационарным особенностям ЭКС по сравнению с другими методами, обусловленная алгоритмом обучения.
Известно [1] , что задача анализа ЭКС на основе НС относится к классификационным задачам. НС, использующая евклидову меру близости для классификации объектов, называется сетью Кохонена. Недостаток сети Кохонена заключается в отсутствии возможности обучения «с учителем». НС ЬУО является развитием структуры сети Кохонена, устраняя указанный недостаток. На рисунке 1 приведена структура НС ЬУО [2] .
Рисунок 1 - Структура НС ЬУО для анализа ЭКС
Нейросетевой анализ (НСА) ЭКС в КДС «Кардиовид» характеризуется следующей структурной схемой:
диагноз
Рисунок 2 - Схема нейросетевого анализа ЭКС в КДС «Кардиовид»
Где ОУ - операционное устройство, анализирующее выходы НС.
Для анализа ЭКС используется такая схема, в которой при выявлении признаков одного заболевания используется двенадцать НС для отдельного анализа каждого отведения. Общее количество НС равно произведению количества выявляемых состояний сердца и количества отведений ЭКС (рисунок 2).
Осуществление нейросетевого анализа ЭКС возможно только после выполнения процедуры обучения НС. Перед обучением НС осуществляется подготовка обучающего набора данных. Формирование обучающей выборки производится с использованием ЭКС с общедоступного сайта PhysioNet [8]. Каждый из используемых сигналов проанализирован специалистами и имеет соответствующий протокол обследования.
После проверки специалистами проводится статистическая проверка ЭКС на принадлежность к одной генеральной совокупности. Для анализа используется пакет SPSS Statistics 17.0. Алгоритм статистического анализа следующий: ЭКС, относящиеся к одному диагнозу по решению специалистов делят на 2 выборки. В первом случае на две равные выборки по четности-нечетности, во втором половинным делением. Для проверки гипотезы о принадлежности каждой группы выборок к одной генеральной совокупности используется t-критерий Стьюдента. Рассчитываются коэффициенты корреляции и t-критерий. Условие принятия гипотезы t$,aKT > 1табл. Табличное значение коэффициента Стьюдента при уровне значимости
0,01 равно 1,669. Например, для ЭКС, относящихся к диагнозу передне-перегородочного инфаркта миокарда (ИМ), коэффициент корреляции пары выборок первого случая имеет значение 0,025, значение коэффициента Стьюдента 12,073. Для пары выборок второго случая имеем коэффициент корреляции
0,018, значение коэффициента Стьюдента 21,400. Следовательно, можно сделать вывод о подтверждении гипотезы принадлежности пар выборок к одной генеральной совокупности.
После подготовки обучающих данных проводится обучение НС. Для обучения НС, выявляющей признаки одной из локализаций ИМ, используется 80 сигналов в качестве обучающей выборки. 40 сигналов характеризуют выявляемый ИМ, 4 0 сигналов отнесены к классу здоровых.
Исходный аналоговый сигнал ЭКС оцифровывается в соответствии со стандартом ЗСР-ЕСО для обмена цифровыми ЭКС [3] и представляется в виде 500 отсчетов на один кардиоцикл. Выделение одного кардиоцикла [4] является отличительной особенностью: для выявления ИМ достаточно одного кардиоцикла
[5].
Размерность входного слоя НС N определяется стандартом ЗСР-ЕСО для обмена цифровыми ЭКС [3] и равна N = 500.
Размерность выходного слоя НС К соответствует числу анализируемых классов заболеваний, т.е. каждому заболеванию ССС соответствует один выход НС. Из-за снижения качества работы НС с увеличением количества анализируемых ею классов состояния ССС, используются НС для двух состояний ССС: здоров и один из ИМ. Ответы НС ЬУО кодируются значением «1» для выхода, соответствующего классу заболевания, к которому НС отнесла входной сигнал и «0» для выхода, соответствующего классу «здоровый». НС в КДС «Кардиовид» анализируют 10 классов заболеваний (К=10), из них 9 классов относятся к различным видам ИМ [5] и один класс - к «здоровому пациенту».
Количество нейронов М в слое Кохонена соответствует числу кластеров, на которые предполагается разделить входные данные. Для определения данного значения используется следующая формула:
М = а-К (1)
где С - число кластеров, приходящийся на один класс заболеваний.
Диагностика инфаркта миокарда амплитудно-временными методами опирается на 5 признаков инфаркта
[7]. В связи с этим, С =5 , поэтому К = 50.
При обучении сеть адаптируется для распознавания конкретного ЭКС. При этом выявляются закономерности, неявно выраженные в ЭКС. Целью обучения НС при анализе ЭКС является такое упорядочение нейронов (подбор значений их весов), которое минимизирует значение ожидаемого искажения, оценива-
к
емого погрешностью аппроксимации входного вектора X , значениями весов ™к нейрона-победителя в конкурентной борьбе. Эта погрешность (или ошибка распознавания) может быть представлена в виде:
е=Щ|(х -)2 (=)
где р - количество входных векторов,
1Ш - 1-й элемент вектора весов ш-го нейрона конкурирующего слоя при предъявлении входного хк
вектора X .
Критерием завершения процесса обучения НС служит выполнение условия ^ & , где е - величина
погрешности, заданная пользователем перед началом обучения (например, е = 0,01). Время, за которое будет выполнено это условие, является временем обучения или временем сходимости алгоритма обучения.
Известный алгоритм обучения НС ЬУО [2] не гарантирует обучение всех нейронов конкурирующего слоя, поэтому авторами КДС «Кардиовид» разработан усовершенствованный алгоритм обучения НС ЬУО
[6] для анализа ЭКС на основе метода «выпуклой комбинации» [7]. Схема усовершенствованного алгоритма обучения НС ЬУО для анализа ЭКС приведена на рисунке 3.
Рисунок 3 - Схема усовершенствованного алгоритма обучения НС ЬУО для анализа ЭКС Алгоритм работает следующим образом:
т 1
Присваивается всем весам слоя Кохонена одно и то же начальное значение ж-
Выбирается из обучающей выборки очередной вектор х . Изменяются элементы вектора хъ в соответствии в формулой (3)
(3)
Х=р{і )• Xі+
где ь - номер эпохи обучения,
¡3(1)- монотонно возрастающая функция, меняющаяся от 0 до 1 по мере обучения.
Определяется евклидово расстояние между вектором х' и каждым нейроном конкурирующего слоя по формуле (4)
=
где
значение 1-го элемента вектора х',
- значение 1-го веса ш-го нейрона конкурирующего слоя.
Определяются 2 нейрона с наименьшим евклидовым расстоянием ^ до входного вектора х'.
При выполнении условия (5) осуществляется переход к п. 7, иначе происходит возврат к п. 2
>(1 -є) / (1 + є)
(5)
где ^ - евклидово расстояние между вектором х' и весами первого найденного нейрона, d2 - евклидово расстояние между вектором х' и весами второго найденного нейрона, е - значение, выбираемое из диапазона 0.2 ^ 0.3 [2].
Изменяются веса найденных нейронов. При правильной классификации вектора х' выполняется корректировка по формуле (6). При ложной классификации выполняется «отторжение» по формуле (7).
--а,-1 +ъ (х -ю, -!) (6)
0 = 0-і -Л,(х-т,_і) (7)
где Пь - величина скорости обучения НС.
При минимизации ошибки обучения Ея (см. выражение 2) прекращается цикл обучения, иначе осуществляется переход к п. 2.
Результаты тестирования нового алгоритма обучения [ 6] показали увеличение чувствительности (доля больных, правильно отнесенных к категории «больные») и специфичности (доля здоровых, правильно отнесенных к категории «здоровые») по сравнению со стандартным алгоритмом обучения НС ЬУО.
Таким образом, можно выделить 3 пути повышения качества обучения НС в КДС «Кардиовид»: первый
- совершенствование алгоритма НСА, второй - совершенствование формирования обучающих данных, третий - совершенствование алгоритма обучения НС.
X
ЛИТЕРАТУРА
1. Патент РФ № 2257838. Способ диагностики состояния сердечно-сосудистой системы / Бодин О.Н., Адамов А.В. Агапов Е.Г., Бурукина И.П. Кузьмин А.В. // Официальный бюллетень «Изобретения. Полезные модели». №22, 2 0 05.
2. Kohonen T. Self-Organization and Associative Memory, 2nd Edition, Berlin: Springer-Verlag,
1987.
3. Плотников А.В., Прилуцкий Д.А., Селищев С.В. Стандарт SCP-ECG для обмена цифровыми ЭКС // Тезисы докладов Международной конференции по биомедицинскому приборостроению «Биомедприбор-98» -Москва, ВНИИМП РАМН.-6-8 октября 1998, 213-215с.
4. Патент РФ №2294139. Способ выделения начала кардиоцикла и устройство для его осуществления / Бодин О.Н., Жулев И.О., Логинов Д.С., Митрошин А.Н., Прошкин В.В. // Официальный бюллетень «Изобретения. Полезные модели». №6, 2007.
5. Зудбинов Ю.И. Азбука ЭКС. Изд. 4-е, испр. и доп., Ростов н/Д: Феникс, 2003, 240с.
6. Бодин О.Н., Логинов Д.С. Адаптация структуры нейронной сети LVQ для анализа электрокардиосигнала // Нейрокомпьютеры: разработка, применение, №6, 2008.
7. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика. - М.: Мир, 1992, 240с.
8. www.PhisioNet.org.