Научная статья на тему 'МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ДЛЯ ВЫЯВЛЕНИЯ ЭПИЛЕПТИЧЕСКИХ ПРИСТУПОВ НА ЗАПИСИ ЭЭГ'

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ДЛЯ ВЫЯВЛЕНИЯ ЭПИЛЕПТИЧЕСКИХ ПРИСТУПОВ НА ЗАПИСИ ЭЭГ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
79
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЭГ / ЧАСТОТНО-ВРЕМЕННОЙ АНАЛИЗ / НЕЙРОННЫЕ СЕТИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Назариков Сергей Игоревич

Цель настоящего исследования — анализ возможности использования сверточных нейронных сетей в качестве модели для выявления эпилептических приступов на реальных данных ЭЭГ. Методы. Для частотно-временного анализа используется вейвлет-анализ. Для локализации эпилептических разрядов задача их детектирования была сведена к задаче классификации и использовалась модель нейронной сети архитектуры ResNet18. Были использованы техники для аугментации и балансировки рассматриваемого датасета биомедицинских данных. Результаты. Сверточная нейронная сеть может быть успешно применена для выявления эпилептических приступов, предложен метод постобработки результатов первичного детектирования для улучшения качества работы модели. Показано, что разработанная модель демонстрирует высокую точность по сравнению с другими методами, основанными на классических алгоритмах машинного обучения. Значение метрики F1-score достигает 0.44, что является высоким значением при классификации реальных биологических данных. Заключение. Представленная модель на основе сверточной нейронной сети для выявления эпилептических приступов на записи ЭЭГ может стать основной в системах поддержки принятия врачебных решений врача-эпилептолога.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Назариков Сергей Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MATHEMATICAL MODEL FOR EPILEPTIC SEIZURES DETECTION ON AN EEG RECORDING

Purpose of this study — analysis of the possibility of using convolutional neural networks as a model for detecting epileptic seizures on real EEG data. Methods. In this paper, wavelet analysis is used for time-frequency analysis. To localize epileptic discharges, the task of detecting them was reduced to the classification task and the ResNet18 architecture of neural network was used. Techniques were used to augment and balance the biomedical data dataset under consideration. Wavelet analysis is used for time-frequency analysis. To localize epileptic discharges, the problem of their detection was reduced to the classification task, and the ResNet18 neural network architecture was used. Techniques were used to augment and balance the considered biomedical dataset. Results. Convolutional neural network can be successfully used to detect epileptic seizures, a method of postprocessing the results of primary detection is proposed to improve the quality of the model. It is shown that the developed model demonstrates high accuracy in comparison with other methods based on classical machine learning algorithms. The value of the F1-score metric reaches 0.44, which is a high value for classification of the real biological data. Conclusion. The presented model based on a convolutional neural network for detecting epileptic seizures on an EEG recording can become the main one in medical decision support systems for epileptologist.

Текст научной работы на тему «МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ДЛЯ ВЫЯВЛЕНИЯ ЭПИЛЕПТИЧЕСКИХ ПРИСТУПОВ НА ЗАПИСИ ЭЭГ»

Нелинейная

^^^^^^^^ динамика и нейронаука

Известия высших учебных заведений. Прикладная нелинейная динамика. 2023. Т. 31, № 5 Izvestiya Vysshikh Uchebnykh Zavedeniy. Applied Nonlinear Dynamics. 2023;31(5)

Научная статья УДК 530.182

DOI: 10.18500/0869-6632-003065 EDN: ZMFWFL

Математическая модель для выявления эпилептических приступов на записи ЭЭГ

С. И. Назариков

Балтийский федеральный университет имени Иммануила Канта, Россия E-mail: snazarikov@gmail.com Поступила в редакцию 10.05.2023, принята к публикации 28.08.2023, опубликована онлайн 19.09.2023, опубликована 29.09.2023

Аннотация. Цель настоящего исследования — анализ возможности использования сверточных нейронных сетей в качестве модели для выявления эпилептических приступов на реальных данных ЭЭГ. Методы. Для частотно-временного анализа используется вейвлет-анализ. Для локализации эпилептических разрядов задача их детектирования была сведена к задаче классификации и использовалась модель нейронной сети архитектуры ResNet18. Были использованы техники для аугментации и балансировки рассматриваемого датасета биомедицинских данных. Результаты. Сверточная нейронная сеть может быть успешно применена для выявления эпилептических приступов, предложен метод постобработки результатов первичного детектирования для улучшения качества работы модели. Показано, что разработанная модель демонстрирует высокую точность по сравнению с другими методами, основанными на классических алгоритмах машинного обучения. Значение метрики F1-score достигает 0.44, что является высоким значением при классификации реальных биологических данных. Заключение. Представленная модель на основе сверточной нейронной сети для выявления эпилептических приступов на записи ЭЭГ может стать основной в системах поддержки принятия врачебных решений врача-эпилептолога.

Ключевые слова: ЭЭГ, частотно-временной анализ, нейронные сети.

Благодарности. Работа поддержана программой «Приоритет-2030» Балтийского федерального университета им. И. Канта Министерства образования и науки РФ.

Для цитирования: Назариков С. И.Математическая модель для выявления эпилептических приступов на записи ЭЭГ //Известия вузов. ПНД. 2023. T. 31, № 5. С. 628-642. DOI: 10.18500/0869-6632-003065. EDN: ZMFWFL

Статья опубликована на условиях Creative Commons Attribution License (CC-BY 4.0).

Article

DOI: 10.18500/0869-6632-003065

Mathematical model for epileptic seizures detection on an EEG recording

S. I. Nazarikov

Immanuel Kant Baltic Federal University, Russia E-mail: snazarikov@gmail.com Received 10.05.2023, accepted 28.08.2023, available online 19.09.2023, published 29.09.2023

Abstract. Purpose of this study — analysis of the possibility of using convolutional neural networks as a model for detecting epileptic seizures on real EEG data Methods. In this paper, wavelet analysis is used for time-frequency analysis. To localize epileptic discharges, the task of detecting them was reduced to the classification task and the ResNet18 architecture of neural network was used. Techniques were used to augment and balance the biomedical data dataset under consideration. Wavelet analysis is used for time-frequency analysis. To localize epileptic discharges, the problem of their detection was reduced to the classification task, and the ResNet18 neural network architecture was used. Techniques were used to augment and balance the considered biomedical dataset. Results. Convolutional neural network can be successfully used to detect epileptic seizures, a method of postprocessing the results of primary detection is proposed to improve the quality of the model. It is shown that the developed model demonstrates high accuracy in comparison with other methods based on classical machine learning algorithms. The value of the F1 -score metric reaches 0.44, which is a high value for classification of the real biological data. Conclusion. The presented model based on a convolutional neural network for detecting epileptic seizures on an EEG recording can become the main one in medical decision support systems for epileptologist.

Keywords: EEG, time-frequency analysis, neural networks.

Acknowledgements. This work was supported by the Priority 2030 program of the Immanual Kant Baltic Federal University of the Ministry of Education and Science of the Russian Federation.

For citation: Nazarikov SI. Mathematical model for epileptic seizures detection on an EEG recording. Izvestiya VUZ. Applied Nonlinear Dynamics. 2023;31(5):628-642. DOI: 10.18500/0869-6632-003065

This is an open access article distributed under the terms of Creative Commons Attribution License (CC-BY 4.0).

Введение

Эпилепсия — это хроническое неврологическое расстройство, проявляющееся в форме редких повторяющихся припадков, вызванных аномальной активностью в мозге. Под припадком понимают аномальную активность нейронов в головном мозге, которая может сопровождаться потерей сознания, неконтролируемыми движениями или другими негативными проявлениями. По состоянию на 2016 год более 50 миллионов человек по всему миру страдало эпилепсией [1], однако стоит отметить, что при своевременном выявлении и надлежащем лечении до 70% пациентов достигают состояния ремиссии [2,3]. На сегодняшний день основным диагностическим инструментом при эпилепсии является электроэнцефалография.

Электроэнцефалография (ЭЭГ) — это неинвазивное измерение электрических полей головного мозга, при котором электроды, помещенные на кожу головы, регистрируют потенциалы напряжения, возникающие в результате прохождения тока в нейронах и вокруг них. Наиболее распространенным подходом к анализу ЭЭГ является визуальный анализ, который проводится опытным врачом-эпилептологом. Данный подход является трудоемким и дорогостоящим процессом, так как специалисту необходимо проанализировать огромный объем данных. Например, в некоторых случаях пациент может пробыть в клинике от нескольких суток до нескольких недель для проведения долгосрочного мониторинга, что приведет к необходимости анализа сотен часов записей ЭЭГ [4]. Наличие автоматизированного инструмента для выявления эпилептических приступов на записи ЭЭГ могло бы существенно ускорить процесс скрининга, освободить врача от кропотливой работы, а также предоставить альтернативное мнение. Построение подобных систем поддержки принятия врачебных решений в настоящее время является актуальной и важной научной задачей [5,6].

На сегодняшний день существует большое количество исследований в области анализа ЭЭГ данных, и выявление эпилептических приступов не исключение [7]. В части работ для выявления приступов используются статистические модели [8,9], но также существует большое число работ, где используются различные алгоритмы машинного обучения [10-12]. Отдельно стоит сказать, что в последние годы активно развивается отрасль глубокого обучения, где нейронные сети показывают лучшие результаты в решении различных задач с использованием данных различных модальностей, включая изображения, тексты и звуковые сигналы. В результате многие исследователи пробуют применять искусственные нейронные сети и к задаче детекции эпилептических приступов [13,14].

Однако чаще всего исследования и оценка предлагаемых моделей проводится на публично доступных данных, среди которых самыми распространенными используемыми датасетами являются Bonn-Barcelona EEG [15] и CHB-MIT [16], но эти наборы данных имеют определенные недостатки, которые препятствуют получению моделей, готовых к использованию в повседневных условиях неинвазивного мониторинга. Так, например, [15] содержит данные внутричерепных записей ЭЭГ пациентов, страдающих фармакорезистентной фокальной эпилепсией, что сильно отличается от того как проводится современный неинвазивный мониторинг ЭЭГ. Датасет [16], в свою очередь, содержит данные лишь о 23 пациентах младше 22 лет, среди которых 5 мужчин, что может быть недостаточно репрезентативной выборкой, так как известно, что ЭЭГ-данные сильно вариативны от пациента к пациенту [17].

В данной работе исследуется вопрос: может ли подход на основе сверточных нейронных сетей использоваться в качестве модели для выявления эпилептических приступов на реальных данных ЭЭГ записи. Для получения ответа на этот вопрос используется набор данных неинвазивного мониторинга, где все данные были записаны при помощи одного устройства и размечены одним врачом эпилептологом, предоставленные Национальным медико-хирургическим центром имени Н.И. Пирогова (Москва), методы частотного анализа. Для локализации припадков на ЭЭГ используется гибридный подход, где сначала сигнал переводится в частотно-временной домен при помощи непрерывного вейвлет-преобразования и затем используется сверточная нейронная сеть.

1. Методика

Общая схема исследования представлена на рис. 1, где овал использован для обозначения данных на различных стадиях обработки, а прямоугольник отвечает за обозначение этапов работы с данными. Пунктирная линия означает опциональность использования блока. Каждый отдельный шаг будет разобран далее в статье.

1.1. Данные. В работе используются данные, предоставленные Национальным медико-хирургическим центром имени Н. И. Пирогова Министерства здравоохранения Российской Федерации (Москва, Россия). Все медицинские процедуры проводились в Центре в соответствии с Хельсинкской декларацией и медицинскими правилами Центра и были одобрены лечебно-экспертной комиссией. Все пациенты дали письменное информированное согласие перед участием. Набор данных включает анонимизированные данные долгосрочного мониторинга пациентов в отделении неврологии и клинической нейрофизиологии в период с 2017 по 2019 год. Мониторинг проводился во время повседневной деятельности, включая сон и бодрствование. Продолжительность записи варьируется от 8 до 84 часов в зависимости от состояния пациента и количества эпизодов эпилептиформной активности, необходимых для постановки правильного диагноза. Данные содержат записи 83 пациентов с диагнозом фокальная эпилепсия. Эпилептические очаги обнаруживались в лобных, височных или теменных областях левого, правого или обоих полушарий. У каждого пациента за время наблюдения было зафиксировано от одного до пяти эпилептических припадков. Сигналы ЭЭГ регистрировали с частотой дискретизации 128 Гц по 25 каналам согласно международной системе 10-20 [18]. Пример данных изображен на рис. 2.

Рис. 1. Схема исследования. Овалом изображаются данные на различных стадиях обработки. Прямоугольным блоком описываются шаги работы с данными. Пунктирная линия означает опциональность использования блока

Fig. 1. Study scheme. The oval represents data at various stages of processing. The rectangular block describes the data processing steps. The dotted line indicates the optional use of the block

-1.......

.. -хУ""-"4"- •- -

~V""--

——-—

.....'

-----

"Л/ u "

- ■M.wyVHVyftiiiK. , . , ....._ -—'■-"'......

-^ "—*-

'"" 11 ""rL"" ■■ .......L.......... .....- ... .

--- ----——--——

.......^j'' 1—----^----- —-—

......

.............V"-

.. . .^у^

■^vvw -....... . ...... - ■ - r" ■■ 1 •

V V * . 1

1 _____ . ------ . ..

seizure

Рис. 2. ЭЭГ запись из используемого датасета, содержащая приступ, который выделен красным цветом (цвет онлайн) Fig. 2. EEG record from the dataset with a seizure, which is highlighted in red (color online)

1.2. Частотно-временной анализ. Анализ сигналов выполнялся при помощи непрерывного вейвлет-преобразования (НВП) [19]. НВП выполняет свертку для каждого из 25 ЭЭГ сигналов

с базовой функцией 'ф(п):

те

(Ш = лМ У ХпШ*(/(г - Ь))М, п = 1,2,...,М, (1)

— те

где N — количество каналов в ЭЭГ записи, f — частота, £ — время, ^ — коэффициенты

вейвлет преобразования. Знаком * обозначается комплексно-сопряженная функция. В качестве базовой функции НВП был использован вейвлет Морле:

1 ■ п2

у(ц) = — е]т° це—^, (2)

у п

где юо = 2п — центральная частота вейвлета, которая описывает его общее поведение, определяемое путем аппроксимации вейвлета синусоидой.

Далее рассматривалась мощность полученного спектра в диапазоне частот 1...40 Гц:

ЖпШ) = №пи,1)12, п = 1,2,....М, (3)

1.3. Математическая модель. Выявление эпилептических приступов на записи ЭЭГ было сведено к задаче классификации непересекающихся отрезков ЭЭГ записи фиксированной длины (в данной работе — 10 секунд) после вейвлет-преобразования. Данные отрезки могут быть рассмотрены как 25-канальные изображения и, следовательно, задача в общем смысле заключается в классификации изображений. В данной постановке доминирующее положение занимают нейронные сети, которые с момента появления А1ех№1 [20] в 2012 году занимают лидирующие позиции в различных бенчмарках, таких как ImageNet [21]. Поэтому в качестве математической модели была выбрана нейронная сеть архитектуры Яе8№М8 [22], что является стандартным выбором для задачи классификации.

Стоит отметить, что нейронные сети имеют тенденцию сходиться быстрее и стабильнее, когда входные данные нормально распределены с близким к нулю средним значением и ограниченной дисперсией. Однако общее распределение мощности спектра, ввиду того, что многие значения близки к нулю, является асимметричным, близким к экспоненциальному. Поэтому входом для сети была прологарифмированная и нормализованная мощность спектра:

И^ Ш) = ЪЕ(йгпШ)), (4)

ФисГт(, л = Щ) - )

^п а ^ а(\¥^) , (5)

где ^(Х) = ^]хех % — среднее значение, а(Х) = ^щ^хех(х - ))2 — стандартное отклонение.

Обычно, для того чтобы получить лучшие результаты и ускорить сходимость модели [23], используют предобученные веса соответствующей архитектуры, обученной на задаче классификации на датасете цветных изображений (такие предобученные веса обычно присутствуют во всех современных программных пакетах). Однако проблема состоит в том, что цветные изображения имеют 3 канала, тогда как имеющиеся данные ЭЭГ после вейвлет преобразования — 25 каналов. Для решения этой проблемы была реализована специальная схема инициализации первого сверточного слоя нейронной сети. Каждый фильтр первого сверточного слоя предобученной сети был усреднен вдоль измерения соответствующего каналам входного изображения и, затем,

для каждого фильтра соответствующее ему «среднее» было продублировано 25 раз. Данный подход позволил использовать параметры предобученной модели и начать обучение с хорошего начального приближения.

Также стоит отметить, что имеющийся датасет является сильно несбалансированным — более 99% общего времени записи соответствует нормальному состоянию пациента. Поэтому во время обучения сети случайным образом отбиралось равное количество отрезков, содержащих и не содержащих эпилептический приступ. В данной работе для каждого пациента отбиралось 100 отрезков, содержащих нормальную, и 100 отрезков, содержащих эпилептическую активность.

Обучение сети проводилось на данных 34 пациентов, тестирование — на данных 45 пациентов и 4 записи были исключены из рассмотрения, так как в них были выявлены недочеты в разметке на этапе анализа исходных данных. Например, записи двух пациентов имели один приступ продолжительностью 1000 секунд в конце записи, что в несколько раз превосходит максимальную продолжительность приступа во всех оставшихся записях. Ещё 2 записи были исключены из рассмотрения после консультации с врачом из-за значительного числа артефактов при регистрации ЭЭГ.

Параметры обучения модели:

• количество эпох — 10,

• скорость обучения — 0.001,

• размер батча — 4,

• оптимизатор — Adam.

В качестве функции потерь для нейронной сети использовалась бинарная перекрестная энтропия (Binary Cross Entropy, BCE):

I ^data

BCE = - — ^ (Уг log(xt) + (1 - уг) \og(1 - хг)), (6)

aa г=1

где Ndata — количество примеров для обучения, хг — предсказание модели, уг — истинная метка.

1.4. MixUp и аугментации. Для улучшения результатов работы сети использовались техники аугментации и подход MixUp [24]. Подход MixUp позволяет увеличить количество уникальных примеров в датасете, смешивая имеющиеся данные в определенной пропорции, что, в свою очередь, позволяет получить линейное поведение модели в промежутках между обучающими примерами. Это улучшает стабильность сети, так как позволяет использовать для обучения примеры, которые сложно получить в реальной жизни. Также эксперименты показывают, что при использовании MixUp границы принятия линейно переходят от класса к классу [24]. Математически MixUp можно записать следующим образом:

ж = Ахг + (1 - X)Xj,

' (7)

У = Цг + (1 - A)yj,

где (х, у) — новый пример для обучения, (хг, уг) и (xj ,yj) — два случайных обучающих примера из датасета, A — значение из бета-распределения, то есть А~В(а,а), Ае[0,1]. В данной работе

Под аугментациями понимаются техники повышения вариативности датасета при помощи преобразований над исходными данными, что позволяет получать более стабильные и точные решения. В данной работе в качестве аугментаций использовались случайное отражение мощности спектра 10-секундного отрезка по времени, а также подход SpecAugment [25] — простой метод аугментации, изначально предложенный для задачи распознавания речи. SpecAugment применяется непосредственно к мощности спектра и заключается в маскировании блоков частотных каналов

с

Рис. 3. Пример работы SpecAugment: a — оригинал; b — маскирование по частоте; c — маскирование как по частоте, так и по времени (цвет онлайн)

Fig. 3. Example of SpecAugment. a — source; b — frequency masking; c — time and frequency masking (color online)

и/или маскировании блоков временных каналов, то есть в замене оригинальных значений блока на 0 либо на среднее значение мощности спектра. На рис. 3 изображен пример использования этой аугментации, где оригинальные значения заменяются на среднее. Здесь представлена оригинальная мощность спектра (рис. 3, a), мощность спектра с применением маскирования по частоте (рис. 3, Ь) и мощность спектра с применением маскирования как по частоте, так и по времени (рис. 3, с).

1.5. Постобработка. На тренировочных данных был подобран порог отнесения отрезка к положительному или отрицательному классу. После получения предсказаний сети было замечено большое количество ложноположительных срабатываний сети лишь на одном последовательном отрезке в 10 секунд. На рис. 4 продемонстрировано это наблюдение: 2 ложноположительных срабатывания, обозначенные розовыми столбцами, каждый из которых, согласно модели, длится

Рис. 4. Зависимость уверенности сети от времени. Красной линией изображен порог классификации, розовые столбцы — одиночные ложноположительные срабатывания на отрезке в 10 секунд (цвет онлайн)

Fig. 4. Dependence of the network's confidence on time. Red line shows the classification threshold, pink columns are single 10 seconds long false positives (color online)

в течение 10 секунд. Это является серьезной проблемой, так как при реальном использовании такой модели врачу будет необходимо тратить огромное количество времени на просмотр ложных «подозрительных» отрезков, которые на самом деле не содержат аномальной активности.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для решения проблемы большого количества одиночных ложных срабатываний было рассмотрено распределение продолжительности приступов, изображенное на рис. 5, для построения которого были вычислены продолжительности всех приступов всех пациентов. Из распределения видно, что минимальная продолжительность приступа составляет более 40 секунд, а средняя продолжительность приступа при этом составляет более 100 секунд, поэтому для минимизации количества ложных одиночных срабатываний, было решено применить к полученным предсказаниям модели постобработку. Для этого был использован медианный фильтр с размером ядра к = 7, так как такой подход, в отличие от, например, подбора эвристических правил отнесения отрезка к ложноположительному, позволяет сгладить сигнал в целом и получить менее стохастические предсказания.

Для оценки качества работы модели использовались стандартные метрики качества для задачи классификации — precision (Р), recall (R) и F1, основанные на ошибках 1 и 2 рода, возникающих при проверке статистических гипотез:

Р

R =

TP

Fi =

TP + FP1

TP TP + FN' 2 • PR

P + R '

(8) (9) (10)

где ТР — количество истинно положительных предсказаний модели, ТИ — количество истинно ложных предсказаний модели, РР — количество ложноположительных предсказаний модели, РИ — количество ложноотрицательных предсказаний модели.

Рис. 5. Оценка плотности распределения продолжительности эпилептических приступов в используемом наборе данных. Красная вертикальная линия — средняя продолжительность приступа (цвет онлайн)

Fig. 5. Estimation of the probability density function (PDF) of the distribution of the duration of epileptic seizures in the data set used. Red vertical line shows average seizure duration (color online)

2. Результаты и обсуждение

В данной работе была предложена модель для выявления эпилептических приступов, основанная на сверточной нейронной сети архитектуры Яе8№И8. На рис. 6 изображены примеры приступов, которые предложенная модель распознала как истинно положительные (рис. 6, а, Ъ) и ложноположительные (рис. 6, с, ё). Для наглядности и компактности отображения было

0.0002

>

-0.0002

Ö

ад

-0.0006

0

N

к

^

о Ö

CD

CD &

34.4

23.3

12.1

0.00006

>

l0.00002

Ö

ад

-0.00002

N

к

£

Ö

CD ^

CD <4н

d

time, s

4

6

time, s

2000

4000 wavelet power

6000

time, s

time, s

20

40

wavelet power

60

80

Рис. 6. Пример приступов, которые обнаруживает разработанная модель: a — исходный сигнал истинно положительного отрезка; b — мощность спектра истинно положительного отрезка; c — исходный сигнал ложноположительного отрезка; d — мощность спектра ложноположительного отрезка (цвет онлайн)

Fig. 6. An example of seizures that developed model detects: a — the original signal of a true positive segment; b — the power of the spectrum of a true positive segment; c — the original signal of a false positive segment; d — the power of the spectrum of a false positive segment (color online)

a

0

b

c

0

решено визуализировать исходный сигнал и мощность спектра (формула (3)) после бейзлайн коррекции только для канала Cz, который соответствует центральному электроду, расположенному на срединной сагиттальной плоскости черепа.

Результаты обучения сети на тренировочной и тестовой выборках представлены в табл. 1. Из табл. 1 видно, что при переходе с тренировочного множества на тестовое происходит значительное уменьшение метрики precision, а вместе с ней и Fi. Это объясняется тем, что во время обучения для балансировки датасета случайно выбирались по 100 отрезков нормальной и эпилептической активности, а во время фазы тестирования вся запись разбивается на последовательные 10-секундные отрезки. Учитывая, что средняя продолжительность записи составляет более 12 часов и более 99% записи являются нормальной активностью, то во время тестирования количество отрезков, содержащих нормальную активность, многократно превышает их количество во время тренировки. Следовательно, повышается и количество ложноположительных срабатываний, что и отражается в уменьшении значения метрики precision.

Из данных табл. 1 также следует, что медианная фильтрация существенно улучшает результаты работы предложенной модели. Улучшения наиболее заметны в метрике precision, что является закономерным результатом, так как медианный фильтр особенно эффективен в борьбе с импульсным шумом, чем и являются одиночные ложные срабатывания модели.

Также для демонстрации эффективности предложенного метода в табл. 2 приведено сравнение с методами, предложенными в [26,27], которые основаны на классических алгоритмах машинного обучения и используют такой же набор данных.

Предложенная в данной работе модель без применения постобработки достигает значения метрики Fi = 0.2495, что превосходит результат, представленный в [26], где авторы генерируют признаки вручную для последующей классификации с помощью алгоритма случайного леса. Результаты, демонстрируемые нашей моделью, также являются сопоставимыми с результатами, представленными в работе [27], в которой авторы решают задачу выявления приступов, рассматривая её как задачу детекции выбросов, с помощью одноклассового SVM [28]. При добавлении шага постобработки результаты существенно улучшаются и итоговое значение метрики Fi составляет 0.4382, что превосходит результаты в работах [26,27] и демонстрирует эффективность предложенного метода.

Другой важной задачей является создание интерфейсов мозг-компьютер для немедикаментозного прерывания эпилептических приступов [29], которые основаны на предсказании формирования приступа по сигналам ЭЭГ/ЭКоГ и последующей стимуляции мозга интерфейсом [30,31]. Предложенная модель может быть эффективна для решения данной задачи, так как

Таблица 1. Результаты обучения предложенной модели Table 1. Training results of the model

Подмножество данных precision recall Fi

Тренировочное 0.7771 0.7794 0.7782

Тестовое 0.1903 0.7199 0.2495

Тестовое, медиан. фильтр. к = 7 0.4196 0.7308 0.4382

Таблица 2. Сравнение моделей Table 2. Comparison of models

Модель precision recall Fi

Random Forest [26] 0.0533 0.7867 0.0933

One-class SVM [27] 0.1270 0.7697 0.2058

ResNet-18 0.1903 0.7199 0.2495

ResNet-18 медиан. фильтр. к = 7 0.4196 0.7308 0.4382

классификация производится по коротким (до 10 с) интервалам. Однако возникает проблема необходимости расчета вейвлет-спектров по всему интервалу частот, что приводит к большим затратам машинного времени. Поэтому для использования алгоритма в реальном времени необходима его дальнейшая оптимизация, в частности, важным является анализ наиболее значимого частотного диапазона, по которому необходимо восстановление вейвлет-спектра.

Заключение

В данной работе была продемонстрирована эффективность использования сверточной нейронной сети для выявления эпилептических приступов на ЭЭГ записи. Для получения качественного решения были использованы техники аугментации и специальная схема обучения. Исходя из результатов, представленных в табл. 2, видно, что предложенная модель, основанная на сверточной нейронной сети архитектуры ResNet18 с медианным фильтром для постобработки, несмотря на небольшой проигрыш по метрике recall, в целом превосходит модели на базе классических алгоритмов. Предложенная модель не требует ручной генерации признаков, что является преимуществом по сравнению с классическими подходами. Также можно сказать, что предложенная модель неплохо справляется с выявлением отрезков, содержащих приступ, но в то же время присутствуют проблемы с ложноположительными срабатываниями, что объясняется сложностью исходного сигнала — большой вариативностью как в рамках записи одного пациента, так и между записями нескольких пациентов. Однако стоит отметить, что среди всех приступов всех пациентов модель отметила как минимум один отрезок как эпилептический, а значит, при просмотре врачом таких «подозрительных» отрезков ни один приступ не будет упущен, что является ключевым критерием применимости модели в качестве системы поддержки принятия врачебных решений (СППВР).

Список литературы

1. Megiddo I., Colson A., Chisholm D., Dua T., Nandi A., Laxminarayan R. Health and economic benefits of public financing of epilepsy treatment in India: An agent-based simulation model // Epilepsia. 2016. Vol. 57, no. 3. P. 464-474. DOI: 10.1111/epi.13294.

2. Sander J. W. The use of antiepileptic drugs-principles and practice // Epilepsia. 2004. Vol. 45, no. s6. P. 28-34. DOI: 10.1111/j.0013-9580.2004.455005.x.

3. Ghosh S., Sinha J. K., Khan T., Devaraju K. S., Singh P., Vaibhav K., Gaur P. Pharmacological and therapeutic approaches in the treatment of epilepsy // Biomedicines. 2021. Vol. 9, no. 5. P. 470. DOI: 10.3390/biomedicines9050470.

4. Tatum W. O., Mani J., Jin K., Halford J. J., Gloss D., Fahoum F., Maillard L., Mothersill I., Beniczky S. Minimum standards for inpatient long-term video-EEG monitoring: A clinical practice guideline of the international league against epilepsy and international federation of clinical neurophysiology // Clinical Neurophysiology. 2022. Vol. 134. P. 111-128. DOI: 10.1016/ j.clinph.2021.07.016.

5. Карпов О.Э., Храмов А.Е. Информационные технологии, вычислительные системы и искусственный интеллект в медицине. М.: ДПК Пресс, 2022. 480 с.

6. Sutton R. T., Pincock D., Baumgart D. C., Sadowski D. C., Fedorak R. N., Kroeker K. I. An overview of clinical decision support systems: benefits, risks, and strategies for success // npj Digital Medicine. 2020. Vol. 3. P. 17. DOI: 10.1038/s41746-020-0221-y.

7. Roy Y, Banville H., Albuquerque I., Gramfort A., Falk T.H., Faubert J. Deep learning-based electroencephalography analysis: a systematic review // Journal of Neural Engineering. 2019. Vol. 16, no. 5. P. 051001. DOI: 10.1088/1741-2552/ab260c.

8. Chen Z., Lu G., Xie Z., Shang W. A unified framework and method for EEG-based early

epileptic seizure detection and epilepsy diagnosis // IEEE Access. 2020. Vol. 8. P. 20080-20092. DOI: 10.1109/ACCESS.2020.2969055.

9. Mousavi S. R., Niknazar M., Vahdat B. V. Epileptic seizure detection using AR model on EEG signals // In: 2008 Cairo International Biomedical Engineering Conference. 18-20 December 2008, Cairo, Egypt. New York: IEEE, 2009. P. 1-4. DOI: 10.1109/CIBEC.2008.4786067.

10. Wang D., Miao D., Xie C. Best basis-based wavelet packet entropy feature extraction and hierarchical EEG classification for epileptic detection // Expert Systems with Applications. 2011. Vol. 38, no. 11. P. 14314-14320. DOI: 10.1016/j.eswa.2011.05.096.

11. Vanabelle P., Handschutter P. D., Tahry R. E., Benjelloun M., Boukhebouze M. Epileptic seizure detection using EEG signals and extreme gradient boosting // The Journal of Biomedical Research. 2020. Vol. 34, no. 3. P. 228-239. DOI: 10.7555/JBR.33.20190016.

12. Karpov O.E., Khoymov M.S., Maksimenko V.A., Grubov V.V., Utyashev N., Andrikov D.A., Kurkin S. A., Hramov A. E. Evaluation of unsupervised anomaly detection techniques in labelling epileptic seizures on human EEG // Applied Sciences. 2023. Vol. 13, no. 9. P. 5655. DOI: 10.3390/ app13095655.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

13. Zhao W., Zhao W., Wang W., JiangX., ZhangX., Peng Y, Zhang B., Zhang G. A novel deep neural network for robust detection of seizures using EEG signals // Computational and Mathematical Methods in Medicine. 2020. Vol. 2020. P. 9689821. DOI: 10.1155/2020/9689821.

14. AsifU., Roy S., Tang J., Harrer S. SeizureNet: Multi-spectral deep feature learning for seizure type classification // In: Kia S. M., Mohy-ud-Din H., Abdulkadir A., Bass C., Habes M., Rondina J. M., Tax C., Wang H., Wolfers T., Rathore S., Ingalhalikar M. (eds) Machine Learning in Clinical Neuroimaging and Radiogenomics in Neuro-oncology. MLCN RNO-AI 2020 2020. Vol. 12449 of Lecture Notes in Computer Science. Cham: Springer, 2020. P. 77-87. DOI: 10.1007/978-3-030-66843-3_8.

15. AndrzejakR. G., Schindler K., Rummel C. Nonrandomness, nonlinear dependence, and nonstationa-rity of electroencephalographic recordings from epilepsy patients // Phys. Rev. E. 2012. Vol. 86, no. 4. P. 046206. DOI: 10.1103/PhysRevE.86.046206.

16. Shoeb A. H. Application of Machine Learning to Epileptic Seizure Onset Detection and Treatment. PhD Thesis. Massachusetts: Massachusetts Institute of Technology, 2009. 162 p.

17. Hwang S., Park S., Kim D., Lee J., Byun H. Mitigating inter-subject brain signal variability FOR EEG-based driver fatigue state classification // In: ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). 06-11 June 2021, Toronto, ON, Canada. New York: IEEE, 2021. P. 990-994. DOI: 10.1109/ICASSP39728.2021.9414613.

18. Homan R. W. The 10-20 electrode system and cerebral location // American Journal of EEG Technology. 1988. Vol. 28, no. 4. P. 269-279. DOI: 10.1080/00029238.1988.11080272.

19. Hramov A.E., Koronovskii A.A., Makarov V.A., Maximenko V.A., Pavlov A.N., Sitnikova E. Wavelets in Neuroscience. Cham: Springer, 2021. 384 p. DOI: 10.1007/978-3-030-75992-6.

20. Krizhevsky A., Sutskever I., Hinton G. E. ImageNet classification with deep convolutional neural networks // In: Pereira F., Burges C. J., Bottou L., Weinberger K. Q. (eds) Advances in Neural Information Processing Systems 25. NIPS, 2012. P. 1097-1105.

21. Deng J., Dong W., Socher R., Li L.-J., Li K., Fei-Fei L. ImageNet: A large-scale hierarchical image database // In: 2009 IEEE Conference on Computer Vision and Pattern Recognition. 20-25 June 2009, Miami, FL, USA. New York: IEEE, 2009. P. 248-255. DOI: 10.1109/CVPR.2009.5206848.

22. He K., Zhang X., Ren S., Sun J. Deep residual learning for image recognition // In: 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 27-30 June 2016, Las Vegas, NV, USA. New York: IEEE, 2016. P. 770-778. DOI: 10.1109/CVPR.2016.90.

23. Hendrycks D., Lee K., Mazeika M. Using pre-training can improve model robustness and

uncertainty // In: Proceedings of the 36th International Conference on Machine Learning. Vol. 97. Long Beach, California. PMLR, 2019. P. 2712-2721.

24. Zhang H., Cissé M., Dauphin Y.N., Lopez-Paz D. mixup: Beyond empirical risk minimization // In: 6th International Conference on Learning Representations. 30 Apr-3 May 2018, Vancouver, BC, Canada. ICLR (Poster), 2018. P. 1-13.

25. ParkD. S., Chan W., Zhang Y, Chiu C.-C., Zoph B., CubukE. D., Le Q. V. SpecAugment: A simple data augmentation method for automatic speech recognition // In: Proc. Interspeech 2019. 15-19 September 2019, Graz, Austria. Interspeech, 2019. P. 2613-2617. DOI: 10.21437/Interspeech. 2019-2680.

26. Karpov O. E., Afinogenov S., Grubov V. V., Maksimenko V., Korchagin S., UtyashevN., HramovA. E. Detecting epileptic seizures using machine learning and interpretable features of human EEG // The European Physical Journal Special Topics. 2023. Vol. 232, no. 5. P. 673-682. DOI: 10.1140/epjs/ s11734-022-00714-3.

27. Karpov O.E., Grubov V.V., Maksimenko V.A., Kurkin S.A., Smirnov N.M., Utyashev N.P., Andrikov D.A., Shusharina N.N., Hramov A.E. Extreme value theory inspires explainable machine learning approach for seizure detection // Scientific Reports. 2022. Vol. 12, no. 1. P. 11474. DOI: 10.1038/s41598-022-15675-9.

28. Cortes C., Vapnik V. Support-vector networks // Machine Learning. 1995. Vol. 20, no. 3. P. 273-297. DOI: 10.1007/BF00994018.

29. Hramov A. E., Maksimenko V.A., Pisarchik A. N. Physical principles of brain-computer interfaces and their applications for rehabilitation, robotics and control of human brain states // Physics Reports. 2021. Vol. 918. P. 1-133. DOI: 10.1016/j.physrep.2021.03.002.

30. Pisarchik A. N., Maksimenko V.A., Hramov A. E. From novel technology to novel applications: Comment on "An integrated brain-machine interface platform with thousands of channels" by Elon Musk and Neuralink // Journal of Medical Internet Research. 2019. Vol. 21, no. 10. P. e16356. DOI: 10.2196/16356.

31. Maksimenko V.A., van Heukelum S., Makarov V. V., Kelderhuis J., Lüttjohann A., KoronovskiiA.A., Hramov A. E., Luijtelaar G. Absence seizure control by a brain computer interface // Scientific Reports. 2017. Vol. 7, no. 1. P. 2487. DOI: 10.1038/s41598-017-02626-y.

References

1. Megiddo I, Colson A, Chisholm D, Dua T, Nandi A, Laxminarayan R. Health and economic benefits of public financing of epilepsy treatment in India: An agent-based simulation model. Epilepsia. 2016;57(3):464-474. DOI: 10.1111/epi.13294.

2. Sander JW. The use of antiepileptic drugs-principles and practice. Epilepsia. 2004;45(s6):28-34. DOI: 10.1111/j.0013-9580.2004.455005.x.

3. Ghosh S, Sinha JK, Khan T, Devaraju KS, Singh P, Vaibhav K, Gaur P. Pharmacological and therapeutic approaches in the treatment of epilepsy. Biomedicines. 2021;9(5):470. DOI: 10.3390/ biomedicines9050470.

4. Tatum WO, Mani J, Jin K, Halford JJ, Gloss D, Fahoum F, Maillard L, Mothersill I, Beniczky S. Minimum standards for inpatient long-term video-EEG monitoring: A clinical practice guideline of the international league against epilepsy and international federation of clinical neurophysiology. Clinical Neurophysiology. 2022;134:111-128. DOI: 10.1016/j.clinph.2021.07.016.

5. Karpov OE, Hramov AE. Information Technology, Computing Systems and Artificial Intelligence in Medicine. Moscow: DPK Press; 2022. 480 p. (in Russian).

6. Sutton RT, Pincock D, Baumgart DC, Sadowski DC, Fedorak RN, Kroeker KI. An overview of clinical decision support systems: benefits, risks, and strategies for success. npj Digital Medicine. 2020;3:17. DOI: 10.1038/s41746-020-0221-y.

7. Roy Y, Banville H, Albuquerque I, Gramfort A, Falk TH, Faubert J. Deep learning-based electroencephalography analysis: a systematic review. Journal of Neural Engineering. 2019;16(5): 051001. DOI: 10.1088/1741-2552/ab260c.

8. Chen Z, Lu G, Xie Z, Shang W. A unified framework and method for EEG-based early epileptic seizure detection and epilepsy diagnosis. IEEE Access. 2020;8:20080-20092. DOI: 10.1109/ ACCESS.2020.2969055.

9. Mousavi SR, Niknazar M, Vahdat BV. Epileptic seizure detection using AR model on EEG signals. In: 2008 Cairo International Biomedical Engineering Conference. 18-20 December 2008, Cairo, Egypt. New York: IEEE; 2009. P. 1-4. DOI: 10.1109/CIBEC.2008.4786067.

10. Wang D, Miao D, Xie C. Best basis-based wavelet packet entropy feature extraction and hierarchical EEG classification for epileptic detection. Expert Systems with Applications. 2011; 38(11):14314-14320. DOI: 10.1016/j.eswa.2011.05.096.

11. Vanabelle P, Handschutter PD, Tahry RE, Benjelloun M, Boukhebouze M. Epileptic seizure detection using EEG signals and extreme gradient boosting. The Journal of Biomedical Research. 2020;34(3):228-239. DOI: 10.7555/JBR.33.20190016.

12. Karpov OE, Khoymov MS, Maksimenko VA, Grubov VV, Utyashev N, Andrikov DA, Kurkin SA, Hramov AE. Evaluation of unsupervised anomaly detection techniques in labelling epileptic seizures on human EEG. Applied Sciences. 2023;13(9):5655. DOI: 10.3390/app13095655.

13. Zhao W, Zhao W, Wang W, Jiang X, Zhang X, Peng Y, Zhang B, Zhang G. A novel deep neural network for robust detection of seizures using EEG signals. Computational and Mathematical Methods in Medicine. 2020;2020:9689821. DOI: 10.1155/2020/9689821.

14. Asif U, Roy S, Tang J, Harrer S. SeizureNet: Multi-spectral deep feature learning for seizure type classification. In: Kia SM, Mohy-ud-Din H, Abdulkadir A, Bass C, Habes M, Rondina JM, Tax C, Wang H, Wolfers T, Rathore S, Ingalhalikar M, editors. Machine Learning in Clinical Neuroimaging and Radiogenomics in Neuro-oncology. MLCN RNO-AI 2020 2020. Vol. 12449 of Lecture Notes in Computer Science. Cham: Springer; 2020. P. 77-87. DOI: 10.1007/978-3-030-66843-3_8.

15. Andrzejak RG, Schindler K, Rummel C. Nonrandomness, nonlinear dependence, and nonstationarity of electroencephalographic recordings from epilepsy patients. Phys. Rev. E. 2012;86(4):046206. DOI: 10.1103/PhysRevE.86.046206.

16. Shoeb AH. Application of Machine Learning to Epileptic Seizure Onset Detection and Treatment. PhD Thesis. Massachusetts: Massachusetts Institute of Technology; 2009. 162 p.

17. Hwang S, Park S, Kim D, Lee J, Byun H. Mitigating inter-subject brain signal variability FOR EEG-based driver fatigue state classification. In: ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). 06-11 June 2021, Toronto, ON, Canada. New York: IEEE; 2021. P. 990-994. DOI: 10.1109/ICASSP39728.2021.9414613.

18. Homan RW. The 10-20 electrode system and cerebral location. American Journal of EEG Technology. 1988;28(4):269-279. DOI: 10.1080/00029238.1988.11080272.

19. Hramov AE, Koronovskii AA, Makarov VA, Maximenko VA, Pavlov AN, Sitnikova E. Wavelets in Neuroscience. Cham: Springer; 2021. 384 p. DOI: 10.1007/978-3-030-75992-6.

20. Krizhevsky A, Sutskever I, Hinton GE. ImageNet classification with deep convolutional neural networks. In: Pereira F, Burges CJ, Bottou L, Weinberger KQ, editors. Advances in Neural Information Processing Systems 25. NIPS; 2012. P. 1097-1105.

21. Deng J, Dong W, Socher R, Li LJ, Li K, Fei-Fei L. ImageNet: A large-scale hierarchical image database. In: 2009 IEEE Conference on Computer Vision and Pattern Recognition. 20-25 June 2009, Miami, FL, USA. New York: IEEE; 2009. P. 248-255. DOI: 10.1109/CVPR.2009.5206848.

22. He K, Zhang X, Ren S, Sun J. Deep residual learning for image recognition. In: 2016 IEEE

Conference on Computer Vision and Pattern Recognition (CVPR). 27-30 June 2016, Las Vegas, NV, USA. New York: IEEE; 2016. P. 770-778. DOI: 10.1109/CVPR.2016.90.

23. Hendrycks D, Lee K, Mazeika M. Using pre-training can improve model robustness and uncertainty. In: Proceedings of the 36th International Conference on Machine Learning. Vol. 97. Long Beach, California. PMLR; 2019. P. 2712-2721.

24. Zhang H, Cisse M, Dauphin YN, Lopez-Paz D. mixup: Beyond empirical risk minimization. In: 6th International Conference on Learning Representations. 30 Apr-3 May 2018, Vancouver, BC, Canada. ICLR (Poster); 2018. P. 1-13.

25. Park DS, Chan W, Zhang Y, Chiu CC, Zoph B, Cubuk ED, Le QV. SpecAugment: A simple data augmentation method for automatic speech recognition. In: Proc. Interspeech 2019. 15-19 September 2019, Graz, Austria. Interspeech; 2019. P. 2613-2617. DOI: 10.21437/Interspeech.2019-2680.

26. Karpov OE, Afinogenov S, Grubov VV, Maksimenko V, Korchagin S, Utyashev N, Hramov AE. Detecting epileptic seizures using machine learning and interpretable features of human EEG. The European Physical Journal Special Topics. 2023;232(5):673-682. DOI: 10.1140/epjs/s11734-022-00714-3.

27. Karpov OE, Grubov VV, Maksimenko VA, Kurkin SA, Smirnov NM, Utyashev NP, Andrikov DA, Shusharina NN, Hramov AE. Extreme value theory inspires explainable machine learning approach for seizure detection. Scientific Reports. 2022;12(1):11474. DOI: 10.1038/s41598-022-15675-9.

28. Cortes C, Vapnik V. Support-vector networks. Machine Learning. 1995;20(3):273-297. DOI: 10.1007/BF00994018.

29. Hramov AE, Maksimenko VA, Pisarchik AN. Physical principles of brain-computer interfaces and their applications for rehabilitation, robotics and control of human brain states. Physics Reports. 2021;918:1-133. DOI: 10.1016/j.physrep.2021.03.002.

30. Pisarchik AN, Maksimenko VA, Hramov AE. From novel technology to novel applications: Comment on "An integrated brain-machine interface platform with thousands of channels" by Elon Musk and Neuralink. Journal of Medical Internet Research. 2019;21(10):e16356. DOI: 10.2196/16356.

31. Maksimenko VA, van Heukelum S, Makarov VV, Kelderhuis J, Lüttjohann A, Koronovskii AA, Hramov AE, Luijtelaar G. Absence seizure control by a brain computer interface. Scientific Reports. 2017;7(1):2487. DOI: 10.1038/s41598-017-02626-y.

Назариков Сергей Игоревич — окончил с отличием магистратуру факультета математического обеспечения и администрирования информационных систем Балтийского федерального университета имени Иммануила Канта (2022). Область научных интересов — компьютерное зрение, глубокое обучение, нейронные сети, машинное обучение, математическое моделирование. Имеет несколько научных публикаций и свидетельств о регистрации программ для ЭВМ.

Россия, 236016 Калининград, ул. А. Невского, 14 Балтийский федеральный университет имени Иммануила Канта E-mail: snazarikov@gmail.com AuthorlD (eLibrary.Ru): 1173572

i Надоели баннеры? Вы всегда можете отключить рекламу.