НАУЧНОЕ ИЗДАНИЕ МГТУ ИМ. Н. Э. БАУМАНА
НАУКА и ОБРАЗОВАНИЕ
Эл № ФС77 - 4 8211. Государственная регистрация №042 1200025. ISSN 1994-0408
электронный научно-технический журнал
Модельно-ориентированный подход к классификации электроэнцефалограмм # 04, апрель 2014
DOI: 10.7463/0414.0705745
Трофимов А. Г., Шишкин С. Л., Осадчий А. Е.
УДК 519.6
Россия, НИЯУ МИФИ НИЦ "Курчатовский институт" НИУВШЭ [email protected]
Введение
Электроэнцефалография - неинвазивный метод исследования функционального состояния головного мозга путём регистрации наведённой электрической активности на поверхности головы. Причиной этой активности являются слабые ионные токи, протекающие в нервных клетках мозга [1,2].
Одним из основных применений электроэнцефалографии является диагностика нервных и психических заболеваний, в особенности, эпилепсии. Клиническая картина электроэнцефалограммы (ЭЭГ) для ряда тяжёлых мозговых нарушений известна, ярко выражена, и болезнь может быть диагностирована врачом-специалистом [3]. В тоже время диагностика ряда заболеваний головного мозга на ранних стадиях, отслеживание динамики действия лекарственных препаратов, локализация участков мозга с патогенной электрической активностью являются более сложными задачами при визуальном анализе ЭЭГ.
В связи с активным развитием вычислительной техники в последние десятилетия всё большую роль в диагностике заболеваний головного мозга играет количественная (компьютерная) электроэнцефалография, основанная на математическом анализе ЭЭГ. Практически неограниченные вычислительные ресурсы позволяют применять компьютерную электроэнцефалографию также в немедицинских целях, в частности, при исследовании когнитивных функций мозга и в интерфейсах "мозг-компьютер" [4,5].
Ключевой задачей компьютерной электроэнцефалографии является задача классификации сигналов ЭЭГ. Эта задача включает в себя следующие этапы.
1) Предобработка. Как правило, предобработка ЭЭГ состоит в отборе информативных каналов электроэнцефалографа, устранении артефактов и грубых сбоев, проведении частотной фильтрации и т.п.
2) Формирование вектора характерных признаков для классификации. Целью этого этапа является отображение пространства многомерных динамических данных ЭЭГ в пространство статических данных. Как только такое отображение сделано, задача классификации ЭЭГ сводится к известной задаче классификации многомерных данных.
3) Классификация в пространстве характерных признаков. На этом этапе могут использоваться известные алгоритмы классификации, например, линейный дискриминантный анализ, метод опорных векторов, байесовский подход, нейросетевой аппарат и другие [6,7].
Для формирования вектора характерных признаков ЭЭГ может быть предложено множество подходов. Простейшим из них является конкатенация всех наблюдаемых значений ЭЭГ (по всем каналам в каждый момент времени) в единый вектор характерных признаков [8]. Недостатками данного подхода являются высокая размерность получаемого пространства признаков, зависимость размерности вектора от числа временных отсчётов и частоты дискретизации, высокая чувствительность к шумам. В работе [9] использованы энергии в частотных диапазонах альфа- и бета-ритмов для формирования вектора характерных признаков, в [10] признаки формируются на основе коэффициентов вейвлет-преобразования. Другой подход, предложенный в работах [11,12], основан на выделении и статистическом анализе паттернов ЭЭГ. В [13] рассмотрены методы расчёта пространственных фильтров для формирования характерных признаков ЭЭГ.
В настоящей работе предложен метод построения пространства характерных признаков, основанный на моделировании распределения электрической активности на поверхности головы. Насчитывается огромное множество публикаций по проблеме моделирования ЭЭГ, в то время как применение модельного подхода для задач классификации, в частности, в интерфейсах "мозг-компьютер", встречается существенно реже. Так, в работах [14,15] предложен метод классификации, основанный на качественном анализе положения эквивалентных токовых диполей.
Цель данной работы - показать, что модельно-ориентированный (model-based) подход к построению пространства характерных признаков ЭЭГ для классификации сравним по точности с подходами, основанными на данных (data-driven), при этом открывая ряд воз-
можностей к её дальнейшему увеличению и обладая понятной нейрофизиологической интерпретацией.
В первом разделе приводится описание метода моделирования ЭЭГ с помощью эквивалентных токовых диполей. Во втором разделе формулируется постановка задачи классификации сигналов ЭЭГ. В третьем разделе предлагается метод формирования вектора характерных признаков ЭЭГ для классификации, основанный на моделировании эквивалентных токовых диполей. Четвёртый раздел посвящён экспериментальному исследованию предложенного метода на реальных данных и обсуждению полученных результатов. В заключении формулируются основные результаты работы и направления возможных исследований.
1. Дипольная модель ЭЭГ
Головной мозг состоит примерно из 1010 нервных клеток, способных проводить и генерировать электрический разряд (потенциал действия). Наряду с потенциалом действия, с нейронами связывают ещё один тип электрической активности - постсинаптический потенциал - потенциал, возникающий в результате ионного обмена на мембране клетки. Каждую такую клетку можно рассматривать как крошечный электрический диполь с отрицательным зарядом на апикальных дендритах и положительным зарядом на соме [16,17] (рис. 1а).
В случае, когда многочисленная группа нейронов активируется одновременно (рис. 16), результирующий постсинаптический потенциал становится заметным и может быть зарегистрирован на поверхности головы с помощью электроэнцефалографа. Электрическая активность множества нервных клеток может быть смоделирована с помощью эквивалентного токового диполя (ЭТД), ориентация которого получается путём усреднения ориентаций элементарных диполей, образуемых отдельными нейронами [16] (рис. 1в).
В каждый момент времени I ЭТД характеризуется 6 параметрами: 3-мя пространственными координатами (локализация диполя) р(?) = ( х(1;), у^), г(?))Г и 3-мя координатами
вектора дипольного момента я(Г) = ((Г), (Г), (Г)) = (Г)ех + (Г)еу + (Г)ег, где ех, е , ег - орты декартовой системы координат. Задача моделирования ЭЭГ в момент времени I состоит в нахождении положения и дипольного момента ЭТД, наилучшим образом описывающего распределение электрической активности на поверхности головы, регистрируемого с помощью электроэнцефалографа в момент времени
Axons from Presynaptic Cells
7777777777^
^4777777777 -
Stimulated
Region of Cortex
Postsyna " " Axon
Skull -
+
+
Рис. 1. Иллюстрация дипольной модели ЭЭГ: а) пирамидальная клетка как элементарный диполь; б) схематичное представление извилины коры головного мозга, содержащей множество пирамидальных клеток; в) суперпозиция множества элементарных диполей представлена в виде одного эквивалентного
диполя. Рисунки заимствованы из [16]
Вычислительный подход к определению параметров р(^) и q(í) ЭТД предполагает решение прямой и обратной задач моделирования [18-20]. Зная параметры ЭТД и характеристики у проводящих структур мозга, используя известные уравнения электродинамики [18,20], может быть рассчитана электрическая активность х(/), формируемая ЭТД на поверхности головы (прямая задача):
тенциалов в фиксированных позициях на поверхности головы, Ь - число отведений электроэнцефалографа.
Некоторые модели распространения электромагнитной активности внутри головы, используемые при решении прямой задачи, приведены в [18-20].
Сравнивая расчётную х(7) и наблюдаемую х(7) электрические активности, проводится коррекция параметров ЭТД, обеспечивающая уменьшение рассогласования между ними (обратная задача). Схема настройки параметров ЭТД приведена на рис. 2.
Рис. 2. Схема настройки параметров ЭТД
При моделировании ЭЭГ в некотором временном интервале А положение p диполя может быть зафиксировано. В этом случае критерием моделирования ЭТД будет суммарный квадратичный критерий:
I = £||x(0 - x(0||2 - min. (1)
teA Р
Модельная электрическая активность на поверхности головы связана с вектором ди-польного момента ЭТД соотношением [18]:
S(0 = G(p)q(0, (2)
где G(p) - матрица прямой модели (так называемая lead field matrix) размерности L*3. Столбец матрицы G(p) представляет собой электрическую активность, образуемую диполем с единичным дипольным моментом, равным ex, e или ez, и может быть рассчитан
для данной локализации p ЭТД с помощью прямой модели F.
Подставляя в формулу (2) вместо модельной электрической активности х(/) наблюдаемую x(t) и учитывая, что система уравнений (2) является переопределённой, находим вектор дипольного момента q(t) ЭТД по формуле:
q(t) = G^Mt (3)
где + - оператор псевдообращения Мура-Пенроуза. Учитывая (2) и (3), перепишем критерий (1):
I = Z||(G(p)G+ (Р) -1)x(t)|f - min , (4)
teA Р
где I - единичная матрица размерности L*L.
Для численного поиска минимума критерия (4) на практике используются вычислительные методы, например, метод Нелдера-Мида, генетические алгоритмы и др. [21].
В качестве меры оценки объяснительных способностей дипольной модели используется её коэффициент детерминации (называемый также коэффициент дипольности):
XI К*) - х (? )||2
Я2 = 1 --5-. (5)
XI *(* )|Г )
геД
2. Постановка задачи
Пусть в результате эксперимента получено Р сигналов ЭЭГ одинаковой длины, каждый из которых отнесён к одному из К классов (типов ментальной активности). Обозна-
_ к
чим Рк - число сигналов, относящихся к к-му классу, к = 1, К, X р = Р .
к=1
Значение сигнала ЭЭГ, относящегося к к-му классу, полученное в результате р-го наблюдения в момент времени I, будем обозначать
хк,р (о=(*к-* (?), хк,р (о,..., ху (*)), г=1, т, р=1, Рк, к=1, к, (6)
где Т - число дискретных отсчетов, х\,р (г) - значение /-го компонента сигнала Хк,р = (г),г = \Ткр |, в момент времени г, I = .
Обозначим через ¥ оператор расчёта вектора ъ = (z1,...,zM)Т характерных признаков сигнала X:
Ч>[Х] = х, г е П м .
Классификатор в пространстве характерных признаков запишем как оператор, сопоставляющий вектору г номер класса к, к которому относится сигнал X:
С[ъ] = к, к е {1,2,...,К}.
Отметим, что возможный неудачный выбор оператора ¥ может быть компенсирован за счёт увеличения сложности оператора С. С другой стороны, если в сформированном пространстве признаков г данные разных классов хорошо разделимы, то для качественной классификации не требуется излишнее усложнение алгоритма классификации.
При прочих равных условиях простые методы классификации более предпочтительны, поскольку они, как правило, более устойчивы и обладают более высокими обобщающими способностями. Это говорит о важности задачи формирования пространства признаков г, в котором данные из разных классов обладали бы свойством разделимости.
Для оценки качества классификации будем использовать показатель:
К П
^ = Ху к п-• (7)
к=1 Як
где щ - число верно распознанных примеров к-ого класса при предъявлении Ы; сигналов этого класса, у; - коэффициент важности правильной классификации сигналов к-го класса,
_ К
к = 1, К, = 1. Значение показателя (7), равное 1, означает правильную классифика-
к=1
цию всех предъявленных на вход классификатора примеров.
Таким образом, задача классификации многомерных временных рядов сводится к задаче поиска операторов ¥ и С, обеспечивающих максимальную точность классификации J. В настоящей работе предложен подход к построению оператора основанный на использовании характеристик эквивалентных токовых диполей.
3. Алгоритм расчёта характерных признаков сигнала ЭЭГ на основе параметров ЭТД
Обозначим А1,...,АЯ - непересекающиеся временные интервалы, в которых будет
проводиться моделирование сигнала X = |х(V),V = 1,т| в соответствии с критерием (4).
Эти интервалы могут быть выбраны на основе априорной информации о сигналах (например, ожидаемые латентности вызванных потенциалов) или в результате специального анализа. В предельных случаях Я = 1, при этом интервал моделирования равен интервалу
наблюдения сигнала ЭЭГ, А1 = 1, Т, или Я = Т, при этом локализация ЭТД проводится в каждый момент времени, А = {}, V = 1, Т. Отметим, что на протяжении всего интервала Аг, г = 1, Я, положение ЭТД фиксировано, при этом его дипольный момент может изменяться со временем (см. (3)).
Пусть в результате минимизации критерия (4) найдено некоторое оптимальное положение р г диполя, фиксированное на протяжении интервала моделирования Аг, г = 1, Я. Тогда соответствующий вектор оптимальных дипольных моментов и модельная электрическая активность на поверхности головы в каждый момент времени V еА определяются по формулам (2), (3):
q(t) = О+ (рг )х(0, (8)
х(г) = О(рг^), V еАг, г = . (9)
В связи с тем, что расчёт положения диполя предполагает вычислительно ёмкое численное решение оптимизационной задачи, использование этой процедуры нежелательно при тестировании классификатора, в особенности в приложениях, работающих в режиме
реального времени (например, в интерфейсах "мозг-компьютер"). Расчёт же вектора ди-польного момента ЭТД по формуле (8) при заданном положении диполя не представляет вычислительной сложности. Учитывая этот факт, вектор характерных признаков ЭЭГ будем формировать лишь на основе оптимальных дипольных моментов ЭТД.
1) Выбор состава вектора характерных признаков
Вектор признаков г составим из векторов гг, характеризующих временные последовательности Ог = (я(г), г еДг} дипольных моментов ЭТД на интервалах моделирования Дг,
г = 1, Я. Каждый такой вектор гг рассчитывается независимо от остальных. Обозначая через ф оператор расчёта характерных признаков последовательности дипольных моментов ЭТД, запишем:
ъ = ( ф[£ ],...,ф^я ]). (10)
Может быть предложено множество способов выбора оператора ф. В настоящей работе рассматривается оператор ф, сопоставляющий временной последовательности Qr вектор её статистических характеристик, а именно: среднее значение и среднеквадратиче-ское отклонение (по времени):
Ъ г = ф[Ог ] = (яг , с г ) , (11)
где 4 г = 7^1 X я(г) , Сг = ,^гу ,СТ» ) , . = ЛТ"^ Х( Чг .(0 - Чг .)2 , I Д г I - число времен-
I Дг 1 геД. \11 Дг 1 геДг
ных отсчётов в интервале Дг.
После формирования характерных признаков в соответствии с (10) состав вектора г может быть скорректирован, например, путём удаления неинформативных или сильно коррелированных признаков, применения масштабирования или нормировки и т.п. Исследования возможных методов обработки, направленных на повышение качества сформированного набора признаков с точки зрения разделимости классов, выходят за рамки данной работы.
Обозначим через Ог 'р = 'р (г), г еД} временную последовательность дипольных
моментов ЭТД, моделирующего на интервале Дг сигнал ЭЭГ Х,р, г = 1, Я, р = 1, Рк ,
к = 1, К. В соответствии с формулами (10), (11) запишем состав вектора характерных признаков р-го сигнала ЭЭГ, относящегося к к-му классу:
ък'р =(як,р,ск,р,...,Чк/,4р), р = 1,Р , к = 1,К. (12)
Данный вектор имеет простую нейрофизиологическую интерпретацию и фактически представляет собой вектор средних и среднеквадратических отклонений (по времени) ориентаций источников электрической активности мозга на заданном временном интервале. Выбор в пользу данного состава вектора характерных признаков подтверждается, в частности, нейрофизиологическими исследованиями [22], согласно которым многие патологии головного мозга изменяют характеристики источников электрической активности.
2) Выбор приближения к оптимальным локализациям ЭТД к-го класса
Расчёт временных последовательностей оптимальных дипольных моментов ЭТД Qkr'р
, г = 1, Я, р = 1, Рк , к = 1, К, возможен лишь при известной локализации ЭТД. В качестве вектора координат ЭТД для сигналов ЭЭГ к-го класса в интервале моделирования Аг будем использовать некоторое приближение р*' к оптимальным локализациям
|рк,р, р = 1, р |, полученным в результате решения задачи (4) для сигналов Х,р, р = 1, Рк ,
к = 1, К. Таким приближением может являться, например, вектор эталонных координат ЭТД, который определим как среднее из локализаций для сигналов к-го класса:
1 рк _ _
Рк = Рк =1Ерк,р , г = 1, Я, к = 1, К. (13)
Рк р=1
Использование приближения (13) позволит избавиться от решения вычислительно ёмкой оптимизационной задачи локализации ЭТД для каждого тестового сигнала ЭЭГ. Отметим, что оптимальные локализаций ЭТД в общем случае могут быть описаны совокупностью приближений, например, совокупностью эталонных представителей кластеров,
образуемых оптимальными локализациями ЭТД для сигналов ЭЭГ к-го класса, к = 1, К.
3) Выбор типа классификатора в пространстве дипольных признаков
На этапе тестирования и использования дипольного классификатора ЭЭГ при подаче на его вход сигнала X проводится расчёт последовательностей дипольных моментов ЭТД,
имеющих эталонные локализации Обозначим О^Х - последовательность
дипольных моментов ЭТД с положением р^', рассчитанную для сигнала X на интервале моделирования Аг в соответствии с формулой (8). Для каждой последовательности Q (X | рк ), к = 1, К, рассчитаем вектор характерных признаков г (X | рк ) в соответствии с
формулами (10), (11), где рк = Таким образом, для каждого тестового сигнала
X получим совокупность характерных векторов р1 ),...,г(Х| р)} • В то же время
к-ый класс характеризуется совокупностью характерных векторов
{ъ (хк ^),..., ъ (хк ,рк|рк)}, к=^ .
Для классификации сигнала X используем модификацию метода N ближайших соседей [23,24]. В качестве расстояния между классифицируемым сигналом X и обучающим
сигналом
Хк,р
р = 1, рк , к = 1, К ,определим функцию:
р (X, ХКр ) = ||ъ (X | рк )- ъ (Хк, | рк )||. (14)
Учитывая (11), расстояние (14) между сигналами X и Х,р имеет смысл рассогласования между статистическими характеристиками последовательностей дипольных моментов ЭТД для сигнала X и дипольных моментов ЭТД для сигнала Xкр , при условии, что оба диполя имеют одно и то же положение, определяемое эталонным представителем к-го класса. Иллюстрация к расчёту расстояния по формуле (14) приведена на рис. 3.
Рис. 3. Иллюстрация к методу расчёта расстояния в пространстве характерных признаков. Объект X представлен множеством точек. Стрелками обозначено расстояние от X до объектов разных классов
В соответствии с методом N ближайших соседей объект X относится к к-му классу, если к нему относится большинство из N ближайших объектов обучающей выборки.
На рис. 4 приведена схема предлагаемого алгоритма расчёта вектора характерных признаков ЭЭГ.
, г =
1 Рк, к = 1, к} 1
Выбор интервалов моделирования
{А 1,..., А л } 1
Расчёт локализаций ЭТД для всех обучающих ЭЭГ
1,Рк, к = 1, К} ^
Расчёт эталонных локализаций классов
1 Я, к = 1, к} ^
Расчёт дипольных моментов для всех обучающих ЭЭГ
1,Рк, к = 1, к} ч
Формирование векторов характерных признаков
1Р к = 1,К} ч
X
Расчет дипольных моментов для всех ЭТД с эталонными локализациями
{о (хрк), г= г
Расчет векторов характерных признаков
г Мх!Рк),к =
Классификация
г номер класса
Рис. 4. Схема алгоритма классификации ЭЭГ: слева - режим обучения; справа - режим тестирования
4. Результаты экспериментальных исследований
1) Описание исходных данных
Экспериментальные исследования предложенных алгоритмов классификации проводились на сигналах ЭЭГ, полученных в лаборатории Нейроэргономики и интерфейсов «мозг-компьютер» НБИКС-центра НИЦ «Курчатовский институт». Каждая ЭЭГ принадлежит одному из К = 2 классов, условно названных «целевой» и «нецелевой». Целевые сигналы ЭЭГ соответствуют сосредоточению внимания испытуемого на внешнем стимуле (предъявление изображения на экране монитора), нецелевые сигналы записаны в состоянии чтения текста нейтрального содержания.
Все сигналы ЭЭГ были оцифрованы с частотой дискретизации Шд = 500 Гц и очищены от артефактов. Запись каждого сигнала ЭЭГ велась по Ь = 58 каналам, расположенным по стандартной схеме «10-10», в течение одной секунды (Т = 500). Сигналы были разбиты на обучающую и тестовую выборки, объёмы которых соответственно равны робуч = 240+280 = 520, Ртест = 60+70 = 130 Р = 300, Р2 = 350).
к
г
2) Статистический анализ оптимальных положений ЭТД на данных обучающей выборки
В связи с тем, что целевые сигналы соответствуют реакции испытуемого на внешний стимул, в записях ЭЭГ ожидается появление вызванных потенциалов [16]. Типичными компонентами вызванных потенциалов являются Р3 (или Р300), имеющий латентность 250-500 мс, латерально-затылочный N1 с латентностью 150-200 мс и др. [16]. Наиболее эффективным методом выявления вызванных потенциалов является усреднение целевых сигналов ЭЭГ [16]. Будем использовать полученную таким образом картину вызванных потенциалов для определения интервалов моделирования ААк ЭТД. На рис. 5 показаны усреднённые сигналы целевых ЭЭГ в различных каналах, из которого визуально определяем Я = 4 интервала с выраженными компонентами вызванного потенциала: А1 = [80; 95], А2 = [95;110], А= [130,150] , А= [190,230].
_6t-----
0 0.2 0.4 0.6 0.8 1
Time (ms)
Рис. 5. Усреднённые целевые сигналы ЭЭГ. Каждая кривая соответствует каналу электроэнцефалографа
В связи с тем, что оптимизируемыми параметрами критерия (4) являются три координаты диполя, для повышения качества оптимизации будем использовать двушаговую процедуру. На первом шаге строится сетка внутри объёма головы, в каждом узле которой рассчитывается значение критерия. На втором шаге из узла с наименьшим значением критерия запускается метод оптимизации Нелдера-Мида [21]. Поиск оптимальной локализа-
ции ЭТД таким методом проводился с использованием фреймворка FieldTrip для системы MATLAB [25].
В результате многократного решения оптимизационной задачи получено множество оптимальных локализаций ркг,р для всех сигналов обучающей выборки и всех интервалов
моделирования, р = 1, Рк , к = 1, К, г = 1, Я. Диаграммы рассеяния координат ЭТД приведены на рис. 6.
50 г 0-50-100 -
60 г
40-N 20-
-20L
60 40 N 20 0
-20 -6 0
-50
-40
0 X
(8 Target Non-target
О Ф ■-.о
-50 0 50 X
и Target Non-target
1
6' о
и и
50
о Тс rget >n-target
К) в • No
' О fc i
■ и
-20 0 Y
20
40
а)
>
50 г 0-50-100 -- 6
60 г
40-N 20-
к Target Non-target
« |
© о с )
-60 -40 -20 0 20 40 60 80
X
-20 ^
С' Target Non-target
® О ^ 1
«
-60 -40 -20 0 20 40 60 80 X
-20
Target Non-target
© •
■ <0
-80 -60 -40 -20 0 20 40 Y
б)
Рис. 6. Диаграммы рассеяния координат ЭТД для сигналов обучающей выборки: а) для интервала Д1; б) для
интервала Д2. Большими знаками "х" и "о" отмечены эталонные локализации ЭТД целевого и нецелевого классов соответственно. В целях удобства визуального восприятия на рисунке показана лишь часть данных
обучающей выборки
В соответствии с формулой (13) рассчитаны эталонные локализации р' для каждого
класса в каждом интервале моделирования Дг, к = 1, К, г = 1, Я. На рис. 6 видно, что локализации ЭТД сигналов ЭЭГ имеют довольно большой разброс, а эталонные локализации целевого и нецелевого классов различаются несильно. Этот факт говорит в пользу введения множества эталонных локализаций для каждого класса, что является одним из возможных направлений развития данной работы.
3) Статистический анализ дипольных моментов ЭТД на данных обучающей выборки Для каждого обучающего сигнала ЭЭГ ^го класса, к = 1, К, в каждом интервале моделирования Аг, г = 1, Я, в соответствии с формулой (8) были рассчитаны временные последовательности дипольных моментов Qk,р = |як,р (V), V £Аг}, при этом локализация ЭТД
полагалась равной эталонной локализации рк, к = 1, К, г = \ Я.
На рис. 7 показаны диаграммы box-and-whisker для простейших статистических характеристик дипольных моментов ЭТД внутри каждого интервала моделирования для целевого и нецелевого классов.
а)
x 10
Target
с
03 ф
X1 Y1 Z1 X2 Y2 Z2 X3 Y3 Z3 X4 Y4 Z4
Feature
б)
x 10
§ 0 ф
-t-
-5 -
Non-target
Ж
-t-
4т-
-t--t-
X1 Y1 Z1 X2 Y2 Z2 X3 Y3 Z3 X4 Y4 Z4
Feature
5
б)
г)
x 10
Target
Q
Ч—
О ■о
(Л
2 1.5 1
0.5
X1 Y1 Z1 X2 Y2 Z2 X3 Y3 Z3 X4 Y4 Z4
Feature
x 10
Non-target
-t-
Q
ч—
о
32 (Л
2 1.5 1
0.5 0
-ь
X1 Y1 Z1 X2 Y2 Z2 X3 Y3 Z3 X4 Y4 Z4
Feature
0
Рис. 7. Диаграммы box-and-whisker для средних (по времени) значений дипольных моментов ЭТД целевого и нецелевого классов (а, б) и для среднеквадратических отклонений дипольных моментов ЭТД целевого и нецелевого классов (в, г) на данных обучающей выборки Признаки «Хг», «Уг», «2г» соответствуют г-му
интервалу моделирования Аг
По оси абсцисс на диаграммах фактически отложены компоненты вектора г характерных признаков, определяемого в соответствии с формулой (12), по оси ординат - их значения.
Из рис. 7 (а, б) видно, что многие из признаков ,...,имеют несимметричное
распределение с ненулевым средним для целевого класса (при k = 1), а для ряда признаков и с не пересекающим ноль интерквартильным интервалом, в то время как для нецелевого класса (при k = 2) эти признаки распределены практически симметрично относительно нуля. Этот результат говорит о специфичности рассматриваемых признаков для сигналов ЭЭГ целевого класса. Различие в распределениях среднеквадратических отклонений орр,...,орр (рис. 7 (в, г)) менее выражено, что может говорить о меньшей роли данных признаков в классификации.
4) Результаты классификации данных тестовой выборки
Элементами вектора характерных признаков для классификации являются средние значения и среднеквадратические отклонения дипольных моментов ЭТД в каждом временном интервале. Таким образом, вектор г имеет размерность M = 6*Я = 6*4 = 24.
На рис. 8 показан график зависимости точности классификации (7) (у = у2 = 0.5)
данных тестовой выборки методом N ближайших соседей от числа N. В качестве функции расстояния между сигналом ЭЭГ тестовой выборки и ближайшими сигналами ЭЭГ обучающей выборки выбрана функция (14).
Рис. 8. График зависимости точности классификации от числа N ближайших соседей для тестовой выборки.
Разные кривые соответствуют разным составам вектора характерных признаков: вектор, составленный из средних значений ориентаций ЭТД (точечная кривая); вектор, составленный из среднеквадратических отклонений ориентаций ЭТД (пунктирная кривая); вектор, составленный из средних значений и среднеквадратических отклонений ориентаций ЭТД (сплошная кривая)
На рисунке показаны три кривые, соответствующие разным составам вектора характера признаков г, а именно: г = (ях,...,Я), г = (вх,...,ок) и г = (ях,,...,Яд,). Из рисунка видно, что использование в качестве характерных признаков лишь среднеквадратических отклонений дипольных моментов ЭТД не обеспечивает высокой точности классификации, что говорит о неспецифичности данных признаков для классификации и подтверждается результатами, представленными на рис. 7 (в, г). В то же время выбор в качестве характерных признаков средних дипольных моментов ЭТД позволяет достичь точности классификации до 88%. Добавление среднеквадратических отклонений в вектор характерных признаков практически не изменяет точность классификации.
Из рис. 8 видно, что с ростом числа соседей N точность классификации в пространстве признаков г = (ях,..., Яд ) практически не изменяется, достигая максимальных значений при 2 < N < 10, что может говорить об устойчивости построенного классификатора.
Классический подход к построению пространства признаков для классификации в интерфейсах "мозг-компьютер" состоит в конкатенации значений ЭЭГ на всех каналах в каждый момент времени, после некоторой их предобработки. С этим подходом было проведено сравнение предложенного алгоритма.
Для формирования пространства характерных признаков все сигналы ЭЭГ были де-цимированы до частоты дискретизации 50 Гц. Значения ЭЭГ в интервалах Д,...,Д на 19
отобранных каналах (исходя из нейрофизиологических представлений для данного эксперимента) объединены в один вектор. Таким образом, размерность вектора характерных признаков была равной 19*11 = 209. Для классификации в этом пространстве был использован линейный дискриминантный анализ. Получена точность классификации 99% на обучающей выборке и 91% на тестовой. Отметим, что полученный результат, по всей видимости, достигнут благодаря правильному выбору каналов. При другом выборе каналов точность находилась в пределах от 72% до 90%. Кроме того, классификация в пространстве большой размерности, которое неизбежно получается при конкатенации исходных значений ЭЭГ, требует больших объёмов обучающих данных и, как правило, не является устойчивой.
Заключение
В работе представлен подход к построению вектора характерных признаков для классификации сигналов ЭЭГ, основанный на моделировании распределения потенциалов ЭЭГ на поверхности головы с помощью эквивалентных токовых диполей.
В результате экспериментальных исследований на реальных данных показано, что точность предложенного метода сравнима с точностью классического метода классификации в интерфейсах "мозг-компьютер". При этом в качестве характерных признаков для классификации выбраны простейшие статистические характеристики дипольных моментов ЭТД, а для классификации в построенном пространстве признаков использован метод ближайших соседей.
Использование модельного подхода к построению пространства признаков для классификации ЭЭГ открывает ряд возможностей для увеличения точности классификации, в частности, путём построения более адекватных моделей (например, многодипольных моделей). Представленные в работе теоретические и экспериментальные результаты позволяют обозначить ряд проблем, решение которых должно способствовать повышению качества пространства признаков и точности классификации:
1) проблема выбора временных интервалов А1;..., A R, в которых моделируются диполи;
2) проблема формирования вектора, характеризующего временную последовательность дипольных моментов ЭТД в каждом интервале моделирования;
3) проблема выбора приближения к вектору координат ЭТД, используемого для расчёта последовательностей дипольных моментов для сигналов ЭЭГ тестовой выборки;
4) проблема оптимизации многоэкстремального критерия моделирования ЭТД. Несмотря простоту предложенных в работе методов решения этих проблем, каждая из
которых предполагает проведение дополнительных исследований, получены результаты точности классификации сигналов ЭЭГ, сравнимые результатами существующих классических подходов.
Авторы выражают благодарность сотрудникам лаборатории Нейроэргономики и интерфейсов «мозг-компьютер» НБИКС-центра НИЦ «Курчатовский институт» А. Федоровой и Ю. Нуждину за помощь в сборе и первичной обработке нейрофизиологических данных.
Автор Осадчий А.Е. поддержан Программой Фундаментальных Исследований НИУ ВШЭ (ТЗ 76, Нейрокогнитивные механизмы принятия решений и социального влияния).
Список литературы
1. Жадин М.Н. Биофизические механизмы формирования электроэнцефалограммы. М.: Наука, 1984. 197 с.
2. Гусельников В.И. Электрофизиология головного мозга. М.: Высшая школа, 1976. 423 с.
3. Зенков Л.Р. Клиническая электроэнцефалография (с элементами эпилептологии). Руководство для врачей. М.: МЕДпресс-информ, 2004. 368 с.
4. Wolpaw J.R., Birbaumer N., McFarland D.J., Pfurtscheller G., Vaughan T.M. Brain-computer interfaces for communication and control // Clinical Neurophysiology. 2002. Vol.113. P. 767-791.
5. Wolpaw J.R. Brain-computer interfaces as new brain output pathways // The Journal of Physiology. 2007. Vol. 579. P. 613-619.
6. McLachlan G. Discriminant Analysis and Statistical Pattern Recognition. New York: John Wiley&Sons, 1992.
7. Осовский С. Нейронные сети для обработки информации: пер. с польск. М.: Финансы и статистика, 2004. 344 с.
8. Kaper M., Meinicke P., Grossekathoefer U., Lingner T., Ritter H. BCI competition 2003-data set lib: support vector machines for the P300 speller paradigm // IEEE Transactions on
Biomedical Engineering. 2004. Vol. 51, no. 6. P. 1073-1076. DOI: 10.1109/TBME.2004.826698 9. Perez J.L.M., Cruz A.B. Linear Discriminant Analysis on Brain Computer Interface // WISP 2007. IEEE International Symposium on Intelligent Signal Processing, 2007. IEEE, 2007. P. 1-6. DOI: 10.1109/WISP.2007.4447590
10. Subasi A., E^elebi E. Classification of EEG signals using neural network and logistic regression // Computer Methods and Programs in Biomedicine. 2005. Vol. 78, no. 2. P. 87-99.
11. Трофимов А.Г., Скругин В.И. Адаптивный классификатор многомерных нестационарных сигналов на основе анализа динамических паттернов // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2010. № 8. Режим доступа: http://technomag.bmstu.ru/doc/ 151934.html (дата обращения 01.03.2014).
12. Трофимов А.Г., Скругин В.И. Метод выделения динамических паттернов в задаче классификации многомерных временных рядов // Информационные технологии. 2011. № 4. С. 65-71.
13. Ramoser H., Muller-Gerking J., Pfurtscheller G. Optimal spatial filtering of single trial EEG during imagined hand movement // IEEE Transactions on Rehabilitation Engineering. 2000. Vol. 8, no. 4. P. 441-446. DOI: 10.1109/86.895946
14. Kamousi B., Liu Z., He B. Classification of motor imagery tasks for brain-computer interface applications by means of two equivalent dipoles analysis // IEEE Transactions on Neural Systems and Rehabilitation Engineering. 2005. Vol. 13, no. 2. P. 166-171. DOI: 10.1109/TNSRE.2005.847386
15. Qin L., Ding L., He B. Motor imagery classification by means of source analysis for brain-computer interface applications // Journal of Neural Engineering. 2004. Vol. 1, no. 3. P. 135141.
16. Luck S.J. An introduction to the event-related potential technique. Cambridge, MA: MIT Press, 2005. 388 p.
17. Niedermeyer E. Dipole theory and electroencephalography // Clinical EEG (electroenceph-alography). 1996. Vol. 27, no. 3. P. 121-131.
18. Hallez H., Vanrumste B., Grech R., Muscat J., De Clercq W., Vergult A., D'Asseler Y., Camilleri K.P., Fabri SD.G., Van Huffel S., Lemahieu I. Review on solving the forward problem in EEG source analysis // Journal of NeuroEngineering and Rehabilitation. 2007. Vol. 4, no. 1. Art. no. 46. DOI: 10.1186/1743-0003-4-46
19. Ferree T.C., Nunez P.L. Primer on electroencephalography for functional connectivity // Handbook of Brain Connectivity. Springer Berlin Heidelberg, 2007. P. 169-200. DOI: 10.1007/978-3-540-71512-2 6
20. Mosher J.C., Leahy R.M., Lewis P.S. EEG and MEG: forward solutions for inverse methods // IEEE Transactions on Biomedical Engineering. 1999. Vol. 46, no. 3. P. 245-259. DOI: 10.1109/10.748978
21. Банди Б. Методы оптимизации. Вводный курс : пер. с англ. М.: Радио и связь, 1988. 128 с.
22. Неробкова Л.Н., Филатова Ю.Б. , Воронина Т.А. , Авакян Г.Г. , Хромых Е.А., Гайдуков И.О., Авакян Г.Н. Изучение электрофизиологических механизмов регресса пато-логиче-ской системы у больных эпилепсией с использованием спектрально-когерентного анализа и метода дипольных источников // Эпилепсия и пароксизмаль-ные состояния. 2013. № 1. С. 22-30.
23. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности. М.: Финансы и статистика, 1989. 607 с.
24. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning. Springer New York, 2001. 536 p. (Springer Series in Statistics). DOI: 10.1007/978-0-387-21606-5
25. Oostenveld R., Fries P., Maris E., Schoffelen J.-M. FieldTrip: open source software for advanced analysis of MEG, EEG, and invasive electrophysiological data // Computational Intelligence and Neuroscience. 2011. Vol. 2011. Art. ID 156869. DOI: 10.1155/2011/156869
SCIENCE and EDUCATION
EL №FS77- 48211. N»0421200025. ISSN 1994-0408
Model-based approach to EEG classification
# 04, April 2014
DOI: 10.7463/0414.0705745
A., G.Trofimov, S. L. Shishkin, A. E. Ossadtchi
National Research Nuclear University MEPhI, 115409, Moscow, Russian Federation National Research Centre "Kurchatov Institute", 123182,Moscow, Russian Federation National Research University Higher School of Economics, 101000, Moscow, Russian Federtion
A method to construct a feature space for electroencephalogram (EEG) classification based on the localization of brain's electrical activity sources is developed.
The purpose of the work is to show that a model-based approach to the construction of feature space for EEG classification allows us to achieve the accuracy comparable to existing classical approaches at the same time giving a number of opportunities to further increase it and having clear neurophysiological interpretation.
Experimental researches on real EEG show that the accuracy of the proposed method is comparable to the accuracy of the classical method of classification in brain-computer interfaces. The simplest statistical characteristics of dipole moments for equivalent current dipoles are chosen as features for classification, and the nearest neighbour algorithm is used for classification.
Application of the proposed algorithm is diagnostics of brain diseases and brain-computer interfaces.
The first section describes a method of modeling the EEG using equivalent current di-
poles.
In the second section the statement of the EEG classification problem is formulated. In the third section we propose a method of constructing a feature space for EEG classification based on the equivalent current dipoles characteristics.
The fourth section is dedicated to the experimental research of the proposed method on real EEG and to discussion of the results achieved.
Publications with keywords: classification, electroencephalogram, brain-computer interface, sources of brain electrical activity, equivalent current dipole, EEG inverse problem Publications with words: classification, electroencephalogram, brain-computer interface, sources of brain electrical activity, equivalent current dipole, EEG inverse problem
References
1. Zhadin M.N. Biofizicheskie mekhanizmy formirovaniya elektroentsefalogrammy [Biophysical mechanisms of formation of electroencephalogram]. Moscow, Nauka Publ., 1984. 197 p. (in Russian).
2. Gusel'nikov V.I. Elektrofiziologiyagolovnogo mozga [Electrophysiology of brain]. Moscow, Vysshaya shkola Publ., 1976. 423 p. (in Russian).
3. Zenkov L.R. Klinicheskaya elektroentsefalografiya (s elementami epileptologii). Rukovodstvo dlya vrachey [Clinical electroencephalography (with elements of epileptology). Guide for Physicians]. Moscow, MEDpress-inform Publ., 2004. 368 p. (in Russian).
4. Wolpaw J.R., Birbaumer N., McFarland D.J., Pfurtscheller G., Vaughan T.M. Brain-computer interfaces for communication and control. Clinical Neurophysiology, 2002, vol.113, pp. 767-791.
5. Wolpaw J.R. Brain-computer interfaces as new brain output pathways. The Journal of Physiology, 2007, vol. 579, pp. 613-619.
6. McLachlan G. Discriminant Analysis and Statistical Pattern Recognition. New York, John Wiley&Sons, 1992.
7. Osovskii S. Neironnye seti dlia obrabotki informatsii [Neural networks for information pro-cessing].Transl. from Polish. Moscow, Finansy i statistika Publ., 2007. 344 p.
8. Kaper M., Meinicke P., Grossekathoefer U., Lingner T., Ritter H. BCI competition 2003-data set lib: support vector machines for the P300 speller paradigm. IEEE Transactions on Biomedical Engineering, 2004, vol. 51, no. 6, pp. 1073-1076. DOI: 10.1109/TBME.2004.826698
9. Perez J.L.M., Cruz A.B. Linear Discriminant Analysis on Brain Computer Interface. WISP 2007. IEEE International Symposium on Intelligent Signal Processing, 2007. IEEE, 2007, pp. 1-6. DOI: 10.1109/WISP.2007.4447590
10. Subasi A., Erçelebi E. Classification of EEG signals using neural network and logistic regression. Computer Methods and Programs in Biomedicine, 2005, vol. 78, no. 2, pp. 87-99.
11. Trofimov A.G., Skrugin V.I. [Adaptive classificator of multidimensional non stationary signals based on dynamical patterns analysis]. Nauka i obrazovanieMGTUim. N.E. Baumana -
Science and Education of the Bauman MSTU, 2010, no. 8. Available at: http://technomag.bmstu.ru/en/doc/151934.html , accessed 01.03.2014. (in Russian).
12. Trofimov A.G., Skrugin V.I. [Method of Dynamical Patterns Revealing in Problem of Multidimensional Signals Classification]. Informatsionnye tekhnologii, 2011, no. 4, pp. 65-71. (in Russian).
13. Ramoser H., Muller-Gerking J., Pfurtscheller G. Optimal spatial filtering of single trial EEG during imagined hand movement. IEEE Transactions on Rehabilitation Engineering, 2000, vol. 8, no. 4, pp. 441-446. DOI: 10.1109/86.895946
14. Kamousi B., Liu Z., He B. Classification of motor imagery tasks for brain-computer interface applications by means of two equivalent dipoles analysis. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2005, vol. 13, no. 2, pp. 166-171. DOI: 10.1109/TNSRE.2005.847386
15. Qin L., Ding L., He B. Motor imagery classification by means of source analysis for brain-computer interface applications. Journal of Neural Engineering, 2004, vol. 1, no. 3, pp. 135141.
16. Luck S.J. An introduction to the event-related potential technique. Cambridge, MA, MIT Press, 2005. 388 p.
17. Niedermeyer E. Dipole theory and electroencephalography. Clinical EEG (electroencephalography), 1996, vol. 27, no. 3, pp. 121-131.
18. Hallez H., Vanrumste B., Grech R., Muscat J., De Clercq W., Vergult A., D'Asseler Y., Camilleri K.P., Fabri SD.G., Van Huffel S., Lemahieu I. Review on solving the forward problem in EEG source analysis. Journal of NeuroEngineering and Rehabilitation, 2007, vol. 4, no. 1, art. no. 46. DOI: 10.1186/1743-0003-4-46
19. Ferree T.C., Nunez P.L. Primer on electroencephalography for functional connectivity. In: Handbook of Brain Connectivity. Springer Berlin Heidelberg, 2007, pp. 169-200. DOI: 10.1007/978-3-540-71512-2 6
20. Mosher J.C., Leahy R.M., Lewis P.S. EEG and MEG: forward solutions for inverse methods. IEEE Transactions on Biomedical Engineering, 1999, vol. 46, no. 3, pp. 245-259. DOI: 10.1109/10.748978
21. Bunday B.D. Basic Optimisation Methods. Edward Arnold Publishers, 1984. (Russ. ed.: Bunday B. Metody optimizatsii. Vvodnyy kurs. Moscow, Radio i svyaz' Publ., 1988. 128 p.).
22. Nerobkova L.N., Filatova Yu.B., Voronina T.A., Avakyan G.G., Khromykh E.A., Gaydukov I.O., Avakyan G.N. [The study of electrophysiological mechanism of pathological system regression among the patients with epilepsy by the method of spectral-coherence analysis and
the method of dipole sources]. Epilepsiya iparoksizmal'nye sostoyaniya, 2013, no. 1, pp. 2230. (in Russian).
23. Ayvazyan S.A., Bukhshtaber V.M., Enyukov I.S., Meshalkin L.D. Prikladnaya statistika: Klassifikatsiya i snizhenie razmernosti [Applied statistics: Classification and dimension reduction]. Moscow, Finansy i statistika Publ., 1989. 607 p. (in Russian).
24. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning. Springer New York, 2001. 536 p. (Springer Series in Statistics). DOI: 10.1007/978-0-387-21606-5
25. Oostenveld R., Fries P., Maris E., Schoffelen J.-M. FieldTrip: open source software for advanced analysis of MEG, EEG, and invasive electrophysiological data. Computational Intelligence andNeuroscience, 2011, vol. 2011, art. ID 156869. DOI: 10.1155/2011/156869