ЭЭГ ПРОГНОЗ УСПЕШНОСТИ ВЫПОЛНЕНИЯ ПСИХОМОТОРНОГО ТЕСТА ПРИ СНИЖЕНИИ УРОВНЯ БОДРСТВОВАНИЯ: ОПИСАНИЕ
ЭКСПЕРИМЕНТА
Щукин Т.Н., - аспирант, Институт психологии РАН, Москва Дорохов В. Б., - к.биол.н. Институт Высшей Нервной Деятельности и
Нейрофизиологии РАН, Москва.
Лебедев А.Н., - д.биол.н. профессор, Институт психологии РАН, Высшая Школа
Экономики, Москва Луценко Е.В., - д.э.н., к.т.н., профессор, Кубанский государственный аграрный
университет, Краснодар
В статье приводятся условия проведения и результаты эксперимента, задачей которого было построение методики идентификации и прогноза успешности выполнения психомоторного теста с помощью применения классической и неклассической статистической модели к данным электроэнцефалограммы, предшествующей ответу. Эксперимент проводился в условиях, провоцирующих наступление дремоты и засыпания.
Нами был спланирован и проведен эксперимент [1], задачей которого было построение методики идентификации и прогноза успешности выполнения психомоторного теста с помощью применения классической и неклассической статистической модели к данным электроэнцефалограммы, предшествующей ответу. Эксперимент проводился в условиях, провоцирующих наступление дремоты и засыпания.
В исследовании принимали участие здоровые испытуемые (N=41) с амплитудой альфа ритма среднего и высокого индекса. Мужчин - 23, женщин - 18, возраст от 17 до 33 лет (средний возраст составил 25 лет) и один испытуемый в возрасте 55 лет.
Эксперименты в рамках многостороннего исследования проводили в вечернее время с 17 до 20 часов с регистрацией многоканальной (8 каналов) электроэнцефалограммы (ЭЭГ). Использовалось 4 пары отведений (по системе 10/20) относительно объединенных референтных мастоидных электродов А1, А2 (монополярный монтаж) и полиграфических данных (ЭКГ, ЭМГ, дыхание, показания пульсоксиметра). Использованные отведения: Ер1,Ер2, С3,С4, Р3, Р4, 01, 02;
Частота квантования ЭЭГ равнялась 200 Гц. Испытуемые находились в звукоизолированном помещении, в положении лежа в течение 2-3 часов. С испытуемыми поддерживалась видео - и аудио связь.
Звуковые стимулы, генерируемые компьютером, подавали бинаурально через наушники: интенсивностью 60 дб, длительностью 50 мс, частотой 1000 Гц. Стимулы подавались нерегулярно. Промежутки между стимулами варьировались в диапазоне 2.4 - 2.8 сек. Промежутки варьировались случайно. Промежутков в подаче стимулов не было. Всего каждый испытуемый произвел около тысячи нажатий на кнопки.
С помощью опросников контролировались: ситуативная и общая сонливость,
функциональная ассиметрия. Опросники применялись до начала эксперимента с целью допустить до эксперимента только испытуемых, которые хорошо выспались, не принимали в течении последних суток лекарств, алкоголя и не пили напитков, содержащих кофеин или иные стимулирующие вещества.
Экспериментальная модель:
Исследования реальной деятельности человека при засыпании затруднительно по ряду причин, одной из которых является опасность появления ошибок, критических для жизни человека. Поэтому, для исследования механизмов возникновения состояния утомления/усталости, необходима разработка экспериментальных моделей нарушений деятельности при засыпании, в которых одновременно регистрируются физиологические, поведенческие и субъективные показатели деятельности.
В качестве экспериментальной модели использовался психомоторный непрерывнодискретный тест, разработанный В.Б.Дороховым который через 5-15 минут вызывает дремотное состояние, а при углубление дремоты - «микросон».
Такое быстро снижение уровня бодрствования определяется несколькими причинами: во-первых монотонным характером теста, во-вторых, снижением афферентного притока как от внешней среды (закрывание глаз и выполнение теста в заглушенной камере), так и от интерорецепторов.
Монотонный характер теста достигался непрерывным повторением двух серий счета «про себя». В первой серии счет от 1 до 10 сопровождался одновременным нажатием кнопки большим и указательными пальцами. Во второй серии испытуемый считал от 1 до 5 без нажатий на кнопку. Выполнение теста с закрытыми глазами и минимумом двигательной активности позволяет безартефактно регистрировать электрофизиологические показатели, что особенно существенно при регистрации электрической активности мозга человека.
Инструкция испытуемым содержала описание задания: отвечать на стимулы
одновременным нажатием кнопок на джойстиках, которые они держали в руках - на десять стимулов подряд отвечать нажатиями, следующие пять стимулов пропускать и т.д.
Ранее было показано, что такая экспериментальная модель способствует быстрому засыпанию.
Большинство испытуемых в процессе выполнения задания переживали состояние дремоты. Ошибки и отказы испытуемых были связаны с ЭЭГ активностью, характерной для засыпания.
В результате отбора годными были признаны данные 26 испытуемых. Остальные испытуемые были исключены из обработки по критериям, не имеющим отношения к тематике данной работы (ошибки регистрирующей программы и программы экспорта данных).
Методики обработки данных
Первый этап:
На первом этапе работы из сырых ЭЭГ данных был произведен отбор параметров. Расчет параметров проводился в 700 мс окне (140 моментальных значений сигнала при частоте квантования ЭЭГ = 200 ГЦ.).
Ранняя граница окна отстояла от момента стимула на 700 мсек. до стимула. Поздняя граница совпадала с моментом стимула. Также были проведены аналогичные расчеты с окном, середина которого совпадала с моментом стимула, но после завершения обработки было принято решение не использовать эти данные ввиду сложности интерпретации полученных результатов.
Всего для каждого нажатия было рассчитано 34 параметра ЭЭГ. Для каждого из 8 отведений ЭЭГ рассчитывались:
1. Средняя амплитуда сигнала
2. Моментальная амплитуда сигнала в момент стимула
3. Стандартное отклонение сигнала в окне расчета
4. корреляции сигнала в отдельном отведении с виртуальным (обобщенным) девятым отведением.
Два дополнительных параметра представляли собой обобщенное стандартное отклонение по всем каналам и обобщенную моментальную амплитуду сигнала в момент стимула.
Отбор параметров ЭЭГ, который производился на первом этапе работы, обоснован в целом ряде работ и базируется на психофизиологической модели восприятия и памяти, разрабатываемой в лаборатории когнитивной психофизиологии ИПРАН под руководством А.Н.Лебедева на протяжении нескольких десятков лет.
Постановка задачи:
С помощью двух методов - регрессионного анализа и использования системы «Эйдос» нами решалась задача предсказания по параметрам ЭЭГ двух видов переменных:
1. Время реакции
2. Правильность счета (выполнения инструкции)
В зависимости от времени реакции (латентности ответа) были сформированы десять классов:
1. Время реакции (ВР) Меньше -0.5 сек. (сильное опережение)
2. ВР между -0.5 и -0.3 сек. (опережение)
3. ВР между -0.3 и -0.1 сек. (опережение)
4. ВР между -0.1 и 0.1 сек. (совпадение)
5. ВР между 0.1 и 0.2 сек.
6. ВР между 0.2 и 0.3 сек.
7. ВР между 0.3 и 0.5 сек.
8. ВР между 0.5 и 0.75 сек.
9. ВР между 0.75 и 1 сек.
10. ВР более 1 сек. (сильное опоздание)
Среднее время реакции по всем испытуемым составило 230 мс.
1
■л^^чrvчl"lЛ/^ЛДl|ЛV \л
л~-~^ЛЛЛ\АЛ\л
ИЛ 1^дЛл-л.
ПА \М
ш
\Лл' \Л'^Л’'\Л л/ у'Л'л.
л1
\f\JV \Л Л’"
№ ^
■л. дАл
г
■л/Ч
Мл
№"^/>лАл'
Дл---------уу
/\iwjyv
л/и
10
■У'л/ПДЛл/
стимул
Распределение ответов по ВР (на примере ЭЭГ).
Распределение ответов по ВР (на распределении ВР).
Для различения опережений от поздних ответов были построены гистограммы распределения ответов для каждого испытуемого. Ответы на участке до второго минимума распределения относились нами к поздним нажатиям, ответы на участке после второго минимума распределения - к опережениям.
На следующей таблице можно увидеть пример диаграммы, модифицированной таким образом, что ответы, которые на диаграмме до модифицикации относились к текущему стимулу, на диаграмме после модификации были автоматически отнесены к опережениям следующего стимула.
В зависимости от правильности выполнения инструкции (На десять стимулов реагировать нажатием, на следующие 5 - не реагировать) данные были распределены по четырем ячейкам в соответствии с правильностью счета:
11. Нормальные пропуски. Правильные серии пропусков в ответ на стимулы - т.е. по пять пропусков.
12. Ошибочные пропуски. Ошибочные серии пропусков в ответ на стимулы - т. е. пропуски количеством меньше или больше пяти.
13. Нормальные нажатия. Правильные серии нажатий в ответ на стимулы - т. е. нажатия по десять раз.
14. Ошибочные нажатия. Ошибочные серии нажатий в ответ на стимулы - т. е. нажатия более или менее десяти раз.
Фактически, в ячейки были записаны моменты (точное время события) стимулов, реакции (или их отсутствие) в ответ на которые попадали в одну из четырех описанных выше групп. Ответы также попадали в одну из ранее описанных 10 групп латентностей. Пропуски же попадали в одну из двух групп (11 ая или 12ая).
Таким образом, по каждому испытуемому был сформирован файл с 14 столбцами данных, в каждом из которых находилось время события-стимула, ответ на который относился к одному из 14 классов и 34 столбцами, в которых содержались параметры ЭЭГ, соответствующие каждому стимулу.
Пример файла с данными можно увидеть на таблице. Первый столбец таблицы представляет собой наименование события (время от начала записи). Столбцы с наименованиями Т01-Т14 -классы событий. Остальные столбцы - признаки электроэнцефалограммы.
NUM T01 T02T03 T04T05 T06 T07 T08 T09 T10 T11 T12 T13 T14 AVM M01 M02 M03 M04 ... E01 E02 E03 E04 E11 E12 E13 E14 141_17.085 70 70 70 70 70130 70 70 130 70 70 70130 70 -30 -25 -36 -80 -22... 0 -41 -29 1 3 -2 -8 -14
141_19.69 70 70 70 70 70130 70 70 70 70 70 70130 70 -70-136 -52 85 -29... 17 9 -1 6 13 14 8 2
141_22.2 70 70 70 70 70130 70 70 70 70 70 70130 70 -3 8 -25 -41 52... 2 -3 -6 8 0 6 0 -6
141_24.605 70 70 70 70 130 70 70 70 70 70 70 70130 70 -73-213 -48 42-148... 13 6 -9 17 21 7 -6 -9
141_26.9 70 70 70 70 70130 70 70 70 70 70 70130 70 9 30 2 -44 15... 1 13 1 7 8 4 8 6
141 29.41 70 70 70130 70 70 70 70 70 70 70 70130 70 10 0 -83 25 115... -15 -14 14 1 -9 -10 -2 4
В качестве проверки нами было проведено параллельное исследование с альтернативным набором параметров ЭЭГ.
В программе, с помощью которой осуществлялась регистрация полиграфических показателей (“8а§ига”) были построены спектры в шести диапазонах (Дельта 1-[0.5-2Гц.]; Дельта2-[2-4Гц.]; Тета-[4-8Гц.]; Альфа-[8-12Гц.]; Сигма-[12-18Гц.]; Бета-[18-70Гц.]). Спектры были посчитаны в десятисекундных окнах с помощью встроенного алгоритма быстрого преобразования Фурье, рассчитанного по стандартной формуле. Были получены абсолютные значения спектров для шести диапазонов.
Для тех же испытуемых нами была построена таблица, аналогичная приведенной выше, отличающаяся тем, что вместо 34 описанных выше использовались 48 показателей спектра - 6 спектральных диапазонов для 8 отведений. Обработка данных этой таблицы полностью соответствовала работе с ранее описанными данными.
Второй этап:
Была поставлена задача спрогнозировать на основе параметров ЭЭГ (амплитуда, среднее, корреляции, а также отдельно спектральные показатели) ожидаемое ВР и класс реакции.
Задача выявления ЭЭГ детерминант, определяющих развитие того или иного процесса деятельности, традиционно считается весьма сложной, и плохо поддающейся решению с помощью методов классического статистического анализа.
По этой причине нами были привлечены две разные, хорошо зарекомендовавшие дополняющие друг друга модели расчетов соответствия индексов параметрам деятельности.
Модель классической статистики - регрессионного анализа, зарекомендовавшей себя в исследованиях лаборатории А.Н.Лебедева, была дополнена неклассической математической моделью.
В качестве второй нами была привлечена универсальная аналитическая система «Эйдос».
Система объединяет преимущества искусственных нейронных сетей с возможностями интерпретации получаемых результатов, превосходящими аналогичные в методах многомерного шкалирования
Работа программы базируется на системной теории информации, и результаты обработки в данном исследовании представляют собой автоматически классифицированные примеры (параметры участков ЭЭГ) на основе информационных портретов классов нормальных и ошибочных действий (классов распознавания). Используемая в распознающей программе семантическая информационная модель является непараметрической, т.к. базируется на системной теории информации. Программная система использует робастные процедуры, обеспечивающие устойчивую работу модели на исходных данных, зашумленных артефактами, т.е. выпадающих из общих статистических закономерностей, которым подчиняется исследуемая выборка, что упрощает задачу контроля артефактов в данных.
Результаты:
Для обработки таблиц нами применялось два метода.
Первым использовался стандартный алгоритм множественного регрессионного анализа. В результате были получены уравнения с тремя наиболее значимыми параметрами. Менее значимые параметры были отброшены.
На основе таблиц с данными ЭЭГ было построено 233 регрессионных уравнения. Уравнения для каждого испытуемого были построены для 8 классов-событий (из 10 латентностей в обработку взяты были только 6 - те, для которых существовало минимальное количество примеров.)
В результате применения уравнения к исходным данным по каждому событию были получены три вида ответов. При попадании полученного с помощью уравнения числа в один из двух крайних диапазонов, принималось решение о принадлежности («да» - положительный ответ) или о не принадлежности («нет» - отрицательный ответ) события к классу событий, для прогноза которых было создано уравнение. При попадании полученного числа в интервал между зонами ответов «да» и «нет» событие описывалось как нераспознанное.
Результаты регрессионного уравнения были представлены в двух видах. Во-первых, в виде таблиц корреляций ряда предсказываемых значений с реальными значениями для каждого типа события каждого испытуемого индивидуально.
Для 91% предсказываемых параметров из 14 параметров для 26 испытуемых удалось построить уравнения, корреляции которых с динамикой описываемого признака являются значимыми на уровне 0.05. Уравнения для различных испытуемых имели существенно различные коэффициенты корреляции с динамикой предсказываемых признаков.
Также результаты применения регрессионного анализа были представлены в виде четырехполюсной таблицы. Из этой таблицы были получены четыре вида коэффициентов.
1. Точность ответов «да»: отношение количества случаев, когда система принимала решение «да» правильно к случаям, когда система принимала решение «да» ошибочно. (общее количество решений «да» деленное на верное количество решений «да» в процентах).
2. Точность ответов «нет»: отношение количества случаев, когда система принимала
решение «нет» правильно к случаям, когда система принимала решение «нет» ошибочно. (общее количество решений «нет» деленное на верное количество решений «нет» в процентах).
3. Процент верных ответов «да» (валидность положительного решения): Процент правильных
идентификаций реальных событий «да».
4. Процент верных ответов «нет» (валидность отрицательного решения): Процент
правильных идентификаций отсутствия событий («нет»).
Все эти показатели посчитаны на той части выборки, которая относится либо к ответам «да», либо к ответам «нет». Ответам «нет» приписывалось значение «70», ответам «да» - значение «130». Если число, получаемое с помощью регрессионного уравнения, попадало в бин «не знаю», то эти результаты далее не учитывались. (См. рис. Т)
Средний процент обрабатываемой выборки для уравнений составляет 54% и указан в следующей таблице наряду с четырьмя упомянутыми выше коэффициентами.
процент да
нет
да
нет
среднее 54.47274 99.25399 96.42797 77.17119 99.55112
медиана 54.45148 100 97.81837 84.88372 100
стандартное отклонение 13.86894 1.556358 4.83087 23.60377 1.154278
количество 234 230 234 231 234
мин 12.82565 87.5 63.76812 0 89.0411
макс 99.90628 100 100 100 100
Также в результате обработки была построена аналогичная таблица для каждого типа события в отдельности.
валидность нет валидность да точность нет точность да процент обработанных показатель класс
99.98305 100 0.058352 24 99.76134 100 56.43845 50.96154 24.33832 24 20 100 96.61494 97.77706 3.847975 24 81.38528 100 99.94245 100 0.197943 24 99.19355 100 52.91028 52.77561 17.84698 24 18.5699 91.67734 среднее медиана стандартное отклонение количество мин макс ВР между -0.3 и -0.1
99.85052 100 0.359146 26 98.62259 100 71.11469 79.05268 26.61332 26 5.660377 100 95.01244 97.60225 7.888109 26 63.76812 100 99.56294 100 1.000471 26 96.34146 100 55.29657 54.69725 16.018 26 30.37838 97.11359 среднее медиана стандартное отклонение количество мин макс ВР между -0.1 и 0.1
99.69245 100 0.546793 26 98.20628 100 75.52004 86.28143 27.3104 26 0 100 96.06773 98.26013 5.6755 26 73.82075 100 98.88523 100 2.027571 25 91.52542 100 57.10935 57.79891 12.86797 26 27.59283 89.13502 среднее медиана стандартное отклонение количество мин макс ВР между 0.1 и 0.2
99.49183 100 1.129995 26 95.57522 100 78.92471 87.9 23.91025 25 15.64626 100 94.90823 97.77037 7.064715 26 70.53571 100 99.22686 100 1.264902 25 95.55556 100 56.36845 56.21004 13.90107 26 12.82565 99.90628 среднее медиана стандартное отклонение количество мин макс ВР между 0.2 и 0.3
99.72692 100 0.569508 26 97.77778 100 70.53016 72.99383 24.57321 24 24.5283 100 97.26521 97.83346 3.034099 26 85.43689 100 99.15419 100 1.779884 24 91.66667 100 56.41815 54.5029 17.94559 26 17.96954 99.89507 среднее медиана стандартное отклонение количество мин макс ВР между 0.3 и 0.5
99.37593 99.7351 0.829029 26 94.02076 96.12503 6.607665 26 97.48716 98.81926 3.19459 26 98.5411 99.31088 1.723386 26 53.49921 54.68895 4.610667 26 среднее медиана стандартное отклонение количество Верное количество пропусков
96.93878 100 73.50993 100 88.30409 100 94.2446 100 41.48528 62.99505 мин макс
99.83183 100 0.672012 26 96.57795 100 72.6643 74.1498 22.41412 26 23.89381 100 97.04105 97.96368 3.586559 26 87.83784 100 99.76974 100 0.676104 26 96.80851 100 52.01975 54.72586 16.04624 26 20.1469 79.91361 среднее медиана стандартное отклонение количество мин макс Ошибочное количество пропусков
98.10373 98.94345 2.524563 26 89.0411 100 95.73764 96.5709 4.37847 26 82.35294 100 96.2912 96.99095 3.607774 26 84.41558 100 98.38212 98.88901 2.476738 26 87.5 100 54.9684 54.47698 3.575836 26 47.44352 66.50943 среднее медиана стандартное отклонение количество мин макс Верное количество нажатий
99.96684 100 0.169066 26 99.13793 100 75.82034 78.24074 15.51195 26 36.53846 97.54098 96.92576 97.63968 2.483371 26 91.66667 99.44904 99.86737 100 0.676263 26 96.55172 100 49.29351 49.45737 12.15922 26 25.94937 70.01067 среднее медиана стандартное отклонение количество мин макс Ошибочное количество нажатий
Из таблицы следует, что наибольшая валидность отрицательных ответов (процент правильных распознаваний отрицательных ответов, т.е. отсутствия события) наблюдается у класса Т3 (ВР между -0.3 и -0.1 сек.) У этого же класса наибольшая точность ответов «да» - более 99.9 %. Это означает, что когда система принимает решение о положительном ответе, то это почти всегда правильная идентификация.
Наибольшая валидность положительных ответов (процент правильных распознаваний положительных ответов, т.е. наличия события) наблюдается у класса Т13 (Верное количество нажатий) - 95%.
У класса Т11 (верное количество пропусков) наибольшая точность ответов «нет» - 97.4%. Это означает, что когда система принимает решение об отсутствии события, то почти всегда имеет место правильная идентификация.
В целом, точность ответов «да» и «нет» по всем испытуемым очень высока - если система осуществляет идентификацию события как имеющего место или не имеющего места, то вероятность ошибки крайне мала. Валидность распознавания событий (процент правильно опознанных событий, имевших место) также довольно высок и составляет более 77%. Валидность распознавания отсутствия событий (процент правильно распознанных отсутствий событий) еще более высока и составляет более 99.5%.
Все эти данные, тем не менее, относятся лишь к чуть более чем 54% всех данных. Во всех остальных случаях система затруднялась принять решение.
Не у всех испытуемых удавалось с помощью уравнений регрессии предсказать ВР и тип работы.
На следующей таблице видно, что удовлетворительная валидность (процент верных распознаваний выше 65%) сильно различается от класса к классу.
Параметр Общее валидность "да" Удовл. Удовл. Удовл.точность
количество (количество с процентом валидность Точность «нет» выше 65. Далее- «нет» «да»
аналогично)
количество в процентах в процентах в процентах в процентах
ВР между -0.3 и -0.1 сек 23 7 30.40% 100% 100% 100%
ВР между -0.1 и 0.1 сек. 26 16 61.50% 100% 100% 100%
ВР между 0.1 и 0.2 сек. 25 19 76% 100% 100% 100%
ВР между 0.2 и 0.3 сек. 24 20 83.30% 100% 100% 100%
ВР между 0.3 и 0.5 сек. 26 15 57.60% 100% 100% 100%
Верное к-во пропусков. 26 26 100% 100% 100% 100%
Ошибочное к-во пропусков 25 17 68% 100% 100% 100%
Верное к-во нажатий 26 26 100% 100% 100% 100%
Ошибочное к-во нажатия 26 22 84.60% 100% 100% 100%
Из этих данных следует, что с помощью регрессионных уравнений
хуже всего удалось предсказывать наступление событий классов «ВР между -0.3 и -0.1 сек» и «ВР между 0.3 и 0.5 сек.».
Лучше всего удавалось предсказывать класс «ВР между 0.2 и 0.3 сек.» из видов латентностей ответов и классы 11 и 13 («верное количество пропусков» и «верное количество нажатий») среди разных видов счета. Аналогичная тенденция наблюдается на предыдущей таблице - в обобщенных валидностях по классам, без учета количества испытуемых, преодолевающих барьер в 65%. Необходимо сказать, что остальные характеристики (валидность «нет», точность «да», точность «нет») превышают барьер в 65% у всех без исключения испытуемых.
Те же данные без учета доверительного интервала - т.е. те данные, которые попали в сектор «не знаю» посчитаны как не идентифицированные, отражены на следующей таблице.
Процент
распознаваний
(валидность
Предсказываемый параметр «да»)
ВР между -0.3 и -0.1 сек 70.1%
ВР между -0.1 и 0.1 сек. 66.0%
ВР между 0.1 и 0.2 сек. 58.4%
ВР между 0.2 и 0.3 сек. 53.2%
ВР между 0.3 и 0.5 сек. 61.2%
Верное кол-во пропусков 57.0%
Ошибочное к-во пропусков 67.5%
Верное кол-во нажатий 53.7%
Ошибочное кол-во нажатия 68.2%
Если из уравнения следовало, что время реакции может иметь два-три возможных значения, то выбиралось то значение, регрессионное уравнение класса события которого имело больший коэффициент корреляции с реальными данными.
Прогноз успешности выполнения психомоторного теста с применением регрессионного анализа, использованный в данном исследовании, обладает всеми традиционными недостатками регрессионного анализа, а именно:
При проведении регрессионного анализа предполагается, что связь между переменными является линейной. Процедуры множественного регрессионного анализы в незначительной степени подвержены воздействию малых отклонений от этого предположения. Тем не менее, это предположение в наших данных не подтверждено. Также в множественной регрессии предполагается нормальность распределения - т.е. предполагается, что остатки (предсказанные значения минус наблюдаемые) распределены нормально (т.е. подчиняются закону нормального распределения). Это предположение также не подтверждено в нашем случае.
Наиболее важным фактом, определяющим выбор альтернативного метода прогноза успешности выполнения психомоторного теста, является основное концептуальное ограничение
всех методов регрессионного анализа, состоящее в том, что они позволяют обнаружить только числовые зависимости, а не лежащие в их основе причинные связи.
Проблема мультиколлинеарности (наличия среди признаков двух и более дублирующих друг друга (т.е. сильно связанных)) является общей для многих методов корреляционного анализа, в том числе для регрессионного анализа.
Последним, но не наименее важным является необходимость анализа остатков при проведении регрессионного анализа. Выбросы (т.е. экстремальные наблюдения) могут вызвать серьезное смещение оценок, "сдвигая" линию регрессии в определенном направлении и тем самым, вызывая смещение регрессионных коэффициентов. Часто исключение всего одного экстремального наблюдения приводит к совершенно другому результату.
Для компенсации всех перечисленных недостатков в качестве второго метода для решения задачи прогноза на основе параметров ЭЭГ ожидаемого ВР и класса реакции использовалась универсальная аналитическая система «Эйдос».
На основе таблицы с данными каждого испытуемого формировалась обучающая выборка, включающая в себя половину строк таблицы, отобранных по принципу «четные строки -обучающая выборка, нечетные строки - распознаваемая выборка».
На основе обучающей выборки система обучалась, формируя обобщенные образы классов распознавания (правила, на основе которых система относит участок ЭЭГ к тому или иному классу).
На основе обобщенных образов классов распознавания, сформированных на первой половине выборки, проводилось распознавание второй половины выборки.
Объект считался отнесенным к классу, с которым у него наибольшее сходство. Образы классов, по которым процент верных распознаваний был ниже 65%, считались не сформированными. Нами рассматривались модели, построенные не менее, чем на 20 примерах. Количество моделей, число примеров в которых превышало 20, обозначено в первых столбцах следующих двух таблиц.
Аналогичным образом были обработаны данные по параметрам спектральных характеристик ЭЭГ, сопровождающих действия человека.
Были получены следующие результаты:
количество с валидностью средний моделей с выше 65%, процент
кол-вом процент от (валидн стандартное
Параметр примеров общего ость) медиана отклонение мин макс
более 20 количества
ВР между -0.3 и -0.1 сек 10 5 50% 60.077 66.41 15.104 38.89 77.27
ВР между -0.1 и 0.1 сек. 19 4 21% 56.9705 58.23 14.1631 32.43 82.35
ВР между 0.1 и 0.2 сек. 23 8 34.7% 56.0813 56.76 14.7029 22.01 78.79
ВР между 0.2 и 0.3 сек. 23 10 43.5% 58.0213 60 16.9789 23.44 85.71
ВР между 0.3 и 0.5 сек. 17 5 29.4% 56.1553 59.84 15.9271 29.57 88.24
ВР между 0.5 и 0.7 5 сек. 6 2 33.3% 55.185 47.3 17.6552 40.43 79.31
ВР между 0.7 5 и 1 сек. 5 1 20% 47.882 43.75 15.8562 34.62 73.33
ВР более 1 сек. 2 0 0% 40.625 40.625 22.0971 25 56.25
Верное кол-во пропусков 26 3 11.5% 51.3696 48.845 14.9209 18.24 80.26
Ошибочное к-во пропусков 15 3 20% 52.5433 54.55 17.2764 11.21 80.2
Верное кол-во нажатий 26 8 30.8% 56.7873 60.175 15.4917 19.27 79
Ошибочное кол-во нажатия 22 4 18.2% 54.9341 54.025 9.63854 37.93 71.05
Таблица успешности предсказания по амплитудно-корреляционным параметрам фоновой
ЭЭГ.
На этой таблице приведены результаты распознавания по фоновой ЭЭГ с помощью системы «Эйдос». Следует заметить, что данные приведены для всех классов всех испытуемых, по которым
количество примеров превышало 20. В том числе рассматривались данные испытуемых, по данным которых вообще не удалось произвести успешного прогноза ни по одному классу распознавания.
Следующая таблица во всем подобна предыдущей, за исключением того, что на ней приведены данные об успешности распознавания по спектральным характеристикам ЭЭГ.
количество с валидностью моделей с выше 65%, Средний
кол-вом процент от процент
примеров общего (валидн стандартное
параметр более 20 количества ость) медиана отклонение мин макс
ВР меньше -0.5 сек. 1 1 100% 72.73 72.73 72.73 72.73
ВР между -0.5 и -0.3 1 0 0% 45.45 45.45 45.45 45.45
ВР между -0.3 и -0.1 сек 8 3 37.5% 56.535 54.74 15.50127 38.46 79
ВР между -0.1 и 0.1 сек. 15 3 20% 50.478 51.67 16.32707 14.29 76.39
ВР между 0.1 и 0.2 сек. 20 5 25% 57.6865 54.545 13.07801 37.88 87.88
ВР между 0.2 и 0.3 сек. 19 4 21.0526% 53.84474 56.76 13.5722 27.27 78.57
ВР между 0.3 и 0.5 сек. 15 2 13.3333% 53.27533 50 11.1444 41.67 83.33
ВР между 0.5 и 0.7 5 сек. 6 2 33.3333% 51.97 56.545 23.76088 7.41 74.36
ВР между 0.75 и 1 сек. 5 1 20% 51.364 52.38 20.97478 21.43 78.57
ВР более 1 сек. 3 1 33.3333% 59.19333 61.54 12.73323 45.45 70.59
Верное кол-во пропусков 23 10 43.4783% 59.91261 59.85 18.42749 10.3 88
Ошибочное кол-во пропусков 14 6 42.8571% 73.45143 67.335 16.67501 48.96 100
Верное кол-во нажатий 23 6 26.087% 54.7087 57.56 11.40061 34.5 76.11
Ошибочное к-во нажатия 19 8 42.1053% 61.55789 59.52 18.5624 32.31 100
Таблица успешности предсказания по спектральным параметрам ЭЭГ. Данная таблица во всем аналогична предыдущей за исключением того, что в качестве исходных данных использовались данные о спектральных признаках ЭЭГ, а не набор из амплитудных и корреляционных признаков, как в прошлой диаграмме.
По таблицам видна закономерность, заключающаяся в том, что спектральные показатели позволяют лучше предсказывать правильность счета (правильность выполнения инструкции), а другие показатели ЭЭГ позволяют лучше предсказывать латентность ответа. Это выражается в том, что для спектральных показателей больше количество предсказаний с высоким уровнем прогноза (более 65%), а также выше средний процент верных распознаваний правильности счета. Для фоновых показателей выше аналогичные показатели для латентности ответа.
Эта закономерность проиллюстрирована на следующей таблице. Красным цветом отмечены большие проценты (по сравнению с другим основанием распознавания).
по спектру по спектру по спектру по фону по фону по фону
количество примеров выше количество примеров
параметр 65% среднее выше 65% среднее
ВР между -0.3 и -0.1 сек 3 37.5% 56.535 5 50% 60.077
ВР между -0.1 и 0.1 сек. 3 20% 50.478 4 21% 56.9705
ВР между 0.1 и 0.2 сек. 5 25% 57.6865 8 34.7% 56.0813
ВР между 0.2 и 0.3 сек. 4 21.05263% 53.84474 10 43.5% 58.0213
ВР между 0.3 и 0.5 сек. 2 13.33333% 53.27533 5 29.4% 56.1553
ВР между 0.5 и 0.75 сек. 2 33.33333% 51.97 2 33.3% 55.185
ВР между 0.75 и 1 сек. 1 20% 51.364 1 20% 47.882
ВР более 1 сек. 1 33.33333% 59.19333 0 0% 40.625
Верное кол-во пропусков 10 43.47826% 59.91261 3 11.5% 51.3696
Ошибочное кол-во пропусков 6 42.85714% 73.45143 3 20% 52.5433
Верное кол-во нажатий Ошибочное кол-во нажатия
6 26.08696% 54.7087
8 42.10526% 61.55789
8 30.8% 56.7873
4 18.2% 54.9341
Таблица сравнения эффективности распознавания по двум наборам параметров (скорректированная по количеству испытуемых).
-о— По спектру По фону
Те же данные изображены в виде графика.
Причины разной эффективности расчетов на основе разных данных в задачах предсказания правильности счета могут быть объяснены. Участки спектров, используемые в расчете, построены на основе 10 секундных окон электроэнцефалограммы, в то время, как расчеты по фону производились на основе данных, полученных на 700 мс. окне. Полученные результаты говорят о том, что классы правильности счета различаются между собой спектральными параметрами ЭЭГ, посчитанными на больших окнах в большей степени, чем амплитудно-корреляционными параметрами, посчитанными на окнах длительностью менее одной секунды.
Признаки, определяющие время реакции испытуемого на стимул, напротив, заключены в динамике амплитудно-корреляционных параметров ЭЭГ и несколько хуже отражены в спектральных параметрах, посчитанных на больших отрезках ЭЭГ.
Средняя степень распознавания у испытуемых различна. Есть испытуемые, количество хорошо (более 65%) распознанных классов у которых доходит до шести. Одновременно, существуют испытуемые, у которых хорошо не распознается ни один класс. Этот факт говорит о том, что в ЭЭГ испытуемых, для которых не удалось построить модель удовлетворительного прогноза, представляет собой в значительной степени случайный сигнал, и в ней не содержатся устойчивые комбинации признаков. Причиной этого может быть как низкое качество записи сигнала, так и характер самой электроэнцефалограммы. Прояснение этого вопроса требует дальнейших исследований.
При этом у некоторых испытуемых для некоторых классов результаты распознавания настолько высоки, что позволяют использовать методику для прямой идентификации наступающего события по ЭЭГ. По признакам ЭЭГ, предшествующей стимулу, достаточно хорошо предсказываются в среднем два класса из (в среднем) восьми, по которым существовало более двадцати примеров электроэнцефалограммы. Аналогична успешность распознавания по спектрам.
Это говорит о том, что при наличии достаточного количества примеров, хорошо предсказываются более четверти классов распознавания. Классы, представленные недостаточным
количеством примеров (менее 20), как правило, предсказываются еще лучше (до 100 % правильных распознаваний).
Сравнивая результативность метода регрессионного анализа и метода, реализованного в системе «Эйдос», можно увидеть, что их эффективность вполне сопоставима, когда в результатах, полученных с помощью регрессионного анализа, не учитывается доверительный интервал.
Результаты распознавания с помощью системы «Эйдос» Результаты распознавания с помощью регрессионных уравнений
По данным спектра По амплитуднокорреляционным показателям Количество примеров с валидность ю выше 65% в процентах общая валидность ответов «да» общая валидность ответов «да» без учета доверительн ого интервала
Количеств о примеров с валидност ью выше 65% в процентах общая валиднос ть ответов «да» Количество примеров с валидность ю выше 65% в процентах общая валидность ответов «да»
ВР между -0.3 и -0.1 сек 37.5% 56.5% 50% 60.1% 30.40% 56% 50.1%
ВР между -0.1 и 0.1 сек. 20% 50.5% 21% 57.0% 61.50% 71% 66.0%
ВР между 0.1 и 0.2 сек. 25% 57.7% 34.7% 56.1% 76% 75% 58.4%
ВР между 0.2 и 0.3 сек. 21.05263% 53.8% 43.5% 58.0% 83.30% 78% 53.2%
ВР между 0.3 и 0.5 сек. 13.33333% 53.3% 29.4% 56.2% 57.60% 70% 61.2%
Верное кол-во пропусков. 43.47826% 59.9% 11.5% 51.4% 100% 94% 57.0%
Ошибочное кол-во пропусков 42.85714% 73.5% 20% 52.5% 68% 72% 67.5%
Ошибочное кол-во нажатия 42.10526% 61.6% 18.2% 55.0% 84.60% 75% 68.2%
Верное кол-во нажатий 26.08696% 54.7% 30.8% 56.8% 100% 95% 53.7%
Если же мы посмотрим на результаты, полученные на данных вне доверительного интервала, то мы увидим, что точность ответов «да» и ответов «нет» очень высока. Это означает, что этот метод предпочтительнее использовать в задачах с высокой ценой ошибки - «ложной тревоги».
Литература
1. Щукин Т.Н., Дорохов В. Б., Лебедев А.Н., Луценко Е.В. ЭЭГ прогноз успешности выполнения психомоторного теста при снижении уровня бодрствования: постановка задачи. // Научный журнал КубГАУ. - 2004.- №4(6). - 9 с. http://ei.kubagro.ru.