тарской речи позволили реализовать программный модуль автоматического распознавания речи на татарском языке. Применяемый при создании моделей фонем аппарат скрытых марковских моделей показал хорошее качество обучения. В рамках проведенных экспериментов по распознаванию слов татарского языка построенная система показала 92-процентное качество распознавания, что позволило использовать ее при создании пользовательского интерфейса для распознавания речи с возможностями записи речевого фрагмента с микрофона.
Литература
1. Gales M., Young S. The Application of Hidden Markov Models in Speech Recognition. Foundations and Trends in Signal Processing, 2007, vol. 1, iss. 3, pp. 195-304.
2. Lopes C., Perdigao F. Phone recognition on TIMIT database. Speech technologies. InTech Publ., 2011, pp. 285-302.
References
1. Gales M., Young S. The application of hidden markov models in speech recognition. Foundations and trends in signal processing. 2007, vol. 1, iss. 3, pp. 195-304.
2. Lopes C., Perdigao F. Phone recognition on TIMIT database. Speech technologies. InTech Publ., 2011, pp. 285-302.
УДК 004.5
ТИПОЛОГИЗАЦИЯ ЛОКАЛЬНЫХ МАКСИМУМОВ В СПЕКТРАХ ЭЛЕКТРОЭНЦЕФАЛОГРАММ, ПОЛУЧЕННЫХ ПУТЕМ НЕПРЕРЫВНОГО ВЕЙВЛЕТПРЕОБРАЗОВАНИЯ
Я.А. Туровский, к.ж.н., доцент, руководитель лаборатории; С.Д. Кургалин, д.ф.-м..н., зав. кафедрой; А.Г. Семенов, студент (Воронежский государственный университет, Университетская пл., 1, г. Воронеж,, 394006, Россия, yaroslav_turovsk@mail.ru, kurga.lir@bk.ru, revolusioru@mcdl.ru)
Предложен метод получения функционально значимой информации о работе головного мозга, основанный на анализе цепочек локальных максимумов (ЦЛМ) на наборе вейвлетных энергетических спектров (скейлограмм, локальных спектров), получаемых из матрицы квадратов коэффициентов вейвлет-преобразования данных электроэнцефалограммы. Сущность метода состоит в усреднении ЦЛМ в частотном пространстве. В методе используются два способа усреднения: по первой временной координате ЦЛМ и по минимизации различий между ЦЛМ. При использовании первого способа все цепочки синхронизируются по первому значению, которое приравнивается к нулевому отсчету во временной шкале; при использовании второго цепочки сдвигаются относительно друг друга для минимизации различий между ними, и только затем выполняется усреднение. Проведенные исследования показали, что для электроэнцефалограммы человека в состоянии покоя существуют пять основных типов поведения ЦЛМ: 1) возрастающий, характеризующийся увеличением частоты максимумов локального спектра в цепочке; 2) убывающий, характеризующийся снижением частоты локальных максимумов во времени; 3) постоянный, при котором для всей ЦЛМ частота существенно не меняется; 4) возрастающе-убывающий, при котором частота локальных максимумов в цепочке сначала растет, а затем снижается; 5) убывающе--возрастающий, противоположный по поведению четвертому типу. Отношение цепочки к определенному типу является индивидуальным свойством человека и зависит от характера активности мозга в данный момент. Сделан вывод, что проведенная типологизация локальных максимумов матриц вейвлет-коэффициентов для электроэнцефалограммы имеет важное значение для исследования процессов ЭЭГ при различных функциональных состояниях человека.
Ключевые слова: вейвлет-анализ, биомедицинская информация, электроэнцефалограмма, скейлограмма.
TYPOLOGIZATION OF LOCAL MAXIMUMS IN ELECTROENCEPHALOGRAM SPECTRUMS DERIVED FROM CONTINUOUS WAVELET TRANSFORMATION Turovskiy Ya.A., Ph.D. (Medics), associate professor, head of laboratory;
Kurgalin S.D., Dr.Sc. (Physics and Mathematics), head of chair; Semenov A.G., student (Voronezh State University, Universitetskaya Sq., 1, Voronezh, 394006, Russian Federation, yaroslav_turovsk@mail.ru, kurgalin@bk.ru, revolusion@mail.ru) Abstract. The paper offers a method to obtain a functionally important information about brain work. It is based on the analysis of local maxima chains (LMC) on the set of the wavelet energy spectrum (scalogramm, local spectra) derived from a matrix of squares of the coefficients of the wavelet transformation of electroencephalogram (EEG) data.The method means averaging LMC in frequency space. The method uses two ways of averaging: by the first LMC timing coordinate, and by minimizing the differences between LMC. When using the first way, all chains are synchronized according to the first value which equals to zero scaling reading the timeline; in the second way chains move relatively to each other in order to
minimize the differences between them, and only then averaging is run. The research have shown that for the EEG of a human at rest there are five basic types of LMC behavior: 1) the increasing one, characterized by increasing frequency of the local spectrum maxima in the chain, 2) the decreasing one, characterized by reducing frequency of local maxima in time, 3) the constant one, when the whole LMC frequency is not changing significantly, 4) ascending-descending, when the local maxima frequency in the chain first increases and then decreases, 5) the decreasing-increasing one which is opposite to the behavior of the 4th type. It is determined that the relation of the chain to a certain type is an individual property of a human and depends on the nature of the brain activity at the moment. The typology performed for the local maxima of the matrices of the wavelet coefficients for EEG is essential to study the EEG in different functional states of a human.
Keywords: wavelet-analysis, medical and biological information, electroencephalogram, scalegram.
Исследование функционирования центральной нервной системы, особенно головного мозга, направлено в первую очередь на выявление новых физиологически значимых эффектов на основе информации, содержащейся в электроэнцефалограммах (ЭЭГ), которые можно было бы связать с теми или иными формами психической активности человека. Поиск неизвестных, связанных с активностью головного мозга феноменов может осуществляться как в процессе разработки новых методов исследования (что в свое время, например, привело к появлению магнитно-резонансной и позитронно -эмиссионной томографии), так и путем создания новых методов анализа традиционных сигналов, посылаемых центральной нервной системой. К таким широко используемым методам относится электроэнцефалография, представляющая собой регистрацию электрической активности мозга с неповрежденных кожных покровов головы и являющаяся неинвазивным (то есть не требующим вживления электродов), относительно дешевым и малолатентным методом исследования, по праву занимающим одну из лидирующих позиций в системном анализе активности центральной нервной системы. Несмотря на существование многочисленных подходов к оценке данных ЭЭГ, имеющих широкие возможности как клинического, так и научного применения, целый ряд потенциально высокоинформативных способов по-прежнему используется недостаточно активно. В первую очередь речь идет о подходах к обработке данных ЭЭГ на основе вейвлет-анализа (ВА). Рост числа публикаций, в которых используются эти подходы, включая использование их результатов в ряде применяющихся в клинике программно-аппаратных комплексов (http://neurobotics.ru/ downloads/Neuшbotics_PriceИst_2012.pdf), в большинстве случаев не ведет к созданию новых физиологически содержательных алгоритмов анализа данных ЭЭГ. Помимо этого, в ряде разработок ВА используется исключительно для фильтрации и сжатия данных без попыток провести интерпретацию полученных результатов в медико-биологическом аспекте.
Таким образом, актуальной является разработка таких методов, которые не только обеспечат обработку ЭЭГ на основе ВА, но и позволят провести физиологически значимую оценку результатов его применения. К таким методам относится предлагаемый в данной работе метод, основанный
на анализе цепочек локальных максимумов (ЦЛМ) для матрицы коэффициентов вейвлет-преобразо-вания. В его основу положены расчет и исследование поведения локальных максимумов в локальных спектрах (в матрице квадратов коэффициентов непрерывного вейвлет-преобразования) для относительно коротких (~ 0,1 с) отрезков времени. Полученные ЦЛМ (см. рис.) требуют, тем не менее, дальнейшей обработки с целью извлечения значимой информации о функционировании головного мозга человека или животных в различных состояниях.
Распределение локальных максимумов в матрице квадратов коэффициентов вейвлет-преобразования Ш2(а, Ь)
сигналов ЭЭГ, построенное на основе скейлограмм. Отведение Oz, частота дискретизации сигнала - 1 кГц. По горизонтальной оси отложено время в мс, по вертикальной - масштаб вейвлет-преобразования. Стрелкой указано наличие разрыва в ЦЛМ. Области: А - ЦЛМ первого, Б - второго, В - третьего, Г - четвертого, Д - пятого типов
Целью настоящего исследования является разработка метода получения физиологически значимой информации о работе головного мозга, основанного на анализе ЦЛМ, полученных в ходе обработки ЭЭГ человека в различных функциональных состояниях: покоя, решения в уме логических и образных задач. В основу метода положена парадигма, основанная на использовании идеологии выделения вызванных потенциалов головного мозга. Как известно [1], вызванные потенциалы представляют собой низкоамплитудные колебания электрического поля мозга, возникающие в ответ на определенные стимулы (вспышку света, резкий звук, щелчок, тактильное раздражение и т.п.) или предшествующие определенным действиям (например сокращению мышц) [2]. По-
скольку амплитуда вызванных потенциалов значительно ниже амплитуд колебаний для фоновой ЭЭГ, в предлагаемом методе для улучшения отношения сигнал/шум используется когерентное накопление фрагментов ЭЭГ, связанных с изучаемым стимулом, что позволяет провести детальный анализ вызванных потенциалов.
В ходе исследования проводится усреднение в частотно-временном пространстве частот локальных максимумов, присутствующих в данной ЦЛМ, для получения С, к - значений координат усредненной ЦЛМ 1-го типа: 1
=- X аш, (1)
п 1=1
где а,/,к - значение частоты локального максимума; = 1, ..., 5 - тип ЦЛМ; /=1, ..., - номер цепочки в массиве ЦЛМ данного типа / (номера цепочек устанавливаются в соответствии с их длиной, меньший номер соответствует большей длине, общее количество цепочек типа / равно »); к=1, ..., т1 - номер точки в конкретной ЦЛМ типа /; т1 -количество точек в наиболее длинной ЦЛМ 1-го типа.
Важным моментом при использовании данного метода является выбор начальной точки для усреднения ЦЛМ как в частотном, так и во временном пространстве.
Для решения этой задачи во временном пространстве были использованы два подхода.
В первом из них усреднение выполняется после совмещения первых точек ЦЛМ, так что значения времени появления первых локальных максимумов 4Ь 42, ..., 4я будут равны нулю, где 41 -время (или номер отсчета) появления первого локального максимума первой ЦЛМ; 42 - время (или номер отсчета) появления первого локального максимума второй ЦЛМ при его наличии; 4« -время (или номер отсчета) появления первого локального максимума п-й цепочки, используемой в расчетах. Затем проводится синхронизация всех координат ЦЛМ во временном пространстве, заключающаяся в том, что рассчитываются средние значения частот для усредненной ЦЛМ. В случае отсутствия в одной из ЦЛМ точки с определенными временными координатами (на рисунке этот случай указан стрелкой) в общей суммации для данной временной координаты такая ЦЛМ не участвует. Следовательно, здесь усреднение осуществляется только по точкам, полученным в ходе расчета ЦЛМ, без учета искусственно построенных точек, например, в результате аппроксимации или интерполяции, которые могут заполнять участки ЦЛМ без локальных максимумов.
Во втором подходе используется функция и,, характеризующая степень различия цепочек в частотном пространстве:
I+г
и. = У| а .. - а . I (2)
г=1
при /=1, 2, ..., т—г,; /=2, 3, ..., п,; г, - число точек в текущей ЦЛМ 1-го типа. Остальные обозначения те же, что и в формуле (1).
Требуется найти целое I, при котором значение функции и, будет наименьшим. Минимум функции и, будет указывать на такое взаиморасположение ЦЛМ во временном пространстве, при котором их различие в частотном пространстве будет минимальным. Таким образом, для получения итоговой усредненной ЦЛМ перед процессом усреднения каждая цепочка для />1 сдвигается во временном пространстве на / где I/ - значение I, соответствующее минимальному и, для цепочки 1-го типа с номером/.
Нетрудно заметить, что использование данного подхода, в котором ЦЛМ перед последующим усреднением выстраиваются, перемещаясь во временном пространстве путем изменения всех временных координат ЦЛМ за счет прибавления к ним константы I, позволяет минимизировать в частотном пространстве отличия данной ЦЛМ от ЦЛМ с максимальным числом локальных максимумов. При этом следует обратить внимание, что минимизация этих различий осуществляется именно с использованием шкалы значений, измеряемых в Гц, а не в масштабах вейвлет-преобразо-вания, так как в этом случае данные, полученные для разных вейвлетов для одного и того же сигнала, могут существенно различаться. К тому же, используя именно частотное пространство и зная разрешение различных вейвлетов для определенных масштабов вейвлет-преобразования исследуемого сигнала, можно наиболее корректно интерпретировать классифицированные данные.
Однако реализация данных способов усреднения ЦЛМ в описанном выше виде сталкивается с рядом проблем. В частности, длина ЦЛМ, как во временном пространстве, так и характеризуемая числом точек, зависит от частоты (масштаба вейв-лет-преобразования). Таким образом, суммация двух ЦЛМ, появившихся на ЭЭГ на частотах, например 3 и 35 Гц, представляется бессмысленной не только с физиологической точки зрения, но и с точки зрения численной обработки исследуемого сигнала. Для устранения данной проблемы применялось разделение на поддиапазоны всего исследуемого диапазона частот ЭЭГ: нижняя граница исследуемого поддиапазона бралась равной нижней границе 9-ритма, а верхняя - частоте Найкви-ста для данного электроэнцефалографа. Можно пользоваться таким разделением как в рамках классического варианта анализа ЭЭГ [3], так и путем построения поддиапазонов, исходя из динамических характеристик их границ, основанном на частотных значениях локальных минимумов, которые, подобно максимумам ЦЛМ, также изменяют свои частотные характеристики (способ исследования электроэнцефалограммы человека и животных защищен патентом № 2332160 в 2008 г.,
авторы: Я.А. Туровский, С.А. Запрягаев, С.Д. Кур-галин).
Другая проблема, возникающая при получении усредненных ЦЛМ методом когерентного накопления, связана с их весьма различающейся динамикой поведения во времени.
Как видно из рисунка, можно выделить пять различных типов характера поведения ЦЛМ.
1. ЦЛМ со стабильно нарастающей частотой (область А на рисунке). Такие ЦЛМ во многом свойственны ЭЭГ в состоянии покоя. Характер увеличения частоты локального максимума для разных случаев здесь различен, что, возможно, позволит выделить несколько подтипов данного типа поведения ЦЛМ. Поведение ЦЛМ в частотном пространстве различается как по скорости V дрейфа частот (v=ю^t, где ю - частота; t - время; V измеряется в Гц/с), так и по форме получившейся ЦЛМ в пространстве время - масштаб вейвлет-преобразования. Наблюдаются следующие виды динамики поведения ЦЛМ: а) линейно-равномерная (когда зависимость v(t) хорошо аппроксимируется линейной функцией); б) неравномерная (когда тренды, построенные по началу и концу ЦЛМ, отличаются от ее центральной части).
2. ЦЛМ со стабильно убывающей частотой (область Б на рисунке). Как и для ЦЛМ первого типа, характер снижения частоты для ЦЛМ данного типа достаточно сильно различается. Возможно, стабильно убывающий тип представляет собой обратный по сравнению с первым типом вариант функционирования осцилляторов, модулирующих электрическую активность головного мозга, порождающих поведение ЦЛМ первого типа.
3. ЦЛМ без динамики изменения в частотном пространстве (область В на рисунке). Осциллятор (или группа осцилляторов) головного мозга не увеличивает и не уменьшает свою частоту в пределах разрешающей способности используемого вейвлета.
4. ЦЛМ, в которых сначала происходит рост частоты, а потом ее уменьшение, при том, что ЦЛМ может завершиться как на более высокой, так и на более низкой по сравнению с начальной частоте (область Г на рисунке).
5. ЦЛМ, демонстрирующие первоначальное уменьшение частоты с последующим ее ростом. Как и для ЦЛМ предыдущего типа, отношение частот начала и завершения ЦЛМ может быть различным (область Д на рисунке).
Проведенная выше типологизация локальных максимумов матриц вейвлет-коэффициентов для
ЭЭГ имеет важное значение для исследования процессов ЭЭГ в различных функциональных состояниях человека.
С учетом и на основе представленной выше классификации различных типов характера поведения ЦЛМ авторами был разработан программный модуль дополнительно к уже существующему программно-аппаратному комплексу анализа ЭЭГ, включающему в себя два синхронно работающих электроэнцефалографа, компьютерный сервер и ряд вычислительных узлов, реализованных на технологии CUDA, обеспечивающих одновременное использование более 1 300 процессоров на видеокартах. Получены результаты, демонстрирующие изменение характера дрейфа элементов ЦЛМ в частотном пространстве и свидетельствующие о высокой чувствительности предлагаемого метода к различным состояниям головного мозга человека, зарегистрированным с помощью ЭЭГ. Разработаны индивидуальные карты динамики диапазонов, применяемых в анализе ЭЭГ для 19 испытуемых, которые проходили ряд тестов, связанных с решением логических и образных задач.
Разработанный метод, помимо его использования для анализа ЭЭГ, может быть применен для изучения различных биомедицинских сигналов: электрокардиографического, вариабельности сердечного ритма, суточного мониторинга артериального давления, лазерной допплеровской флоуметрии и др. Можно предположить, что его широкое использование позволит выявить новые закономерности и за пределами медико-биологических исследований.
Литература
1. Гнездицкий В.В. Вызванные потенциалы мозга в клинической практике. М.: МЕДпресс-информ, 2003. 264 с.
2. Психофизиология: учеб. для вузов; [под ред. Ю.И. Александрова]. СПб: Питер, 2012. 464 с.
3. Зенков Л.Р. Клиническая электроэнцефалография (с элементами эпилептологии). М.: МЕДпресс-информ, 2011. 356 с.
References
1. Gnezditskiy V.V. Vyzvannye potentsialy mozga v klini-cheskoy praktike [Evoked brain potential in clinic practice]. Moscow, MEDpress-inform Publ., 2003, 264 p.
2. Aleksandrov Yu.I. Psikhofiziologiya: ycheb. dlya vuzov [Psychophysiology: students book]. St. Petersburg, Piter Publ., 2012, 464 p.
3. Zenkov L.R. Klinicheskaya elektroentsefalografiya (s elementami epileptologii) [Clinic electroencephalography (with elements of epileptology)]. Moscow, MEDpress-inform Publ., 2011, 356 p.
Вниманию авторов
Аннотация к статье на русском и английском языках должна быть развернутой -не менее 200 слов (машинный перевод недопустим). Новые редакционные требования на сайте журнала www.swsys.ru.