Научная статья на тему 'Эволюционный подход к проблеме отбора признаков в задаче распознавания эмоций'

Эволюционный подход к проблеме отбора признаков в задаче распознавания эмоций Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
265
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОТБОР ПРИЗНАКОВ / FEATURE SELECTION / РАСПОЗНАВАНИЕ ЭМОЦИЙ / EMOTION RECOGNITION / МНОГОКРИТЕРИАЛЬНАЯ ОПТИМИЗАЦИЯ / MULTI-OBJECTIVE OPTIMIZATION / МЕТОД ГЛАВНЫХ КОМПОНЕНТ / PRINCIPAL COMPONENTS ANALYSIS / МЕТОД ОПОРНЫХ ВЕКТОРОВ / SUPPORT VECTOR MACHINE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иванов И.А., Сопов Е.А.

Решается подзадача снижения размерности признакового пространства в задаче распознавания эмоций. Проведено сравнение трех подходов к снижению размерности на пяти выборках данных: метод главных компонент, отбор признаков методом однокритериальной и многокритериальной оптимизации. Подход к отбору признаков методом многокритериальной оптимизации обеспечил лучшую точность классификации эмоций на большинстве выборок.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Иванов И.А., Сопов Е.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EVOLUTIONARY APPROACH TO FEATURE SELECTION IN EMOTION RECOGNITION PROBLEM

Feature space dimensionality reduction sub-problem of emotion recognition problem is being solved. Comparison of three approaches to dimensionality reduction is conducted on five datasets: principal components analysis, feature selection by using single-objective and multi-objective optimization methods. The multi-objective optimization approach to dimensionality reduction provided the best emotion classification accuracy on the majority of datasets.

Текст научной работы на тему «Эволюционный подход к проблеме отбора признаков в задаче распознавания эмоций»

Актуальные проблемы авиации и космонавтики - 2015. Том 1

УДК 519.68

ЭВОЛЮЦИОННЫЙ ПОДХОД К ПРОБЛЕМЕ ОТБОРА ПРИЗНАКОВ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ЭМОЦИЙ*

И. А. Иванов1 Научный руководитель - Е. А. Сопов2

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева

Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 E-mail: 1ilyaiv92@gmail.com, 2evgenysopov@gmail.com

Решается подзадача снижения размерности признакового пространства в задаче распознавания эмоций. Проведено сравнение трех подходов к снижению размерности на пяти выборках данных: метод главных компонент, отбор признаков методом однокритериальной и многокритериальной оптимизации. Подход к отбору признаков методом многокритериальной оптимизации обеспечил лучшую точность классификации эмоций на большинстве выборок.

Ключевые слова: отбор признаков, распознавание эмоций, многокритериальная оптимизация, метод главных компонент, метод опорных векторов.

EVOLUTIONARY APPROACH TO FEATURE SELECTION IN EMOTION

RECOGNITION PROBLEM

I. A. Ivanov1 Scientific supervisor - E. A. Sopov2

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: 1ilyaiv92@gmail.com, 2evgenysopov@gmail.com

Feature space dimensionality reduction sub-problem of emotion recognition problem is being solved. Comparison of three approaches to dimensionality reduction is conducted on five datasets: principal components analysis, feature selection by using single-objective and multi-objective optimization methods. The multi-objective optimization approach to dimensionality reduction provided the best emotion classification accuracy on the majority of datasets.

Keywords: feature selection, emotion recognition, multi-objective optimization, principal components analysis, support vector machine.

Задача машинного распознавания эмоций человека является перспективной прикладной задачей. Системы по распознаванию эмоций используются в диалоговых системах, обеспечивающих человеко-машинное взаимодействие. Задача распознавания эмоций, как и любая другая задача классификации, может быть разбита на три этапа: сбор и подготовка данных, предобработка данных, построение классификатора. Данная работа посвящена этапу предобработки данных, а именно, снижению размерности признакового пространства и отбору информативных признаков.

Классической областью применения методов отбора информативных признаков является молекулярная биология и медицина. В задачах анализа ДНК-микрочипов число признаков может достигать десятков тысяч, тогда как объем выборки не превышает нескольких тысяч. Большая часть признаков, как правило, оказываются малоинформативными, шумовыми. Наиболее часто встречающийся прием - использование стохастических алгоритмов оптимизации, таких как генетические алгоритмы (ГА), particle swarm optimization (PSO) в связке с алгоритмами классификации, например методом опорных векторов или ^-ближайших соседей [1; 2]. Такой оптимизационный подход позволяет находить подмножества признаков, оптимальных по конечной точности решения задачи.

Опишем процесс решения задачи распознавания эмоций по порядку. В качестве исходных данных была взята база данных SAVEE [3], в которой собраны короткие аудио- и видеозаписи четырех

* Работа выполнена в рамках проекта RFMEFI57414X0037.

Секция «Математические методы моделирования, управления и анализа данных»

мужчин, на английском языке читающих набор определенных фраз и имитирующих семь основных эмоций: злость, отвращение, страх, счастье, нейтральное состояние, грусть и удивление. Из аудио и видеозаписей были извлечены количественные признаки. Для извлечения количественных признаков из аудио была использована программа openSMILE [4], количественные признаки из видео были извлечены тремя алгоритмами: Quantized Local Zernike Moments (QLZM), Local Binary Patterns (LBP), Local Binary Patterns on Three Orthogonal Planes (LBP-TOP). Также все выборки были объединены в одну общую выборку с целью проверки улучшения точности классификации эмоций по аудиовизуальным признакам. Размерности полученных выборок представлены в таблице.

Следующий этап - снижение размерности полученных выборок. Были опробованы три подхода к снижению размерности: метод главных компонент (principal components analysis, PCA), отбор признаков (feature selection) методом однокритериальной и многокритериальной оптимизации. В одно-критериальной постановке максимизируемым критерием выступала точность классификации эмоций. В качестве алгоритма классификации был выбран метод опорных векторов. В многокритериальной постановке был добавлен второй критерий - количество используемых признаков. Данный критерий минимизировался, исходя из соображений, что меньшее число признаков обеспечивает простоту модели. Входной переменной в алгоритмах оптимизации служил бинарный вектор длины m, где m -число признаков используемой выборки. Единица в бинарном векторе означала, что признак с порядковым номером данного бита используется в классификации, ноль - не используется.

В качестве алгоритма однокритериальной оптимизации был выбран коэволюционный ГА. Параметры алгоритма: количество независимо работающих ГА: 5, общее число индивидов: 50, число поколений: 50, интервал адаптации: 5, размер штрафа: 10 %, минимальный гарантированный размер популяции ГА: 10 % от исходного. В качестве алгоритма многокритериальной оптимизации был выбран Strength Pareto Evolutionary Algorithm (SPEA). Параметры алгоритма: размер популяции - 50, число поколений -50, вероятность скрещивания - низкая, тип скрещивания - равномерное, максимальный размер внешнего множества - 50, вероятность мутации - низкая. Результаты экспериментов представлены в таблице.

Точность классификации эмоций (%), метод опорных векторов, различные выборки данных и подходы к снижению размерности

Выборки данных Число признаков выборки Точность классификации / новое число признаков

Все признаки Метод главных компонент Отбор п] эизнаков

Однокрит. оптимизация Многокрит. оптимизация

QLZM 656 10.506 21.458 / 36 20.208 / 301 24.911 / 319

LBP-TOP 177 22.847 32.017 / 10 40.278 / 77 45.694 / 90

LBP 59 20.486 23.75 / 4 25.972 / 33 25.694 / 31

Аудио 991 28.542 35.923 / 131 38.095 / 476 39.702 / 484

Аудио + видео 1883 19.732 31.718 / 180 33.661 / 902 35.893 / 885

Как видно из таблицы, подход к отбору информативных признаков методом многокритериальной оптимизации обеспечивает лучшую точность классификации эмоций на большинстве выборок. Объединение в одну выборку признаков, извлеченных из аудио и видео, не дало улучшения точности.

В будущей работе планируется провести более детальное исследование и сравнение представленных подходов к отбору информативных признаков путем использования других алгоритмов классификации, а также других алгоритмов оптимизации при отборе признаков.

Библиографические ссылки

1. Huerta E. B., Duval B. et Hao J.-K. A hybrid GA/SVM approach for gene selection and classification of microarray data. evoworkshops 2006, LNCS, vol. 3907, p. 34-44.

2. Jirapech-Umpai T. et Aitken S. Feature selection and classification for microarray data analysis : Evolutionary methods for identifying predictive genes. BMC bioinformatics, 2005, vol. 6, no. 1, p. 148.

3. Haq S., Jackson P. J. B. Speaker-dependent audio-visual emotion recognition. In Proc. Int. Conf. on Auditory-Visual Speech Processing (AVSP'09), Norwich, UK, p. 53-58, September 2009.

4. Eyben F., Wullmer M., Schuller B. OpenSmile - The Munich Versatile and Fast Open-Source Audio Feature Extractor. In Proceedings ACM Multimedia (MM), ACM, Florence, Italy, ISBN 978-1-60558933-6, p. 1459-1462, 25.-29.10.2010.

© Иванов И. А., 2015

i Надоели баннеры? Вы всегда можете отключить рекламу.