Решетневскуе чтения. 2014
УДК 004.93
АВТОМАТИЗИРОВАННОЕ ПРОЕКТИРОВАНИЕ СИСТЕМ РАСПОЗНАВАНИЯ
ИЗОБРАЖЕНИЙ С ПОМОЩЬЮ САМОКОНФИГУРИРУЕМОГО МНОГОКРИТЕРИАЛЬНОГО
АЛГОРИТМА SELFCOMOGA
И. А. Иванов, Е. А. Сопов
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 Е-mail: [email protected], [email protected]
Рассмотрена проблема проектирования систем распознавания пользователя по изображению. В качестве примера рассмотрена задача определения возраста по фотографии лица. Предложен новый подход, позволяющий автоматически формировать множество решающих правил, включающих различные комбинации фильтров для выделения признаков и конволюционной нейронной сети для распознавания. Проектирование осуществляется с помощью алгоритма SelfCOMOGA.
Ключевые слова: конволюционные нейронные сети, многокритериальный генетический алгоритм, распознавание изображений.
AUTOMATED DESIGN OF IMAGE RECOGNITION SYSTEM USING SELF-CONFIGURED MULTI-
OBJECTIVE ALGORITHM SELFCOMOGA
I. A. Ivanov, E. A. Sopov
Siberian State Aerospace University named after academician M. F. Reshetnev 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660014, Russian Federation Е-mail: [email protected], [email protected]
The research is devoted to the problem of system design for person identification through photo image. The person's age estimation is considered as example. A novel approach is proposed for generating a set of decision rules, which includes various combinations of feature extraction filters and the convolution neural network for recognition. The design is realized via SelfCOMOGA algorithm.
Keywords: convolutional neural networks, multi-objective genetic algorithm, image recognition.
Современные информационные технологии являются высокоинтерактивными, проблеме построения эффективных человеко-машинных интерфейсов (Human machine interface - HMI) уделяется значительное внимание: контекстный анализ активности пользователя, голосовые диалоговые интерфейсы и т. д. Сегодня практическая вся современная информационно-коммуникационная и компьютерная техника имеет возможность получать изображение пользователя (камеры на компьютерах и смартфонах, банкоматах, автоматах обслуживания, в автомобилях и т. д.). Анализ изображения пользователя позволяет обеспечить HMI дополнительной информацией, которую можно учитывать для повышения эффективности человеко-машинного взаимодействия. В частности, по анализу изображений можно получить такую неконтекстную информацию, как антропологические данные пользователя (пол, возраст, этнос и пр.).
В данной работе рассмотрена частная проблема распознавания возраста пользователя по изображению фотографии лица. В настоящее время данная проблема плохо решена, что связано, как минимум, со следующими причинами [1]:
1. Отсутствие технологии выделения информативных признаков на изображении, которые позволя-
ют решить задачу распознавания. При этом существует огромное количество различных частных приемов, использующих фильтры для обработки изображений.
2. Предобработка изображений и извлечение значимых признаков подразумевают решение задачи распознавания определенных частей лица человека (нос, рот, брови и т. д.), что само по себе является сложной задачей.
3. Возрастные признаки у разных людей выражены по-разному, следовательно, нет универсального метода оценки возраста человека.
4. Изображение человека получается в различных, неидеальных условиях (освещенность, угол съемки, посторонние объекты и артефакты на изображении).
Таким образом, возникает актуальная задача разработки эффективного алгоритмического обеспечения для решения задачи распознавания возраста пользователя. В данной работе предложен подход к автоматизированному генерированию интеллектуальных информационных технологий, обеспечивающих решение поставленной задачи.
Задача распознавания решается с применением конволюционных (сверточных) нейронных сетей
Математические методы моделирования, управления и анализа данных
(Convolution Neural Network - CNN) [2; 3]. В настоящее время этот тип сетей является наиболее подходящим для решения задач распознавания изображений. CNN реализуют идею глубокого машинного обучения (Deep Learning), т. е. обучения с использованием большого количества уровней представления информации для моделирования комплексных отношений в данных. Структура CNN включает чередование трех типов слоев (см. рисунок): сверточных слоев (Convolutional, C-Layer), слоев подвыборки (Subsampling, S-Layer) и полносвязных слоев (Fully-connected, F-Layer).
Convolution Fully connected
iUT
\
LO (Input) LI L2 L3 L4 F5 F6
512x512 256x256 128x128 64x64 32x32 (Output)
Пример структуры конволюционной сети
Такая комбинация слоев позволяет получить следующие преимущества при распознавании изображений:
- локальное восприятие: на нейроны поступает лишь некоторая часть изображения;
- разделяемые веса: для большого количества связей используется небольшой набор весов;
- обобщающие свойства: сеть игнорирует шумы и находит инварианты в изображении.
В качестве тестовых данных для настройки сети взята известная база данных фотоизображений лиц, накопленная исследователями Мичиганского университета (http://agingmind.utdallas.edu/facedb). База содержит более 1000 различных изображений людей разного пола и этноса, лица имеют различные эмоции.
Для выделения признаков (черты лица) в различных комбинациях применялись фильтры обработки изображений: Logarithmic, Canny, Zerocross, Prewitt, Sobel, Roberts.
Как известно, настройка нейронных сетей является сложной задачей. В данной работе для автоматизации генерирования структуры системы распознавания (комбинация фильтров и CNN) применяется самоконфигурируемый многокритериальный генетический алгоритм SelfCOMOGA [4; 5]. За счет много-критериальности обеспечивается возможность генерирования коллектива распознающих моделей, имеющих принципиально различную структуру и, как следствие, различные способы решения задачи распознавания.
Результаты исследования эффективности предложенного подхода сравнены с традиционным подхо-
дом, основанным на применении оператора локальных бинарных шаблонов (Local Binary Patterns - LBP) и метода опорных векторов (Support Vector Machine -SVM) [6]. Предложенный подход демонстрирует лучшие обобщающие возможности и качество распознавания, а применение алгоритма SelfCOMOGA обеспечивает решение задачи в автоматизированном режиме без привлечения специалистов по обработке изображений и распознаванию образов.
Библиографические ссылки
1. Geng X., Zhou Z.-H., Smith-Miles K. Automatic age estimation based on facial aging patterns // IEEE Trans. On PAMI. 2007. № 29(12).
2. Bishop C. M. Neural Networks for Pattern Recognition. Oxford University Press, 1995.
3. Simard P. Y., Steinkraus D., Platt J. C. Best Practices for Convolutional Neural Networks Applied to Visual Document Analysis // Intern. Conf. on Document Analysis and Recognition (ICDAR), IEEE Com-puter Society. Los Alamitos, 2003.
4. Иванов И. А., Сопов Е. А. Самоконфигурируемый генетический алгоритм решения задач поддержки многокритериального выбора // Вестник СибГАУ. 2013. Вып. 1(47).
5. Иванов И. А., Сопов Е. А. Исследование эффективности самоконфигурируемого коэволюционного алгоритма решения сложных задач многокритериальной оптимизации // Системы управления и информационные технологии. 2013. № 1.1 (51).
6. Abe S. Support Vector Machines for Pattern Classification. MIT Press, 2010.
References
1. Geng X., Zhou Z.-H., Smith-Miles K. Automatic age estimation based on facial aging patterns // IEEE Trans. On PAMI, 29(12), 2007.
2. Bishop C. M. Neural Networks for Pattern Recognition // Oxford University Press, 1995.
3. Simard P. Y., Steinkraus D., Platt J. C. Best Practices for Convolutional Neural Networks Applied to Visual Document Analysis // International Conference on Document Analysis and Recognition (ICDAR), IEEE Com-puter Society. Los Alamitos, 2003.
4. Ivanov I. A., Sopov E. A. Samokonfiguriumii genetichestii algoritm reshenia zadach podderzhki mnogokriterialnogo vibora (Self-configured genetic algorithm for multi-objective decision support) // Vestnik SibSAU, 1(47), 2013.
5. Ivanov I. A., Sopov E. A. Issledovaie effektivnosti samokonfiguriemogo koevolutsionnogo algoritma reshenia slozhnih zadach mnogokriterialnoi optimizatsii (On performance investigation of self-configured co-evolutionary algorithm for complex multi-objective optimization problem) // Control systems and information technologies, 1.1 (51), 2013.
6. Abe S. Support Vector Machines for Pattern Classification // MIT Press, 2010.
© Иванов И. А., Сопов Е. А., 2014