Научная статья на тему 'Распознавание лиц по изображениям'

Распознавание лиц по изображениям Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
2956
428
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ / АНАЛИЗ / МЕТОД / АЛГОРИТМ / 2D ИЗОБРАЖЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Исаев Андрей Львович, Газаров Денис Андреевич, Евсеев Сергей Дмитриевич

В статье рассматриваются методы распознавания лиц по двухмерным (2D) изображениям. Выделены основные достоинства и недостатки такого подхода. Особое внимание уделено анализу методов Eigenface, Виолы-Джонса и активной модели формы. Дана рекомендация для осуществления эффективного подхода к решению задачи распознавания.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Исаев Андрей Львович, Газаров Денис Андреевич, Евсеев Сергей Дмитриевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Распознавание лиц по изображениям»

несовершенством системы масляных уплотнений, а также в результате дегазации уплотняющего масла. В качестве решения данной проблемы были рассмотрены мероприятия по отказу от масла в системе маслоснабжения нагнетателя и замена масляных уплотнений опор на систему газодинамических уплотнений и электромагнитные подшипники (ЭМП). Для сравнения в масляных уплотнениях уровень дополнительной эмиссии от дегазации циркулирующего масла превышает уровень утечек через газовый затвор и составляет от 1,1 до 5,6 м3/мин, в зависимости от размера и рабочего давления компрессора. Для СГУ этот показатель составляет порядка 0,12 м3/мин. Однако, применяя систему управления технологическими потерями газа после СГУ, фактически можно свести данный показатель к нулю, так как появляется возможность использовать сэкономленный объем природного газа на технологические нужды. Кроме того, среди положительных черт от применения данных технологический решений можно выделить: снижение механических потерь нагнетателя в следствие применения ЭМП, увеличение ресурса работы механики опорных узлов, сокращение времени и периодичности технического обслуживания и ремонта, более низкое потребление электрической мощности по сравнению с масляной системой, прекращение загрязнения перекачиваемого газа маслом.

Список использованной литературы:

1. Китаев, С.В. Информационно-аналитические системы прогнозирования состояния магистральных газопроводов в полной технологической топологии / С.В. Китаев, М.И. Кузнецова, Ю.В. Колотилов. - Газовая промышленность. - 2016. - № 3 (735). - С. 92-95.

2. Байков, И.Р. Повышение энергетической эффективности работы центробежных компрессоров большой мощности на примере нефтеперерабатывающего завода / И.Р. Байков И.Р., Ш.З. Файрушин, С.В. Китаев, Ю.В. Колотилов. - Транспорт и хранение нефтепродуктов и углеводородного сырья. - 2016. - № 1. - С. 31-35.

3. Тухбатуллин, Ф.Г. Реализация эффективной работы компрессорной станции с соблюдением принципов промышленной безопасности техногенных объектов / Ф.Г. Тухбатуллин, А.М. Короленок, Ю.В. Колотилов. - Территория Нефтегаз. - 2015. - № 6. - С. 110-112.

4. Байков, И.Р. Перспективы энергоресурсосбережения в условиях длительно эксплуатируемой газотранспортной системы / И.Р. Байков, С.В. Китаев, И.А. Шаммазов. - Транспорт и хранение нефтепродуктов и углеводородного сырья. - 2012. - № 4. - С. 9-13.

5. Байков, И.Р. Методы повышения энергетической эффективности трубопроводного транспорта природного газа / И.Р. Байков, С.В. Китаев, И.А. Шаммазов. - СПб.: Недра, 2008. - 439 с.

6. Байков, И.Р. Определение показателей энергоэффективности в магистральном транспорте газа / И.Р. Байков, М.И. Кузнецова, С.В. Китаев. - Транспорт и хранение нефтепродуктов и углеводородного сырья. -2013. - № 3. - С. 46-49.

© Зиборов А.Ю., Прокопенко Д.В., Трифонов А.А., 2017

УДК 004.93

Исаев Андрей Львович

кандидат технических наук, доцент МГТУ им. Н.Э. Баумана

Газаров Денис Андреевич студент магистратуры МГТУ им. Н.Э. Баумана Евсеев Сергей Дмитриевич студент магистратуры МГТУ им. Н.Э. Баумана

г. Москва, РФ E-mail: isaeval@bmstu.ru

РАСПОЗНАВАНИЕ ЛИЦ ПО ИЗОБРАЖЕНИЯМ Аннотация

В статье рассматриваются методы распознавания лиц по двухмерным (2D) изображениям. Выделены

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» № 04-2/2017 ISSN 2410-700Х_

основные достоинства и недостатки такого подхода. Особое внимание уделено анализу методов Eigenface, Виолы-Джонса и активной модели формы. Дана рекомендация для осуществления эффективного подхода к решению задачи распознавания.

Ключевые слова

Распознавание, анализ, метод, алгоритм, 2D изображение.

Системы распознавания лиц актуальны в наше время. Они могут использоваться для охраны правопорядка, для скроллинговых систем банка и т.п. Существует множество методов распознавания по геометрии лица. Все они основаны на том, что черты лица и форма черепа каждого человека индивидуальны. Эта область биометрии многим кажется привлекательной, потому что люди узнают друг друга в первую очередь по лицу. Данная область делится на два направления: 2D распознавание и 3D (трехмерное) распознавание. У каждого из них есть достоинства и недостатки, однако многое зависит еще и от области применения и требований, предъявленных к конкретному алгоритму.

В данной статье рассматриваются методы распознавания лиц по 2D изображениям. Преимуществом этих методов, в отличие от большинства биометрических методов, является отсутствие необходимости использования дорогостоящего оборудования. Существуют и недостатки: низкая статистическая достоверность, повышенные требования к освещению, обязательно фронтальное изображение лица и др. Однако, системы распознавания лиц по двухмерным изображениям в силу указанного преимущества в настоящее время являются широко востребованными.

Результат распознания

_!_

Распознание образов

Признаки Анализ изображений

2Э изображение Обработка изображений

Г

20 изображение Рисунок 1 - Этапы работы системы распознания лиц

Этапы работы такой системы приведены на рис. 1. Здесь, обработка изображений - низкоуровневая обработка без детального изучения содержимого изображения. Она применяется для подготовки изображения к анализу и заключается в следующих действиях:

• восстановление;

• очистка от шумов;

• сжатие данных;

• улучшение характеристик (четкость, контраст и др.).

На входе и выходе этого этапа всегда находятся двухмерные изображения.

Анализ изображений - выделение из изображений объектов и измерение их параметров, представляет собой извлечение информации из изображения. Входом анализа изображений всегда является одно или несколько двухмерных изображений, к ним могут относиться изображения с цветной или черно-белой камеры, данные с ИК-камеры. Карта глубины тоже относится к двухмерным изображениям, хоть и

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» № 04-2/2017 ISSN 2410-700Х_

характеризует трехмерное пространство. На выходе получается вектор признаков с их значениями, и возможно, с вероятностными оценками.

Этап распознания образов представляет собой классификацию или кластеризацию вектора признаков, полученного от этапа анализа изображений. На выходе может быть либо номер образа (класса, кластера), либо вектор вероятностей принадлежности исходного изображения к образам. Трудности, возникающие при распознании лиц:

• перекрытые лица;

• различные повороты и наклоны головы;

• вариативность спектров, интенсивностей и углов освещения;

• лицевая мимика;

• старение.

В первых работах по компьютерному зрению осуществлялось построение модели простых геометрических тел по нескольким изображениям проекций. Результаты этого исследования применялись в роботах, которые собирали конструкции из разбросанных по столу деталей. Большинство ранних исследований по распознанию лиц не публиковались, что затрудняет исторический анализ. Первые системы распознания лиц были полуавтоматическими и требовали, чтобы оператор вручную осуществлял локализацию признаков на изображении (такие как глаза, уши, нос и рот). После чего система вычисляла расстояния до опорной точки, которые в дальнейшем и использовались для сравнения моделей. В 1971 году была опубликована работа [1, с.1], представляющая использующие 21 признак (такие как цвет волос, толщина губ и др.) для полуавтоматического распознавания.

Eigenface - одна из ранних полностью автоматических систем. Она была представлена в 1991 году [2, с.1]. Метод, положенный в ее основу, заключается в нахождении главных компонент из нормализованных изображений обучающей выборки. Т.е., по сути, сводится к понижению размерности обучающей выборки для упрощения будущего классификатора. Происходит это за 2 шага.

Шаг 1 - нормализация изображений. В обучающей выборке, состоящей из различных изображений одного лица очень много повторяющихся элементов. Для сокращения размерности следует исключить из изображений все общие компоненты, оставить только особенности. Для этого рассчитывается среднее изображение (рис. 2), состоящее из оценок математического ожидания соответствующих пикселей.

Рисунок 2 - Среднее изображение

Полученное среднее изображение вычитается из всех изображений обучающей выборки (рис. 3). В результате остаются только уникальные черты.

Рисунок 3 - Получение уникальных черт изображения путем вычитания среднего изображения

Шаг 2 - вычисление главных компонент. Вычисляются собственные вектора и собственные значения ковариационной матрицы. Отбираются несколько наиболее весомых собственных векторов. Отброс остальных приведет к незначительной потере информации, но при этом к существенному сокращению размерности. Отобранные собственные вектора и значения и представляют новое, сокращенное, пространство признаков. На основе этих данных строится классификатор.

Метод Виолы-Джонса был разработан в 2001 году Полом Виолой и Майклом Джонсоном [3, с.1]. Метод позволяет распознавать лица в полностью автоматическом режиме. Низкая алгоритмическая сложность позволяет использовать его в системах реального времени. Метод инвариантен к цвету кожи и освещения. Метод включает в себя использование признаков Хаара на стадии Анализа изображений, и классификатора AdaBoost (Adaptive Boosting) на стадии Распознания образов.

Признаки Хаара были представлены Виолой и Джонсом, и названы так из-за своего сходства с вейвлетами Хаара. Вейвлет Хаара представляет собой свертку одномерного сигнала, в виде разности двух ближайших отсчетов. Функция свертки изображена на рис. 4.

Рисунок 4 - Вейвлет Хаара

Признак Хаара представляет собой прямоугольную область, разделенную на две смежных области. Признаки накладываются на изображение на различных позициях и в различных масштабах. Значение признака определяется как разность сумм пикселей из областей. Примеры признаков Хаара изображены на рис. 5.

■ 0 ♦

Рисунок 5 - Примеры признаков Хаара

Каждый признак может показать наличие (или отсутствие) какой-либо конкретной характеристики изображения, таких как границы или изменение текстур. Например, признак из двух смежных прямоугольных областей может показать, где находится граница, между темным и светлым регионами. Наклонные признаки удачно расширяют пространство признаков, например, позволяют определить наличие края под углом в 45 градусов. Хоть с математической точки зрения идея наклонных признаков и является верной, но на практике возникают проблемы с округлением на изображениях низкого разрешения, которыми обычно и пользуются для обеспечения реального времени.

AdaBoosting (адаптивный бустинг) - это процедура последовательного построения композиции алгоритмов машинного обучения, когда каждый следующий алгоритм стремится компенсировать недостатки композиции всех предыдущих алгоритмов. В основе такой идеи лежит построение цепочки (ансамбля) классификаторов, который называется каскадом, каждый из которых (кроме первого) обучается на ошибках предыдущего. Бустинг является «жадным» алгоритмом, т.е. в каждом последующем каскаде делается локальный наилучший выбор в надежде, что итоговое решение будет правильным. Адаптивный бустинг является частным развитием бустинга, в котором каждый последующий каскад обучается только на тех выборках, на которых ошибся классификатор предыдущего каскада.

Активная модель формы была представлена Тимом Кутсом в 1995 году [4, с.1]. Активная модель -это статистическая модель, которая путем различного рода деформаций может быть подогнана под реальное изображение. Форму определяет ряд точек, расположенных на лице. Перед распознанием необходимо построить (обучить) статическую модель формы. Далее, при распознании, эта модель итеративно примеряется к реальному изображению, для определения схожести.

Обучение статистической модели формы происходит следующим образом. На вход поступает обучающая выборка. Каждый элемент выборки представляет собой множество помеченных точек. Расстановка точек для обучающей выборки осуществляется оператором по изображениям. Перемещения, повороты, масштабирование выполняются таким образом, чтобы минимизировать суммарное среднеквадратичное отклонение между элементами обучающей выборки. На рис. 6 изображен результат нормирования.

Рисунок 6 - Результат нормализации статистической модели формы

Каждой точке соответствует облако точек из обучающей выборки. Для сокращения размерности эти точки аппроксимируются по Гауссу (хотя в частных модификациях могут применяться другие распределения). Аппроксимация осуществляется методом главных компонент.

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» № 04-2/2017 ISSN 2410-700Х_

Варьируя параметрами модели, можно синтезировать из модели конкретные примеры формы (точные координаты точек), которые далее примеряются к изображениям. Примеры синтезируемых форм, полученных из одной модели, приведены на рис. 7.

Рисунок 7 - Примеры форм, синтезируемых статистической моделью формы для трех разных параметров

На этапе подгона формы к изображению синтезируемая форма определенным образом размещается на изображении. Это может быть случайное место или, например, заранее локализованное другим методом (например, методом Виола-Джонса) лицо. Далее для формы итеративно подбирается аффинное преобразование (транспонирование, масштаб, поворот) такое, чтоб минимизировать ошибку. Для оценки ошибки из каждой точки проводится нормаль (рис. 8), и вдоль нормали на изображении находится граница (наибольший дифференциал). Расстояние от точки, до границы на ее нормали представляет собой ошибку, усреднение которой для всех точек стремится минимизировать алгоритм.

Рисунок 8 - Оценка ошибки приближения модели

В модификациях алгоритма могут применяться другие метрики ошибки, например значение признака Хаара в точке. Пример итеративной подгонки изображен на рис. 9.

а в с

Рисунок 9 - Подгонка формы к изображению при увеличении количества итераций (от а до с)

При распознании лиц человеком, свойства пигментации не менее важны, чем свойства формы. Учитывать текстуру в контексте формы позволяет активная модель внешности, представленная Тимом Кутсом в 1998 году [5, с.1]. В данной модели текстура поделена на не пересекающиеся треугольники с вершинами в точках формы. В начале, форма нормализуется точно так же, как в активной модели формы. Текстура терпит те же преобразования, что и треугольники, на которых они расположены. В результате

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «СИМВОЛ НАУКИ» № 04-2/2017 ISSN 2410-700Х_

имеются облака соответствующих точек и множество сопоставленных текстур (рис. 10). Оба этих параметра усредняются посредством поиска главных компонент, а главные компоненты текстур ищутся подобно методу Eigenface.

Для сопоставления помимо конкретной формы синтезируется конкретная текстура. При сопоставлении итеративно уменьшается не только ошибка формы, но и ошибка текстуры.

После обзора и анализа методов распознавания лиц по 2D изображениям можно сделать вывод, что самым быстрым методом является метод Виолы-Джонса, но при этом его алгоритм является самым "жадным". Скорость работы алгоритма активной модели формы зависит от того сколько итераций придется пройти алгоритму для подгонки формы для минимизации возникновения ошибки. В результате можно предложить в качестве эффективного подхода к решению задачи распознавания комбинацию метода Виолы-Джонса и метода активной модели формы.

Список использованной литературы:

1. A.J. Goldstein, L.D. Harmon, A.B.Lesk, "Identification of Human Faces", Proc. IEEE, May 1971, Vol. 59, No. 5, 748-760.

2. M.A. Turk and A.P. Pentland, "Face Recognizing Using Eigenfaces", Proc. IEEE, 1991, 586-591.

3. P. Viola and M.J. Jones, «Rapid Object Detection using a Boosted Cascade of Simple Features», proceedings IEEE Conf. on Computer Vision and Pattern Recognition (CVPR 2001), 2001.

4. T.F. Cootes and C.J. Taylor and D.H. Cooper and J. Graham (1995). "Active shape models - their training and application". Computer Vision and Image Understanding (61): 38-59.

5. T.F. Cootes, G. J. Edwards, and C. J. Taylor. Active appearance models. ECCV, 2:484- 498, 1998.

© Исаев А.Л., Газаров Д.А., Евсеев С.Д., 2017

УДК 004.942

Куров Андрей Владимирович,

канд. техн. наук, доцент МГТУ им. Н.Э.Баумана

E-mail: avkur7@mail.ru Медведев Владислав Олегович, студент МГТУ им. Н.Э. Баумана, E-mail: vladrobot@mail.ru Соломатина Дарья Игоревна, студентка МГТУ им. Н.Э. Баумана, E-mail: solomatinadi95@gmail.com, г.Москва, РФ

ВИЗУАЛИЗАЦИЯ ДВИЖЕНИЯ АВТОМОБИЛЯ В ГОРКУ В СООТВЕТСТВИИ С РАЗРАБОТАННОЙ МАТЕМАТИЧЕСКОЙ МОДЕЛЬЮ ИМПУЛЬСНОГО УПРАВЛЕНИЯ ДВИЖИТЕЛЕМ

Аннотация

Рассмотрена математическая модель движения автомобиля в горку для прогнозирования тягово-

i Надоели баннеры? Вы всегда можете отключить рекламу.