Научная статья на тему 'Сравнительный анализ алгоритмов распознавания лиц'

Сравнительный анализ алгоритмов распознавания лиц Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
2658
309
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ЛИЦ / МЕТОД ВИОЛЫ-ДЖОНСА / МЕТОД ГЛАВНЫХ КОМПОНЕНТОВ / НЕЙРОННАЯ СЕТЬ ХОПФИЛДА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мухамадиева Кибриё Бахадировна

Описываются и анализируются современные методы распознавания лиц. На основе анализа методов, представляется, что перспективным может являться создание гибридных методов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мухамадиева Кибриё Бахадировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Сравнительный анализ алгоритмов распознавания лиц»

СРАВНИТЕЛЬНЫЙ АНАЛИЗ АЛГОРИТМОВ РАСПОЗНАВАНИЯ ЛИЦ

Мухамадиева Кибриё Бахадировна, старший преподаватель

(mkb78@mail.ru)

Бухарский инженерно-технологический институт, г.Бухара, Узбекистан

Описываются и анализируются современные методы распознавания лиц. На основе анализа методов, представляется, что перспективным может являться создание гибридных методов.

Ключевые слова: распознавание лиц, метод Виолы-Джонса, метод главных компонентов, нейронная сеть Хопфилда.

В настоящее время методы анализа данных активно развиваются в направлении обработки больших объемов данных. Источниками возникновения больших данных являются непрерывно поступающие данные с измерительных устройств (аудио и видео-регистрации и т.п.). Обработка изображений сегодня широко используется в системах безопасности для идентификации людей по изображениям лиц, мониторинга состояния технических объектов.

Одним из практических применений теории распознавания образов является распознавание лиц, в задачу которого входит автоматическая локализация лица на изображении и, при необходимости, идентификация человека по лицу. Интерес к процедурам, лежащим в основе процесса локализации и распознавания лиц, довольно значителен в связи с разнообразием их практического применения в таких областях, как охранные системы, верификация, криминалистическая экспертиза, телеконференции, компьютерные игры и т. д.

Технология идентификации личности на основе изображения лица, в отличие от использования других биометрических показателей, не требует физического контакта с устройством и с учетом стремительного развития цифровой техники является наиболее приемлемой для массового применения. Основной трудностью данной технологии является зависимость качества результата распознавания человека по изображению лица от ракурса, положения, условий освещенности и т. д. Выбор категории и метода для распознавания зависит от ограничений и условий задачи распознавания лиц. В качестве ограничений, влияющих на выбор метода решения задачи, следует выделить:

• наличие или отсутствие ограничений на возможные искусственные помехи на лице;

• пространственные характеристики положения лиц;

• цветность изображения;

• масштаб лиц и разрешение изображения;

• количество лиц на изображении;

• условия освещенности объектов;

• приоритет в минимизации ложных распознаваний или в количестве распознанных лиц.

Существует большое количество методов и подходов, использующихся в системах распознавания лиц [1]. Среди них можно выделить метод главных компонент (МГК), линейный дискриминантный анализ (ЛДА), скрытые марковские модели (СММ), вейвлеты Габора. При использовании скрытых марковских моделей [2] для решения задачи распознавания лиц для каждого класса лиц вычисляется своя скрытая марковская модель. Далее для неизвестного образа запускаются все имеющиеся модели, и среди них ищется та, которая выдаёт самый близкий результат. Недостатком такого подхода является то, что скрытые марковские модели не обладают хорошей различающей способностью, т.к. алгоритм обучения максимизирует отклик на свои классы, но не минимизирует отклик на другие классы. Методы распознавания, основанные на использовании вейвлетов Габора [3,4], показывают высокую эффективность. Фильтры Габора используются на стадии предобработки для формирования вектора Габор-особенностей изображения лица. Метод вейвлетов Габора устойчив к изменениям в освещении, поскольку не использует напрямую значения оттенков серого каждого пикселя, а извлекает особенности.

Далее в работе описываются и анализируются современные методы распознавания лиц.

Метод главных компонентов (Principal Component Analysis, PCA).

Идея метода состоит в представлении изображений лиц в виде набора (вектора) главных компонентов изображений, называемых «собственные лица» (Eigenfaces). Они, лица, имеют полезное свойство: что изображение, соответствующее каждому такому вектору, имеет лицеподобную форму. Вычисление главных компонентов сводится к вычислению собственных векторов и собственных значений ковариационной матрицы, которая рассчитывается из изображения. Сумма главных компонент, умноженных на соответствующие собственные вектора, является реконструкцией изображения.

Для каждого изображения лица вычисляются его главные компоненты. Обычно берется от 5 до 200 главных компонентов. Процесс распознавания заключается в сравнении главных компонент неизвестного изображения с компонентами всех известных изображений.

При этом предполагается, что изображения лиц, соответствующих одному человеку, сгруппированы в кластеры в собственном пространстве. Из базы данных выбираются изображения-кандидаты, имеющие наименьшее расстояние от входного (неизвестного) изображения [1].

Метод собственных лиц требует для своего применения идеализированных условий таких, как единые параметры освещенности, нейтральное выражение лица, отсутствие помех вроде очков и бород. При несоблюдении этих условий главные компоненты не будут отражать межклассовые вариации. Например, при различных условиях

освещенности метод собственных лиц практически неприменим, поскольку первые главные компоненты преимущественно отражают изменения освещения, и сравнение выдает изображения, имеющие похожий уровень освещенности. При соблюдении идеализированных условий точность распознавания с использованием данного метода может достигать значения свыше 90%, что является очень хорошим результатом. Вычисление набора собственных векторов отличается высокой трудоемкостью. Один из способов — это свертка изображений по строкам и столбцам- в такой форме представление изображения имеет на порядок меньший размер, вычисления и распознавание происходит быстрее, но восстановить исходное изображение уже невозможно.

Метод Виолы-Джонса. Данный метод является высокоэффективным для поиска объектов на изображениях и видеопоследовательностях в режиме реального времени [2- 3]. Этот детектор обладает крайне низкой вероятностью ложного обнаружения лица.

Метод хорошо работает и обнаруживает черты лица даже при наблюдении объекта под небольшим углом, примерно до 30°. Точность распознавания с использованием данного метода может достигать значения свыше 90%, что является очень хорошим результатом. При угле наклона больше 30° вероятность обнаружения лица резко падает. Указанная особенность метода не позволяет в стандартной реализации детектировать лицо человека, повернутое под произвольным углом, что в значительной мере затрудняет или делает невозможным использование алгоритма в современных производственных системах с учетом их растущих потребностей.

Сравнение шаблонов (Template Matching). Основа этого метода заключается в выделении областей лица на изображении, и последующем сравнении этих областей для двух различных изображений. Каждая совпавшая область увеличивает меру сходства изображений. Для сравнения областей используются простейшие алгоритмы вроде попиксельного сравнения.

Недостаток этого метода заключается в том, что он требует много ресурсов как для хранения участков, так и для их сравнения. Ввиду того, что используется простейший алгоритм сравнения, изображения должны быть сняты в строго установленных условиях: не допускается заметных изменений ракурса, освещения, эмоционального выражения и пр. Точность распознавания с использованием данного метода составляет около 80%, что является хорошим результатом.

Нейронная сеть Хопфилда. Алгоритм обучения сети Хопфилда существенно отличается от классических алгоритмов обучения персептронов тем, что вместо последовательного приближения к нужному состоянию с вычислением ошибок, все коэффициенты весовой матрицы рассчитываются по одной формуле, за один цикл, после чего сеть сразу готова к работе.

Ограничения метода:

— запоминаемые образы не должны быть сильно похожи— изображение не должно быть смещено или повернуто относительно его исходного состояния.

Для устранения этих недостатков рассматриваются различные модификации классической нейронной сети Хопфилда. Сеть Хоп-филда с ортогональным преобразованием позволяет восстанавливать сильно скоррелированные образы за счет преобразования их исходного множества к дуальному множеству векторов. Таким образом, получается нейронная сеть, которая может запоминать некоторое количество векторов, и при подаче на вход любого вектора, может определить, на какой из запомненных он более всего похож.

Точность распознавания с использованием данного метода составляет свыше 90%, а в ряде случаев — даже приближается к 100%, что является почти отличным результатом.

Среди современных работ, посвященных распознаванию лиц, отметим статью [6], в которой построена теоретико-вероятностная модель полутонового изображения и применен метод идентификации личности по фотографии лица на основе оптимального байесовского правила. В другой работе [5] решалась задача автоматического распознавания на основе принципа минимума информационного рассогласования. В работе [4] предложен оригинальный алгоритм распознавания лиц в режиме реального времени. В задачах идентификации лиц часто прибегают к использованию инвариантных моментов в качестве признаков. Так, в работе [8] применяется вектор особенностей, состоящий из 11 различных моментов, а в работе [1] исследуются свойства инвариантных моментов Показано, что инварианты имеют разную чувствительность к изменениям входных данных. Отметим капитальный в этой области труд [10], в котором систематизируются знания о применении инвариантных моментов. Укажем также на интересную работу [3], посвященную обработке трехмерных изображений, однако задача 3D-распознавания лиц еще недостаточно исследована. Разумеется, здесь нельзя не отметить подходы, связанные с выделением таких особенностей лица, как губы, нос, овал или профиль лица, но ввиду множества факторов, усложняющих анализ изображений (зашумления, повороты лица, выражения различных эмоций и др.) пока нет подхода, гарантирующего точное решение проблемы.

В настоящей работе предлагается комбинированный подход, в котором сочетаются следующие инструментальные средства: методы выделения инвариантных моментов методы формирования эталонных классов лиц; метрика Евклида-Махаланобиса [2] и аппарат искусственных нейронных сетей (ИНС).

Проведение вычислительных экспериментов показало перспективность комплексного подхода распознавания лиц по полутоновым фотографиям на основе метода инвариантных моментов и классификаторов на основе

метрики Евклида-Махаланобиса и вероятностной нейронной сети. При использовании метрики Евклида-Махаланобиса система справляется с поворотами и/или наклонами головы, а также с яркостными изменениями изображения. Вероятностная нейронная сеть лучше справляется с такими «сложными» для системы факторами как закрытые глаза, измененная мимика лица (улыбка, гримаса и т.п.). Недостатком нейронных сетей являются существенные временные затраты на обучение при больших объемах данных. Коренного улучшения результата, очевидно, следует ожидать после перехода на 3-D технологию распознавания лиц и применение высокопроизводительных вычислений для достижения реального времени при полном цикле обработки изображений.

Для большинства современных систем автоматического распознавания лиц основной задачей является задача сравнения заданного изображения лица с набором изображений лиц из базы данных. Характеристики систем автоматического распознавания лиц в этом случае оцениваются путем определения вероятностей ошибочного отказа в распознавании (ошибки первого рода) и ошибочного распознавания (ошибки второго рода).

В дополнение к вероятностям ошибок для оценки системы автоматического распознавания лиц часто используется оценка устойчивости к возмущению изображений, вызываемая комбинацией со сложными фонами, изменчивостью освещения, изменению прически, и т. д.

Учитывая вышеизложенное, представляется, что перспективным может являться создание гибридных методов, использующих преимущества и нивелирующих недостатки рассмотренных выше различных частных подходов.

Список литературы

1. Абрамов Н. С., Хачумов В. М. Распознавание на основе инвариантных моментов // Вестник РУДН. Серия: Математика. Информатика. Физика. — 2014. — № 2. — C.142-149.

2. Амелькин С. А., Захаров А. В., Хачумов В. М. Обобщенное расстояние Евклида-Махаланобиса и его свойства // Информационные технологии и вычислительные системы. — 2006. — № 4. — C. 40-44.

3. Баев А. А., Морозовский К. В., Роженцов А. А. Модифицированное обобщённое преобразование Хафа для обработки трёхмерных изображений с неизвестными параметрами вращения и масштабирования // Автометрия. — 2013. — № 2. — C. 30-41.

4. Брилюк, Д. Распознавание человека по изображению лица и нейросетевые методы / Д. Брилюк, В. Старовойтов. — Минск: Институт Технической Кибернетики Национальной Академии Наук Беларуси, 2001.

5. Viola, P. Rapid object detection using a boosted cascade of simple features / Р. Viola // IEEE Conf. on Computer Vision and Pattern Recognition. -Kauai, Hawaii, USA, 2001. — V 1. — P 511-518.

6. Viola, P. Robust realtime face detection / P. Viola // International Journal of Computer Vision. — 2004. -V 57. — №& gt- 2. — P. 137-154.

Mukhamadieva Kibriyo Bakhodirovna

Bukhara Engineering Technology Institute, Senior Lecturer

COMPARATIVE ANALYSIS OF FACIAL RECOGNITION ALGORITHMS Annotation. It describes and analyzes the modern methods of facial recognition. On the basis of the analysis methods, it seems that perspective may be the creation of hybrid methods. Key words: face recognition, Viola-Jones method, main components method, Hopfield neural network.

УДК 621.899:66.021.06

РЕГЕНЕРАЦИЯ ОТРАБОТАННЫХ МОТОРНЫХ МАСЕЛ С ИСПОЛЬЗОВАНИЕМ НАНОМЕМБРАН Пахотин Никита Евгеньевич, аспирант

(nepahotin@gmail.com) Осадчий Юрий Павлович, к.т.н., доцент Пахотина Ирина Николаевна, к.т.н., доцент Ивановский государственный политехнический университет,

г.Иваново, Россия

Отработанные масла собирают и подвергают регенерации с целью повторного использования. В данной статье предлагается новая комбинированная система разделения и очистки отработанного моторного масла, включающая нанофильтрацию.

Ключевые слова: отработанное моторное масло, регенерация, нанофильтрация, мембрана.

Регенерация - самый предпочтительный для окружающей среды способ утилизации отработанного масла. Это такой вид обработки, при котором из отработанного масла удаляются все загрязнители. Результат регенерации используют для производства того же самого масла. Это позволяет продлить срок службы смазочных материалов, сэкономить сырье и сохранить экологию.

Отработанные масла содержат в своем составе различные металлы, продукты старения, углеводороды нафтеновые, парафиновые, ароматические, смолы, минеральные кислоты, минеральную пыль, асфальто-смолистые продукты, сложные эфиры.

По мере накопления сажи, смол, асфальтенов моторное масло начинает интенсивно стареть. Это оказывает влияние на срок службы масла, отражается на технико-экономических показателях работы двигателя и автомобиля в целом [1].

Существующие способы разделения и очистки масел не позволяют вместе с механическими примесями удалять и продукты старения. Это доказывает необходимость разработки новых способов разделения и очистки отработанных масел. Существующие методы очистки не позволяют полностью удалять асфальто-смолистые соединения и продукты окисления.

i Надоели баннеры? Вы всегда можете отключить рекламу.