Исследование основных проблем, связанных с распознаванием и идентификацией лиц по видеофиксации и совершенствование работы алгоритмов распознавания лиц по видеофиксации в режиме реального времени

Юрко Игорь Вячеславович; Алдобаева Василиса Николаевна

Список литературы / References

1. Расчет технологичности изготовления изделия. [Электронный ресурс]. Режим доступа: http://studbooks.net/1886063/matematika_himiya_fizika/raschet_tehnologichnosti_izdeliya/ (дата обращения: 10.05.2018).

2. Пашков В.П. Анализ и оценка технологичности изделий приборостроения. Санкт-Петербург, 2007.

3. Сагателян Г.Р. Расчет комплексного показателя технологичности изделия. Москва, 2010.

ИССЛЕДОВАНИЕ ОСНОВНЫХ ПРОБЛЕМ, СВЯЗАННЫХ С РАСПОЗНАВАНИЕМ И ИДЕНТИФИКАЦИЕЙ ЛИЦ ПО ВИДЕОФИКСАЦИИ И СОВЕРШЕНСТВОВАНИЕ РАБОТЫ АЛГОРИТМОВ РАСПОЗНАВАНИЯ ЛИЦ ПО ВИДЕОФИКСАЦИИ В РЕЖИМЕ РЕАЛЬНОГО ВРЕМЕНИ Юрко И.В.1, Алдобаева В.Н.2 Email: Yurko17126@scientifictext.ru

'Юрко Игорь Вячеславович - студент магистратуры; 2Алдобаева Василиса Николаевна - студент магистратуры, кафедра корпоративных информационных систем, Институт информационных технологий Федеральное государственное бюджетное образовательное учреждение высшего образования Московский технологический университет (МИРЭА), г. Москва

Аннотация: современные системы распознавания и идентификации по видеофиксации способны без участия человека обнаружить и отследить в реальном времени заданные цели (например, автомобиль, группа людей) или потенциально опасные ситуации (например, задымление, возгорание, несанкционированный доступ), после чего своевременно выдать тревожный сигнал. Еще одним преимуществом применения таких систем является значительное снижение нагрузки на коммуникационные каналы и архивную базу за счет фильтрации видеопотока в режиме реального времени.

Любые системы распознавания и идентификации по видеофиксации базируются на определенном алгоритме выявления соответствия считываемых характеристик заранее заданному шаблону. Видеокамера транслирует видеопоток на сервер в режиме реального времени, система распознавания и идентификации определяет соответствие хранящейся в базе данных информации, а идентификация происходит с учетом заранее определенных в системе факторов (например, усов или головных уборов). Ключевые слова: система распознавания, идентификация по видеофиксации.

STUDY OF THE MAIN PROBLEMS RELATED TO FACE RECOGNITION AND IDENTIFICATION BY VIDEO RECORDING AND IMPROVEMENT OF FACE RECOGNITION ALGORITHMS BY VIDEO RECORDING IN REAL TIME Yurko I.V.1, Aldobaeva V.N.2

'Yurko Igor Vyacheslavovich - Student of master's degree; 2Aldobaeva Vasilisa Nikolaevna - Student of master's degree, DEPARTMENT OF CORPORATE INFORMATION SYSTEMS, INSTITUTE OF INFORMATION TECHNOLOGIES FEDERAL STATE BUDGETARY EDUCATIONAL INSTITUTION OF HIGHER EDUCATION MOSCOW TECHNOLOGICAL UNIVERSITY"(MIREA), MOSCOW

Abstract: а modern system of recognition and identification on video capable without human intervention can detect and track in real time the performance objectives (e.g., car, group of people) or potentially hazardous situation (e.g., smoke, fire, unauthorized access), and then timely give an alarm signal. Another

advantage of using such systems is a significant reduction in the load on the communication channels and the archive base by filtering the video stream in real time.

Any .system of recognition and identification based on video recording based on a specific algorithm for determining the compliance of the characteristics of the read predetermined pattern. The video camera broadcasts the video stream to the server in real time, the recognition and identification system determines the correspondence of the information stored in the database, and the identification takes place taking into account the factors previously defined in the system (for example, mustaches or hats). Keywords: recognition system, identification by video.

УДК 004.932.724

Введение

Проблемы, связанные с распознаванием и идентификацией лиц по видеофиксации в режиме реального времени, можно классифицировать на следующие два направления:

1. Проблемы, связанные с обучением.

Обучение систем распознавания и идентификации лиц по видеофиксации в режиме реального времени реализуется посредством разделения и классификации отдельных объектов с указанием их принадлежности тому или другому образу. В результате обучения распознающая система приобретает способность реагировать соответствующими реакциями на объекты одного или различных образов. В качестве объектов обучения являются картинки, в той или иной степени отражающие лица людей.

2. Проблемы, связанные с распознаванием.

За обучением следует процесс распознавания новых объектов, который характеризует действия уже обученной системы. Автоматизация этих процедур и составляет проблему обучения распознаванию образов. В том случае, когда человек сам разгадывает или придумывает, а затем навязывает системе правило классификации, проблема распознавания решается частично, так как основную и главную часть проблемы (обучение) человек берет на себя.

Основная часть

Прежде чем начать процесс распознавания лиц, необходимо получить определенную упорядоченную информацию, представляющую собой характеристику объектов, их отображение на множестве воспринимающих органов распознающей системы [1].

Но каждый объект наблюдения может воздействовать по-разному, в зависимости от условий восприятия. Так, например, какое-либо лицо в одинаковых внешних условиях может смещаться относительно видеокамеры и находиться на различных расстояниях под различными углами. Кроме того, лица одного и того же образа могут достаточно сильно отличаться друг от друга, например в зависимости от нанесенного макияжа или состояния здоровья.

Каждое отображение какого-либо объекта на видеокамеры распознающей системы, независимо от его положения, принято называть изображением объекта, а множества таких изображений, объединенные какими-либо общими свойствами, представляют собой образы. При решении проблем, связанных с распознаванием и идентификацией лиц по видеофиксации в режиме реального времени, методами распознавания образов вместо термина «изображение» применяют термин «состояние».

Состояние можно определить, как отображение измеряемых текущих (или мгновенных) характеристик лица. Совокупность состояний определяет ситуацию. Понятие «ситуация» является аналогом понятия «образ». Но эта аналогия не полная, так как не всякий образ можно назвать ситуацией, хотя всякую ситуацию можно назвать образом. Ситуацией принято называть некоторую совокупность состояний сложного объекта, каждая из которых характеризуется одними и теми же или схожими характеристиками объекта [2].

Для того, чтобы система эффективно распознавала и идентифицировала лица по видеофиксации в режиме реального времени необходимо обеспечить максимальную инвариантность (на сколько это возможно в рамках алгоритма распознавания) к формам представления распознаваемых лиц -различным изображениям лиц в условиях воздействия внешних факторов. Такие факторы приведем в следующем перечне:

1. Освещение. Лицо должно правильно распознаваться независимо от месторасположения, количества и интенсивности источников света. На рисунке 1 приведено четыре изображения лица одного и того же человека в условиях различной освещенности.

Рис. 1. Изображения лица одного и того же человека в условиях различной освещенности

2. Положение головы в пространстве. В зависимости от предстоящей задачи распознавания, требуется инвариантность к различным углам поворота головы вправо-влево или вверх-вниз. Так, например, в идеальных условиях при поиске человека в толпе требуется инвариантность к повороту головы до угла ±90°, пример таких изображений представлен на рисунке 2.

||уж7 '»с I >{л|пс К Ж) Ьачк" ?•• Ьрт !•• lipin.ll Я

! гс I: 40 | |еик:1.1 М Праге 14 20 1.р.к И Ю 11виг» 16 ОО

I I_.il I? ■ 10 I 1ки|с 18 • 20 1 |рчгг - V» I |шгс 20 1'1 [ |дшт21 50

Рис. 2. Изображения лица одного и того же человека с различным положением головы в пространстве

3. Фон. Лицо должно распознаваться независимо от заднего фона, он может быть как однородным, так и произвольным. К фону также можно отнести прическу распознаваемого объекта.

4. Мимика лица. Система должна распознавать человека как с нейтральным, так и с грустным, веселым, смеющимся и кривляющимся лицом.

5. Масштаб изображения лица.

6. Частичное заслонение (очки, волосы, усы, борода и т.д.).

Рис. 3. Изображения лица одного и того же человека с различным частичным заслонением

Выбор исходного описания лиц, подвергающихся последующему анализу и распознаванию, является одной из центральных задач проблемы распознавания и идентификации. При удачном выборе исходного описания (пространства признаков) задача распознавания может оказаться тривиальной и, в тоже время, неудачно выбранное исходное описание может привести либо к очень сложной дальнейшей обработке данных, либо вообще к отсутствию решения [3].

Так, например, при сканировании лица анфас в помещении с отличной освещенностью хорошие результаты демонстрируют алгоритмы, работающие с двухмерными изображениями. Анализируя уникальные точки и расстояния между ними, система распознавания лиц определяет факт идентификации по коэффициентам различия между «живым» снимком и зарегистрированным шаблоном.

Трехмерные технологии устойчивы к изменению светового потока, допустимое отклонение от фронтального ракурса - до 45 градусов. Здесь анализу подвергаются не только точки и линии, но и свойства поверхностей (кривизна, профиль), метрика расстояний между ними.

Однако, для работы таких алгоритмов, требуется обработка видеозаписи высокого качества с частотой не менее 200 кадров в секунду, обусловленная не только высоким оптическим разрешением видеокамер и сведенной до минимума погрешностью синхронизации, но и высокой производительностью систем распознавания.

Таким образом, основной проблемой, связанной с распознаванием и идентификацией лиц по видеофиксации в режиме реального времени, является необходимость снижения уровня независимости работы системы от факторов освещённости, ракурса и возрастных изменений лиц наряду с вычислительными и производительными требованиями к используемым в системе устройствам [4].

Несмотря на значительное число исследований по разработке эффективных алгоритмов распознавания лиц, до сих пор не создана система, способная работать без учета многочисленных ограничений в виде шумов, расстояния до объекта или уровня освещенности. В действительности спроектировано довольно много эффективных алгоритмов, однако на практике получение качественного результата упирается в вычислительные мощности или воздействие внешних негативных факторов.

На практике, совершенствование работы алгоритмов распознавания лиц заключается в поиске оптимального соотношения эффективности распознавания и вычислительных мощностей в условиях воздействия внешних факторов. В дальнейшей работе представлены рекомендации по совершенствованию существующих алгоритмы распознавания в условиях неизменности архитектуры системы видеофиксации и вычислительных мощностей.

1. Сужение выборки распознавания посредством анализа рудиментарных особенностей схематических изображений лиц.

В рамках данной рекомендации предлагается на первых шагах отсеивать часть выборки, по которой производится сравнение с целью минимизации затраченных вычислительных мощностей. Так, например, рекомендуется разработать простейшие шаблоны, отражающие специфические особенности лиц (например, большой лоб или широкий разрез глаз). В качестве примера можно привести шаблоны, предлагаемые на рисунке 4.

Рис. 4. Примеры шаблонов, отражающих специфические особенности лиц 2. Оптимизация шаблонных изображений в части освещенности.

В качестве другой рекомендации можно предложить усовершенствовать изображения в базе данных системы для особо важных лиц (например, преступников) в части освещенности. Такие дополнения будут служить в некоторой части избыточными в базе данных, однако повысят эффективность распознавания особо важных лиц. На рисунке 5 представлены несколько вариантов изображения одного и того же лица в условиях разной освещенности.

£

Рис. 5. Изображение лица одного человека в условиях различной освещенности

3. Оптимизация шаблонных изображений в части повышения динамических свойств лиц.

Повышение эффективности распознавания лиц возможно также за счет улучшения динамических свойств. Необходимо отметить, что в рамках данной рекомендации говорится не о вращении камеры вокруг неподвижной головы, а о фиксации эмоциональных изменений в выражении лица или изменения при разговоре. Такие динамические свойства лиц, проявляемые исследуемым, помогают системе точнее выявить структуру лица и повысить качество распознавания.

Як

Morph sequence

■Lester -Stefan"

Рис. 6. Движения при отражении эмоций и речи 4. Повышение узнаваемости критически важных лиц.

В рамках данной рекомендации предлагается уделять особое внимание критически важным лицам, например, особо важным преступникам. По результатам проведенных исследований, люди сохраняют точность узнавания знакомых лиц на изображениях, сглаженных до размера

16х16 пикселей, при этом точность распознавания свыше 50% сохраняется при сглаживании до эквивалентного размера 7х10 пикселов (см. рис. 1), и становится практически равной максимально возможному значению при разрешении 19х27 пикселов. На рисунке 6 представлены изображения с лицами знаменитостей. Такие изображения представлены в плохом качестве, несмотря на которое возможность идентификации персоны сохраняется на значительном уровне.

,§ .* е £ г

О (К

Рис. 7. Повышение эффективности распознавания с ростом узнаваемости (популярности) лиц

Таким образом, необходимо обучить машинное зрение такому качеству. Другими словами, способность компенсировать деградацию изображений увеличивается с ростом степени знакомства. В алгоритмах распознавания изображений лиц необходимо предусмотреть возможность ввода параметра, влияющего на такой «интерес» системы распознавания к критически важным лицам.

5. Повышение значимости анализа бровей распознаваемого лица.

Важность анализа бровей подтверждена многими исследованиями - брови очень важны для передачи эмоций, что положительно сказывается на повышении эффективности распознавания. Кроме того, брови являются очень стабильным элементом, устойчивым к деградации разрешающей способности изображения [5].

6. Повышение значимости карикатуризации лиц.

Дело в том, что карикатурные изображения лиц обеспечивают качество распознавания равное или превосходящее уровень распознавания неискаженных лиц.

Дело в том, что карикатурные изображения могут преувеличивать отдельные отклонения формы или комбинировать отклонения формы и пигментации. Поскольку карикатуры искажают отдельные черты лица, индивидуальные отклонения лица от нормального играют повышенную роль при распознавали, что означает необходимость повышения влияния и учета данной рекомендации в рамках совершенствования существующих алгоритмов распознавания.

7. Повышение значимости свойств пигментации кожи.

Лица могут различаться по свойствам отражения света, что можно определить, как пигментация. На рисунке 8 представлены лица людей с различной пигментацией.

Рис. 8. Изображение лиц с различной пигментацией

Учет свойств пигментации в искусственных системах распознавания лиц должен улучшить качество распознавания. Дело в том, что анализ графических свойств формы или совокупности цвета, отражающей способности и прочих параметров одинаково важны для распознавания лиц. Следствием этого является то, что.

8. Повышение значимости цвета кожи или волос.

Как и в случае с пигментацией, структура яркости изображений лиц, крайне важна для повышения эффективности распознавания.

Рис. 9. Примеры влияния цвета на повышение эффективности распознавания лиц

Использования только яркости (т.е. монохромных изображений) вполне достаточно для адекватного распознавания лиц. Однако, в ситуациях, когда свойства формы оказываются неточными (например, при снижении разрешающей способности), алгоритм должен использовать информацию о цвете для повышения эффективности распознавания. Заключение

Несмотря на значительное число исследований, до сих пор не создана система, способная работать без учета многочисленных ограничений в виде шумов, расстояния до объекта, уровня освещенности и других внешних факторов. В действительности спроектировано довольно много эффективных алгоритмов, однако на практике получение качественного результата упирается в вычислительные мощности или воздействие внешних негативных факторов.

В данной статье были предложены рекомендации по совершенствованию работы методов распознавания лиц с целью повышения оптимальности соотношения эффективности распознавания и вычислительных мощностей в условиях воздействия внешних факторов.

Список литературы / References

1. Брилюк Д.В., Старовойтов В.В. Распознавание человека по изображению лица нейросетевыми методами. Минск, 2002. 54 с.

2. Кулябичев Ю.П., Пивторацкая С.В. Обзор методов идентификации людей на основе изображений лиц с учетом особенностей визуального распознавания. Москва, 2008. 3 с.

3. Рогозин О.В., Кладов С.А. Сравнительный анализ алгоритмов распознавания лиц в задаче визуальной идентификации МГТУ им. Н.Э. Баумана, Москва, 2013. 8 с.

4. Шерстобитов А.И., Федосов В.П., Приходченко В.А., Тимофеев Д.В. Распознавание лиц на групповых фотографиях с использованием алгоритмов сегментации. Ростов на Дону, 2013. 8 с.

5. Face Recognition by Elastic Bunch Graph Matching Laurenz Wiskott, Jean-Marc Fellous, Norbert Kruger and Christoph von der Malsburg. Computer Society Washington. DC, 1997. 23 с.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Юрко Игорь Вячеславович, Алдобаева Василиса Николаевна

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Юрко Игорь Вячеславович, Алдобаева Василиса Николаевна