Научная статья на тему 'РАЗРАБОТКА АЛГОРИТМА РАСПОЗНАВАНИЯ ЛИЦ С УЧЕТОМ ОСОБЕННОСТЕЙ РАБОТЫ ЧЕЛОВЕЧЕСКОГО МОЗГА'

РАЗРАБОТКА АЛГОРИТМА РАСПОЗНАВАНИЯ ЛИЦ С УЧЕТОМ ОСОБЕННОСТЕЙ РАБОТЫ ЧЕЛОВЕЧЕСКОГО МОЗГА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
36
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ЛИЦ / РАБОТА ЧЕЛОВЕЧЕСКОГО МОЗГА / МЕТОД ЗОЛОТОГО СЕЧЕНИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Липин Юрий Николаевич

В данной статье приведен алгоритм распознавания лица, основанный на особенностях деятельности человеческого мозга во время распознавания изображения. Отличие данного подхода от существующих заключается в том, что лицо распознается, как единый графический образ, не обращая внимание на атрибуты лица (геометрия бровей, глаз, носа, губ и т. д.). При этом, расположение атрибутов лица подчиняется правилам золотого сечения. Представлены результаты работы алгоритма.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AN ALGORITHM FOR FACE RECOGNITION TAKING INTO ACCOUNT THE HUMAN BRAIN PECULIARITIE

This article presents an algorithm for face recognition, based on the human brain activity peculiarities during image recognition. The difference of this approach from the existing ones is that the face is recognized as a single graphic image, without paying attention to the attributes of the face (geometry of eyebrows, eyes, nose, lips, etc.). At the same time, the arrangement of facial attributes is subject to the rules of golden ratio. The results of the algorithm are presented.

Текст научной работы на тему «РАЗРАБОТКА АЛГОРИТМА РАСПОЗНАВАНИЯ ЛИЦ С УЧЕТОМ ОСОБЕННОСТЕЙ РАБОТЫ ЧЕЛОВЕЧЕСКОГО МОЗГА»

ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА

2023

• Математика. Механика. Информатика •

Вып. 2(61)

«Искусственный интеллект и машинное обучение»

Научная статья УДК 004.93.12

Б01: 10.17072/1993-0550-2023-2-59-64

Разработка алгоритма распознавания лиц с учетом особенностей работы человеческого мозга

Юрий Николаевич Липин

Пермский национальный исследовательский политехнический университет, Пермь, Россия иг-Ир 1935 3 0@уаМех. ги

Аннотация. В данной статье приведен алгоритм распознавания лица, основанный на особенностях деятельности человеческого мозга во время распознавания изображения. Отличие данного подхода от существующих заключается в том, что лицо распознается, как единый графический образ, не обращая внимание на атрибуты лица (геометрия бровей, глаз, носа, губ и т. д.). При этом, расположение атрибутов лица подчиняется правилам золотого сечения. Представлены результаты работы алгоритма.

Ключевые слова: распознавание лиц; работа человеческого мозга; метод золотого сечения

Для цитирования: Липин Ю. Н. Разработка алгоритма распознавания лиц с учетом особенностей работы человеческого мозга // Вестник Пермского университета. Математика. Механика. Информатика. 2023. Вып. 2(61). С. 59-64. Б01: 10.17072/1993-0550-2023-2-59-64.

Статья поступила в редакцию 01.12.2022; одобрена после рецензирования 22.02.2023; принята к публикации 18.06.2023.

Yury N. Lipin

Perm National Research Polytechnic University, Perm, Russia

ur-lip 1935 30@yandex. ru

Abstract. This article presents an algorithm for face recognition, based on the human brain activity peculiarities during image recognition. The difference of this approach from the existing ones is that the face is recognized as a single graphic image, without paying attention to the attributes of the face (geometry of eyebrows, eyes, nose, lips, etc.). At the same time, the arrangement of facial attributes is subject to the rules of golden ratio. The results of the algorithm are presented.

Keywords: facial recognition; human brain work; golden ratio method

For citation: Lipin Yu. N. An Algorithm for Face Recognition Taking Into Account the Human Brain Peculiarities. Bulletin of Perm University. Mathematics. Mechanics. Computer Science. 2023;2(61):59-64. (In Russ.).

DOI: 10.17072/1993-0550-2023-2-59-64.

The article was submitted 01.12.2022; approved after reviewing 22.02.2023; accepted for publication

«Artificial Intelligence and Machine Learning»

Research article

An Algorithm for Face Recognition Taking Into Account the Human Brain Peculiaritie

18.06.2023.

Эта работа © 2023 Липин Ю.Н. под лицензией СС BY 4.0. Чтобы просмотреть копию этой

лицензии, посетите http://creativecommons.Org/licenses/by/4.0/

Введение

К настоящему времени разработано большое количество разнообразных алгоритмов и программ по распознаванию лица человека [см., например, 1-4]. Общим для них является решение проблемы распознавания изображения так называемым подходом "от частного к общему" с применением различных сложных математических вычислений, требующих значительных вычислительных ресурсов. Возникает потребность в динамически развивающихся программных продуктах, способных удовлетворить требования современной науки и техники. Одним из подходов являются попытки использования предполагаемых алгоритмов распознавания, подобных распознаванию мозгом человека. Необходимо отметить, что любые ссылки в публикациях на эту тему и в данном материале необходимо воспринимать, как недоказанные гипотезы, но кое-что можно и использовать в алгоритмических и программных разработках.

Мозг человека решает проблему распознавания лица иначе - по этапам пол, возраст, "свой-чужой" - и тратит на это около 70 мсек [5]. Распознавание производится на двух уровнях - подсознании и сознания. Внешние данные из каналов восприятия формируют группу гипотез и на втором уровне отвергаются менее подходящими. Мозг в памяти не хранит один к одному фото или картинку. Запоминаются понятия, признаки, может и как образ единого. При этом решается проблема по принципу "от общего к частному" (образ-идентификация). Причем для процесса выделения признаков, запоминания, идентификации не используется арифметика или какие-то сложные математические операции. Мозг человека генерирует мысли, слова, речь, эмоции, образы, желания, фантазии, мечты, психическое состояние, действия; реагирует на состояние внутренних органов и событий внешнего мира; воспринимает своими органами чувств все происходящие изменения окружающего мира; запоминает в основном зрительные образы только очень позитивные и негативные неизвестного формата и способа хранения. Мозг человека способен распознать мгновенно лица на фото (особенно шаржи), в толпе, в режиме on-line, при изменении внешности (связанной с погодой, сезонами климата, состоянием здоровья, даже со спины и по

походке). При этом распознавание происходит в первую очередь всего образа через детали, как целого. Рассмотрим особенности распознавания лиц мозгом человека, некоторые из них учтены в предлагаемом в настоящей работе алгоритме. Некоторые пока использовать невозможно.

Изучением механизмов распознавания лиц человеческим мозгом исследователи занимаются на протяжении многих лет [5]. Важным аспектом в области компьютерного зрения является невозможность создания или создания в далеком будущем автоматизированной системы, способной превзойти способности человеческого мозга по распознаванию лиц или хотя бы сравняться с ними. Распознавание лиц мозгом человека характеризуется следующим [5]:

- распознавание лица мозгом человека происходит за время, равное долям секунды;

- к процессу распознавания не подключаются сложные математические методы;

- распознавание происходит "от общего к частному" или по крайней мере мгновенно по минимуму ряда признаков;

- люди способны распознавать знакомые лица на изображениях очень низкого разрешения;

- распознавание изображений, содержащих только контуры, для мозга человека для не вызывает трудностей (например, шаржи);

- черты лица обрабатываются, воспринимаются мозгом как единое целое. Причем в контексте целого лица геометрические соотношения между взятой чертой лица и остальной его частью превалируют. По мнению автора работы, брови явно недооценены специалистами по распознаванию лиц. В частности, процент узнанных лиц со стертыми бровями оказался значительно ниже, чем процент узнавания исходных портретов [1, 2], но в алгоритмах брови можно и не учитывать ввиду формата 200^300 и правил золотого сечения;

- использование точных измерений атрибутов (расстояние между глазами, ширина рта, длина носа) не приветствуется. Очевидно, искажения полностью сбивают алгоритмы, основанные на

измерении абсолютных размеров и соотношений размеров по осям x и у, повороте шеи;

- графические свойства формы и совокупность цвета одинаково важны для распознавания лиц;

- яркость, контрастность изображений лиц, конечно, очень важна для распознавания (для монохромных изображений);

- одной из гипотез того, как используется цвет в распознавании, является гипотеза диагностической роли информации о цвете (например, цвет кожи или волос может подсказать правильный ответ);

- освещение влияет на процесс распознавания, в алгоритме используется автоматическая коррекция яркости и контрастности;

- идентификация лиц и распознавание их выражений, вероятно, производятся различными системами [5]. Возможно ли извлекать информацию о выражении лица независимо от идентификации лица либо это взаимосвязано? Разделение этих двух задач происходит в самом начале обработки лиц, и существуют отдельные области мозга, отвечающие за идентификацию и за эмоции.

Согласно данным последних научных исследований, способность к распознаванию и запоминанию лиц зависит от типа личности [5]. При этом последовательность в цепочке распознавания лиц у мозга всегда одна и та же: сначала пол, возраст, эмоции, идентичность и лишь потом мозг начинает "соображать" знаком ли ему этот человек или нет.

Большинство существующих программ (например, Tonfonos, Pisaca, ASDSEE, Find Face{Ntegh.lab}, Face recording{Jasna Soft}, True Key™ от McAfee, IObit Applock Lite, Face2Gene, Face Lock Screen,BioID MojiPop, Railer - Face Recognition Attendance, Face IT DNA Technology, AppLock Face) по распознаванию лиц работают по принципу "от частных признаков к общему восприятию", при этом используют сложные математические методы и библиотеки [6-11]. Так ли иначе, все программы используют для анализа цветность пикселей. Программы получаются сложными и затратными по используемым ресурсам, в основном платными.

В данной работе разработан алгоритм распознавания лиц, в котором реализован подход распознавания лица по принципу "от общего восприятия к частным признакам" -атрибутам лица (бровей, глаз, носа губ и т. д.). Лицо распознается как единый графический образ, а расположение атрибутов лица подчиняется правилам золотого сечения [1, 2]: если известно горизонтальное положение бровей, то половина высоты "подбородок-брови" даст положение носа, минус 38 % от середины лица даст положение губ. Расстояние между бровями равно расстоянию между внутренних углов глаз и ширине глаза. Отношение высоты лица к ширине равно примерно 1.68. Этих знаний уже достаточно, чтобы построить сетку 6Х6 и получить 25 прямоугольников.

Данный алгоритм опубликован в ранних работах [3-4]. В данном алгоритме формируется цветовая палитра изображения, каждый компонент лица (брови, глаза и т. д.) так или иначе отображается цветами пикселей и этого становится достаточно для идентификации.

Разработка алгоритма и программного обеспечения

Все фото базы преобразованного видеопотока приводятся к формату 300х200 пикселей. База данных создается из фото, ранее записанного видеопотока или подготовленных фото. При чтении фото в зависимости от расширения (BMP.JPEG) формируется компонент Bitmap.

If upperCase(Dext)='.BMP' then begin Bitmap.LoadFromFile( Dpath+Dfio);

Else Jpg.LoadFromFile( Dpath+Dfio{ +'.JPG'}); Bitmap.Assign(JPG);

Далее этот компонент передается в модуль BirmapLite, в котором анализируется цвет не каждого пикселя, а строки в целом через функцию bitmapscanline. По каждому каналу цветности R,G,B контролируется цвет в пределах 80..200 и корректируется яркость и контрастность в пределах 100..156. с расчетом mах, min, средних значений. Производится выравнивание, растяжение цветов по всему изображению, Bitmap загружается в графический компонент Image10 (рис. 1). Общий цвет пикселя формируется по коэффициентам (0.3*Rc+0.59*G+0.11*B). В результате этих преобразований создается массив MM1[Ij];

Для получения овала лица и его координат Массив MM1[I,j]. пропускается через алгоритм Собеля с получением черно-белого массива MM2[I,j] и массивов координат овалов Mkor1[I,1] и Mkor2[I,1]. Оператор Собеля применяют в алгоритмах выделения границ. Это дискретный дифференциальный оператор, вычисляющий приближенное значение градиента яркости изображения. Результатом применения оператора Собеля в каждой точке изображения является либо вектор градиента яркости в этой точке, либо его норма. Метод усиления края с помощью оператора Собеля рассматривает два различных ядра свертки: mxx:tm32=((-1,0,1),(-2,0,2),(-1,0,1)); myy:tm32=((-1,-2,-1),(0,0,0),(1,2,1));

Исходя из этих сверток вычисляется величина и направление краев. Свертка для каждого ядра вычисляется отдельно;

В алгоритме применяется фильтр High Pass. Резкость изображения работает путем увеличения контрастности на краях объектов изображения. При увеличении контрастности светлые участки становятся еще светлее, а темные соответственно темнее и для нашего мозга изображение становится более резким. Чем больше мы будем усиливать контраст, тем резче будет казаться нам изображение. Фильтр High pass обнаруживает эти краевые контрасты. После того как края будут определены, прибегают к режиму наложения для увеличения резкости на краях объектов изображения. Ядро свертки представлено= ((0,-1,0),(-1,5,-1),(0,-1,0). Массив MM1[I,j] пропускается через данный фильтр и результат его воздействия виден на срединном изображении рис. 1. Повышение контрастности резкости этим алгоритмом позволяет улучшить качество рисунка, как и после Fotoshop;

Создается входной поток с записью в папку 50-2, состоящий из фото d gfgrt50-1 и дополнительно неизвестных базе объектов; Выполняется коррекция изображений для каждого фото из 50-1,50-2 по каждому каналу и для каждого пикселя (устранение шума, улучшение качества изображения, изменение и регулировка контраста и яркости в границах (95..145), баланса, подчеркивание границ перехода, растяжение контрастности, яркости, коррекция по цвету, максимального, минимального среднего значения (Rs,Gs,Bs) формированием результата MM1{I,J]:=RGB(Rs*0.3+Gs*0.59+,Bs*0.11). Для усиления границ Mm1[I,j] использовался

фильтр контрастности серых и цветных фото High Pass 1,2;

На наш взгляд, распознавание в целом, как образа, сводится к суммированию цвета пикселей без дополнительного преобразования независимо от их принадлежности к тем или иным объектам лица (брови, глаза и т. д.) в модуле Cobol1. При формировании овала лица были получены массивы левого и правого края овала Mkor1[I,1], Mkor2[I,1]. Размер каждой строки определялся границами овала и результат делился на разницу значений овалов. Результат помещался в массив M00[I], где I=45..300.

Размер вектора примем 25 значений с 26 значением, как среднее по вектору. Для этого в массиве M00[I] (размером 45..300 строк Часть лба пропущена), выбиралось 25 значений по 10 строк, суммировалось с делением на 10 значений с формированием массива Mst4[ii,i]], где II 1..Nf (Идентификатор фото), i=1..26, Nf1 - Номер значения вектора; Массив M00[I] содержит результат обработки цветов по каждому пикселю строки. Таким образом, в данном алгоритме не использовалась процедура Фурье.

Загрузка программы

Рис. 1. Результат работы программы

Кнопка Создание базы - заполняется файл идентификаторами базы данных заполняется файл идентификаторами базы данных.

Кнопка Входной поток - заполняется файл идентификаторами базы данных входного потока Work Basa - рабочее меню программы.

Создание базы - Расчет векторов базы данных.

Входной поток - Расчет векторов базы входного потока данных.

Возможен вариант по одному объекту.

Результат 92,97993043418 % (точность - 12 знаков после запятой).

AVG= 165 значение ГО Объекта 20 значение - 100 %.

База данных равна 22 объектам, входной поток 100 объектов, в который включено 22 объекта из базы данных.

Размер базы данных 22 объекта, и он определен в результате работы, остальные чужие распределились по своим непроходным процентам.

Значение % N = 99, 100 % 22; N = 96..98 % 17; N = 93..95 % 37N = 90..92 % 19; N = 86..89 % 3; N = 81..85 % 2; N = 76..80 % 0 N = 72..75 % 0; N = 68..71 % 0; N = 1..67 % 0 99..100 % 22 В этот диапазон попали все фото из базы данных, остальные разошлись по соответствующим процентам.

Сумма фото входного потока равна 22+17+37+19+3+2=100, что и было задано.

Ошибки 1.2. рода равны нулю.

Время сравнения двух векторов М8ее = 1.

Время формирования вектора из 25 значений Msec= 92.

Среднее значение цвета пикселя по изображению avg1= 159.

Выбор нужного объекта. База векторов размером 25 значений с средним значением находится в массиве Мй2[Щ, приходящий вектор находится в массиве МйЦУ]. Производится суммирование отношений значений 1..25 этих векторов с максимальным значением в знаменателе. При равенстве векторов сумма равна 25, разделив на 25 и умножив на 100, получим 100 %.

База данных векторов отсортирована по 26 значению, это позволяет при любом размере базы для анализа выбирать и использовать только три вектора.

Выводы

• Для получения результата используется идея распознавания графического объекта мозгом человека как единого целого;

• В процессе распознавания не обращается внимание на геометрию расположения элементов лица (брови, глаз и т. д);

• Возможно проводить идентификацию по одному фото;

• В процессе распознавания не используются ни арифметика, специальные разделы высшей математики и профессиональные пакеты, типа ОРЕСМ в том числе и Фурье;

• Предусмотрена возможность корректировки наклонов головы до 30 гр.;

• Предусмотрено использование фронтальных спокойных лиц без эмоций;

• Размер базы векторов не влияет на время распознавания, режим сортировок (при включении режима сортировки для анализа выбирается <=6 векторов).

Суть метода заключается в анализе световых параметров пикселей по каналам R,G.B. и использования фильтра High Pass 1,2. (он улучшает качество фото, см. рис. 1).

Список источников

1. Мухамадиева К.Б. Сравнительный анализ алгоритмов распознавания лиц // Современные материалы, техника и технологии. 2017. № 7(15). URL:

https://cyberleninka.ru/article/n/sravnitelnyy-analiz-algoritmov-raspoznavaniya-lits-1 (дата обращения: 18.02.2023).

2. https://habr.com/ru/company/synesis/blog/238 129/ (дата обращения: 18.02.2023).

3. https://habr.com/ru/company/ua-hosting/blog/588002/ (дата обращения: 18.02.2023).

4. Ахметзянов К.Р., Сазонов В.И., Липин Ю.Н., Южаков А.А. Программный комплекс распознавания лица человека // Вестник УГАТУ = Vestnik UGATU. 2017. № 3(77). URL:

https://cyberleninka.ru/article/n/programmnyy -kompleks-raspoznavaniya-litsa-cheloveka (дата обращения: 18.02.2023).

5. Распознавание лиц человеческим мозгом 19 фактов. Habrcom.com>ru/post/136483/.

6. Аракелян Г.Б. Математика и история золотого сечения. М.: Логос, 2014. 404 с. ISBN 978-5-98704-663-0.

7. Бендукидзе А.Д. Золотое сечение // Квант. 1973. № 8.

8. Липин Ю.Н. Сторорожев С.А. Development of an algorithm for human face recognition (2021 International Conference on Data Analytics for Business and Industry (ICDA-BI)).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Липин Ю.Н., Сторорожев С.А. Разработка программы моделирования алгоритмов систем распознавания лиц // VIII Всерос. науч.-практ. конф. с междунар. участием "Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века".

10. G. Yang and Thomas S. Huang. "Human face detection in a complex background. Pattern Recognition", 27(1):53—63, 1994.

11. C. Kotropoulos, I. Pitas. "Acoustics, Speech, and Signal Processing", 1997. ICASSP-97, 1997 IEEE International Conference on p. 2537-2540. Vol. 4

References

1. Muhamadieva K.B. Sravnitel'nyj analiz algo-ritmov raspoznavaniya lic. Sovremennye ma-terialy, tekhnika i tekhnologii. 2017;7(15). URL: https: //cyberleninka.ru/article/n/ sravnitelnyy-analiz-algoritmov-raspoznava niya-lits-1 (accessed: 18.02.2023). (In Russ.).

2. URL: https://habr.com/ru/company/synesis /blog/238129/ (accessed: 18.02.2023). (In Russ.).

3. URL: https://habr.com/ru/company/ua-hosting /blog/588002/ (accessed: 18.02.2023). (In Russ.).

4. Ahmetzyanov K.R., Sazonov V.I., Lipin YU.N., YUzhakov A.A. Programmnyj kompleks raspoznavaniya lica cheloveka. Vestnik UGATU. 2017;43(77). URL: https://cyberleninka.ru/article/n/programmnyy -kompleks-raspoznavaniya-litsa-cheloveka (accessed: 18.02.2023). (In Russ.).

5. Raspoznavanie lic chelovecheskim mozgom 19 faktov. Habrcom.com>ru/post/136483/ (accessed: 18.02.2023). (In Russ.).

6. Arakelyan G.B. Matematika i istoriya zoloto-go secheniya. M.: Logos; 2014. 404 p. ISBN 978-5-98704-663-0. (In Russ.).

7. Bendukidze A.D. Zolotoe sechenie. Kvant; 1973;8. (In Russ.).

8. Lipin YU.N. Stororozhev S.A. Development of an algorithm for human face recognition (2021 International Conference on Data Analytics for Business and Industry (ICDABI)). (In Russ.).

9. Lipin YU.N., Stororozhev S.A. Razrabotka programmy modelirovaniya algoritmov sistem raspoznavaniya lic (VIII Vseros. Nauch.-pract. konfereciya s mezhdunarodnym uchas-tiem "Iskusstvennyj Intellekt v reshenii ak-tual'nyh social'nyh i ekonomicheskih problem HKHI veka"). (In Russ ).

10. G. Yang and Thomas S. Huang. Human face detection in a complex background. Pattern Recognition. 1994;27(1):53-63.

11. C. Kotropoulos, I. Pitas. Acoustics, Speech, and Signal Processing. ICASSP-97. IEEE International Conference. 1997;4:2537-2540.

Информация об авторе:

Ю.Н. Липин - кандидат технических наук, доцент кафедры автоматики и телемеханики Пермского национального исследовательского политехнического университета (614990, Россия, г. Пермь, ул. Комсомольский проспект, 29).

Information about the author:

Yu. N. Lipin - Canidate in Technical Sciences, Associate Professor of the Department of Automatics and Telemechanics, Perm National Research Polytechnic University (29, Komsomolsky Prospect, Perm, Russia, 614990).

i Надоели баннеры? Вы всегда можете отключить рекламу.