Научная статья на тему 'ТЕХНОЛОГИЯ РАСПОЗНАВАНИЯ ЛИЦ'

ТЕХНОЛОГИЯ РАСПОЗНАВАНИЯ ЛИЦ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
598
103
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ЛИЦ / ОБРАЗ / ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Айткенова М.К., Кусаинова Улжан Болатовна, Нуран Шарапат Кайраткызы

Системы распознавания лиц используются сегодня во всем мире правительствами и частными компаниями. Их эффективность различна. Данная технология дает возможность производить автоматизацию на предприятиях, также способствует развитию защиты персональных данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ТЕХНОЛОГИЯ РАСПОЗНАВАНИЯ ЛИЦ»

УДК 004.93

ТЕХНОЛОГИЯ РАСПОЗНАВАНИЯ ЛИЦ

Айткенова М.К., Кусаинова У.Б., Нуран Ш.К.

Кокшетауский университет им. А. Мырзахметова (г. Кокшетау, Респувблика Казахстан)

Аннотация. Системы распознавания лиц используются сегодня во всем мире правительствами и частными компаниями. Их эффективность различна. Данная технология дает возможность производить автоматизацию на предприятиях, также способствует развитию защиты персональных данных.

Ключевые слова: распознавание лиц, образ, информационные технологии.

Распознавание лиц — это технология, которая позволяет автоматически идентифицировать (распознать, кто на фото) или верифицировать (подтвердить, что на фото именно этот человек) человека на фото, видео или вживую. Для распознавания используют нейросети, которые умеют считывать и анализировать уникальные черты человеческого лица, а затем сверять их с базой.

Первые эксперименты в области машинного распознавания лиц представил в 1960-х годах Вуди Бледсо — профессор Техасского университета в Остине, исследователь искусственного интеллекта. Его рабочая группа создала базу из 800 снимков людей в разных ракурсах. Далее ученые размечали лица 46 точками-координатами с помощью прототипа современного планшета. Посредством специального алгоритма система разворачивала лица под разными углами, увеличивала и уменьшала масштаб. На втором этапе алгоритм использовал 22 измерения, действуя согласно байесовской теории принятия решений — чтобы общий вывод был максимально точным. В итоге система, разработанная Бледсо, справлялась в 100 раз быстрее. На сегодняшний день данная технология развивается очень стремительно [1].

Распознавание лиц — программное обеспечение, которое отображает, анализирует, а затем подтверждает личность лица на фотографии или видео — является одним из самых мощных когда-либо созданных инструментов наблюдения. В то время как многие люди используют распознавание лиц просто как способ разблокировать свои телефоны, компании и правительства используют данную технологию для решения очень широкого круга вопросов.

Когда речь идет о принадлежащем вам устройстве или используемом вами программном обеспечении, вы можете отказаться или отключить распознавание лиц, но повсеместное распространение камер затрудняет использование этой технологии в общественных местах.

Обеспокоенность по поводу этой повсеместности, усиленная свидетельствами расового профилирования и идентификации протестующих, заставила крупные компании, включая Amazon, IBM и Microsoft, ввести мораторий на продажу своего программного обеспечения правоохранительным органам. Но по мере того, как срок моратория истекает, а технология, стоящая за распознаванием лиц, становится все лучше и дешевле, обществу необходимо будет ответить на важные вопросы о том, как следует регулировать распознавание лиц, а также о том, какие услуги каждый из нас готов использовать и чем придется пожертвовать.

Рассмотрим как работает программное обеспечение для распознавания лиц.

Большинство людей десятилетиями видели, как распознавание лиц используется в фильмах (видео), но оно редко изображается правильно. Каждая система распознавания лиц работает по-своему — часто построена на проприетарных алгоритмах, процесс можно разделить на три основных типа технологий:

Детекция — это процесс поиска лица на изображении. Если вы когда-либо использовали камеру, которая распознает лицо и рисует вокруг него рамку для автоматической фокусировки, вы

видели эту технологию в действии. Само по себе это не является распознаванием лиц, данная опция фокусируется только на поиске лица, а не личности, стоящей за ним.

Анализ (также известный как атрибуция) — это шаг, который отображает лица — часто путем измерения расстояния между глазами, формы подбородка, расстояния между носом и ртом — и затем преобразует это в строку чисел или точек, часто называемую «отпечаток лица». В фильтрах Goofy Instagram или Snapchat используется аналогичная технология (видео). Хотя анализ может страдать от сбоев, особенно связанных с ошибочной идентификацией [2].

Распознавание — это попытка подтвердить личность человека на фотографии. Этот процесс используется для проверки, например, в функции безопасности на более новом смартфоне, или для идентификации, которая пытается ответить на вопрос «Кто на этом изображении?».

Фаза обнаружения распознавания лиц начинается с алгоритма, который узнает, что такое лицо. Обычно создатель алгоритма делает это, «обучая» его фотографиям лиц. Если будет загружено достаточно картинок для обучения алгоритма, со временем он поймет разницу, скажем, между розеткой и лицом. Добавляя еще один алгоритм для анализа и еще один для распознавания, можно получите систему распознавания.

Разнообразие фотографий, загруженных в систему, сильно влияет на ее точность на этапах анализа и распознавания. Например, если наборы выборок в основном включают только мужчин — как это было при обучении систем раннего распознавания лиц — программам будет сложно точно идентифицировать лица мужчин и женщин.

В последние годы программное обеспечение для распознавания лиц начало исправлять эти проблемы, хотя некоторые программы неправильно идентифицирует лица азиатской и других рас. Мутале Нконде, сотрудник Лаборатории цифрового гражданского общества в Стэнфорде и член Консультативного совета по контенту TikTok, отмечает, что даже если системы работают идеально, проблемы с гендерной идентификацией остаются: «Ярлыки обычно бинарные: мужчина, женщина. Система такого типа не может смотреть на небинарных или даже на тех, кто произвел изменение внешности».

Как только компания научит свое программное обеспечение обнаруживать и распознавать лица, ПО может находить и сравнивать их с другими лицами в базе данных. Это шаг идентификации, на котором программное обеспечение обращается к базе данных фотографий и перекрестных ссылок, чтобы попытаться идентифицировать человека на основе фотографий из различных источников, от изображений с фотографий до изображений, скопированных из социальных сетей, далее отображаются результаты, обычно ранжированные по точности. Эти системы кажутся сложными, но с некоторыми техническими навыками можно самостоятельно создать систему распознавания лиц с готовым программным обеспечением [3].

Развитие в данной области происходит очень динамично. Так с 2016 по 2020 год точность распознавания лиц нейросетями улучшилась в 50 раз: коэффициент ошибок составил 0,8%. Согласно исследованию Facial Recognition Market 2019 года, мировой рынок распознавания лиц тогда оценивали в $3,2 млрд. Прогноз на 2024 год — $7 млрд, при ежегодном росте в 16%. Самые масштабные разработки в области распознавания лиц — у Google, Apple, Facebook, Amazon и Microsoft (GAFAM).

Сторонники распознавания лиц предполагают, что это программное обеспечение полезно правоохранительным органам тем, что наряду с идентификацией подозреваемых оно может отслеживать известных преступников и помогать идентифицировать детей-жертв жестокого обращения. В толпе оно может отслеживать подозреваемых на крупных мероприятиях и повышать безопасность в аэропортах или на пограничных переходах. Самый старый тип программного обеспечения для распознавания лиц пропускает фотографию через базу данных, контролируемую правительством, такую как база данных ФБР, содержащая более 400 миллионов фотографий, включая водительские права для идентификации подозреваемого. Местные полицейские управления используют различные программы для распознавания лиц, которые часто приобретаются у частных компаний.

Существует длинный список преимуществ ПО распознавания лиц, которые могут использоваться за пределами правоохранительных органов, добавляя удобство или безопасность

повседневным вещам. Распознавание лиц полезно для систематизации фотографий, для защиты устройств, таких как ноутбуки и телефоны, полезно для слепых и слабовидящих людей. Это может быть более безопасный вариант для входа в административные здания, защиты от мошенничества в банкоматах, регистрации на мероприятия или входа в онлайн-аккаунты. Рекламные и коммерческие приложения распознавания лиц обещают широкий спектр предполагаемых преимуществ, включая отслеживание поведения покупателей в магазине для персонализации рекламы в Интернете [4].

Хотя некоторые этические эксперты высказывают свои опасение по поводу данных нововведений. Бренда Леонг, старший советник и директор по искусственному интеллекту и этике на форуме Future of Privacy Forum, предупредила в интервью, что сторонники нововведений указывают на распознавание лиц как на замену программам лояльности или закрытому доступу: «Люди ведут себя иначе, когда за ними наблюдают. Действительно ли мы хотим, чтобы люди чувствовали, что постоянно находятся в подобной среде?».

Внедрение новых IT-разработок в программы лояльности - эффективный метод повышения продаж, оптимизации работы и популяризации бренда. Внедрение технологии распознавания лиц -одно из перспективных современных направлений усовершенствования программ лояльности. Большинство компаний стремится максимально упростить и оптимизировать взаимодействие бизнеса и целевой аудитории в рамках данных программ.

Данные полученные подобными системами могут быть использованы в различных предприятиях и в бизнесе для анализа предпочтений потребителей. Простыми словами, будущее распознавания лиц может принять любую из трех возможных форм: полное отсутствие регулирования, некоторое регулирование и запрет [5].

Библиографический список

1. Емельянов, С.В. Информационные технологии и вычислительные системы. Вычислительные системы. Компьютерная графика. Распознавание образов. Математическое моделирование. Выпуск №2, 2015: моногр. / С.В. Емельянов. - Москва: ИЛ, 2015. - 597 c.

2. Емельянов, С.В. Информационные технологии и вычислительные системы. Вычислительные системы. Математическое моделирование. Распознавание образов. Прикладные аспекты информатики. Выпуск №3/2014 / С.В. Емельянов. - Москва: СИНТЕГ, 2014. - 961 c.

3. Земцов, А. Алгоритмы распознавания лиц / Андрей Земцов. - М.: LAP Lambert Academic Publishing, 2011. - 128 c.

4. Кухарев, Г.А. Методы обработки и распознавания изображений лиц в задачах биометрии / Кухарев Георгий Александрович. - М.: Политехника, 2013. - 198 c.

5. Рожков, М. М. Использование текстурных карт Лавса и дискретного косинусного преобразования в задаче распознавания лиц: моногр. / М.М. Рожков. - М.: Синергия, 2011. - 507 c.

Айткенова М.К., доктор DBA, ст. преподаватель, Кокшетауский университет им. А. Мырзахметова (г. Кокшетау, Республика Казахстан).

Кусаинова Улжан Болатовна, ст. преподаватель, Кокшетауский университет им. А. Мырзахметова (г. Кокшетау, Республика Казахстан).

Нуран Шарапат Кайраткызы, магистрант по специальности «7М06119 -Информационные системы» Кокшетауский университет им. А. Мырзахметова (г. Кокшетау, Республика Казахстан).

e-mail: mahabat_89_is@mail.ru

Дата поступления: 03.05.2022

© Айткенова М.К., Кусаинов С.М., Нуран Ш.К., 2022

i Надоели баннеры? Вы всегда можете отключить рекламу.