Динамические алгоритмы выделения уникальных признаков из рукописной подписи человека
Р.Н. Дзямко-Гамулец Московский технический университет связи и информатики
Аннотация: В настоящие время для получения доступа к информации, содержащейся в автономных и внешних информационных системах, необходимо прохождение процесса авторизации, с использованием современных способов подтверждения личности, таких, как: парольная защита, защита на основе одноразовых кодов, защита на основе ЭП и т.д. Данные способы прекрасно работали и продолжают предоставлять защищённый доступ, однако биометрические методы аутентификации считаются намного более надёжными, когда доступ к конфиденциальной информации должен иметь лишь один пользователь. В данной работе рассматривается один из таких динамических методов биометрической аутентификации: верификация по рукописной подписи. В статье рассматриваются основные алгоритмы для верификации рукописной подписи при выделении уникальных динамических признаков, зависящих от временных и координатных значений анализируемых образцов рукописной подписи.
Ключевые слова: динамические алгоритмы, выделение признаков, время написания подписи, близость функций координат точек, преобразование Фурье.
Одним из самых распространённых направлений в создании надёжных методов аутентификации пользователей является биометрия - технология, посвящённая выделению уникальных биометрических характеристик человека и их дальнейшему сравнению с будущими образцами.
Биометрические методы аутентификации делятся на две группы: статические и динамические. Статические распознают физические параметры человека (отпечатки пальцев, радужная оболочка глаза, сетчатка
форма лица, рисунки вен), в то время, как динамические анализируют поведенческие характеристики человека (речь, почерк, походка, клавиатурный почерк) [1].
Введение
глаза,
Верификация рукописной подписи является одним из наиболее часто используемых методов при подписании физических договоров. Если эффективность биометрического метода достаточно высока, аутентификация по рукописной подписи может стать дополнительным способом подтверждения пользователя на веб-ресурсах и не только.
Уникальные признаки, получаемые из рукописной подписи пользователей, можно разделить на две категории: статические и динамические.
Алгоритмы выделения статических признаков рассматривают подпись как геометрическое множество точек или геометрическую кривую без учёта временных меток написания этих точек. То есть не берётся в расчёт, какой участок подписи был написан быстрее или медленнее, а важно лишь положение точек на плоскости.
В текущей работе рассматриваются алгоритмы вычисления динамических признаков, учитывающих зависимость написания подписи от времени, так как полученная информация может быть полезна для более точного сравнения двух экземпляров, поскольку каждому человеку, кроме индивидуального рисунка самой подписи, присущи и особенности
в скорости написания её различных участков.
Общий подход к выделению признаков
Поскольку в данной работе рассматриваются именно динамические методы извлечения признаков, сама подпись представляется в виде двух функций зависимостей координат от времени (1):
х = х (0,у = у(0 , (1)
Под признаками понимаются тензорные величины, получаемые по определенному алгоритму и характеризующие подпись [2]. После получения признаков требуется определить, как сравнивать две подписи по конкретному признаку. Для этого вводится понятие метрики, что означает близость двух тензорных величин. Она характеризует похожесть двух подписей с точки зрения рассматриваемого признака. Метрика задаёт функцию, которая двум элементам сравнения ставит в соответствие число, которое и характеризует эту близость и называется расстоянием между этими элементами. Выбор метрики должен соответствовать условию, согласно которому подписи, считающиеся более близкими по выделенному признаку, должны иметь меньшее значение расстояния по метрике, введённой для выбранного признака.
С новым экземпляром подписи пользователя сперва производится предобработка полученных данных для приведения их в удобную для сравнения форму. Различные признаки требуют разные степени глубины предобработки, а некоторым она вообще не нужна.
После выделения признака, новая подпись сравнивается с усреднённой подписью, полученной ранее на основе набора экземпляров, введённых пользователем во время этапа предоставления подлинных вариантов своей подписи. Сравнение осуществляется по введённой метрике для выбранного признака. Этот процесс происходит по всем необходимым признакам, после чего, из всех расстояний, полученных для каждого признака, находится усреднённая величина, которая и характеризует итоговое расстояние между подписями.
В данной работе рассматриваются алгоритмы для получения следующих признаков:
1. Время, затраченное на создание подписи;
2. Функциональная зависимость координат от времени;
3. Функциональная зависимость производных координат от времени;
4. Коэффициенты амплитуды и фазы преобразования Фурье функций, зависимость каждой из координат от времени.
Затраченное время на создание подписи
Для сравнения координатных функций, время написания подписи может дать определенную информацию о пользователе. Например, истинный пользователь затрачивает меньше времени на выполнение подписи, по сравнению со злоумышленником. Также у каждого человека есть свои особенности написания, что может отразиться на затраченном для написания привычных элементов подписи времени [3].
Пусть имеется множество точек подписи (2):
Р = {р., 1 = 1 ..Щ, (2)
где N - количество точек. Возьмём первую точку Ръ которая имеет наименьшую (самую раннюю) временную метку, а также точку Рм с наибольшей (самой поздней) временной меткой [4]. Тогда время написания подписи будет выражаться следующим образом (3):
(3)
где - временная метка точки , - временная метка точки .
Так как время, затраченное на создание подписи, представляется в виде числа, сравнение подписей по этому признаку происходит в виде (4):
р(Ч, г2) = | ^ - г2 | , (4)
где - время написания первой подписи, - время написания второй подписи.
Функциональная зависимость координат от времени
Данный признак представляет собой зависимости координат от времени, которые можно сравнивать как функции [5].
Имеются две функции для каждой из координат (5):
х = х (С),у = у(С) , (5)
Сравнивать функции можно по-разному, но один из вариантов сравнения - по разности площадей, которые находятся под ними. А именно: используя в качестве метрики интеграл модуля разности (6):
Р (Л 9) = £ I /(С) - 9 (С) I Л С, (6)
где и - начало и конец рассматриваемого временного интервала.
В данном случае, после предобработки временной промежуток находится в интервале от 0 до 1, поэтому для координатных функций имеются следующие формулы расчёта расстояний (7, 8):
(7)
Р (Ук У2) = /01 I У1 (С) - У2 ( О I Л С , (8)
Данные формулы для непрерывных функций заданы аналитически. В действительности, функции заданы множеством точек,
поэтому для вычисления интеграла можно воспользоваться формулой трапеций [6].
Определим функции (9, 10):
Г* = *11 - *2 и 1 = 1 ■■ N , (9)
ГУ = У1 1-У2и1 = Т77м, (10)
Для чисел г* возможны два варианта.
В первом случае соседние ординаты могут находится по одну стороны оси абсцисс (рис. 1):
х
/К
4-
/ • Л[ + 1 л( +1
—>
^+1
Рис. 1. - Случай при г* -г*+1 > 0
Во втором случае ординаты могут располагаться по разные стороны оси абсцисс (рис. 2):
х
Л
Рис. 2. - Случай при
В первой ситуации формула для вычисления площади трапеции выглядит следующим образом (11):
'1+и
Л,
(11)
во второй ситуации для вычисления точки пересечения с осью абсцисс необходимо воспользоваться подобием треугольников (12):
ГI I _
ГЙ-1.1
С
п - t,
(12)
где ? - расстояние от /-й точки до точки пересечения с осью абсцисс. Отсюда следует (13, 14):
^ = , (14)
М Инженерный вестник Дона, №3 (2024) ivdon.ru/ru/magazine/arcliive/n3y2024/9088
Тогда по формуле суммы площадей треугольников, площадь трапеции выражается следующим образом (15):
5? =
кГК + И^-Ф-о _ (гГ)2+(т&г)2 2 Н\г*\ + \г?+1\-)
Л,
(15)
Аналогично, для 5 У (16):
„У _ + _ (гП2 + (г?+1)2 ,
5 " 2 "2 • ( | г/ | + | г£ х | ' (16)
Полная сумма получается (17, 18):
„(у. 1 у.2л _ „х _ Сх — Ь Vм х1) +(х1+1 х1+г)
Р (х , X ) " 5 " 2, * = 15 " 4.к2 .( | Х1- Х2 | + | х1 ^ 1 | ) - (17)
п(лЛ Л12\ _ „у _ у^ (у1~у1)2 + (.У 1+1 -у1+ г)2 п оч
р (У , У ) " 5 " ь.15 " к2 . (| У1-„?|+| у^-УЬ 1 | ) - (18)
где к " -—- - интервал между точками.
Стоит отметить, что поскольку сравнение предполагается только для одинакового количества точек на единичном временном интервале, то для всех экземпляров подписей величина шага будет одной и той же [7]. Поэтому при сравнении эту величину можно опустить.
После нахождения разности по каждой из координат, итоговая разность вычисляется, как норма двумерного вектора, составленного из координат разностей (19):
Р ( 51 - 5 2 ) " | (рх- Ру) | " ТРж+Ру, (19)
где - первая подпись, - вторая подпись, - расстояние между координатами х подписей, рУ - расстояние между координатами у подписей.
Функциональная зависимость производных координат от времени
Данный признак анализирует производные функции координат точек по времени, что позволяет сравнивать скорости написания различных участков подписи. Поскольку пользователи могут писать одни и те же буквы или линии с разной скоростью, этот признак позволяет распознавать непохожесть экземпляров на основании их различий во временном распределении написания точек.
Для выделения этого признака необходимо сравнить производные функций координат от времени, которые также будут функциями от времени (20):
х' = х' (0,у' = У'(0 (20)
Поскольку функции заданы точками, а не аналитически, то для их вычисления следует применять численную производную. Существуют левосторонняя производная (21), правосторонняя (22), а также центральная (23):
х ' = * 1 - левосторонняя производная, (21)
х' = *+1 * - правосторонняя производная, (22)
х ' = ——--центральная производная. (23)
В данной работе используется центральная производная, так как её точность аппроксимации лучше, чем у других двух [8].
Сравнение производных функций производится аналогично обычным функциям координат, а именно: вычислением интеграла модуля разности функций (24, 25):
Для численного вычисления используются формулы, аналогичные формулам функций координат.
Преобразование Фурье координат, представленных функцией от
Работа данного метода заключается в том, что для каждой координаты, представленной функцией от времени, выполняется преобразование Фурье. Поскольку производится работа с дискретными функциями в виде последовательности точек, необходимо применить дискретное преобразование Фурье. В результате получается набор комплексных значений, представляющих собой комплексные амплитуды [9]. По ним определяется вещественная амплитуда и фаза.
Смысл этого преобразования в том, чтобы разложить сигнал в набор гармоник (синусоидальных сигналов), где каждая следующая гармоника имеет более высокую частоту. В этом случае можно ограничиться лишь некоторым количеством основных низкочастотных сигналов, а высокочастотные отбросить, так как они обычно менее существенны и могут быть подвержены влиянию шумов [10]. Формулы для преобразования функций координат имеют вид (26, 27):
(24)
(25)
времени
у _ у!^ ( (
лк ~ Ьп=\хп
2ттк(п—1) . N
) — I 5Ш
2ттк(п—1) N
)) , (26)
II
у» = Я-! Уп (cos - (sin (2^)) , (27)
где X» , У» - k-ая комплексная амплитуда функций координат, хп, уп - значение функций координат в точке n, N - общее число точек
и частот, к - номер частоты, к = 1 .. N.
После нахождения этих функций решается вопрос о количестве частот, которое будет учитываться, обозначим это число, как М (28):
М < N , (28)
Затем находятся вещественные амплитуды для к-й гармоники обеих функций (29):
^xfc — ' £ ' , ^yfc — ' ^ ' > (29)
А =\1]А А -
а также фазы (30):
<Pxfc — arg (Xfc), <р yfc — a rg ( rfc) , (30)
где arg - аргумент комплексного числа.
Из гармоник составляются два вектора (31, 32):
- = х 1' - у 1 ' - х2' - у2 ■ ■ хМ' - ум) ' (31)
Ч> = ( <Р х 1' Ч>у 1' <Р х 2' <Ру 2 ■ ■ -'^хМ' ^ у М) ' (32)
Эти векторы используются для оценки близости двух подписей [11]. Пусть для первой подписи полученные векторы , , а для второй - ,
< 2, тогда метрика, выражающая близость подписей, будет выражена следующей формулой (33):
В данной работе был сделан акцент на рассмотрении выделения динамических признаков из подписи, представленной в виде зависимости функций координат от времени. Наиболее простой способ выделения признака и определения близости экземпляров по нему - это анализ и сравнение времени, затраченного на написание подписи. Более сложные варианты
- сравнение самих функций координат определенными способами. В качестве одного из способов была выбрана мера, выраженная площадью под графиком функции, представляющей собой модуль разности соответствующих координат двух подписей, что выражается в виде определенного интеграла. Для его вычисления был применён численный метод, называемый методом трапеций.
Аналогично был представлен подход, который вместо самих функций координат использует производные этих функций по времени [12].
Также представлено преобразование Фурье для получения координат подписи и её гармоник, что даёт возможность выделения главной части сигнала и удаления менее существенной информации. Кроме того, были описаны способы сравнения подписей по каждому признаку в виде значений метрик, для которых также были указаны формулы вычисления.
/Фк 52) = ^\А1-А2\2 + \(р1-(р2\2,
(33)
Заключение
По сравнению со статическими методами, которые анализируют геометрическую структуру подписи, подходы, рассмотренные в данной работе, позволяют выделить большое количество признаков, предоставляющих возможность проанализировать отличия между экземплярами подписей с различных сторон. Это позволяет более точно определить, насколько близки или непохожи два экземпляра, что уменьшает ошибки I и II рода во время принятия решения об истинности или фальшивости полученной подписи.
Литература
1. Дикий Д.И., Елисеева В.В., Нечаева Н.В. Обзор алгоритмов оценки динамических характеристик почерка // Сборник трудов V Всероссийского конгресса молодых учёных. Материалы конгресса: В 2 томах. 2016. С. 141-145. URL: elibrary.ru/download/elibrary_30369724_99584939.pdf
2. Коломников Р.Е. Извлечение признаков динамической рукописной подписи на основе скрытой Марковской модели // Сборник избранных статей научной сессии ТУСУР. 2023. № 1-2. С. 156-159. URL: elibrary.ru/download/elibrary_54595069_95057198.pdf
3. Аримпилов С.Н. Генерация и исследование входного пространства признаков для нечёткого классификатора аутентификации пользователя по рукописной подписи // Сборник избранных статей научной сессии ТУСУР. 2019. № 1-2. С. 38-41. URL: elibrary.ru/download/elibrary_41044970_18173501 .pdf
4. Старостина А.В., Куляс О.Л. Подготовка наборов данных для обучения нейросетевой системы идентификации личности по рукописной подписи // Universum: Технические науки. 2023. № 8-1 (113). С. 23-29. URL: elibrary.ru/download/elibrary_54481814_79963357.pdf
5. Сарин К.С., Ходашинский И.А. Метод Бэггинга и отбор признаков в построении нечётких классификаторов для распознавания рукописной подписи // Компьютерная оптика. 2019. Т. 43. № 5. С. 833845.
URL: elibrary.ru/download/elibrary_41496866_95801522.pdf 6. Друки А.А., Милешин М.А. Алгоритмы распознавания рукописных подписей на основе нейронных сетей // Фундаментальные исследования. 2014. № 11-9. С. 1906-1910. URL: elibrary.ru/download/elibrary_22564626_41774880.pdf
7. Финогеев Е.Л., Терехова Ю.В. Исследование зависимости точности распознавания рукописных подписей от языковой группы с использование глубоких нейронных сетей // Материалы Второго Международного научно-практического форума по экономической безопасности «VII ВСКЭБ». Материалы форума. Москва, 2021. С. 97-104. URL: elibrary.ru/download/elibrary_45783201_31947610.pdf
8. Плинатус А.А., Круглов Л.М. Актуальные вопросы исследования изображений почерковых объектов // Научный портал МВД России. 2021. № 3 (55). С. 52-56. URL: elibrary.ru/download/elibrary_47507895_78625771.pdf
9. Иванов Ю.С., Гончарук С.Е. Сравнение признаковых описаний в задачах распознавания рукописной подписи // Вестник научного общества студентов, аспирантов и молодых учёных. 2016. № 2. С. 6873.
URL: elibrary.ru/download/elibrary_26232235_16022927.pdf
10. Андреевских Д.А., Коломников Р.Е. Аутентификация по динамической рукописной подписи с отбором глобальных информативных признаков
// Сборник избранных статей научной сессии ТУСУР. 2022. № 1-2. С. 68-71. URL: elibrary.ru/download/elibrary_49525429_69825723.pdf 11.Островский А.А., Жариков Д.Н., Лукьянов В.С. Система биометрического анализа подписи, основанная на сверхбольшой искусственной нейронной сети // Известия Волгоградского государственного технического университета. 2011. № 9 (82). С. 92-94. URL: elibrary.ru/download/elibrary_17041950_91555306.pdf 12.Пятаева А.В. Распознавание рукописной подписи на основе технологий машинного обучения // Решетневские чтения. Материалы XXV Международной научно-практической конференции, посвящённой памяти генерального конструктора ракетно-космических систем академика М.Ф. Решетнева. В 2-х частях. Под общей редакцией Ю.Ю. Логинова. Красноярск, 2021. С. 393-395. URL: elibrary.ru/download/elibrary_47711950_54142739.pdf
References
1. Dikij D.I., Eliseeva V.V., Nechaeva N.V. Sbornik trudov V Vserossijskogo kongressa molody'x uchyonyx. Materialy' kongressa: V 2 tomax. 2016. pp. 141-145. URL: elibrary.ru/download/elibrary_30369724_99584939.pdf
2. Kolomnikov R.E. Sbornik izbrannyx statej nauchnoj sessii TUSUR. 2023. № 1-2. pp. 156-159. URL: elibrary.ru/download/elibrary_54595069_95057198.pdf
3. Arimpilov S.N. Sbornik izbrannyx statej nauchnoj sessii TUSUR. 2019. № 1-2. pp. 38-41. URL: elibrary.ru/download/elibrary_41044970_18173501.pdf
4. Starostina A.V., Kulyas O.L. Universum: Texnicheskie nauki. 2023. № 8-1 (113). pp. 23-29. URL: elibrary.ru/download/elibrary_54481814_79963357.pdf
5. Sarin K.S., Xodashinskij I.A. Komp'yuternaya optika. 2019. T. 43. № 5. pp. 833-845. URL: elibrary.ru/download/elibrary_41496866_95801522.pdf
6. Druki A.A., Mileshin M.A. FundamentaTny'e issledovaniya. 2014. № 11-9. pp.1906-1910.URL: elibrary.ru/download/elibrary_22564626_41774880.pdf
7. Finogeev E.L., Terexova Yu.V. Materialy' Vtorogo Mezhdunarodnogo nauchno-prakticheskogo foruma po e'konomicheskoj bezopasnosti «VII VSKFB». Materialy' foruma. Moskva, 2021. pp. 97-104. URL: elibrary.ru/download/elibrary_45783201_31947610.pdf
8. Plinatus A.A., Kruglov L.M. Nauchnyj portal MVD Rossii. 2021. № 3 (55). pp. 52-56. URL: elibrary.ru/download/elibrary_47507895_78625771.pdf
9. Ivanov Yu.S., Goncharuk S.E. Vestnik nauchnogo obshhestva studentov, aspirantov i molody'x uchyonyx. 2016. № 2. pp. 68-73. URL: elibrary.ru/download/elibrary_26232235_16022927.pdf
10.Andreevskix D.A., Kolomnikov R.E. Sbornik izbrannyx statej nauchnoj sessii TUSUR. 2022. № 1-2. pp. 68-71. URL: elibrary.ru/download/elibrary_49525429_69825723.pdf
11.Ostrovskij A.A., Zharikov D.N., Lukyanov V.S. Izvestiya Volgogradskogo gosudarstvennogo texnicheskogo universiteta. 2011. № 9 (82). pp. 92-94. URL: elibrary.ru/download/elibrary_17041950_91555306.pdf
12.Pyataeva A.V. Reshetnevskie chteniya.
Materialy' XXV Mezhdunarodnoj nauchno-prakticheskoj konferencii, posvyashhyonnoj pamyati generaTnogo konstruktora raketno-kosmicheskix sistem akademika M.F. Reshetneva. V 2-x chastyax. Pod obshhej redakciej Yu.Yu. Loginova. Krasnoyarsk, 2021. pp. 393-395. URL: elibrary.ru/download/elibrary_47711950_54142739.pdf Дата поступления: 13.02.2024 Дата публикации: 17.03.2024