Научная статья на тему 'ПРЕДСТАВЛЕНИЕ И ПРЕДОБРАБОТКА ДАННЫХ ДИНАМИЧЕСКОЙ ПОДПИСИ ЧЕЛОВЕКА'

ПРЕДСТАВЛЕНИЕ И ПРЕДОБРАБОТКА ДАННЫХ ДИНАМИЧЕСКОЙ ПОДПИСИ ЧЕЛОВЕКА Текст научной статьи по специальности «Математика»

CC BY
45
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРЕДОБРАБОТКА / ТЕНЗОРЫ / МАСШТАБИРОВАНИЕ / УГОЛ ПОДПИСИ / ПРИЗНАКИ

Аннотация научной статьи по математике, автор научной работы — Максименко В. Н., Дзямко-гамулец Р. Н.

Предварительная обработка данных является одним из первых этапов при выделении уникальных биометрических признаков человека. От качества и количества предварительных данных зависит точность работы биометрического метода аутентификации пользователя по его рукописной подписи. В данной работе описаны этапы предобработки данных, приводится обоснование их необходимости, представлены формулы преобразования данных. Указаны случаи, когда предобработка необходима полностью или частично.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Максименко В. Н., Дзямко-гамулец Р. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

REPRESENTATION AND PREPROCESSING OF HUMAN DYNAMIC SIGNATURE DATA

Data preprocessing is one of the first steps in identifying unique biometric features of a person. The accuracy of the biometric method of authenticating a user by his handwritten signature depends on the quality and quantity of preliminary data. This paper describes the stages of data preprocessing, provides a justification for their necessity, and presents data transformation formulas. The cases when preprocessing is necessary in whole or in part are indicated.

Текст научной работы на тему «ПРЕДСТАВЛЕНИЕ И ПРЕДОБРАБОТКА ДАННЫХ ДИНАМИЧЕСКОЙ ПОДПИСИ ЧЕЛОВЕКА»

Существует два типа взаимодействий: активный и пассивный. Пример активного взаимодействия включает в себя большое количество друзей, регулярные публикации, комментирование других членов и т.д. Однако не все члены сообщества - активные участники. Есть значительное количество членов, которые являются пассивными участниками сообщества. Взаимодействие пассивных членов в сообществе включает чтение статей, регулярные посещения сообщества и т.д. Эти члены могут не участвовать или не делиться своим опытом или чувствами, но они являются потребителями информации, что тоже очень ценно. Эти два типа взаимодействия коллективно создают социальный капитал сообщества и используются для оценки социального доверия.

Заключение

Без доверия люди не захотят делиться своими знаниями и опытом из-за страха, что их публикации и идентификационные данные будут использованы неправильно или даже незаконно. Таким образом, актуальной становится задача построения сети доверия. Алгоритмы путей создания сообществ доверия в социальной сети представлены в работе [5]. Реализация этих путей представляет сложную задачу по сбору исходных данных и автоматизации обработки.

Литература

1. Максименко В.Н., Васильев М.А. Методика расчета стандартных показателей качества дополнительных услуг на сетях подвижной связи // Т-Сошш: Телекоммуникации и транспорт, 2011. - Т. 5. - № 4. - С. 26-28.

2. Максименко В.Н. Конвергенция сервисов качества и защиты информации в сетях сотовой подвижной связи на этапах проектирования // Т-Сошш: Телекоммуникации и транспорт, 2018. - Т. 12. - № 11. - С. 57-64.

3. Шелухин О.И., Смычек М.А., Симонян А.Г. Фильтрация нежелательных приложений интернет-ресурсов в целях информационной безопасности // «Наукоемкие технологии в космических исследованиях, 2018. - Т. 10. - № 2. - С. 87-98.

4. Галимова А.Г., Симонян А.Г. Методы выявления нежелательного контента в тексте и изображениях // Сборник трудов XV Международной отраслевой научно-технической конференции «Технологии информационного общества». Москва. 0304 марта 2021. - С. 151-152.

5. Максименко В.Н., Долгова Н.Д. Анализ алгоритмов вычисления уровня доверия к пользователю в социальной сети // Экономика и качество систем связи, 2018. - № 4 (10). - С. 23-30.

ПРЕДСТАВЛЕНИЕ И ПРЕДОБРАБОТКА ДАННЫХ ДИНАМИЧЕСКОЙ

ПОДПИСИ ЧЕЛОВЕКА

В.Н. Максименко, к.т.н., доцент, Московский технический университет связи и информатики, [email protected];

Р.Н. Дзямко-Гамулец, Московский технический университет связи и информатики, [email protected].

УДК 004.056_

Аннотация. Предварительная обработка данных является одним из первых

109

этапов при выделении уникальных биометрических признаков человека. От качества и количества предварительных данных зависит точность работы биометрического метода аутентификации пользователя по его рукописной подписи. В данной работе описаны этапы предобработки данных, приводится обоснование их необходимости, представлены формулы преобразования данных. Указаны случаи, когда предобработка необходима полностью или частично.

Ключевые слова: предобработка; тензоры; масштабирование; угол подписи; признаки.

REPRESENTATION AND PREPROCESSING OF HUMAN DYNAMIC

SIGNATURE DATA

Vladimir Maximenko, Candidate of Technical Sciences, docent, Moscow Technical University of Communications and Informatics;

Roman Dzyamko-Gamulets, Moscow Technical University of Communications and Informatics.

Annotation. Data preprocessing is one of the first steps in identifying unique biometric features of a person. The accuracy of the biometric method of authenticating a user by his handwritten signature depends on the quality and quantity of preliminary data. This paper describes the stages of data preprocessing, provides a justification for their necessity, and presents data transformation formulas. The cases when preprocessing is necessary in whole or in part are indicated.

Keyword: preprocessing; tensors; scaling; signature angle; features.

Введение

Биометрические методы аутентификации отличаются крайне высокой сложностью фальсификации, так как в качестве ключа используются уникальные биометрические характеристики человека. На данный момент происходит активное внедрение статических и динамических методов аутентификации в современные электронные устройства и информационные системы.

В данной статье рассматривается биометрический метод аутентификации человека на основе его рукописной подписи в онлайн режиме. Общий подход заключается в получении набора экземпляров подписи пользователя, вычисления усредненного варианта и сравнение его с тестируемыми экземплярами. Для сравнения подпись требуется формализовать, а именно - выделить набор признаков, которые можно сравнивать [1].

Признаки представляются в виде набора чисел - тензоров, их сравнение происходит на основании нормы тензора, представляющего разность соответствующих признаков. В частных случаях тензор признака может быть числом, вектором или матрицей. Однако для корректного сравнения необходимо совершить предобработку данных подписей.

Подпись представляется в виде двух функций зависимостей координат х и у от времени, из них и происходит выделение признаков для дальнейшего анализа. Но в первоначальном виде функции непригодны для выделения признаков или, по крайней мере, пригодны далеко не для всех возможных признаков. Одна из причин заключаются в том, что подпись может быть введена на экранах, которые сильно отличаются по размеру, а также само устройство ввода может иметь разный угол поворота. Также следует учитывать, что в зависимости от обстоятельств возможна

различная скорость написания подписи.

Стоит иметь ввиду, что устройство считывания данных не всегда может фиксировать точки координат подписи через равные промежутки времени. В итоге это приводит к тому, что при полностью одинаковом повторении подписи, координаты ее точек будут постоянно различными [2].

Таким образом, сами функции могут сильно отличаться, и чтобы сравнение было полным, необходимо привести эти функции к единому виду, который сохранял бы саму структуру зависимости координат точек от времени (без учета масштабирования). Поэтому для полноценного сравнения необходимо из имеющихся двух функций получить две новые, из которых уже и будет происходить выделение признаков. В данной работе преобразованные функции координат от времени называются нормализованными, сам процесс же -нормализацией, термин «предобработка», встречающийся в дальнейшем, обозначает получение данных в необходимом виде до начала процесса выделения признаков.

Стоит отметить, что сами исходные данные тоже имеют ценность и некоторые признаки требуется получать именно из них. Например, общая длина подписи в некоторых случаях может быть информативна, но нормализация лишает этих данных. Отдельно стоит учитывать временной промежуток, затраченный на написание самой подписи, так как при большой разнице от оригинала недоверие к экземпляру увеличивается [3].

Формулировка задачи и ее этапы

Имеются две функции x(t) и y(t) - зависимости координат подписи от времени, te I, где I - некоторый временной интервал. Временной интервал для каждой подписи может быть свой. В нормализованном виде будем считать, что каждая подпись находится в интервале t е [0; 1]. В итоге, математическая формулировка задачи предобработки сводится к получению новой пары функций из пары исходных:

х = x(t),

У = КО,

где: te [0; 1].

Стоить иметь ввиду, что здесь подразумеваются зависимости координат от времени именно в виде непрерывных функций. В действительности, измерения происходят дискретно на устройстве, имеется лишь список точек с временными метками их получения. Поэтому необходимо из одного списка точек создать новый, где координаты и временные метки будут преобразованы к необходимому виду.

В итоге, первая задача, которую следует выполнить - привести этот список к некоторому стандарту. Для этого выбирается заранее сколько точек необходимо для использования. Чем их больше, тем точнее результат, но и больше требований к вычислительным ресурсам, поэтому обработка может занять больше времени [4]. Необходимое количество точек находится в пределах 100-150, но если предполагается обрабатывать достаточно длинные и сложные подписи, то значение увеличивается до 200 или 250 точек. Причем число точек должно быть одинаковым для всех экземпляров подписей (не только для конкретного пользователя, а для всех).

После получения точек необходимо решить следующую проблему -подписи могут быть написаны с немного разными углами. Это приведет к сильному

искажению координат х и у и невозможности полноценного их сравнения. Чтобы это исключить, необходимо все подписи преобразовать так, чтобы они были повернуты на один и тот же угол относительно выбранной системы координат, которая не зависит от геометрических характеристик самой подписи. Возникает необходимость определения угла поворота подписи [5].

Под поворотом пары функций х(у) и у подразумевается получение из них новой пары функций, где для каждого значения аргумента новых функций будет преобразование поворота относительно некоторого выбранного центра от старых значений функций.

Для удобства работы с функциями мы будем считать, что все они должны иметь область определения [0; 1] и область значения [0; 1]. То есть рассматриваем функции на квадрате:

Т X V = [0; 1] X [0; 1],

где: T - область определения функции (временной интервал, на котором заданы функции координат подписи), V - область значения функции (координаты точек на экране).

Для преобразования к такому виду следует произвести параллельный перенос функции так, чтобы начало по временной оси (ось абсцисс) было в нуле, а также минимальное значение функции было также в нуле по оси ординат. После чего необходимо произвести масштабирование по каждой из осей, что позволит получить новую функцию, целиком находящуюся в единичном квадрате [6].

В итоге, предварительная обработка подписи состоит из следующих этапов:

1. Масштабирование временной оси.

2. Получение заранее выбранного количества новых точек и их координат на

основе интерполяции исходных данных.

3. Вычисление угла подписи и поворот ее на этот угол - для получения

условного нулевого поворота.

4. Сдвиг подписи в начало выбранной системы координат.

5. Масштабирование подписи.

Стоит отметить, что хоть эти этапы и предполагается проводить до выделения признаков, некоторые признаки можно получать после определенных этапов или вообще до начала предобработки. Например, если использовать в качестве признака сам угол поворота подписи, то его можно получить уже после 2-го этапа и до 3-го, так как в будущем он будет равен нулю или близок к этому значению. Также общее время написания экземпляра подписи необходимо получать до предобработки, так как после 1 -го шага эта информация будет потеряна.

Масштабирование временной оси

Для начала временная ось масштабируется таким образом, чтобы область определения функций х(), убыла отрезком [0; 1]. Для этого используется формула:

1

где: - новая временная метка для i-й точки, ^ - старая временная метка для i-й точки.

В дальнейшем предполагается, что буква со штрихом обозначает новую переменную после преобразования, а без штриха - старую. Это будет справедливо для каждого преобразования и для каждого этапа. При таком преобразовании временная метка для первой точки будет равна 0, а для последней - 1.

Получение новых точек путем интерполяции исходных

Изначально имеется список исходных данных - точек, зафиксированных в различные моменты времени. Необходимо создать новый список точек для заранее выбранного их количества N. Для этого в новый список копируется первая и последняя точка из исходного набора. Временные метки остальных точек в новом списке будут иметь вид:

ti =--i, i = 1 .. N - 2.

1 N - 1

Чтобы их найти, следует определить, между какими ближайшими двумя точками из необработанных данных находится выбранная точка, и, используя линейную интерполяцию, определить необходимое значение:

x't = хн + Г-?'^ - '«),

Lir Lil

у' = Ун + г-? • & - ta),

Lir 41

где: х', у[ - значения координат определяемого множества точек для i-й точки; Хц, уц - координаты ближайшей точки сырых данных, временная метка которой in < ti; Xir, yir - координаты ближайшей точки сырых данных, временная метка которой tir > ti, ti - временная метка новой точки; индекс l - означает ближайшую точку слева (left), а r - справка (right).

Вычисление угла подписи и поворот

Необходимо определить такое понятие, как угол подписи между ней и осью абсцисс. Полагается, что координаты подписи заданы списками из N точек, равноудаленных друг от друга по оси абсцисс, то есть временные метки находятся через равные промежутки на временной оси. Это то представление, которое должно быть после применения предыдущего шага [7].

Пусть tc - середина временного интервала подписи. Находим все точки (Xj, yi) такие, что их временная метка ti < tc, а также все такие точки (xj, уу), для которых tj > tc. Получаются два множества: множество точек I, полученных в первой половине временного интервала написания подписи, и множество точек J, полученных во второй половине временного интервала. Если есть такие точки, что tfr = tc, то их можно отбросить.

В каждом из этих двух множеств точек I, J вычисляется геометрический центр по формулам:

yl'l г■ ylJl у

Xlc= |Ц , X2c= \J\ ,

У1с |/| , У2с \j\ ,

где: |I| - мощность (количество элементов) первого множества; |J| - второго; хкс,

yfcc - координаты центра k-го множества; к = 1. .2.

Теперь, имея две точки (х1с, у1с) и (х2с, у2с), можно провести прямую. Угол между этой прямой и осью абсцисс будем называть углом наклона подписи к оси абсцисс. Он показывает угол поворота подписи по отношению к условному нулевому углу. То есть, для нормализации поворота подписи и получения «нуля», подпись следует повернуть на угол, противоположный найденному. Значение угла находится по формуле:

а = tan-1 (+л),

V*2C - *1С/

где: число п добавляется либо вычисляется в зависимости от четверти. Здесь предполагается, что х1с Ф х2с. Если это не так, то:

а = - при у2с > У1с, а = -- при у2с < У1с, а = 0 при у2с = У1с.

Поворот подписи осуществляется вокруг ее геометрического центра, который находится по формулам:

У^ X' х = у1=1Л1

с n '

Ус=ЕЪл

N

Для нахождения координат точек после поворота используются следующие выражения:

х' = (x¿ - хс) ■ cosa - (y¿ - ус) ■ sina + хс, y¿ = (y¿ - Ус) ■ sma + (x¿ - xc) ■ cosa + yc.

Сдвиг в начало координат

Для осуществления преобразования сдвига для каждой точки применяется преобразование по следующим формулам:

х' = x¿ - min{x¿},

y¿ = y¿ - raí"{y¿},

где: min{x¿}, min{y¿} - минимальные значения соответствующих координат на всем множестве точек, í = 1.. N.

Масштабирование

Для того, чтобы область значений функций координат укладывалась в отрезок [0; 1], необходимо произвести масштабирование для каждой точки по следующим формулам:

=

y¿

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

max{x¡}'

max{y¡}'

ж

где: тах[х1], тах[у1] - максимальные значения соответствующих координат на всем множестве точек.

Заключение

Предобработка данных подписи является очень важным этапом в процессе аутентификации пользователя по его рукописной подписи. Основная идея алгоритмов аутентификации сводится к сравнению различных экземпляров подписи в виде списков точек с временными метками [8].

Но многие из этих алгоритмов требуют, чтобы оба списка точек имели одинаковый вид. Под этим подразумевается одинаковое количество точек для обоих экземпляров, одинаковый временной интервал написания подписи, одинаковые размеры области, в которой находятся подписи, а также исключение влияния поворота подписи, которое зависит от поворота устройства, на котором происходит ввод подписи.

Исходные данные, полученные от устройства ввода, обычно не удовлетворяют всем условиями, поэтому их надо предварительно обработать таким образом, чтобы алгоритмы сравнения могли ими оперировать.

Литература

1. Сулавко А.Е., Еременко А.В., Самотуга А.Е. Исключение искаженных биометрических данных из эталона субъекта в системах идентификации // Информационные технологии и вычислительные системы. ЛЕНАНД. - Москва, 2013. - № 3. - С. 96-101.

2. Волошина Т.С., Максименко В.Н. Анализ системы распознавания лиц по алгоритму нейронной сети // В сборнике: Технологии информационного общества. Материалы XIII Международной отраслевой научно-технической конференции. -М.: 2019. - С. 341-344.

3. Ложников П.С., А.И. Иванов, Е.И. Качайкин, А.Е. Сулавко. Биометрическая идентификация рукописных образов с использованием корреляционного аналога правила Байеса // Вопросы защиты информации. ФГУП «ВИМИ». - Москва, 2015. - № 3. - С. 48-54.

4. Ручай А.Н. Инварианты как метод верификации по статической подписи // Материалы всероссийской конференции с международным участием «Знания-Онтологии-Теории» (ЗОНТ-09). Новосибирск: ИМ СО РАН, 2009. - С. 212-215.

5. Ложников П.С., Сулавко А.Е., Еременко А.В., Волков Д.А. Экспериментальная оценка надежности верификации подписи сетями квадратичных форм, нечеткими экстракторами и персептронами // Информационно-управляющие системы, 2016. № 5. - С. 73-85.

6. Пинтусов Д.Н. Информационная система идентификации рукописной подписи: автореф. дисс. магистра информатики и вычислительной техники: 1-40 81 01 / Д. Н. Пинтусов; науч. рук. Т.В. Тихоненко. - Минск: БГУИР, 2020. - 15 с.

7. Способ биометрической аутентификации по почерку в компьютеризированной системе контроля доступа: пат. 2469397С1, Рос. Федерация: МПК G06 9/00. [Текст]. Милых В.А., Лапина Т.И., Лапин Д.В.; патентообладатель ФГБОУ ВПО «Юго-Западный государственный университет» (ЮЗГУ). - № RU 2 469 397; заявл. 30.09.2011; опубл. 10.12.2012.

8. Гмурман В.Е. Теория вероятностей и математическая статистика: учеб. пособие для вузов. - М.: Высшая школа, 2004. - 479 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.