УДК 004.93'12
Р. Р. Шарипов, А. С. Катасёв, А. П. Кирпичников
МЕТОДЫ АНАЛИЗА КЛАВИАТУРНОГО ПОЧЕРКА ПОЛЬЗОВАТЕЛЕЙ С ИСПОЛЬЗОВАНИЕМ ЭТАЛОННЫХ ГАУССОВСКИХ СИГНАЛОВ
Ключевые слова: клавиатурный почерк, эталон пользователя, идентификация, аутентификация, информационная
безопасность, биометрия.
Данная статья посвящена анализу методов клавиатурного почерка пользователей с использованием эталонных гауссовских сигналов. Для построения систем разграничения доступа актуализируется использование биометрических методов идентификации и аутентификации. Подробно рассматриваются методы анализа клавиатурного почерка пользователей. Анализируются работы известных российских ученых в данной области. Приводится и анализируется схема статистического анализатора клавиатурного почерка на основе эталонных гауссовских сигналов. В качестве примера приводится график функции плотности распределения временных интервалов нажатия и отпускания клавиш пользователем. Делается вывод о возможности эффективного использования рассмотренных методов в системах идентификации и аутентификации.
Keywords: keyboard handwriting, user reference, identification, authentication, information security, biometrics.
This article analyzes the methods of handwriting keyboard users by using standard Gaussian signals. To construct the access control systems is actualized the use of identification and authentication biometric methods. The detailed review the analysis methods of handwriting keyboard users. Analyzed the works offamous Russian scientists in this field. We present and analyze statistical analyzer circuit keyboard handwriting on the basis of standard Gaussian signals. As an example, the density distribution graph of slots pressing and releasing the user keys. The conclusion about the possibility of the effective use of the methods considered in the identification and authentication systems.
В настоящее время актуализировалась проблема защиты информационных ресурсов от несанкционированного доступа. При этом существует большое количество методов и алгоритмов обеспечения информационной безопасности, в том числе от несанкционированного доступа к информации [1]. Такие методы защиты информации, как установка паролей, шифрование и архивное копирование являются стандартом де-факто в любой корпоративной информационной системе. Но, не смотря на это, важной частью обеспечения безопасности информационных систем является задача разграничения лиц, которые имеют доступ к определённой информации, а также защита от несанкционированного доступа к этой информации.
Важным аспектом обеспечения информационной безопасности в компьютерных и телекоммуникационных системах является проблема установления личности пользователей. Кроме того, необходима идентификация каждого пользователя и обеспечение возможности его аутентификации.
Существуют три типа систем идентификации и аутентификации: парольные, технические и биометрические. При этом идентификация и аутентификация на основе биометрических характеристик пользователей является наиболее тесно связанной с пользователем, так как данные характеристики неотчуждаемы от субъекта.
Для идентификации и аутентификация субъектов доступа выделяют следующие биометрические характеристики [2]:
- отпечатки пальцев;
- форма и размеры ладони;
- узоры радужной оболочки глаза;
- узоры сетчатки глаза;
- формы лица людей;
- голосовые характеристики;
- биомеханическая характеристика рукописного почерка;
- биомеханическая характеристика почерка пользователя, работающего на клавиатурных устройствах ввода информации.
Применение данных признаков в качестве идентификационных параметров людей является развивающимся направлением в системах идентификации и аутентификации личности. Одним из наиболее актуальных направлений является идентификация субъектов по их клавиатурному почерку.
Проведем анализ научных работ, представленных в данной области. Одним из первых исследований решения задачи анализа клавиатурного почерка изложен в [11]. Данный автор разработал методику, в которой он принял временные интервалы нажатия и отпускания клавиш при наборе заранее обусловленного текста, как случайные процессы. При разработке математической модели, автор сделал допущении, о том, что измеренные временные интервалы подчиняются нормальному гауссовскому, закону распределения. Кроме этого им разработаны и представлены достаточно простые алгоритмы для решения следующих задач [11]:
- построения доверительных интервалов дисперсии и математического ожидания;
- проверки гипотезы о равенстве центров распределения двух нормальных гауссовских выборок, при этом автор допускает равенство дисперсий данных выборок;
- проверки гипотезы о равенстве дисперсий двух нормальных гауссовских выборок;
- исключения ошибок из выборок.
В общем аспекте задачу проверки данных автор изложил в виде сравнения двух гипотез следующим образом [11]. Допустим F(Y,L) - закон распределения некой случайной величины Y, которая зависит от одного параметра L. Необходимо гипотезу К0 при
которой параметр Ь=Ь0 (в этом случае полученные и эталонные результаты принадлежат одному и тому же пользователю). И гипотезу К при которой параметр Ь=Ь\ (в этом же случае полученные и эталонные результаты принадлежат разным пользователям). После этого автор описал и предложил несколько алгоритмов для вычисления численных значений математических ожиданий и дисперсий временных значений для обучения системы распознавания и для идентификации пользователей.
В работах [14,15] приводится классификация методов вычисления и обработки временных значений параметров клавиатурного почерка на программно-аппаратные и программные методы. Программные методы сбора и анализа характеристик клавиатурного почерка осуществляется только программными средствами без дополнительного оборудования и устройств. Применяя же аппаратно-программные методы, в которых используется частичное подключение разработанных дополнительных средств и оборудования, можно осуществлять съем дополнительных параметров клавиатурного почерка, которые не возможно зафиксировать на программном уровне. Обычно аппаратно-программные методы используются для съема и анализа исходной информации. Дальнейший анализ собранных данных выполняется с применением специализированного программного обеспечения. Например, в работе [17] предложена аппаратная реализация устройства для съема и вычисления скорости движения клавиш. В данной работе измеряют скорость движения клавиш, измеряя изменение ёмкости контактной пары клавиши при её надавливание пользователем. В данном случае скорость движения клавиши представлена как процесс изменения электрической емкости контактной пары клавиши во времени:
V = ^
где С - ёмкость контактной пары клавиши, t - время изменения ёмкости.
Для реализации данного метода в [17] было разработано устройство, устанавливаемое в стандартную плёночную клавиатуру. Устройство состоит из следующих компонентов:
- согласующего фильтра для съёма емкости клавиш;
- преобразователя, который переводит измеренную ёмкость в электрическое значение;
- аналого-цифрового преобразователя для преобразования электрического значения в набор дискретных значений;
- контроллера для счёта этих значений и вычисления их количества за единицу времени;
- интерфейса RS232, для согласования работы устройства с персональным компьютером, в котором через драйвер порта программа-обработчик получает временные данные с контроллера для дальнейшей статистической обработки.
Кроме того, существуют эффективные нейросе-тевые [3,5-9], нечеткие [4] и нейронечеткие [10] методы, которые можно эффективно использовать в системах обеспечения информационной безопасно-
сти в цело , и для анализа клавиатурного почерка пользователей, в частности.
Особенности работы пользователей за клавиатурой, вследствие перемены эмоционального состояния, можно отнести к случайному процессу. Соответственно, измеренные временные интервалы клавиатурного почерка относятся к случайным величинам. В работе [11] рассмотрена методика распознавания клавиатурного почерка, автор которой делает допущение о том, что измеренные временные значения распределены по нормальному гауссовскому закону. Известен метод определения законов распределения случайных величин [12], который является аппаратурным анализом случайных процессов, использующих эталонные гауссовские сигналы. В [16] представлена одна из реализаций метода для анализа клавиатурного почерка. Авторский метод включает следующие этапы:
1) формируются эталонные сигналы гауссовско-го вида, которые описываются функциями плотности вероятности ^(х);
2) для каждых вспомогательных сигналов хп^) и i-й реализации анализируемого процесса х,(() формируются сигналы сходства по формуле:
*пг = /Ш = |1+йУ-1, П = 1,2...Ж,
где (п/ - является расстоянием между выборками эталонных процессов и анализируемого процесса.
3) /'-я реализация исследуемого процесса включается в некоторую подсовокупность Хп после сравнения исходных сигналов с заданным пороговым уровнем Нп.
Результатом сравнения сигналов сходства между собой является разделение генеральной совокупности реализаций I рассматриваемого процесса на подсовокупности реализаций 1п, п=1,2...Ж Так как каждая п-я подсовокупность рассматриваемого процесса характеризуется некоторым ядром, то есть многомерной плотностью распределения вероятностей п-го вспомогательного процесса ^(х), то многомерные законы распределения заданного процесса описываются смесями плотности распределения со следующими весовыми коэффициентами: qn = 1п/1, п=1,2...М
Для реализации способа разделения в смеси сигналов гауссовской формы, используя эталонные сигналы, авторами работы [13] предложен статистический анализатор. В качестве эталонных сигналов выбраны временные значения нажатия и отпускания клавиш. При этом эталон формируют путем измерения временных интервалов нажатия и отпускания клавиш пользователями, работающими за клавиатурой и набирающими определенный текст. После формирования набора исходных характеристик клавиатурного почерка пользователей собранные данные очищаются путем исключения выбросов, шумов и аномальных значений. Затем на основе очищенных данных вычисляют их математические ожидания, которые в дальнейшем принимаются в качестве эталонных значений клавиатурного почерка.
На рисунке 1 представлена структурная схема статистического анализатора.
2»
1ы
5»
7»
&
Рис. 1 - Схема статистического анализатора клавиатурного почерка
Анализатор, представленный на данном рисунке, содержит в себе эталонные значения различных пользователей 11-1№ блоки для формирования разности по модулю эталонных значений и поступивших значений 21-2№ блок принятия решения 3, счетчик 4, несколько счетчиков 51-5№ несколько генераторов сигналов нормальной гауссовской формы б!-6№ умножители 7-^-7и сумматор 8.
Настроенные эталонные значения 11-1№ синхронизируются с временными параметрами, поступившими на вход, и поступают на входы всех блоков формирования разности по модулю эталонных значений и поступивших значений 21-2№ куда на вторые входы всех блоков поступает исследуемый временной параметр. В блоках, где формируется модуль разности, вычитаются по модулю эталонные значения из значения, поступившего на вход, и результат вычисления интегрируется. В этом случае вероятность того, что наименьшее значение будет накоплен в интеграторе того канала, где эталонное значение наиболее близко к реализации исследуемого значения будет максимальна. После окончания реализации исследуемого значения, которые накоплены в интеграторах блоков 21-2№ значения поступают на решающий блок 3, где эти значения сравниваются и выделяется канал с минимальным значением, что регистрируется счетчиком канала 5п, при этом реализация канального генератора эталонного значения которого соответствует или наиболее близка к реализации исследуемого значения.
Результатом анализа реализаций исследуемого значения является регистрация счетчиков 5^5^ величин /ь 12,...1ы количества реализации исследуемого значения Х(/), которые максимально сходны с эталонными значениями хя(/), п = 1,Ы и совпадают по величине.
Исходя из этого, статистический анализатор разделяет на N подсовокупностей всю совокупность I реализаций исследуемых значений. Законы распределения N подсовокупностей соответствуют по вероятности законам соответствующих эталонных значений. Определение вероятностей происходит следующим образом. Счетчиком нормирования ре-
зультата 4, коэффициент пересчета которого установлен заранее, считывают общее количество поступивших реализаций. Если счетчик нормирования результата переполняется, то с его выхода одновременно подаются сигналы для нормирования показателей счетчиков 51-5ЛГ и запуска генераторов 61-6л^. Значения нормированных показателей счетчиков 51-представляют вероятности qn = 1п/1, п = 1,N разделённых подсовокупностей [12].
Далее в перемножителях 7^-7]^ вероятности qn перемножаются с выходными значениями генераторов Wn(t). В сумматоре 8 суммируются выходные сигналы перемножителей. После этого вырабатывается для исследуемого значения функция распределения и плотность распределения, которая состоит из N подсовокупностей, описываемых смесями гаус-совских плотностей распределения:
W (О = Х qWn (0, Чп > 0, X Чп = 1.
п=1 п=1
В данном случае смесь характеризует распределение временных интервалов нажатия и отпускания клавиш пользователя.
Для исследования данного подхода было разработано программное обеспечение в среде С++ для вычисления временных интервалов нажатий и отпускания клавиш оператора ЭВМ, а также для реализации выше описанного метода с целью выявления функции плотности распределения временных значения тестируемого оператора.
На рисунке 2 представлена плотность распределения вероятности временных интервалов нажатия и отпускания клавиш пользователя.
Рис. 2 - Плотности распределения временных интервалов нажатий и отпускания клавиш оператора ЭВМ
Весовые коэффициенты гауссовских компонент следующие: ql=0,23; q2=0,19; qз=0,12; q4=0,25; q5=0,21. Математические ожидания следующие: т!=86,23; т2=90,03; т3=98,67; ^=105,17; т5=114,37. Дисперсии: 0^=10,14; ст22=14,28; ст32=12,63; СТ42=11,34; СТ52=17,18.
Таким образом, анализ и исследование клавиатурного почерка представленным выше способом может быть реализован на современных компьютерах. Данный способ анализа может быть использован в системах идентификации и аутентификации пользователей. Сначала, систему распознавания клавиатурного почерка настраивают для определён-
ных, известных пользователей, сформировав эталонные значения их клавиатурного почерка. После настройки системы можно будет идентифицировать зарегистрированных пользователей и разграничить доступ незарегистрированных, почерк которых не соответствует эталонам. Работа этой системы имеет скрытый от пользователя интерфейс, а сама система ориентирована на пользователей, у которых уже достаточно сформирован клавиатурный почерк. Система принимает решение, исходя из максимальной вероятности на выходе анализатора клавиатурного почерка.
Литература
1. Аникин И.В., Глова В.И. Методы и средства защиты компьютерной информации: учеб. пособие. - Казань: Изд-во Казанского государственного технического университета, 2008. - 260 с.
2. Иванов А.И. Биометрическая идентификация личности по динамике подсознательных движений: монография. -Пенза: Изд-во Пензенского государственного университета, 2000. - 188 с.
3. Катасёв А.С., Катасёва Д.В. Разработка нейросетевой системы классификации электронных почтовых сообщений // Вестник Казанского государственного энергетического университета. - 2015. - № 1 (25). - С. 68-78.
4. Катасёв А.С., Катасёва Д.В. Формирование нечетких правил фильтрации нежелательных электронных сообщений в инфокоммуникационных сетях / Проблемы техники и технологий телекоммуникаций ПТиТТ-2014. Оптические технологии в телекоммуникациях ОТТ-
2014. Материалы Международных научно-технических конференций. Казань. - 2014. - С. 320-322.
5. Катасёв А.С., Катасёва Д.В., Кирпичников А.П. Нейросетевая диагностика аномальной сетевой активности // Вестник технологического университета. -
2015. - Т. 18. № 6. - С. 163-167.
6. Катасёв А.С., Катасёва Д.В., Кирпичников А.П. Нейросетевая технология классификации электронных почтовых сообщений // Вестник технологического университета. - 2015. - Т. 18. № 5. - С. 180-183.
7. Катасёв А.С., Катасёва Д.В., Кирпичников А.П. Нейросетевое прогнозирование инцидентов информационной безопасности предприятия // Вестник
технологического университета. - 2015. - Т. 18. № 9. - С. 215-218.
8. Катасёв А.С., Катасёва Д.В., Кирпичников А.П., Гумеро-ва Р.И. Нейросетевая модель распознавания рукописных символов в системах биометрической идентификации и аутентификации // Вестник технологического университета. - 2016. - Т. 19. № 4. - С. 122-126.
9. Катасёв А.С., Катасёва Д.В., Кирпичников А.П., Евсеева А.О. Нейросетевая модель идентификации ботов в социальных сетях // Вестник технологического университета.
- 2015. - Т. 18. № 16. - С. 253-256.
10. Катасёв А.С., Катасёва Д.В., Кирпичников А.П., Семенов Я.Е. Спам-фильтрация электронных почтовых сообщений на основе нейросетевой и нейронечеткой моделей // Вестник технологического университета. - 2015. - Т. 18. № 15. - С. 217-220.
11. Расторгуев С.П. Программные методы защиты информации в компьютерах и сетях. М.: Издательство Агентства "Яхтсмен", 1993. - 188 с.
12. Сафиуллин Н.З. Анализ стохастических систем и его приложения: монография. - Казань: Изд-во Казан. гос. техн. ун-та, - 1998. - 168 с.
13. Сафиуллин Н.З., Чабдаров Ш.М. Устройство для определения законов распределения случайных сигналов: А.С. СССР 972527. МКИ G06G7/52.
14. Шарипов Р.Р. Разработка полигауссового алгоритма аутентификации пользователей в телекоммуникационных системах и сетях по клавиатурному почерку: диссертация на соискание ученой степени кандидата технических наук. - Казань, 2006. - 134 с.
15. Шарипов Р.Р. Разработка полигауссового алгоритма аутентификации пользователей в телекоммуникационных системах и сетях по клавиатурному почерку: автореферат диссертации на соискание ученой степени кандидата технических наук. - Казань, 2006. - 18 с.
16. Шарипов Р.Р., Сафиуллин Н.З. Аппаратурный анализ клавиатурного почерка с использованием эталонных га-уссовских сигналов // Вестник Казанского государственного технического университета им. А.Н. Туполева.
- 2006. - № 2. - С. 21-23.
17. Шарипов Р.Р., Сафиуллин Н.З. Способ формирования эталонных значений характеристики пользователя персонального компьютера: патент на изобретение RUS 2333532 07.07.2005.
© Р. Р. Шарипов - к-т техн. наук, доц. кафедры систем информационной безопасности КНИТУ-КАИ, e-mail: [email protected]; А. С. Катасёв - к-т техн. наук, доц. кафедры систем информационной безопасности КНИТУ-КАИ, e-mail: [email protected]; А. П. Кирпичников - д-р физ.-мат. наук, профессор, зав. кафедрой интеллектуальных систем и управления информационными ресурсами КНИТУ, e-mail: [email protected].
© R. R. Sharipov - PhD, Associate Professor of Information Security Systems Department, KNRTU named after A.N. Tupolev, e-mail: [email protected]; A. S. Katasev - PhD, Associate Professor of Information Security Systems Department, KNRTU named after A.N. Tupolev, e-mail: [email protected]; А. P. Kirpichnikov - Dr. Sci, Prof, Head of Intelligent Systems & Information Systems Control Department, KNRTU, e-mail: [email protected].