Из гистограмм видно, что предлагаемый метод позволяет достаточно точно разделить области «свой» и «чужой». Для первой группы пользователей пороговое значение меры Хэмминга близко к 7, для второй - 10. При использовании достаточно большого числа контролируемых биометрических параметров распределение значений меры Хэмминга близко к нормальному, и пороговое значение меры Хэмминга Еп можно определить через математическое ожидание и дисперсию значений меры Хэмминга для «своего» пользователя:
Еп = т(Ес) + С[Ь,(1-р )]-а(Ес), где С[Ь, (1-Р1)] - коэффициент Стьюдента, задаваемый, исходя из числа использованных примеров Ь и величины ошибки первого рода (вероятности Р1 ложного отказа «своему» пользователю).
Предложенный метод отличается от известных тем, что он рассчитан на максимальную длину парольной фразы, в пределах которой структура классификатора остается неизменной. Это позволяет легко настраивать систему идентификации на любых новых пользователей, при необходимости менять биометрические параметры ранее зарегистрированных пользователей (при изменении их клавиатурного почерка), а также оперативно менять саму парольную фразу в пределах ее максимальной длины без каких-либо последствий для структуры классификатора и точности системы. Точность метода определяется единственным параметром - числом коэффициентов разложения, которое выбирается, исходя из максимальной длины парольной фразы.
Библиографический список
1. Иванов А.И. Биометрическая идентификация личности по динамике подсознательных движений: Пенза: Изд-во ПГУ, 2000, 188 с.
2. Брюхомицкий Ю.А., Казарин М.Н. Система аутентификации личности по почерку // Сборник трудов научно-практической конференции с международным участием «Информационная безопасность». Таганрог: Изд-во ТРТУ, 2002. С. 22-29.
3. Ахмед Н., Рао К.Р. Ортогональные преобразования при обработке цифровых сигналов: Пер. с англ./ Под ред. И.Б. Фоменко. М.: Связь, 1980, 248 с.
П.Ю. Юрков
Россия, г. Таганрог, ТРТУ
СИСТЕМА БИОМЕТРИЧЕСКОЙ АУТЕНТИФИКАЦИИ ПОЛЬЗОВАТЕЛЯ ПО ГОЛОСУ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ
В работе приведен один из вариантов решения задачи текстонезависимой аутентификации субъекта по голосу на основе комбинации методов быстрой цифровой обработки сигналов и нейронных сетей. Задача аутентификации пользователя по голосу состоит в определении, соответствует ли предъявленное имя и образец голоса, голосу пользователя зарегистрированного в системе. Однако, непосредственное сравнение речевых сигналов невозможно вследствие ряда причин, например случайного характера искажений при записи, а так же нерегулярности речевого сигнала по амплитуде и времени. Поэтому для текстонезависимой аутентификации субъекта по голосу необходимо использовать набор устойчивых параметров, выделяемых из речевого сигнала, с последующей их обработкой искусственными нейронными сетями.
Известно, что характеризующая диктора информация, содержащаяся в речевом сигнале, сконцентрирована, в основном, в средней и верхней частях спектра. Учитывая, что речь является мультипликативным сигналом, в котором один
из сомножителей представляет собой быстро меняющийся сигнал, а второй - медленно меняющийся сигнал, то для их разделения используются нелинейные методы, как правило, гомоморфная обработка речи [1]. Обычно для вычисления кепст-ра используется обратное Фурье-преобразование логарифма спектра мощности сигнала [2]. Однако, в данной работе кепстральные коэффициенты вычислялись рекурсивно по коэффициентам линейного преобразования [3].
Экспериментально было оценено необходимое число кепстральных коэффициентов для достоверной аутентификации диктора. На основе дисперсионного критерия было обнаружено, что число кепстральных коэффициентов должно быть не менее 26. Важным моментом при аутентификации пользователя является удаление из речевого сигнала пауз и шипящих звуков. Как отмечается в [4], спектр шипящих звуков практически одинаков для различных дикторов и близок к белому шуму. Поэтому при использовании таких участков речевого сигнала для аутентификации/идентификации дикторов значительно ухудшается правильность распознавания. Для удаления пауз и шипящих звуков был использован фильтр, основанный на ИНС. При прохождении речевого сигнала через фильтр полностью удалялись как паузы, так и шипящие звуки.
Преимущество использованного метода состоит в том, что он позволяет не только удалять паузы и шумные звуки, но и имеет возможность перенастройки фильтра на удаление нового типа помех, возникших при записи речевого сигнала, путем дообучения нейронной сети фильтра на этот вид помех. Фильтр представляет собой трехслойный персептрон, обученный методом обратного распространения о ш и б к и . Исходный речевой сигнал разбивается на перекрывающиеся сегменты длиной порядка 25 мсек. В качестве векторов использовались кепстральные коэффициенты линейного предсказания.
Для обучения сети фильтра была создана обучающая выборка общим объемом 1696 векторов, состоящая из пауз, шипящих и остальных звуков в качестве контр примеров. Работа фильтра проверялась на голосах дикторов, не участвовавших в обучении сети. Проверка на голосах 50 дикторов показала высокую эффективность его работы.
Процедура аутентификации пользователя по голосу выглядит следующим образом. Над записанным речевым сигналом осуществлялась описанная выше процедура фильтрации, в результате чего получается сигнал, содержащий только вокализованные участки. Затем речевой сигнал разбивался на перекрывающиеся участки длиной 90 мсек. и вычислялось 26 кепстральных коэффициента линейного предсказания. Полученные вектора далее использовались либо для обучения ИНС, либо для распознавания. При распознавании обученная на каждого диктора нейронная сеть относит каждый предъявленный ей вектор данных с определенной степенью уверенности в интервале от 0 до 1. Принятие решения о принадлежности произнесенной фразы к определенному диктору с последующим допуском его в систему или отказе от допуска производится на основе анализа интегральной оценки ответов нейронной сети. Система предусматривает установление порога идентификации диктора. При добавлении в систему нового диктора формируется обучающая выборка, содержащая вектора данного диктора и вектора других дикторов (до 15 дикторов) в качестве контр примеров. Создается нейронная сеть с 40 нейронами в одном скрытом слое и одним нейроном в выходном слое, которая затем обучается методом обратного распространения ошибки. Время обучения сети составляет от 2-х до 15-ти минут в зависимости от начального распределения весов. Надо отметить, что число скрытых слоев, нейронов в скрытом слое, а также размер входного вектора признаков были найдены экспериментальным путем и позволяют достичь наилучших результатов при аутентификации диктора.
При тестировании системы на голосах 65 дикторов нами были получены следующие результаты: количество ошибок ложного пропуска - 0.5%, количество ошибок ложного отказа - 7%. Полученные нами результаты свидетельствуют, что данную систему возможно использовать в системах удаленного доступа. В настоящее время проводятся работы по дальнейшему усовершенствованию системы аутентификации с целью защиты ее от имитации присутствия пользователя с помощью магнитофонных записей.
Библиографический список
1. Рабинер Л.Р, Шафер Р.В Цифровая обработка речевых сигналов. М., "Радио и связь", 1981.
2. Маркел Дж., Грэй А.Х. Линейное предсказание речи: Пер с англ., Под ред. Ю.Н. Прохорова, В.С. Звездина.- М.: Связь, 1980.- 308 с.
3. S.L. Marple, Jr., Digital Spectral Analysis With Applications, Prentice-Hall, Englewood Cliffs, New Jersey, USA, 1987.
4. Рамишеили А.В. Автоматическое распознавание говорящего. М.:Мир, 1989. 250 с.
И.А. Калмыков, Ю.О. Щелкунова, В.Р. Гахов
Россия, г. Ставрополь, Северо-Кавказский ГТУ
ПРИМЕНЕНИЕ ПОЛИНОМИАЛЬНОЙ СИСТЕМЫ КЛАССА ВЫЧЕТОВ ДЛЯ ПОВЫШЕНИЯ ОТКАЗОУСТОЙЧИВОСТИ БИОМЕТРИЧЕСКИХ СИСТЕМ АУТЕНТИФИКАЦИИ
В настоящее время одним из наиболее перспективных методов защиты информации являются методы биометрической аутентификации пользователя [1]. Как правило, в основу данных методов положена реализация цифровой обработки сигналов на основе одномерного или двумерного дискретного преобразования Фурье (ДПФ). Известно [2], что реализация прямого и обратного ДПФ предопределяет значительные погрешности при вычислении значений спектральных коэффициентов в поле комплексных чисел. Это, прежде всего, обусловлено тем, что поворачивающие коэффициенты Wk представляют собой иррациональные числа, что при значительных значениях входной последовательности отсчетов приводит к существенной аддитивной арифметической погрешности.
Данного недостатка лишены ортогональные преобразования, реализованные в расширенных полях Галуа GF(pv). Применение целочисленной арифметики позволяет в значительной степени сократить среднеквадратическую погрешность, обеспечивая высокую точность результата. Кроме того, расширенные поля Галуа GF(pv) имеют предпосылку для организации высокоскоростных параллельных
вычислений. Известно [3], что двучлен zp -1 -1, определяющий порядок GF(pv), может быть представлен в виде произведения минимальных многочленов p (z) , i = 1,2,..n . Если данные многочлены принять в виде оснований полиномиальной системы класса вычетов (ПСКВ), то, исходя из условия их попарной простоты, любой полином A(z), принадлежащий расширенному полю Галуа GF(pv), можно представить в виде совокупности остатков от деления A(z) на основания pi (z), т.е.
A(z) = (ai(z), a2(z), ...,au(z)), (1)
где ai(z) = A(z)modpi(z), i = 1,2,...u ; pt(z) - основания ПСКВ.
Обладая высоким параллелизмом, коды ПСКВ характеризуются также хорошими корректирующими способностями.