УДК 621.391; 519.21
РАЗРАБОТКА СИСТЕМЫ БИОМЕТРИЧЕСКОЙ ГОЛОСОВОЙ ИДЕНТИФИКАЦИИ
А. К. Алимурадов
DEVELOPMENT OF BIOMETRIC VOICE RECOGNITION
A. K. Alimuradov
Аннотация. Статья посвящена разработке системы идентификации личности по голосу. Подчеркивается актуальность задачи исследования и разработки системы для повышения точности идентификации. Предлагается алгоритм работы системы идентификации, основанный на использовании адаптивного математического аппарата.
Ключевые слова: биометрия, биометрические средства идентификации, голосовая аутентификация, преобразование Гильберта-Хуанга, декомпозиция на эмпирические моды, речевой сигнал.
Abstract. The article is devoted to the development of the system of identification by voice. Emphasizes the urgency of the task of research and development system to improve the accuracy of identification. Propose an algorithm for the identification of the system based on the use of adaptive mathematics.
Key words: biometrics, biometric identification, voice authentication, Hilbert-Huang transform, empirical mode decomposition on the speech signal.
Стремительное развитие и широкое использование современных информационно-телекоммуникационных систем ознаменовали переход человечества от индустриального общества к обществу информационному. В России начало этого перехода ознаменовано концепцией электронного правительства «Электронная Россия», которая была утверждена 6 мая 2008 г. (Постановление № 721).
Процесс информатизации мирового сообщества порождает комплекс негативных явлений. Уязвимость систем, на которых базируются региональные, национальное и мировое информационные пространства, приводит к возникновению принципиально новых угроз. Они связаны с потенциальной возможностью использовать информационно-телекоммуникационные системы в целях, не совместимых с задачами поддержания международной стабильности и безопасности. Поэтому все более актуальной становится проблема идентификации пользователей, имеющих доступ к общественным и личным информационным ресурсам.
На сегодняшний день современные системы идентификации используют технологии нескольких типов: устройства PIN-кода, смарт-карты, ключи «touch memory», ключи штрих-кода и т.п. Данные технологии не справляются с задачей безопасности в случае «прохода карточки (ключа, штрих-кода), а не человека». В то же время идентификатор (карта, ключ, штрих-код) может быть потерян или украден.
Наиболее подходящей и получившей широкое распространение в последние годы технологией является идентификация личности по биометрическим данным. Согласно прогнозу развития мирового биометрического рынка компании Biometrics Research Group через 3 года его объем вырастет более чем в 2 раза в 2015 г. и составит 15 млрд долл. США.
Одна из важнейших задач биометрии - создание технических средств, способных узнавать конкретного человека по его неповторимым биометрическим данным [1]. Классификация современных биометрических средств идентификации показана на рис. 1.
Рис. 1. Биометрические средства идентификации
Биометрические средства идентификации, по прогнозу Biometrics Research Group, обладают значительным простором для дальнейшего развития, что отражает прогноз рынка на 2012-2015 гг. (рис. 2).
ФОРМА КИСТИ РУКИ
ФОРМА ЛИЦА
РАДУЖНАЯ ОБОЛОЧКА ГЛАЗА
СЕТЧАТКА ГЛАЗА
ГОЛОС
ДРУГИЕ ТЕХНОЛОГИИ
Рис. 2. Рынок биометрических средств идентификации
15% /\
ПАПИЛЛЯРНЫЕ ; /11% \
ЛИНИИ ПАЛЬЦА 4 7%
\ \\ 7%/
\
Из анализа рис. 2 видно, что на рынке биометрических средств идентификации доминируют статические технологии. Среди технологий идентификации динамических данных быстрым развитием отмечена голосовая идентификация. Объясняется это в первую очередь универсальностью данной технологии, которую, в отличие от остальных, можно использовать для решения задач в самых различных областях. Голос является единственно доступной биометрической характеристикой для идентификации личности на расстоянии - в случае необходимости использования удаленного доступа, например, по телефону и т.п. Совокупный объем продаж систем биометрической идентификации по голосу в 2012 г. оценивается в 1 млрд долл., в 2015 г. этот объем может увеличиться до 3 млрд.
Биометрические технологии по голосу являются бесконтактными, этически корректными методами получения биометрической информации о личности. Взаимодействие с системой идентификации по голосу не вызывает у человека раздражения при снятии «образца». Преимущество голосовой идентификации над другими технологиями в ценовой политике - не требуется дорогостоящего дополнительного оборудования.
На сегодняшний день существует достаточное количество систем голосовой идентификации. Аналитический обзор характеристик и параметров этих систем показал, что все они имеют один общий недостаток, который сводится к низкой адаптивности математического аппарата, что в свою очередь при ухудшении условий идентификации приводит к некорректному выявлению уникальных свойств голоса и неоднозначности определения личности. Нельзя сказать, что прогресс в этой области вообще отсутствует, современная наука демонстрирует постепенное повышение эффективности систем идентификации личности, но возникает необходимость в постоянных исследованиях этого вопроса, что подтверждает его актуальность.
Исследование известных и разработка новых систем идентификации, работа которых основана на адаптивном анализе голосовых сообщений с использованием новейших математических новаций, является актуальным и перспективным.
Для разработки новых систем идентификации по голосу предложено использовать новый математический аппарат - декомпозиция на эмпирические моды (ДЭМ) [2]. Применение ДЭМ в обработке голоса обеспечит высокую адаптивность технологии и более корректное выделение уникальных свойств. На рис. 3 представлен разработанный алгоритм работы системы биометрической идентификации личности по голосу.
Анализ нестационарных и нелинейных сигналов на основе ДЭМ получил весьма широкое распространение при решении различных задач, в том числе - анализ голоса. Основным преимуществом ДЭМ является высокая адаптивность, проявляющаяся в том, что базисные функции, используемые при разложении голоса, извлекаются непосредственно из самого исходного сигнала и позволяют учитывать только ему свойственные особенности и сложную внутреннюю структуру.
Эмпирические моды, полученные в результате разложения голосового сообщения, на первом этапе позволяют выполнять эффективное для дальнейшего анализа преобразование Гильберта-Хуанга. В результате декомпозиции сигнал представляется в частотно-временной области, что позволяет выявлять скрытые модуляции и области концентрации энергии. Так как декомпозиция основана на данных конкретной локальной временной области сигналов, она применима и к нестационарным сигналам. С помощью преоб-
разования эмпирических мод можно определить мгновенную частоту как функцию времени, позволяющую получить отчетливое представление о внутренней структуре сигнала (рис. 3).
Рис. 3. Алгоритм работы системы идентификации
В качестве информативных параметров выделяются параметры, отвечающие за индивидуальность голоса - частота основного тона и формантные частоты [4]. Анализируется размер флюктуаций частоты основного тона и наклон спектра, а также соотношение мощностей формант вокализованных участков.
Проблему хранения шаблонов предлагается решить использованием преобразования биометрия-код, выполненного в соответствии с требованиями ГОСТ Р 52633.
Уникальными особенностями разрабатываемой системы являются:
- высокая степень адаптивности системы к реальным речевым сигналам;
- отсутствие угрозы перехвата речевого сигнала при регистрации;
- отсутствие хищения базы данных (шаблона);
- высокие показатели идентификации (FAR, FRR).
Разрабатываемая система идентификации по голосу в основном ориентирована на применение в биометрической защите. Однако система с адаптивной технологией идентификации, в зависимости от поставленных перед ней задач, может находить применение и в других направлениях:
- информационная безопасность;
- криминалистика и судебная экспертиза;
- радиоразведка, контрразведка, антитеррористический мониторинг;
- медицина, диагностика и прогнозирование.
Актуальность и перспективность проекта разрабатываемой системы биометрической идентификации личности по голосу подтверждаются результатами исследовательской работы автора [5, 6]. По результатам данных исследований получены два свидетельства о государственной регистрации программ для ЭВМ - № 2012613366, 2012613404.
Список литературы
1. Болл, Р. М. Руководство по биометрии / Р. М. Болл, Дж. Х. Коннел, Н. К. Ратха ; пер с англ. Н. Е. Агапова. - М. : Техносфера, 2007. - 352 с.
2. Huang, N. E. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis / N. E. Huang, Z. Shen, S. R. Long // Proc. R.: Soc. Lond. A. - 1998. - V. 454. - P. 903-995.
3. Фролов, А. В. Синтез и распознавание речи. Современные решения / Г. В. Фролов. - М. : Связь, 2003. - 216 с.
4. Сорокин, В. Н. Верификация диктора по спектрально-временным параметрам речевого сигнала / В. Н. Сорокин, А. И. Цыплихин // Информационные процессы. -2010. - Т. 10, № 2. - С. 87-104.
5. Алимурадов, А. К. Фильтрация речевых сигналов с использованием метода множественной декомпозиции и оценки энергии эмпирических мод / А. К. Алимура-дов, П. П. Чураков, А. Ю. Тычков // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2012. - № 4. - С. 117-125.
6. Алимурадов, А. К. Определение частоты основного тона речевого сигнала с использованием метода множественной декомпозиции на эмпирические моды / А. К. Алимурадов, П. П. Чураков, А. Ю. Тычков // Модели, системы, сети в экономике, технике, природе и обществе : сб. тр. III Всерос. науч.-практ. конф. студентов и молодых ученых. - Пенза, 2012. - С. 121-126.
Алимурадов Алан Казанферович аспирант, кафедра информационно-измерительной техники, Пензенский государственный университет
E-mail: [email protected]
Alimuradov Alan Kazanferovich Postgraduate student, sub-department of information and measuring equipment, Penza State University
УДК 621.391; 519.21 Алимурадов, А. К.
Разработка системы биометрической голосовой идентификации /
А. К. Алимурадов // Модели, системы, сети в экономике, технике, природе и обществе. - 2013. - № 1(5). - С. 120-124.