Научная статья на тему 'Нейросетевые технологии при решении задач разграничения доступа'

Нейросетевые технологии при решении задач разграничения доступа Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
278
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕЧЕВОЙ СИГНАЛ / РЕЧЕВАЯ ИДЕНТИФИКАЦИЯ / КЛАССИФИКАЦИЯ / ВЕКТОРНОЕ КВАНТОВАНИЕ / ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / РАДИАЛЬНЫЕ БАЗИСНЫЕ ФУНКЦИИ / SPEECH / VOICE IDENTIFICATION / CLASSIFICATION / VECTOR QUANTIZATION / ARTIFICIAL NEURAL NETWORKS / RADIAL BASIS FUNCTION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Рыжков Александр Павлович, Катков Олег Николаевич, Морозов Святослав Викторович

В статье рассмотрены некоторые вопросы, касающиеся разработки процедур обработки речевого сигнала в системах речевой идентификации пользователя. Предложено при формировании кодовых книг использовать нейронные сети радиальных базисных функций и осуществлять поиск в них при помощи иерархического векторного квантования. Для функционирования нейросетевых векторных квантователей создан алгоритм классификации параметров сегментов речевого сигнала. Данный подход позволяет осуществлять речевую идентификацию пользователя при доступе к различным инфокоммуникационным системам.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Neural Network Technologies in Solving the Problem of Access Control

The article discusses some of the issues of development of speech signal processing procedures in the users voice identification systems. It is proposed the formation of codebooks to use neural network of radial basis functions and search them using hierarchical vector quantization. For the functioning of neural network vector quantizers established classification algorithm parameters of the speech signal segments. Using this approach allows the voice user authentication when accessing various infocommunication systems.

Текст научной работы на тему «Нейросетевые технологии при решении задач разграничения доступа»

НЕЙРОСЕТЕВЫЕ ТЕХНОЛОГИИ

ПРИ РЕШЕНИИ ЗАДАЧ РАЗГРАНИЧЕНИЯ ДОСТУПА

Рыжков А.П.1, Катков О.Н.2, Морозов С.В.3

В статье рассмотрены некоторые вопросы, касающиеся разработки процедур обработки речевого сигнала в системах речевой идентификации пользователя. Предложено при формировании кодовых книг использовать нейронные сети радиальных базисных функций и осуществлять поиск в них при помощи иерархического векторного квантования. Для функционирования нейросетевых векторных квантователей создан алгоритм классификации параметров сегментов речевого сигнала. Данный подход позволяет осуществлять речевую идентификацию пользователя при доступе к различным инфокоммуникационным системам.

Ключевые слова: речевой сигнал, речевая идентификация, классификация, векторное квантование, искусственные нейронные сети, радиальные базисные функции.

Введение

Одним из важнейших путей развития систем с речевым управлением является создание устройств идентификации личности абонента в целях защиты информационных баз данных от несанкционированного использования или преднамеренного искажения. Такая защита необходима не только в информационно-вычислительных системах специального назначения, но и, например, в автоматизированных системах управления технологическими процессами на предприятиях, выпускающих продукцию двойного назначения. Создание устройств с высокой надежностью (достоверностью) распознавания речи позволит обеспечить не только допуск легитимных абонентов к информационным сетям различного назначения, но и решать задачи по автоматической оценке эмоционального состояния операторов, управляющих сложными производственными процессами, а также другихлиц, работающих в реальных или моделируемых стрессовых ситуациях. В таких системах существует актуальная зауача по хранению и сравнению накоторых параметров речевого сигнала (РС) с бузовыми эталонными значениями, получаемыми заранее на этапе обучения системы распознавания, и формирования выходных сигналов в зависимости от итогов сравнения в виде необходимых управляющих воздействий или, как результат, идентификации личности абонента.

Теоретическая цель работы заключается у обосновании использования искусстаанеых нейронных сетей при создании аащищенных систем с речевым разграничением доатупа, осаорааных на применении радиальных базисных функций, а также разработке классификатора параметров речевого сигнала для функционирования предложенных нейронных сетей.

Классификация сегментов речевого сигнала. При построении дикторонезависимой системы разграничения доступа необходимо выполнить определенную классификацию элементов и параметров РС для дальнейшего сравнения и принятия решения. Как правило, разделение на элементы (сегментация) РС осуществляется оконными функциями длительностью 10-20 мс, что при частоте дискретизации 8 кГц соответствует 80-160 отсчетам. Для классификации сегментов РС на конечное число классов с целью дальнейшей обработки для выполнения процедуры идентификации по голосу используются статистические и параметрические характеристики речи.

К статистическим характеристикам, определяемым на сегменте, относятся:

- математическое ожидание М и средняя мощность (дисперсия) сигнала О,

- функция автокорреляции В и функция плотности аероятности (ФПа) ^(»ИО).

Математическое ожидасие М адиссерсиу О для речевого сигмента определяютуя фсрмулами

N сег M = 7 S(i)Pi, i=1

^сег . ч 2

D = S7 (S(i)-AP)2pi,

i=1

(1)

(2)

сег - количество отсчетов; pt - еероят-

где SA,

нрсть появле нис отс е ста £(/) в с е гмеете.

При совместеом изученеи центрироеанных случайных величин вводится автокорреляционная функция (АКФ):

SW

?(./)= 77 ((i+1)(( i+j+1) . i=0

(3)

1 Рыжков Александр Павлович, кандидат технических наук, Академия ФСО России, I". Орёл

2 Катков Олег Николаевич, каннидаттехнических оауу, Академия Ф-О Иоссии, г. Орёл

3 Морозов Святослав Викторович, Акадеиия ФСО -оссии, г. Орёл, 1тотпИ:@уипйех.ш

Выражение (3) справедливо при вычислении функции автокорреляцчи в сегменте для случая равеовероятности появления отсчетов. Как правило, вычидление функдди автокорреляции является частью процедуры належденле коэффиоиди-товлинейеоло иредскаолнлд.

Статистические сгойотва речевегч сигнала хс рош о отисыва ювтся чвтырьмя тччпаалегч распределений со слодуюгщими фучкцпями иллтчости вероятности (ФПВ): гауссовой, равномерной, лапласо-вой, гамма:

( Ня-м)2 ^

{Н,)==

В

2ст2

л/ВЛст

0,[ >73а;

м>Ня )к

К2В 43

ст

г Та)л

2ст

(4)

(5)

(6)

(7)

д/З^ткст

где ^ - соответствующее значение отсчета РС; <- среднеквадратическое отклонение сигнала (СКО), <<и = <чПС .

1Г парэги гмеечтрчич ечским лалектеристикам, которые могут быть исвелглооаны при разработке системы разграничении дослупя, относятся:

- коэффпциент озибвющей О кодируемого нигнола,

- число лидеходов через голь 2Г1,

- пирамптр сигнал тон/шум /(СТШ), гычисляе-мыо на сегменте анализа и повчоояющий разделить на 2 клсиса сегменвов: шумовые и тоновые,

- частота основного) тона 7%,,

- число формантных областей Ы7! на сегменте анализа.

Коэффициент огибающей кодируемого сигнала определяется по формуле:

о =

В Фсег-В

2 [(п+В)-[(п)\,

ф сег -В п=В

(8)

сег

где S(n) - отсчеты РС в сегменте анализа, Фс -с длина) сесмента, о характеризвет среднюкз скорость изме нения сигнала.

Число переходде через ноль %п определяет шумовые свойства РСн. Эео чв<зтота смены знака те-нущего отсчета ннаа сегменте анализа.

Для выделения параметра СТШ на сегменте анализа предполагается мспользовать метод, ос-

нованный на анализе АКФ [1], а также модифицированный метод Итакуры-Саито. Процесс нахож-денив I риализуется путем анализа АКФ сегмента сиансла длительностью 80 отсчетов и нахождения ее экстозмдма в заданной области определения, при этом вводится следующее правило принятия решения:

-тон;

я(тг)<£я(о)->/-шум (9)

Рекомендуется использовать значение k = 0,5, определенн(4о)е экспериментально.

Нахождение частоты основного тона производится для тоновых сегментов:

=1/^1. (10)

где Х^ - значение временного сдвига АКФ, при котором найден ее экстремум, удовлетворяющий правилу (9).

Оценка параметра СТШ и частоты ОТ методом Итакуры-Саито заключается в фильтрации остатка линейного предсказания рекурсивным НЧ-фильтром 6-го порядка (прототип фильтра Баттерворта с частотой среза от 300 до 600 Гц) для уменьшения влияния второй формантной области паз результаты вычислений. Данный фильтр выбр ан из соображений равномерности амплгтудно-частотной и линейности фазоча-стотной характеристик в полосе пропускания, а также приемлемой крутизны АЧХ в полосе рас-филгзровкн.

Для оценки частоты ОТ применяются одновременно два метода: метод анализа АКФ и модифицированный метод Итакуры-Саито. За частоту ОТ принимается среднее арифметическое значе-ниг, гычисленное с помощью этих двух методов:

¿от = 0,5 (¿0т1 + ^>т2).

Частота среза фильтра в методе Итакуры-Саито выбирается в зависимости от предварительно полученных данных о частоте ОТ на основе анализа АКФ речевого сегмента. Правила адаптивного изменения граничной частоты Рг пропускания фильтра в зависимости от частоты ОТ представлены в таблице 1.

Таблица 1

Зависимость граничной частоты среза ФНЧ от частоты ОТ

¿от, Гц Гц

<130 300

1(0-200 400

> 200 600

В

Число формантных областей Л^ на сегменте анализа определяется посредством исследования спектра речевого сегмента, исследование формантной структуры речи представлено в [2]. Данный параметр отражает необходимое и достаточное количество коэффициентов линейного предсказания.

Качественные характеристики систем обработки речевого сигнала зависят от выбранного алгоритма классификации речевыхскгментов.

Исследовались два альте°нативных алгоритма классификации сегментов речи:

Классификатор), основанный на анализе статистических и параметаическиххарактеристик речи.

Классификатор на базе анализа функции распределения исследуемого сигнала.

Класссфикатор первого типа основан на многоэтапном а нализе сегмиста. На первом этапе классификации сигнал делится ни ективныеучаст-ки и паузы, критерием принятия решения служит соотношение

Р < Р

[да,£ - пауза, I нет,£ - речь,

(11)

гдд Р =

N

1 ^ег ,

^ ^2 , Nк

число отсчетов

'кег ¿=1 в анализируемом сегменте.

Определеное Н0 заключается в раздалении сер мента в 80 отсчетов на паузн и нктивные участки с саФором насального уровня Р^ Сформированный экспертом сигнал) пауз подпевается прослушиванию и в нем определяется средняя мощность этих фрагментос для зоррекции значпнея Рн с учетом реномпндацкй, ввккачанных экспертом. Определение дисперсеи си-нала паузы прюизео-дится для большого числа дикторов с различча1 -ми свойствами р ечи. Таким об|йазом, за нгскол ноо итераций находится граничнон значение дисперсии , которое принимаедся за величину/ РДс

Рассчитанное знаненсе Р0 позволяет делить РС ни два кла сса (пауз а/речь) тски м об ра зо м- нко доля времени пнуз в речи составляет около )50 %, что соответствует резулотатам исследований речи друсими автм|зами [3]].

На вто|сомэтапе класссфикации сегменты активной речи делятся на четыре типа:тоновые, шумовые, переходные 1 типа и переходные 2 типа. Для такого °алпоня натисляется параметр» СТШ I и частота ОТ ]Дот не сегменте анализа.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Высисления на|таметна СТШ и частоты ОТ производятся соуместно на осноне аяалида АКФ РС и метода Итакуры-Саито. Использование двух ме-

тодов в совокупности уменьшает вероятность ошибки в классификации сегментов речи.

Целесообразность выбора данных методов для выделения параметра СТШ и частоты ОТ объясняется уменьшением общей вычислительной сложности за счет повторного применения результатов, полученных в ходе их вычислеоея на последующих этапах обработки РС.

Правила принятия рашекия о типе сегмента сформулированы слддующим обрваом:

- тоновые сегменты: метод анализа АКФ определяет сегмент как тоновый, матод ИтакурысСаи-то - яактоновый;

- шумовые сегменты: метод анализа АКФ определя ет сегмент как шумовой, метод Итаку-ры-Саито - как шумовой;

- переходные сегменты первого типа: метод анализа АКФ определяет сегмент как шумовой, метод Итакуры-Саито - как тоновый;

- переходные сегменты второго типа: метод анализа АКФ определяет сегмент как тоновый, метод Итакуры-Саито - как шумовой.

Нч третьем этапе все тоновые и переходные сегменты делятся на мужские и женские по правилу: если ДоТ > Дгр, то сегмент женский, если Дот ^ Днр, то сегмент мужской.

Граничная частота ОТ Дгр=180 Гц определена экспериментально и сиответствует рузультатам исследований [4].

Таким ебразом, с помощью трехэтапного клас-сифнеатора дктивные сегменты РС будут долиться низ 7 типов.

Алгоритм классификации речевых сегментов на ноаданое число классов с использованием харак-иеристик РС представлен ни рисунее 1, а вапяанты классифицированных сегмеитов а на рисунке 2.

Приец ип построения классификатора второго типа состоит в использявании четырех осиовных фуни^ плотноити вероятности, законы раипре-деления которых хорошо описывают статистические свойства РС Такой клаисификатор строится на основе критериа согла сия Колмогоро ва-Смирнова с четырьмя возможными аналитическими моделями функций плотности вероятности (0)-(7). Данный класзификатор дополнительно мсжет применять и такие характериа"иио, как мощность сигнала на участке анализа, параметр тон/шум и частоту! ОТ, функцию коррнляции сигнала на сегменте анализа (3). Результаты исследо-кания функций плотности вероятности отсчетов РС на сегменте анализа и способы построения классификатора на их основе, а также полученные при эпом результаты показаны я [5].

Начало

Киассификеция сегментов РС методом АКФ и Итакуры-Саито

I

Определение принадлежности к классу мужских или женских голосов

_и_

Определение типа сегмента активной речи

, На ^

Г" Конец

Рис. 1. Блок-схема алгоритма классификации сегментов РС

[(п)'

0.5 0.4 0.3 0.2 0.В 0

-0.В -0.2 -0.3 -0.4

Тоновые сегменты

Шумовые сегменты.

0 Г0 В60 240 320 400 4Г0 560 640

Рис. 2. В иды речевых сегмантов во временной области

п

Для обоснованного выбора типа классификатора было проведено моделирование, которое показало, что лучший результат по критерию суммарного отношения сигнал/шум обеспечивает классификатор 1-го типа, поэтому он выбран в качестве классификатора сегментов РС для дальнейшего использования в системах разграничения доступа.

Нейросетевая обработка сегментов речевого сигнала. Хранение и сравнение элементов и

параметров речевого сигнала при функционировании систем разграничения доступа по голосу невозможны без применения принципа векторного квантования (ВК). В качестве перспективного направления ВК предлагается использование каскадного ВК [6]. Его алгоритмы достаточно хорошо согласуются с процедурой обучения и поиска в нейронных сетях - классификаторах, которые выступают в качестве векторных квантователей эле-

ментов и параметров РС. В контексте нейронных сетей возможно применение нейронных сетей радиальных базисных функций РВР, поскольку в [7, 8] доказано, что каждое множество образов, случайным образом размещенных в многомерном пространстве, является ф -разделимым при условии большой размерности этого пространства.

Основанием использования сетей типа РВР по сравнению с аналогичными (многослойными пер-септронами, рекуррентными, с самоорганизацией) в первую очередь является высокая скорость обучения, а следовательно, и создание кодовых книг при векторном квантовании.

Нейронная сеть РВР функционирует по принципу многомерной интерполяции, состоящей в отображении р различных входных векторов

(г=1,2,..., р) из входного N -мерного пространства во множество из р рациональных чисел dj(/ =1,2,...,р). Для реализации необходимо применить р скрытых нейронов радиального типа и задать функцию отображения ¥ (х) вида ¥ (х)=йI. Чаще всего в качестве радиальной функции выступает функция Гаусса. При размещении ее центра в точке С^ она может быть определена как

Вход

х(1)

ф( х) = ф(|| х-С111) = ехр

/

\\X-Ci

V

2<

2

\

У

(12)

где < - параметр, от значения которого зависит ширина функции.

Решение, представляющее аппроксимирующую функцию в многомерном пространстве в виде взвешенной суммы локальных базисных радиальных функций, может быть интерпретировано радиальной нейронной сетью, представленной на рисунке 3, в которой ф- определяется зависимостью (12). Это сеть с трехслойной архитектурой, в которой только скрытый слой выполняет нелинейное отображение, реализуемое нейронами с базисными радиальными функциями. Выходной нейрон линеен, а его роль сводится к взвешенному суммированию сигналов, поступающих от нейронов скрытого слоя.

Процесс обучения сети РВР с учетом выбранного типа радиальной базисной функции сводится к подбору центров С^ и параметров <\ формы базисных функций, а так же подбору весов нейронов выходного слоя.

Определяющим при обучении является подбор параметров нелинейных радиальных функций, особенно центров С^. Известны три основных метода подбора: самоорганизация, обучение с учителем и гибридный.

ф(и)

Рис. 3. Обобщенная структура радиальной сети ИБР

Анализ рассмотренных методов обучения нейронных сетей на основе радиальных базисных функций и результатов моделирования показывает, что лучшим в целях обучения является гибридный метод, включающий в себя как процедуры настройки на основе самоорганизации, так и обучение с учителем.

Этап обучения на основе самоорганизации. Его целью является оценка подходящих положений центров радиальных базисных функций скрытого слоя. При реализации каскадного ВК этап самоорганизации должен состоять из трех циклов. Увеличение количестыва циклов обучения не приводит к существенному уменьшению ошибки классификации (рис. 4).

Этап обучения с учителем. Завершается оценка центров радиальных базисных функций скрытого слоя и определяются линейные веса выходного слоя.

Алгоритм можно описать следующим образом:

Этап 1

1. Инициализация. Выбираются случайные значения для исходных центров радиальных базисных функций с. Единственным требованием к их выбору на данном шаге является различие всех начальных значений.

2. Выборка. Нейронной сети РВР предъявляется вектор х из обучающего множества X. В случае проведения эксперимента в качестве обучающей выборки предъявлялись векторы линейных спектральных частот.

3. Проверка подобия. Согласно критерию минимального Евклидова расстояния, определяется индекс победившего нейрона (центра) для вектора х:

г(х) = ъщтт х(п)-с- (п) г

I=1,2,..., С

(13)

Точность 4,542е-008, предельная 1е-005

П=0,005

10"'

а .

О 10'

10

.........1........■'........

.............

..........

\\\ \ ^ ^------ \ 3 эксиеримен 1 ■у__i 1 эксиер значТ эксиери 1мент ■ ICII 1

1 2 Количество этапов обучения

Рис. 4°. Зависимость) ошибки обучения нейронной сети RBFот числа циклов на первом этапе обучения

где в} - центр ¡-й радиальной базисной функции, п - номер итерации, С - количество центров.

4. Корректировка. Центры радиальных функций корректируются по правилу

сг (п +1) = Ь (п)+п[х-С (п)]' К х)' (14) С (п)-в противном случае,

где П - параметр скорости обучения, 0 <п<1.

5. Повторение шагов 3-4 (увеличение шага на 1) до тех пор, пока п оложени е центров окр ытыа нейронов не уерестанет существенно изменяться (как правило, достаточно трех итераций).

По зав ершении первого этапа для обучаю щей выборзки пространствп скрытых нейроиов трехслойной сети РВР оказалось равным 145-157 для сери и из повторяющихся экспериментов (рис. 5).

При фор мировании кодовых книг на первом этапе значение П выбрано 0,005, необходимое для хорошей статистической точности на этапе сходимости (рис. 6).

Этап 2

Сформированное пространство ячеек векторов является приближенным с точки зрения размещения опорных векторов-центроидов в Ы-мерной системе координат. В качестве механизма точной подстройки необходимо произвести квантование векторов:

1) в случае максимальной близости вектора Вороного ИО, ко входному вектору Х^

(п+1)=пе- ро)+[л^- — "И^(пс)],гДе 0<ап<1 .

2) при несовпадении Wj (n+l)=Wj (n)-

О 10'

1 жсиеримеш

***.з2 жсие-римеш ■—3 жсиеримеш!

V

0 90 100 110 120 130 140 150

Количество скрытых шейрошов

Рис. 5. Формирование пространства скрытых нейронов по завершении первого этапа обучения сети RBF

0 -5

О 10

V4-

n 0.00I

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— -А "

~ —^

— i^.) П 0,005 ■

\

--П 0 ,1 \ \

■--- \

: : \

\ *

\

ч

\

0 1 2 3 4 5 6 7

Циклы обучения

Рис. 6. Влияние параметра скорости обучения на первом этапе формирования кодовых книг для векторов линейных спектральных частот

3) остальные векторы Вороного не изменяются.

Постоянную обучения ап для формирования кодовых книг выбирают с начальным значением 0,09 (рис. 7).

В результате процедуры квантования после нескольких проходов по входным данным координаты опорных векторов Вороного перестают изменяться, а следовательно, и завершается создание пространства многоугольников Вороного.

Особенностями алгоритма являются:

1) функция стоимости - выпуклая по линейному параметру ^, однако невыпуклая по отношению к центрам с^ и матрице ;

2) для оторого этапа можно использовать разные пара метры скорости обучения а п;

0

10

10

-2

10

10

10

( Начало ^

0 2 4 6 8 10 12 14

Циклы обучения

Рис. 7. Влияние постоянной обучения ап на втором этапе формирования кодовых книг для векторов линейных спектральных частот

3) в отличие от алгоритма обратного распространения, этап обучения с учителем, являющийся процедурой градиентного спуска для сети РВР, не предполагает обратного распространения сигнала ошибки.

Блок-схема алгоритма гибридного обучения сети РВР представлена на рисунке 8.

При осуществлении поиска используется многоступенчатая иерархическая процедура, которая ускоряет поиск в отличие от древовидного поиска опорного вектора-центроида [9]. Многоступенчатое иерархическое ВК разделяет общую операцию поиска на множество подопераций, каждая из которых требует малого объема вычислений. В каждой подоперации обрабатывают остаток вектора, формируемый на предыдущем подэтапе. Входной вектор квантуют £гуровневым векторным квантователем, остаток (ошибка) квантования подают на вход второго ^-уровневого векторного квантователя. Процесс может повторяться для любого количества подэтапов. Окончательное квантованное значение вектора для кодовых книг представляют в виде суммы выходных векторов промежуточных и конечного квантователя.

Заключение

Проверка разработанных алгоритмов, согласно требованиям, предъявляемым к ним, в среде МЛИЛВ показала их соответствие и возможность дальнейшей реализации на современной элементной базе [10]. Тестирование разработанных алгоритмов выполнено на реальных РС длительностью не менее 15 мин для 13 дикторов. Таким образом, использование предложенных выше элементов системы разграничения доступа для целей регистра-

Ввод обучающей выборки

X

Инициализация

I

п = 1

Проверка подобия

/'(х) = а^тт||х(п) - с(п)||, I = 1,2,...,С

Коррекция

С (п+1)=

С (п)+п[х - с^ (п)\1=х), сI (п)-в противном случае,

п = п + 1 п____ = 3

Определение функции потерь

2 Л

X

Уточнение позиций центров

дЕ(п)

С1(п + 1)=С(п)-П

дС(п)

Расчет весов выходного слоя

^ (п+1)=^ (п)-Ч^Щ-, Г =1,2,...,С

(п)

Квантование опорных векторов

Формирование таблицы координат центроидов ячеек

т

^ Конец ^

Рис. 8. Блок-схема алгоритма гибридного обучения нейронных сетей радиальных базисных функций

0

0

0

и I

0

0

0

0

ции и идентификации пользователей инфокомму-никационных систем обеспечивает выполнение двух технических задач:

- повышение надежности функционирования системы разграничения и контроля доступа к информации аппаратно-программным способом;

- реализацию широких функциональных возможностей по изменению критериев доступа в за-

висимости от информационной важности данных.

В целом система распознавания пользователей на основе речевого классификатора и нейросете-вого ВК может выступать как часть программно-аппаратных средств управления доступом и комбинироваться как с традиционными средствами подтверждения подлинности, так и с иными биометрическими системами.

Рецензент: Цирлов Валентин Леонидович, кандидат технических наук, доцент МГТУ им. Н.Э. Баумана, Москва, v.tsirlov@bmstu.ru

Литература:

1. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: классификация и снижение размерности. - М. : Финансы и статистика, 1989. Т. 3. - 607 с.

2. Маркел Д., Грей А.Х. Линейное предсказание речи: под ред. Ю.Н. Прохорова и В.С. Звездина. - М.: Связь, 1980. - 308 с.

3. Волчихин В.И., Иванов А.И., Назаров И.Г., Фунтиков В.А., Язов Ю.К. Нейросетевая защита персональных биометрических данных : монография / Под ред. Ю. К. Язова. - М.: Радиотехника, 2012. - 160 с.

4. Афанасьев А.А., Рыжков А.П. Использование взаимозависимостей параметров линейного предсказания при реализации процедур обработки речевых данных // Телекоммуникации. 2012. № 13. С. 36-39.

5. Рыжков А.П., Афанасьев А.А. Реализация нейросетевой обработки сегментов при линейном предсказании речи // Известия Тульского государственного университета. Технические науки. 2012. № 11-2. С. 173-179.

6. Макхоул Д., Рукос С., Гиш Г. Векторное квантование при кодировании речи // ТИИЭР, 1985. Т. 73. № 11. С. 19-61.

7. Cover T.M. Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 1967, vol. IT-13, p.21-27.

8. Cover T.M. Geometrical and statistical properties of systems of linear inequalities with applications in pattern recognition. IEEE Transactions on Electronic Computers, 1965, vol. EC-14, p.326-334.

9. Хайкин С. Нейронные сети: полный курс, 2-е издание. - М.: Издательский дом «Вильямс», 2006. - 1104 с.

10. Медведев В. С., Потемкин В. Г. Нейронные сети. MATLAB 6. - М. : Диалог-МИФИ, 2002. - 496 с.

NEURAL NETWORK TECHNOLOGIES IN SOLVING THE PROBLEM OF ACCESS CONTROL

RyzhkovA.P.4, KatkovO.N.5, MorozovS.V.6

The article discusses some of the issues of development of speech signal processing procedures in the users voice identification systems. It is proposed the formation of codebooks to use neural network of radial basis functions and search them using hierarchical vector quantization. For the functioning of neural network vector quantizers established classification algorithm parameters of the speech signal segments. Using this approach allows the voice user authentication when accessing various infocommunication systems.

Keywords. Speech, voice identification, classification, vector quantization, artificial neural networks, radial basis function.

References:

1. Ayvazyan S.A., Bukhshtaber V.M., Enyukov I.S., Meshalkin L.D. Prikladnaya statistika: klassifikatsiya i snizhenie razmernosti. - M. : Finansy i statistika, 1989. T. 3. - 607 P.

2. Markel D., Grey A.Kh. Lineynoe predskazanie rechi: pod red. Yu.N. Prokhorova i V.S. Zvezdina. - M.: Svyaz1, 1980. - 308 P.

3. Volchikhin V.I., Ivanov A.I., Nazarov I.G., Funtikov V.A., Yazov Yu.K. Neyrosetevaya zashchita personal'nykh biometricheskikh dannykh : monografiya, Pod red. Yu. K. Yazova. - M.: Radiotekhnika, 2012. - 160 P.

4. Afanas'yev A.A., Ryzhkov A.P. Ispol'zovanie vzaimozavisimostey parametrov lineynogo predskazaniya pri realizatsii protsedur obrabotki rechevykh dannykh, Telekommunikatsii. 2012. No 13, pp. 36-39.

5. Ryzhkov A.P., Afanas'yev A.A. Realizatsiya neyrosetevoy obrabotki segmentov pri lineynom predskazanii rechi, Izvestiya Tul'skogo gosudarstvennogo universiteta. Tekhnicheskie nauki. 2012. No 11-2, pp. 173-179.

6. Makkhoul D., Rukos S., Gish G. Vektornoe kvantovanie pri kodirovanii rechi // TIIER, 1985. T. 73. No 11, pp. 19-61.

7. Cover T.M. Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 1967, vol. IT-13, p.21-27.

8. Cover T.M. Geometrical and statistical properties of systems of linear inequalities with applications in pattern recognition. IEEE Transactions on Electronic Computers, 1965, vol. EC-14, p.326-334.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Khaykin S. Neyronnye seti : polnyy kurs, 2-e izdanie. - M. : Izdatel'skiy dom «Vil'yams», 2006. - 1104 P.

10. Medvedev V. S., Potemkin V. G. Neyronnye seti. MATLAB 6. - M. : Dialog-MIFI, 2002. - 496 P.

4 Aleksandr Ryzhkov, Ph.D., The Academy of Federal Security Guard Service of the Russian Federation, Orel

5 Oleg Katkov, Ph.D., The Academy of Federal Security Guard Service of the Russian Federation, Orel

6 Svatoslav Morozov, The Academy of Federal Security Guard Service of the Russian Federation, fromnet@yandex.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.