Научная статья на тему 'Пути улучшения качества речевого сигнала пользователя систем голосовой аутентификации'

Пути улучшения качества речевого сигнала пользователя систем голосовой аутентификации Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
473
75
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АУТЕНТИФИКАЦИЯ / AUTHENTICATION / АНТЕННАЯ РЕШЕТКА / ARRAY / БИОМЕТРИЯ / BIOMETRICS / ДИАГРАММА НАПРАВЛЕННОСТИ / РЕЧЕВОЙ СИГНАЛ / VOICE SIGNAL / КВАДРАТУРНАЯ ОБРАБОТКА / QUADRATURE PROCESSING / МИКРОФОН / MICROPHONE / DIRECTION PATTERN

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Файзулаева Ольга Николаевна, Невлюдов Игорь Шакирович

Обоснована целесообразность использования речевого сигнала пользователя компьютерных систем в процессе его аутентификации. Рассматривается научная задача повышения отношения сигнал/шум речевого сигнала пользователя системы аутентификации. Объект исследования процесс ввода и выделения речевого сигнала пользователя системы аутентификации в компьютерных системах и сетях. Исследуются методы и средства ввода и выделения речевого сигнала на фоне внешних помеховых сигналов. Предложены пути повышения качества речевого сигнала пользователя в системах голосовой аутентификации. Поскольку современные компьютерные средства, в том числе и мобильные, оснащены двухканальной звуковой картой, предложено при вводе речевого сигнала системы аутентификации использовать два микрофона. При этом решена задача формирования одного лепестка диаграммы направленности микрофонной решетки в требуемой области регистрации речевого сигнала (от 100 Гц до 8 кГц). Использование направленных свойств предложенной микрофонной решетки позволяет в 2-3 раза ослабить воздействие внешних помеховых сигналов в диапазоне частот от 4 до 8 кГц. Исследованы возможности применения пространственно-временной обработки регистрируемых сигналов при использовании постоянных и адаптивных весовых коэффициентов. Представлены результаты имитационного моделирования предложенной системы ввода и выделения сигналов в процессе цифровой обработки узкополосных сигналов. Предложенные решения позволяют повысить значение отношения сигнал/шум регистрируемых полезных сигналов до 10-20 дБ при воздействии внешних помеховых сигналов в диапазоне частот от 4 до 8 кГц. Полученные результаты могут быть полезны специалистам, выполняющим исследования в области распознавания речи, а также различения дикторов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Файзулаева Ольга Николаевна, Невлюдов Игорь Шакирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS FOR QUALITY ENHANCEMENT OF USER VOICE SIGNAL IN VOICE AUTHENTICATION SYSTEMS

The reasonability for the usage of computer systems user voice in the authentication process is proved. The scientific task for improving the signal/noise ratio of the user voice signal in the authentication system is considered. The object of study is the process of input and output of the voice signal of authentication system user in computer systems and networks. Methods and means for input and extraction of voice signal against external interference signals are researched. Methods for quality enhancement of user voice signal in voice authentication systems are suggested. As modern computer facilities, including mobile ones, have two-channel audio card, the usage of two microphones is proposed in the voice signal input system of authentication system. Meanwhile, the task of forming a lobe of microphone array in a desired area of voice signal registration (100 Hz to 8 kHz) is solved. The usage of directional properties of the proposed microphone array gives the possibility to have the influence of external interference signals two or three times less in the frequency range from 4 to 8 kHz. The possibilities for implementation of space-time processing of the recorded signals using constant and adaptive weighting factors are investigated. The simulation results of the proposed system for input and extraction of signals during digital processing of narrowband signals are presented. The proposed solutions make it possible to improve the value of the signal/noise ratio of the useful signals recorded up to 10,..., 20 dB under the influence of external interference signals in the frequency range from 4 to 8 kHz. The results may be useful to specialists working in the field of voice recognition and speaker’s discrimination.

Текст научной работы на тему «Пути улучшения качества речевого сигнала пользователя систем голосовой аутентификации»

УДК 057.087.1:621.391.26

ПУТИ УЛУЧШЕНИЯ КАЧЕСТВА РЕЧЕВОГО СИГНАЛА ПОЛЬЗОВАТЕЛЯ СИСТЕМ ГОЛОСОВОЙ АУТЕНТИФИКАЦИИ

О.Н. Файзулаеваа, И.Ш. Невлюдова

а Харьковский национальный университет радиоэлектроники, Харьков, Украина, [email protected] Обоснована целесообразность использования речевого сигнала пользователя компьютерных систем в процессе его аутентификации. Рассматривается научная задача повышения отношения сигнал/шум речевого сигнала пользователя системы аутентификации. Объект исследования - процесс ввода и выделения речевого сигнала пользователя системы аутентификации в компьютерных системах и сетях. Исследуются методы и средства ввода и выделения речевого сигнала на фоне внешних помеховых сигналов. Предложены пути повышения качества речевого сигнала пользователя в системах голосовой аутентификации. Поскольку современные компьютерные средства, в том числе и мобильные, оснащены двухканальной звуковой картой, предложено при вводе речевого сигнала системы аутентификации использовать два микрофона. При этом решена задача формирования одного лепестка диаграммы направленности микрофонной решетки в требуемой области регистрации речевого сигнала (от 100 Гц до 8 кГц). Использование направленных свойств предложенной микрофонной решетки позволяет в 2-3 раза ослабить воздействие внешних по-меховых сигналов в диапазоне частот от 4 до 8 кГц. Исследованы возможности применения пространственно-временной обработки регистрируемых сигналов при использовании постоянных и адаптивных весовых коэффициентов. Представлены результаты имитационного моделирования предложенной системы ввода и выделения сигналов в процессе цифровой обработки узкополосных сигналов. Предложенные решения позволяют повысить значение отношения сигнал/шум регистрируемых полезных сигналов до 10-20 дБ при воздействии внешних помеховых сигналов в диапазоне частот от 4 до 8 кГц. Полученные результаты могут быть полезны специалистам, выполняющим исследования в области распознавания речи, а также различения дикторов.

Ключевые слова: аутентификация, антенная решетка, биометрия, диаграмма направленности, речевой сигнал, квадратурная обработка, микрофон.

METHODS FOR QUALITY ENHANCEMENT OF USER VOICE SIGNAL IN VOICE AUTHENTICATION SYSTEMS O.N. Faizulaieva1", I.S. Nevlyudov"

а Kharkiv National University of Radioelectronics, Kharkiv, Ukraine, [email protected]

The reasonability for the usage of computer systems user voice in the authentication process is proved. The scientific task for improving the signal/noise ratio of the user voice signal in the authentication system is considered. The object of study is the process of input and output of the voice signal of authentication system user in computer systems and networks. Methods and means for input and extraction of voice signal against external interference signals are researched. Methods for quality enhancement of user voice signal in voice authentication systems are suggested. As modern computer facilities, including mobile ones, have two-channel audio card, the usage of two microphones is proposed in the voice signal input system of authentication system. Meanwhile, the task of forming a lobe of microphone array in a desired area of voice signal registration (100 Hz to 8 kHz) is solved. The usage of directional properties of the proposed microphone array gives the possibility to have the influence of external interference signals two or three times less in the frequency range from 4 to 8 kHz. The possibilities for implementation of space-time processing of the recorded signals using constant and adaptive weighting factors are investigated. The simulation results of the proposed system for input and extraction of signals during digital processing of narrowband signals are presented. The proposed solutions make it possible to improve the value of the signal/noise ratio of the useful signals recorded up to 10, ..., 20 dB under the influence of external interference signals in the frequency range from 4 to 8 kHz. The results may be useful to specialists working in the field of voice recognition and speaker's discrimination.

Keywords: authentication, array, biometrics, direction pattern, voice signal, quadrature processing, microphone.

Введение

В последние годы вопрос информационной безопасности вычислительных систем и сетей становится более актуальным не только для государственных учреждений, но и для коммерческих организаций и частных лиц по всему миру. Согласно оценкам комиссии по внутренним делам британского парламента, годовые потери мировой экономики от преступлений, совершенных с помощью Интернета, достигли 388 млрд. долларов. Таким образом, киберпреступность обошла по своему размаху мировой наркорынок, годовой оборот которого оценивается в 288 млрд. долларов. Размах киберпреступности обусловлен низким качеством систем аутентификации, совершенствование которых связывают с использованием биометрических признаков пользователя.

Биометрия принадлежит к тем областям современных технологий, темп развития которых значительно увеличился после драматических событий 11 сентября 2001 года в Нью-Йорке. Биометрические системы - это автоматические методы и средства идентификации личности посредством измерения уникальных физиологических особенностей или поведенческих характеристик человека и их сравнения с эталонами, хранящимися в соответствующих базах данных.

Первоначально основные усилия по решению стран «восьмерки» были сосредоточены на дактилоскопии, распознавании геометрии лица и радужной оболочки глаза. Эти идентификаторы рекомендовано использовать и при изготовлении биометрических паспортов. В основу работы биометрических систем

положена математическая статистика (а именно, проверка гипотез [1]), алгоритмы которой интенсивно используются в ряде технических систем, таких как связь, радиолокация, множество байесовских систем. В качестве основных характеристик биометрической системы, построенной на основе статистической теории проверки гипотез (тестов), принимают ошибки первого и второго рода [2, 3].

В последнее время исследователи уделяют большое внимание голосовой аутентификации, которая имеет следующие достоинства:

- простота, компактность, низкая стоимость устройств ввода информации;

- ввод информации дистанционно, без участия рук;

- алгоритмическая реализация процедур аутентификации с приемлемыми вычислительными затратами, поскольку обработке подвергается временной ряд;

- динамически меняющаяся парольная фраза, которая для обеспечения требуемых характеристик может наращиваться в процессе оперативной аутентификации;

- работа в темноте и в условиях сильных внешних шумовых и помеховых сигналов;

- устойчивая работа в каналах связи для обеспечения удаленной аутентификации, например, при организации надежного веб-доступа.

Основные характеристики (ошибки первого и второго рода) систем голосовой аутентификации, как и других биометрических систем, в значительной мере определяются отношением сигнал/шум (ОСШ) обрабатываемых материалов регистрации. Заметим, что ОСШ может увеличиваться как в процессе построения системы ввода сигнала, так и за счет реализации последующих процедур цифровой обработки материалов регистрации. Ввод речевого сигнала пользователя осуществляется, как правило, на фоне внешних мешающих сигналов, например, акустических волн, обусловленных работой коммутационной аппаратуры, серверов, кондиционеров и т.д. Задача компенсации этих сигналов осложняется, если они действуют в полосе частот речевого сигнала. Экспериментальные исследования спектра сигнала, обусловленного работой коммутационной аппаратуры (коммутаторы, маршрутизаторы), показали, что он занимает большую полосу частот с максимумами в области 1; 3; 4,2; 5 кГц.

Таким образом, существует актуальная научная задача повышения качества речевого сигнала пользователя систем голосовой аутентификации. Указанная задача будет решаться за счет совершенствования системы ввода и уточнения процедур выделения речевого сигнала пользователя на фоне внешних мешающих сигналов.

Методика и результаты исследований системы ввода речевого сигнала

Известно, что использование нескольких микрофонов (антенных решеток) позволяет получить ряд преимуществ, среди которых выделим следующие: повышение ОСШ; реализация процедур пространственно-временной обработки материалов регистрации, в том числе и для компенсации мешающих воздействий, находящихся в полосе частот полезного сигнала; расчет угла прихода интенсивного мешающего сигнала; оценка расстояния до источника звука и т.д.

Использование нескольких микрофонов рассматривалось в работах [4-7]. Например, в [4] рассматривался метод компенсации характеристик канала регистрации с помощью стереозаписи; в [5] разработан метод оценки расстояния до четырех микрофонов с целью компенсации характеристик канала регистрации; в [6] выполнены исследования пространственно-временной обработки сигналов для систем звукозаписи, а также оценены возможности применения таких методов в малогабаритных системах локализации источника звука.

В связи с тем, что современные компьютеры оснащены двухканальной звуковой картой, далее ограничимся анализом использования в системе ввода двух микрофонов, тем более что в мобильных устройствах (телефонах, смартфонах, планшетах и т.д.) ограничены возможности установки большего числа микрофонов. Первый аспект, на который обратим внимание, - расстояние между микрофонами. С одной стороны, оно ограничено размерами мобильных устройств, а с другой стороны, расстояние d зависит от длины регистрируемых волн X и определяется соотношением [8, 9]

d =Х/2.

Вопросы анализа длины волны речевого сигнала, используемого в системах аутентификации, рассмотрены в [10, 11]. При этом в [10] выявлено, что наибольшая информация о дикторе находится в полосах ниже 600 Гц и выше 3000 Гц. Частотный диапазон стандартного телефонного канала 300-3400 Гц обрезает высокие частоты, ухудшая различимость речи диктора. В [11] найдены три информативные области, которые влияют на различимость диктора: 100-300 Гц (влияние голосового источника), 4-5 кГц (грушевидные полости) и 6,5-7,8 кГц (возможно, влияние согласных). Небольшая область находится в районе 1 кГц. Исходя из этого, при выборе величины d учтем, что необходимо регистрировать речевой сигнал в диапазоне от 100 Гц до 8 кГц.

Здесь же заметим, что расстояние между микрофонами существенно влияет на вид диаграммы направленности (ДН) антенной решетки и процедуры цифровой обработки. Аналогичная задача применительно к радиодиапазону была рассмотрена в [8]. Воспользуемся соотношениями, представленными в

этой работе, и оценим ДН двухэлементной решетки для регистрации речевого сигнала. Основное отличие речевого сигнала - скорость распространения звуковой волны, равная 340 м/с, что приводит к изменению как длины волны, так и времени задержки. ДН определяется соотношением

А(©) = £ехр(] - (I -1) -Т),

к=1

где © - угол прихода волны, отсчитываемый относительно нормали к решетке, который изменяется в рассматриваемом случае в пределах от 0° до +90°; Т = 2-п-(й/X)-Бт(©); к =1 и 2 - номер микрофона. Пределы изменения угла © обусловлены тем, что микрофоны должны быть установлены на плоскости. В этом случае с иных направлений звуковая волна на микрофоны не попадет. Нормированная ДН, измеренная в децибелах, определяется как [8]

О(©) = 101в{|А(©)|2/4}.

Не вдаваясь в подробности обоснования, заметим, что в диапазоне анализируемых волн целесообразно потребовать наличия одного лепестка ДН. В этом случае акустические сигналы, поступающие по нормали к оси антенной решетки (речевой сигнал пользователя системы), будут регистрироваться без изменений, а сигналы с других направлений (помеховые излучения) будут ослабляться. Таким образом, решетка из двух микрофонов, которая имеет один лепесток ДН, позволит частично компенсировать мешающие сигналы во всем анализируемом диапазоне волн.

Для формирования одного лепестка ДН, как показали результаты аналитических расчетов, размещать микрофоны необходимо на расстоянии 10-20 мм. Указанный результат согласуется с данными, полученными в [6], где в исследованиях используется d =16 мм. Результаты выполненного моделирования нормированной ДН представлены на рис. 1. Анализ рис. 1 свидетельствует о наличии одного лепестка, но для волн с меньшей частотой значительно изменяется коэффициент передачи. Например, коэффициент передачи для диапазона волн 4-8 кГц изменяется в 2 раза. При этом направленные свойства микрофонной решетки позволяют в 2-3 раза снизить воздействие мешающих сигналов, действующих в диапазоне частот 4-8 кГц. Для частот ниже 4 кГц коэффициент передачи имеет значения от -1 до -0,1 дБ, что является недостаточным для подавления помеховых сигналов низкой частоты.

Рис. 1. Диаграмма направленности решетки из двух микрофонов ( d =20 мм)

Уточнение процедур выделения речевого сигнала пользователя

Следующие аспекты связаны с цифровой обработкой сигналов. Важным является вопрос выбора частоты временной дискретизации регистрируемых сигналов. С точки зрения качества цифровой обработки нельзя ограничиваться выполнением требований теоремы Котельникова. Вопросы временной дискретизации сигналов детально исследованы в [12], где показано, что требуемая частота дискретизации зависит от величины ОСШ обрабатываемых сигналов. Применительно к требуемому диапазону регистрируемых волн частота временной дискретизации находится в пределах от 18 кГц (ОСШ около 20 дБ) до 60 кГц (ОСШ - единицы дБ).

Далее уточним процедуры цифровой обработки. В отличие от [6], где задачи локализации источника звука решались за счет использования систем TDOA (Time Difference of Arrival - разность времени прихода сигнала), предлагается реализовать квадратурную обработку регистрируемых сигналов.

Качественное формирование и учет квадратурной составляющей зарегистрированного сигнала дают возможность более тонко восстановить его структуру (амплитудную огибающую, фазовую и частотную составляющие), что является важным в процессе аутентификации пользователя. Подтверждением необходимости квадратурной обработки является и то, что она широко и давно эффективно используется в радиолокации и радиосвязи, а в последнее время стала применяться в современных технологиях 100G Ethernet при передаче данных по оптоволокну.

Структурная схема системы ввода речевого сигнала и его обработки применительно к радиодиапазону рассмотрена в [8, 9] и представлена на рис. 2.

Источник шума

Ось антенной решетки

Нормаль 1С оси Пользователь антенны

K>i

X +

1

d Tll2 X

|Ю3 X

TT /2 X

Рис. 2. Структурная схема системы ввода и выделения речевого сигнала: М1 и М2 - микрофоны; п/2 - программные формирователи квадратурной составляющей; œ,. - весовые коэффициенты; i = 1,...,4; х - умножители, реализующие весовую обработку; (+) - сумматор

При воздействии узкополосного помехового сигнала в пределах углов 0° < © < 55° эта схема обработки обеспечивает его качественное подавление при постоянных весовых коэффициентах: о^ = 0,5 ; œ2 = 0,5 ; œ3 = 0,5 ; œ4 = -0,5 . При этом обязательным является разнесение микрофонов на расстояние d = X /2. Здесь X - длина волны помехового сигнала. Заметим, что для компенсации помехового сигнала из второй четверти (углы -55°<©< 0° ) величина коэффициентов должна быть изменена следующим образом: œj = 0,5 ; œ2 = 0,5 ; œ3 = -0,5 ; œ4 = 0,5 .

Для повышения качества компенсации помеховых сигналов рассматриваемой системы исследовано влияние использования адаптивного алгоритма расчета весовых коэффициентов [13]. Расчет весовых коэффициентов сводился к следующему. Сигнал ошибки для i -го канала и j -го такта обработки определим как разность между входным сигналом и выходом системы обработки, т.е.

ej = Xj - Xj • Wj ,

где x. - входной сигнал i -го канала и j -го такта обработки; Xrj = (x1 , x2 , x3 , x4 ) - вектор входных сигналов j -го такта обработки; Wj = (ю1 j, ю2j, ю3j, ю4j ) - вектор весовых коэффициентов для j -го такта обработки; X^ • Wj - выходной сигнал системы обработки. Каждый последующий весовой коэффициент i -го канала Wt]+1 равен сумме предыдущего коэффициента этого канала WtJ и переменной составляющей, пропорциональной значениям ошибки в этом канале:

W. . 1 = W, . + 2• и• X. . • е..,

i, j+1 i, j г i, j ij '

где и - это коэффициент, который определяет устойчивость и сходимость процесса адаптации. На величину этого коэффициента накладываются следующие ограничения:

0 < U < 1/V m^

где vmax - максимум собственного значения корреляционной матрицы входных сигналов.

Представленные процедуры адаптивного расчета коэффициентов носят название алгоритма минимума среднеквадратического отклонения Уидроу-Хоффа.

Предлагается следующая методика применения рассмотренных процедур во время аутентификации. На первом этапе (идентификации пользователя, например, с использованием пароля) выполняется уточнение весовых коэффициентов с учетом помеховой обстановки в помещении. Длительность уточне-

ния коэффициентов зависит от ^ . Меньшему значению ^ соответствует большее время адаптации. На втором этапе, во время ввода и выделения речевого сигнала пользователя, используются коэффициенты, полученные на предыдущем этапе. При этом целесообразно регистрировать как входные сигналы, так и результаты обработки. Они могут потребоваться в процессе последующей обработки.

Для формирования квадратурной составляющей предлагается использовать преобразование Гиль-берта-Хуанга. Это преобразование обеспечивает не только качественную обработку сигналов с нестационарными и нелинейными искажениями, что присуще акустическим сигналам, но и дает возможность повысить ОСШ за счет исключения (при необходимости) зашумленной первой модовой функции [12, 14].

Результаты моделирования свидетельствуют, что при д=0,001 для адаптации достаточно обработки до 300 отсчетов помехового сигнала (при ^ =0,002 число обрабатываемых отсчетов уменьшается до 150). Уточнение величины весовых коэффициентов позволяет уменьшить амплитудные значения помехового сигнала почти в 5 раз.

На рис. 3, а, представлен результат регистрации аддитивной смеси эталонного (500 Гц) и помехового (5000 Гц) сигналов на один микрофон (штриховая линия). Угол прихода помехового сигнала © = 70°. Сплошной линией на рис. 3, а, б, показан эталонный сигнал. Штриховой линией на рис. 3, б, представлен результат выделения эталонного сигнала с помощью предложенной системы обработки.

Критерием оценки качества цифровой обработки являлся коэффициент корреляции между эталонным сигналом и результатом регистрации (обработки). В первом случае это выход одного микрофона, а во втором - выход системы обработки. Коэффициент корреляции был равен 0,7 на выходе микрофона и 0,99 на выходе предложенной системы с адаптивными коэффициентами.

Известно, что коэффициент корреляции может быть пересчитан в значение ОСШ. В первом случае это 4 дБ, предложенная схема выделения речевого сигнала позволяет повысить ОСШ до 20 дБ. При этом качественная обработка сигналов обеспечивается в более широком диапазоне углов (до 80°). С уменьшением частоты мешающего воздействия будет снижаться и выигрыш в значении ОСШ. Например, при воздействии помехового сигнала с частотой 4 кГц величина ОСШ будет равна 10 дБ.

Отсчеты сигнала Отсчеты сигнала

"""" результат регистрации - одии микрофон ■ ■ ■ ■ результат обработки двух микрофонов

а б

Рис. 3. Результат регистрации аддитивной смеси речевого и помехового сигнала: на выходе микрофона (а); на выходе системы обработки (б). Сплошная линия - эталонный сигнал

Проблемой рассмотренной схемы обработки является недостаточное ее качество для подавления помеховых сигналов меньше 4 кГц. В этом случае достаточно сложно рассчитать величину весовых ко -эффициентов из-за малого расстояния между микрофонами. Для решения этой проблемы можно использовать дополнительный микрофон, обеспечив большее расстояние между микрофонами, и в дальнейшем использовать рассмотренные выше процедуры обработки. Указанный вариант потребует введения дополнительного канала регистрации. Кроме этого, расстояние между микрофонами для компенсации сигналов низкой частоты должно составлять десятки сантиметров, что не всегда можно реализовать на мобильных устройствах.

Заключение

Рассмотрены пути повышения качества речевого сигнала пользователя в системах голосовой аутентификации. Проанализировано использование нескольких микрофонов для ввода речевого сигнала, которые позволяют не только повысить величину отношения сигнал/шум регистрируемых сигналов, но и дают возможность реализовать пространственно-временную обработку материалов регистрации.

Исследованы характеристики системы ввода сигнала с помощью двух микрофонов, которые расположены на расстоянии 20 мм. Это позволило сформировать один лепесток диаграммы направленности микрофонной решетки, позволяющей ослаблять в 2-3 раза воздействие внешних помеховых сигналов в диапазоне 4-8 кГц. Детализированы процедуры цифровой обработки, которая включает учет квадратурной составляющей зарегистрированных сигналов и позволяет улучшить энергетические и уточнить фазовые характеристики речевых сигналов, что существенно для решения задач качественной аутентификации пользователя. Оценена возможность применения адаптивного расчета весовых коэффициентов для предложенной системы ввода и выделения речевого сигнала. Предложенные решения позволили повысить значение отношения сигнал/шум регистрируемых полезных сигналов до 10-20 дБ при воздействии внешних помеховых сигналов в диапазоне частот 4-8 кГц.

Достоверность и эффективность технических решений подтверждена результатами моделирования. Полученные результаты могут оказаться полезными и при решении иных задач, связанных с обработкой речевых сигналов в компьютерах, например, при распознавании речи или различении диктора.

Дальнейшие исследования будут связаны с разработкой процедур компенсации помеховых сигналов в области низких частот.

References

1. Gmurman V.E. Teoriya veroyatnostei i matematicheskaya statistika [Probability theory and mathematical statistics]. Moscow, Vysshaya Shkola Publ., 1999, 479 p.

2. Teoreticheskie osnovy radiolokatsii [Theoretical foundations of radiolocation]. Ed. Ya.D. Shirman. Moscow, Sov. radio Publ., 1970, 560 p.

3. Pastushenko O.N., Nevlyudov I.Sh. Analiz kachestvennykh pokazatelei biometricheskikh system autentifikatsii pol'zovatelei [Qualitative analysis of biometric systems for users authentication]. Problemy telekommunikatsii, 2012, no. 4 (9), pp. 96-103.

4. Murthy H.A., Beaufays F., Heck K.P., Weintraub M. Robust text-independent speaker identification over telephone channels. IEEE Transactions on Speech and Audio Processing, 1999, vol. 7, no. 5, pp. 554-568. doi: 10.1109/89.784108

5. Wang L., Kitaoka N., Nakagawa S. Robust distant speaker recognition based on position-dependent CMN by combining speaker-specific GMM with speaker-adapted HMM. Speech Communication, 2007, vol. 49, no. 6, pp. 501-513. doi: 10.1016/j.specom.2007.04.004

6. Mokretsov A.V. Algoritm i ustroistvo s adaptivnym upravleniem kharakteristikoi napravlennosti na osnove prostranstvenno vremennoi obrabotki signalov. Avtoref. diss. kand. tekhn. nauk [Algorithm and device with adaptive control of directivity pattern based on the space-time signal processing. PhD eng. sci. diss. abstract]. Taganrog, 2012, 16 p.

7. Sorokin V.N., V'yugin V.V., Tananykin A.A. Raspoznavanie lichnosti po golosu: analiticheskii obzor [Individual voice recognition: an analytical review]. Informatsionnyeprotsessy, 2012, vol. 12, no. 1, pp. 1-30.

8. Monzingo R.A., Miller T.W. Introduction to adaptive arrays. SciTech Publishing, Inc., 2003, 544 p.

9. Losev Yu.I. Berdnikov A.G., Goikhman E.Sh., Sizov B.D. Adaptivnaya kompensatsiya pomekh v kanalakh svyazi [Adaptive interference compensation in the communication channels]. Moscow, Radio i svyaz' Publ., 1988, 208 p.

10. Besacier L., Bonastre J.-F. Subband architecture for automatic speaker recognition. Signal Processing, 2000, vol. 80, no. 7, pp. 1245-1259. doi: 10.1016/S0165-1684(00)00033-5

11. Lu X., Dang J. An investigation of dependencies between frequency components and speaker characteristics for text-independent speaker identification. Speech Communication, 2007, vol. 50, no. 4, pp. 312-322. doi: 10.1016/j.specom.2007.10.005

12. Belousova E.E., Pastushenko N.S., Pastushenko O.N. Analiz vliyaniya chastoty diskretizatsii na kachestvo formirovaniya kvadraturnoi sostavlyayushchei analiticheskogo signala [Analysis of the sampling rate influence on quality of quadrature component forming of the analytical signal]. Vostochno-Evropeiskii zhurnal peredovykh tekhnologii, 2013, vol. 1, no. 9 (61), pp. 8-13.

13. Widrow B. Adaptive noise cancelling: principles and applications. Proceedings of the IEEE, 1975, vol. 63, no. 12, pp. 1692-1716. doi: 10.1109/PR0C.1975.10036

14. Belousova E.E., Pastushenko O.N. Analiz vliyaniya chastoty diskretizatsii na kachestvo formirovaniya kvadraturnoi sostavlyayushchei dlya nekotorykh signalov [Analysis of the sampling rate influence on quality of quadrature component forming of the some signals]. Radiotekhnika, 2013, no. 172, pp. 141-146

Файзулаева Ольга Николаевна Невлюдов Игорь Шакирович

Olha N. Faizulaieva Igor S. Nevlyudov

- аспирант, Харьковский национальный университет радиоэлектроники, Харьков, Украина, [email protected]

- доктор технических наук, профессор, зав. кафедрой, Харьковский национальный университет радиоэлектроники, Харьков, Украина, [email protected]

- postgraduate, Kharkiv National University of Radioelectronics, Kharkiv, Ukraine, [email protected]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- D.Sc., Professor, Department head, Kharkiv National University of Radioelectronics, Kharkiv, Ukraine, [email protected]

Принято к печати 23.01.14 Accepted 23.01.14

i Надоели баннеры? Вы всегда можете отключить рекламу.