Научная статья на тему 'КАНАЛ РЕЧЕВОГО УПРАВЛЕНИЯ АВТОМАТИЗИРОВАННОЙ СИСТЕМОЙ ОТРАБОТКИ РАДИОЛОКАЦИОННОГО ОБОРУДОВАНИЯ. КОМПЛЕКС ПРОГРАММНО-АЛГОРИТМИЧЕСКИХ И АППАРАТНЫХ СРЕДСТВ'

КАНАЛ РЕЧЕВОГО УПРАВЛЕНИЯ АВТОМАТИЗИРОВАННОЙ СИСТЕМОЙ ОТРАБОТКИ РАДИОЛОКАЦИОННОГО ОБОРУДОВАНИЯ. КОМПЛЕКС ПРОГРАММНО-АЛГОРИТМИЧЕСКИХ И АППАРАТНЫХ СРЕДСТВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
11
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕЧЕВЫЕ СИГНАЛЫ / РАСПОЗНАВАНИЕ / ФОНЕМЫ / КАНАЛ РЕЧЕВОГО УПРАВЛЕНИЯ / РЕЧЕВЫЕ КОМАНДЫ / ПРИЗНАКИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сахаров Виталий Олегович

В работе поставлена задача создания канала речевого управления радиолокационным оборудованием. Проведены исследования и разработаны модели представления речевых сигналов. Представлено построение системы распознавания речевых команд. Разработан комплекс программно - алгоритмических и аппаратных средств

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Сахаров Виталий Олегович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «КАНАЛ РЕЧЕВОГО УПРАВЛЕНИЯ АВТОМАТИЗИРОВАННОЙ СИСТЕМОЙ ОТРАБОТКИ РАДИОЛОКАЦИОННОГО ОБОРУДОВАНИЯ. КОМПЛЕКС ПРОГРАММНО-АЛГОРИТМИЧЕСКИХ И АППАРАТНЫХ СРЕДСТВ»

Электронный журнал «Труды МАИ». Выпуск № 38

www.mai.ru/science/trudy/

УДК 621.39

Канал речевого управления автоматизированной системой отработки радиолокационного оборудования. Комплекс программно-алгоритмических и аппаратных средств

В.О.Сахаров

Аннотация

В работе поставлена задача создания канала речевого управления радиолокационным оборудованием. Проведены исследования и разработаны модели представления речевых сигналов. Представлено построение системы распознавания речевых команд. Разработан комплекс программно - алгоритмических и аппаратных средств. Ключевые слова

Речевые сигналы, распознавание, фонемы, канал речевого управления, речевые команды, признаки.

Введение

К качеству радиолокационного оборудования ракетной и авиационной техники, разрабатываемой и изготавливаемой на отечественных научно - производственных предприятиях, предъявляются жесткие требования [ 1 ]. В связи с этим, в рамках производственного цикла особое значение придается этапу отработки ( настройки, контрольно - диагностических работ ) радиолокационного оборудования (радиолокационной станции - РЛС, радиолокационной головки самонаведения - РГСН).

Одним из базовых блоков РЛС (РГСН ) является антенный блок, включающий в свой состав антенную систему ( антенное полотно), а также электромеханическую часть, обеспечивающую перемещение в пространстве антенного полотна, и высокочастотную часть.

При отработке антенного блока, оценка его работоспособности осуществляется путем контроля (проверки) электромеханических параметров на автоматизированных рабочих местах (АРМ), оснащённых цифровыми вычислительными машинами (ЦВМ).

Недостаточно эффективное взаимодействие оператора с техническими средствами рабочего места при контроле параметров и оценке неисправностей антенного блока препятствует обеспечению качественной отработки радиолокационного оборудования.

Однако, ресурсы использования возможностей человека при взаимодействии с цифровыми вычислительными системами АРМ далеко не исчерпаны.

В настоящее время развитие автоматизированных систем идет по пути обучения их функциям, свойственным человеку: способностям распознавать слуховые, зрительные и тактильные образы. Реализация речевых интерфейсов ( взаимодействия в системе "человек -компьютер" с использованием речевой информации) является одной из наиболее востребованных задач индустрии информационных технологий [2].

Это обусловлено преимуществами использования устной речи перед другими способами общения человека и машины [ 3, 4 ]:

- речь является удобной для человека формой передачи информации;

- остаются свободными руки;

- оператор не должен занимать фиксированную позицию;

- не требуется использование клавиатуры, тумблеров, кнопок и других коммутирующих устройств.

Система автоматического распознавания речи (СРР) является центральной системой при создании речевого интерфейса. Разработка надежно работающих СРР позволяет использовать речевые интерфейсы в системах управления различными объектами. При этом реализуется возможность управления с использованием голоса (речевого управления).

Проблема автоматического распознавания речевых сигналов привлекает интерес исследователей на протяжении нескольких десятилетий.

Речевые сигналы (РС), являясь принципиально нестационарными , обладают рядом свойств, обусловливающих сложность их распознавания. К ним можно отнести: большую вариативность, сложный спектр, широкополосность, большой динамический диапазон, раз-номасштабность по времени.

Вопросам обработки и распознавания РС было посвящено большое количество публикаций отечественных и зарубежных авторов. Проведено значительное число работ по применению методов цифровой обработки сигналов (ЦОС) для формирования признаков при распознавании РС: методов спектрального и корреляционного анализа, кепстрального анали-

за, линейного предсказания, вейвлет - анализа. Однако, при использовании данных методов не всегда обеспечивается надежное распознавание РС.

Эффективность СРР существенно зависит от объёма словаря, числа дикторов, четкости произношения, уровня шума, производительности процессоров вычислительных систем и других факторов.

В связи с этим, характеристики качества работы имеющихся образцов СРР, созданных фирмами - производителями: Microsoft Corporation, IBM, Intel, Philips Speech processing, "Центр речевых технологий" не могут быть гарантированы в неблагоприятных условиях эксплуатации [ 5 ].

Следует отметить, что большинство образцов СРР предназначено для работы с речью на иностранных языках, что не позволяет автоматически использовать их при работе с русской речью в связи с ее спецификой.

Задача создания эффективных систем распознавания русской речи до настоящего времени не получила окончательного решения и побуждает разработчиков к дальнейшим исследованиям свойств РС, применению новых методов ЦОС при обработке и распознавании речи.

Реализация речевого управления радиолокационным оборудованием в производственных условиях является сложной задачей, требующей учёта специализации разрабатываемой аппаратуры, проработки вопросов сопряжения существующих и дополнительных аппаратных средств, адаптации разработанной системы речевого управления для работы с конкретными операторами.

С учетом вышеизложенного, реализация речевого управления является актуальной научно-технической проблемой, требующей проведения исследований РС, разработки комплекса процедур, алгоритмов и программного обеспечения (ПО) обработки РС и распознавания речевой информации и выработки системы технических решений, обеспечивающих аппаратную реализацию речевого управления объектом.

Настоящая статья посвящена работе по созданию канала речевого управления автоматизированной системой отработки радиолокационного оборудования. В канале речевого управления осуществляется прием, преобразование и обработка речевых сигналов, распознавание речевых команд оператора, а также формирование управляющих воздействий, поступающих через АРМ к антенному блоку.

Постановка задачи создания канала речевого управления (КРУ) радиолокационным оборудованием

Создание КРУ радиолокационным оборудованием направлено на достижение следующих результатов: повышение уровня автоматизации процесса отработки антенных блоков, снижение физической и информационной нагрузки оператора, обеспечение рационального использования ресурсов технического персонала.

Перечисленные направления рассматриваются как составляющие для достижения основной цели работы: обеспечения повышения качества отработки антенных блоков РЛС (РГСН).

Создание КРУ радиолокационным оборудованием предусматривает решение следующих задач:

- обеспечения надёжного распознавания речевой информации оператора;

- реализации речевого управления объектом.

Решение данных задач включает следующие этапы:

1) Построение системы распознавания речевой информации оператора и разработка программно - алгоритмических средств, реализующих систему распознавания на ПЭВМ;

2) Разработка аппаратных средств, обеспечивающих интерфейс КРУ в сопряжении с АРМ отработки антенных блоков.

Разработка СРР проводится с учетом следующих ограничений и условий эксплуатации:

- число операторов, занятых в процессе отработки радиолокационного оборудования, ограничено;

- число контролируемых параметров антенного блока составляет несколько десятков;

- отработка осуществляется в лабораторных условиях;

- взаимодействие оператора с АРМ должно быть оперативным.

Учитывая проблемные вопросы распознавания РС, а также ограничения и условия эксплуатации СРР, приняты следующие начальные установки:

- в качестве объектов распознавания используются речевые команды оператора (изолированно произнесённые слова речи), функционально соответствующие контролируемым параметрам антенного блока;

- разрабатываемая система распознавания речевых команд (СРРК) предназначена для работы с ограниченным словарём речевых команд конкретных операторов.

Рассматривается следующий подход к решению задачи обеспечения надежного распознавания речевых команд оператора.

Речевая команда представляется в виде совокупности фонем: в качестве характеристик речевой команды, наряду с командными признаками, выступают признаки всех фонем,

входящих в ее состав. Результат работы СРРК - распознавание речевой команды, складывается из промежуточных результатов распознавания фонем.

Необходимо выбрать устойчивые информативные признаки, обеспечивающие надежное распознавание фонем. Предлагается построение многоуровневой процедуры формирования признаков и распознавания фонем, базирующейся на использовании комплекса известных и перспективных методов ЦОС: методов временной и спектральной обработки РС для формирования признаков и выделения групп и ряда отдельных фонем, и методов биспек-трального анализа для формирования признаков и распознавания конкретных фонем.

При проведении "скользящего" экзамена по сегментам на всем интервале речевой команды число решений о распознанных фонемах значительно (в несколько раз) превышает среднее число фонем в речевых командах. Для совместного анализа буквенных кодов распознаваемых фонем и формирования ограниченного набора фонем распознаваемой речевой команды требуется разработка алгоритма обработки символьной информации.

Использование комбинации командных признаков и признаков фонем усложняет структуру процедуры принятия решения о распознавания речевой команды.

При разработке аппаратных средств, обеспечивающих техническую реализацию КРУ радиолокационным оборудованием, требуется их сопряжение с существующими техническими средствами АРМ, используемыми для отработки антенных блоков, и с программно - алгоритмическими средствами АРМ без их доработки.

Постановка задачи создания КРУ радиолокационным оборудованием состоит из подзадач:

- разработки и реализации на ПЭВМ программно-алгоритмических средств СРРК, обеспечивающих надежное распознавание ограниченного набора речевых команд конкретных операторов;

- разработки аппаратных средства КРУ, обеспечивающих речевое управление АРМ при отработке антенного блока РЛС(РГСН).

Построение системы распознавания речевых команд (СРРК)

СРРК является базовой частью КРУ и реализуется в виде программно - алгоритмических средств на ПЭВМ. Основная функция СРРК заключается в обеспечении автоматического распознавания речевых команд оператора.

Разрабатываемая система распознавания относится к классу систем обучения с учителем.

Работа СРРК организуется в два этапа: этап обучения и этап распознавания.

На этапе обучения СРРК в соответствии с используемым словарем формируются эталонные признаки речевых команд и фонем, входящих в их состав.

На этапе распознавания проводится выделение (формирование)текущих признаков распознаваемых сигналов (предварительная обработка) и сравнение с эталонами (классификация ) в соответствии с типовой схемой [ 4 ], представленной на рис.1.

Рис.1. Типовая схема системы распознавания речевых команд Для обеспечения надежного распознавания речевых команд предложена иерархическая структура СРРК, основанная на совместном использовании различных уровней представления, обработки и распознавания РС (уровней сегментов, фонем и команд).

Критерий разделения слов на фонемы представляется наиболее предпочтительным, так как фонемы могут быть надежно распознаны с помощью разных систем признаков, а по полученному набору фонем может быть установлен буквенный код слова (речевой команды).

На рис. 2 приведена иллюстрация разбиения РС на интервале фонемы в речевой команде на характерные временные интервалы (стандартные сегменты, типовые интервалы, интервалы фонем).

Рис.2. Уровни представления РС на интервале фонемы Классификация фонем имеет сложную многоуровневую структуру. Общее число фонем русского языка достигает 40 и более единиц, которые могут быть представлены как распознаваемые классы.

В работе предложена классификация групп и отдельных фонем, основанная на характерных свойствах РС. Использование различных методов обработки сигналов (во временной, спектральной и биспектральной областях) позволяет формировать разнообразные признаки, обеспечивающие надежное выделение (распознавание) групп фонем.

Для оценки возможности формирования признаков фонем были проведены исследования с использованием предложенных моделей представления РС во временной, спектральной и биспек-тральной областях.

При построении моделей РС во временной области используется представление РС в виде совокупности экстремумов - максимальных и минимальных значений амплитуд отсчётов на выбранных временных интервалах [ 6 ].

В качестве параметров моделей используются максимальный разброс амплитуд экстремумов ЛAmax и плотность экстремумов X (число экстремумов) на временном интервале.

При анализе РС фонем были выявлены закономерности в характере огибающей сигнала, образуемой последовательностью значений ЛAmax и X. Определен ряд характеристик РС групп и отдельных фонем, отражающих особенности изменения параметров ЛAmax и X во времени, примеры которых приведены на рис.3 .

Для групп и отдельных фонем были выявлены следующие характеристики:

а) характеристика фонемы "В" - наличие спада и возрастания огибающей с малыми значениями ЛAmax и X в минимуме огибающей;

б) характеристика группы фонем "К", "П" и "Т" - наличие кратковременных импульсов огибающей, сопровождающихся повышением плотности экстремумов, на фоне малых значений

ЛАтах ;

в) характеристика фонемы "Р" - чередование повышения и понижения максимального разброса амплитуд экстремумов;

г) характеристика группы фонем "Ж", "З", "С", "Ф", "Х", "Ц", "Ч", "Ш", "Щ" - повышенные значения плотности экстремумов;

д) характеристика "Паузы" - низкий уровень значений максимального разброса амплитуд экстремумов ЛАтах , сравнимый с уровнем шума.

Рис.3. Примеры характеристик РС для различных фонем

Последовательностью чисел выше реализаций РС представлены значения параметров ДА^ и X на стандартных сегментах. Штриховыми линиями изображены характерные огибающие сигнала. Вертикальными линиями отмечены границы фонем.

Модель представления речевых сигналов в спектральной области использует в качестве параметров разности значений логарифмов модулей спектров, усредненных в разных диапазонах частот ( /ь2, /2-3 ).

При анализе спектров РС в выделенных диапазонах частот (0-2 кГц; 2-5 кГц и 5-8 кГц) выявлено различие усредненных значений логарифмов модулей спектра для разнотипных фонем и близость для однотипных фонем.

На рис.4 и 5 показаны примеры модулей спектра речевого сигнала одного типового интервала фонем "А" и "З" с отмеченными уровнями усредненных значений логарифмов модулей спектров Е]_, Е2 и Е3 в диапазонах частот 1 (0 - 2 кГц), 2 (2 - 5 кГц) и 3 (5 - 8 кГц) и их разностями /1.2 =Е\ - £2 и / 2 - з=£2 - £з •

Диапазоны частот

2 3

дб

40

012 3 4 5678 дакГи

Рис. 4. Спектральные параметры на типовом интервале фонемы "А"

Рис.5. Спектральные параметры на типовом интервале фонемы "З" Усредненные значения логарифмов модулей спектра | Б] | на типовых интервалах фонем в диапазонах 1, 2 и 3 вычисляются в следующем виде: 1

Е 1 =

Е 1п |,

1

1 п 1 + п 2 Е 2 = — . Е 1п | |, п, 1 =п 1 +1

1

Е з =

1

п,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

п1 + п2 + п3

. Е 1п | |.

1 = п ! + п 2 + 1

где и1,и2,и3 - число дискретных спектральных составляющих в соответствующих диапазонах 1, 2 и 3.

В качестве области определения спектральных параметров предложена плоскость с системой координат Ь1-2, Ь2-3 ,в которой наблюдаются различные распределения параметров /1.2, /2-3 для разных фонем.

На рис. 6 приведен пример распределения параметров /1-2, /2-3 в плоскости (Ь 1 . 2 , Ь 2 . 3) для типовых интервалов реализаций сигналов фонем "Б", "Ж" и "Ц".

Рис.6. Примеры областей распределения спектральных параметров /1-2, /2-3 для фонем "Б", "Ц", "Ж"

Биспектральная модель представления речевых сигналов.

Развитием спектрального подхода является модель, основанная на использовании параметров спектров высоких порядков, в частности, биспектров.

Биспектр Б ( ш1, ш2 ) может быть определён двумя способами [ 7 ]:

1) на основе прямого двумерного преобразования Фурье корреляционной функции третьего порядка Я (т 1 , т 2 ) ;

2) как произведение трёх преобразований Фурье для соответствующих частот ®1,®2 и ш1 + ш2

Я ( ш 1, «2 ) = F [ -/ («1+ 02 ) ] * Р [/ (01) ] * Р [/ (02) ]

В настоящей работе используется второй способ для расчета биспектров.

На рис. 7 и 8 показаны примеры модуля биспектра РС фонем "И", "Е", "О", "А" (группа фонем вокализованных звуков) и "Х", "Ф", "З", "С" (группа фонем шумоподобных звуков) соответственно.

Рис. 7. Примеры модулей биспектров фонем "И", "Е", "О", "А".

Рис. 8. Примеры модулей биспектров фонем "Х", "Ф", "З", "С".

Показанные примеры биспектров демонстрируют различие положений и значений амплитуд максимумов для разных фонем. В то же время, при сопоставлении биспектров фонем одного типа наблюдается близость областей наличия максимумов и значений их амплитуд. Эти свойства послужили основой для разработки алгоритма формирования биспектральных признаков фонем [ 8 ].

Программно - алгоритмические средства КРУ

На основе предложенных моделей представления РС во временной, спектральной и бис-пектральной областях разработаны алгоритмы формирования признаков фонем, входящие в состав программно - алгоритмических средств КРУ.

Алгоритмы формирования признаков фонем во временной области

Исходной информацией для формирования признаков фонем во временной области служат речевые сигналы фонем, накопленные в ПЭВМ путем автоматизированной разметки фонем из словаря речевых команд.

В соответствии с моделями представления РС во временной области алгоритмы формирования признаков фонем используют предложенные типовые функции у от экстремально-временных параметров ААщах и X, где индекс функций 1 = 1, 2... соответствует типу функции у

В состав типовых функций вводятся функции ф ¡ч = { (ААтах, X ), описывающие динамические границы, в пределах которых должны находиться параметры ААтах и X, а также логические условия, накладываемые на параметры.

Индекс д = 1, 2, ... п - номер фрагмента фонемы, на котором существует функция у; .

Далее в алгоритмах осуществляется проверка выдвинутых гипотез о выполнении функций у; и ф ¡ч как признаков групп и отдельных фонем.

На рис. 9 приведены примеры выделения групп и отдельных фонем соответствующими алгоритмами на основе признаков РС, формируемых во временной области.

Рис.9. а, б. Примеры выделения фонемы "В" и группы фонем "К", "П" и "Т" на основе признаков во временной области

Рис.9. в - д. Примеры выделения фонем "Р" , группы фонем "З", "Ж" , "С", "Ф","Х","Ц","Ч","Ш","Щ" и "ПАУЗЫ" на основе признаков во временной области Для проверки подтверждения выдвинутых гипотез о соответствии признаков (функций экстремально - временных параметров ) группам и отдельным фонемам была проведена экспериментальная оценка вероятностей срабатывания соответствующих алгоритмов на речевом материале, охватывающем весь состав фонем русской речи.

Алгоритм формирования спектральных признаков фонем разработан на основе модели представления РС в спектральной области.

В алгоритме используются предложенные спектральные параметры /1-2, /2_3 - разности логарифмов модулей спектров, усредненных в разных диапазонах частот.

На основе базы данных РС, размеченных по фонемам из обучающей выборки, была получена эталонная матрица распределения спектральных признаков фонем в принятом дискретном пространстве ¿1-2, ¿2-3..

Для выделения отдельных групп фонем было предложено разбиение пространства £1-2, Ь2.3 на ячейки. Каждой ячейке соответствует своя группа фонем, характеризующаяся однородными признаками - положениями /1-2, /2-з .

Алгоритм формирования биспектральных признаков фонем включает следующие операции:

- вычисление значений модуля спектра на типовых интервалах фонемы;

- усреднение спектров на интервале фонемы;

- вычисление значений модуля биспектра;

- выделение максимумов модуля биспектра (ММБ), определение положений и амплитуд ММБ;

- формирование эталонов фонем - эталонных матриц вероятностей наличия ММБ и эталонных матриц значений амплитуд ММБ в биспектральной плоскости по каждому типу фонем.

Алгоритмы формирования фонемных признаков используются как на этапе обучения СРРК (для формирования эталонных признаков), так и на этапе распознавания (для формирования текущих признаков).

В качестве эталонных признаков групп и отдельных фонем используются:

- при обработке во временной области - эталонные функции от экстремально - временных параметров ;

- при обработке в спектральной области - эталонная матрица распределения фонем в пространстве (£1-2, £2-3) разностей логарифмов модулей спектров, усредненных в разных диапазонах частот;

- при обработке в биспектральной области - эталонная матрица вероятностей наличия ММБ и эталонная матрица значений амплитуд ММБ в точках биспектральной плоскости по каждому типу фонем.

В качестве текущих признаков речевых сигналов используются:

- при обработке во временной области - функции от экстремально - временных параметров ;

- при обработке в спектральной области - положения в пространстве £1-2, Ь2.3 разностей логарифмов модулей спектров, усредненных в разных диапазонах частот;

- при обработке в биспектральной области - положения и значения амплитуд ММБ.

Алгоритмы формирования фонемных признаков используются в разработанной комбинированной процедуре формирования признаков и распознавания фонем, в которой производится последовательная обработка речевых сигналов на всех типовых интервалах от начала до окончания речевой команды во временной, спектральной и биспектральной областях.

Предложенная в работе многоуровневая структура процедуры распознавания фонем на базе комплекса методов обработки сигналов обеспечивает надежное распознавание фонем.

На рис.10 показана упрощенная схема комбинированной процедуры формирования признаков и распознавания фонем.

Рис.10.Упрощенная схема комбинированной процедуры распознавания фонем

При сравнении признаков речевого сигнала с эталонными признаками групп или отдельных фонем обеспечивается принятие решений о принадлежности речевого сигнала к группам или к отдельным фонемам:

- при обработке во временной области - к группам фонем {К, П, Т}, {Ж, З, С, Ф, Х, Ц, Ч, Ш, Щ}, или к одной из фонем {Р}, {В}, а также к паузе { - },

- при обработке в спектральной области - к группе фонем, состав которой определяется в соответствии с ячейкой в пространстве признаков (Ь1.2, Ь2_3).

При сопоставлении буквенных кодов фонем группы {Ж, З, С, Ф, Х, Ц, Ч, Ш, Щ} и группы, полученной в спектральной области, формируется результирующая группа фонем, поступающая на обработку в биспектральной области.

При обработке в биспектральной области производится сравнение признаков речевых сигналов и эталонных биспектральных признаков фонем из результирующей группы и принимается решение о распознавании фонем в соответствии с критериями принятия решения.

Из распознанных фонем, полученных при обработке во временной и в биспектральной области на всех типовых интервалах речевой команды, формируются последовательности решений (буквенных кодов фонем), поступающие на вход алгоритма обработки символьной информации.

В алгоритме обработки символьной информации производится анализ буквенных кодов фонем и отбор наиболее вероятных кандидатов - фонем, с целью формирования ограниченного набора буквенных кодов фонем распознаваемой речевой команды.

Для обеспечения надежного распознавания речевых команд наряду с фонемными признаками формируются командные признаки речевых команд.

Алгоритм формирования командных признаков основан на использовании экстремально-временных параметров речевого сигнала - значений максимального разброса амплитуд экстремумов АЛшах и значений плотности экстремумов сигнала X, изменяющихся на заданном временном интервале.

В качестве эталонных командных признаков речевых команд используются нормированные и усредненные по однотипным речевым командам значения максимального разброса амплитуд экстремумов сигнала АЛтах н э ; и плотности экстремумов сигнала X н э ; , определяемые для всех типовых интервалов речевых команд словаря.

При распознавании речевой команды осуществляется сравнение ее командных признаков с эталонными командными признаками речевых команд словаря и формирование показателей распознавания.

Процедура принятия решения о распознавании речевой команды обрабатывает результаты, полученные при использовании фонемных и командных признаков.

На основе представленных моделей, процедур и алгоритмов разработана структура СРРК, схема которой приведена на рис.11, и создано программное обеспечение, реализующее СРРК на ПЭВМ.

Рис.11.Обобщенная структурная схема СРРК на этапе распознавания речевых команд

Результаты распознавания фонем в виде набора буквенных кодов распознаваемой речевой команды сравниваются с эталонными наборами буквенных кодов фонем команд словаря с учетом временных границ фонем. По числу совпадающих буквенных кодов формируются показатели распознавания речевой команды по фонемным признакам.

В процедуре принятия решения совместно обрабатываются два набора показателей распознавания, полученных при использовании фонемных и командных признаков.

Результатом работы процедуры принятия решения является выбор одной из речевых команд словаря в качестве распознанной.

В случае неоднозначного решения формируется запрос на повторный ввод речевой команды.

На рис.12 представлен пример работы СРРК при распознавании речевой команды "ЗАХВАТ", выбранной по максимальному показателю распознавания - числу распознанных фонем (Пр=6).

з а х в Л . ^овпад™ ^огев енны^е оды ^ онта^и^ко ды^ пауэр а сп озн ав а ш ог о с л ив а и с лив а ш с л овар я

Рис.12. Пример работы СРРК при распознавании речевой команды "ЗАХВАТ"

При проверке работы СРРК получены результаты по вероятности распознавания речевых команд конкретного диктора, достигающие значения 0,9.

Аппаратные средства КРУ

Для реализации канала речевого управления, сопряженного с автоматизированной системой отработки антенного блока, наряду с программно - алгоритмическими средствами разработана система аппаратных средств, обеспечивающая:

- прием и преобразование в цифровую форму речевых команд оператора,

- преобразование кодов речевых команд в коды управления, используемые ПО автоматизированной системы отработки антенного блока,

- формирование и передачу для оператора запроса ввода речевой команды,

- переключение режимов речевого и ручного управления АРМ.

На рис. 1з приведена схема канала речевого управления, сопряженного с автоматизированной системой отработки антенного блока РГСН (РЛС).

Рис.13. Схема канала речевого управления, сопряженного с автоматизированной системой отработки антенного блока РГСН (РЛС).

КРУ состоит из следующих аппаратных средств: ПЭВМ, гарнитуры (микрофона и наушников), устройства преобразования интерфейсов и коммутатора клавиатуры.

Особенностью построения КРУ в части аппаратных средств является использование специально разработанного устройства преобразования интерфейсов, обеспечивающего электронную имитацию нажатия кнопок клавиатуры, что позволяет заменить управление через клавиатуру на речевое управление без доработки действующего ПО ЦВМ АРМ [9].

На рис.14 приведена иллюстрация этапов работы системы "оператор - КРУ - АРМ - антенный блок" при вводе речевой команды "ПОВОРОТ".

ЦВМ

Плодят' -бнЬор пннктов пзавеикн

Дглп'р П.1Ч.Э Пиии'лжи ЕОПИ иощебпенин

Гтт*рт п.1.1.6 Поовеикл впеиенн готовности | мции

Копь П.1.1. М Прочерка нугкиы* см'ианощ

Пииыеик^ «ЛМ1*Ч«*1НЯ ||111>И0И«?НН|Н

Привод Г|.1.4

□ 3111ЦИИ1ТЫ III:IIС'.ПеНИ ПЦИЕОДПС:

Гвржод п.1.й Т.'.".. Ппшиегсн пе^екодногс процесса 6

Дымина п. 1.4 1,12 оинГжв. следярсн сиск-мы f

Г^,: ц 1 4. 7 13 Ил^иннпьная цгтшая скорость ч Ммут п.1.4 -Т.15 ПЬскящиив ипщ И0И1 ВНКП Н СОРП В1К11 Н И

Г ро -IIН п. 1.4 В НегрООЫВИЙЯ Счяиотй Э ЧЙСЙ 1

ВОД

АНТЕННЫЙ ЕЛОК

ЦВМ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Проверка бпоков на ЯРИ

г, 1,4.7,3 Проверка величин напряжений трогшя

Упр. азии (в) Упл, нжп (в] Пэз1иит (гр:мин:сек) Наклон [гр:мин:сек)

0.019727 000:00:30

Утр впсею ПЖД щ вправо 1<=В.З в1 Шр вверх (!-•).3 в! 1ф вииз !<-Й.З в!

1,8591 0.Ш 0.0197 0.0197

Рис.14. Иллюстрация этапов работы системы "оператор - канал речевого управления - АРМ ■ - антенный блок" при вводе речевой команды "ПОВОРОТ"

Информационное сопряжение КРУ с АРМ заключается в использовании речевых команд, соответствующих проверяемым на АРМ параметрам. Распознавание речевой команды приводит к автоматическому выбору в меню на экране дисплея ЦВМ АРМ соответствующего параметра антенного блока и запуску процесса его проверки.

Основные результаты работы

1.Проведены исследования и разработаны модели представления речевых сигналов во временной, спектральной и биспектральной областях:

- определён ряд параметров, характеризующих свойства РС групп и отдельных фонем русской речи;

- проведена оценка возможности использования выявленных параметров для формирования признаков фонем.

2. Разработана система распознавания речевых команд (СРРК), включающая:

- алгоритмы формирования признаков фонем во временной, спектральной и биспек-тральной областях (сформированы эталонные признаки фонем, получены результаты распознавания фонем в группах);

- комбинированную процедуру распознавания фонем, имеющую многоуровневую структуру;

- алгоритм обработки символьной информации;

- алгоритм формирования командных признаков;

- процедуру принятия решения о распознавании речевых команд;

- программное обеспечение (ПО), реализующее СРРК на ПЭВМ.

3.Разработаны аппаратные средства, обеспечивающие интерфейс КРУ, и разработано макетное устройство, реализующее КРУ в сопряжении с АРМ.

4. Проведена проверка работы СРРК в составе КРУ с использованием программного обеспечения, моделирующего контроль параметров антенного блока.

Заключение

1. Проведенные исследования речевых сигналов показывают возможность формирования информативных фонемных и командных признаков, используемых в системе распознавания речевых команд.

2. Построение многоуровневой процедуры распознавания фонем на базе комплекса методов обработки сигналов целесообразно для обеспечения надежного распознавания фонем.

3. Комплекс разработанных программно - алгоритмических и аппаратных средств позволил реализовать канал речевого управления автоматизированной системой отработки антенного блока РЛС (РГСН).

4. Разработанный канал речевого управления может применяться как альтернативный в различных системах, использующих ввод информации от оператора через клавиатуру ПЭВМ в различных областях техники, например, в медицинской технике, робототехнике, в системах, построенных по технологии «Умный дом» и др.

Библиографический список

[1] Канащенков А.И., Меркулов В.И., Самарин О.Ф. Облик перспективных бортовых радиолокационных систем. Возможности и ограничения.-М.: ИПРЖР, 2002.-176с.

[2] Асмаков С., Елманова Н., Пахомов С., Татарников О. Перспективные технологии: итоги и прогнозы // КомпьютерПресс. 2010. №1. -с.12-13.

[3] Плотников В.Н., Суханов В.А., Жигулёвцев Ю.Н. Речевой диалог в системах управления.-М.:Машиностроение,1988.-224с.

[4] Потапова Р.К. Речевое управление роботом: лингвистика и современное автоматизированные системы.-М.:КомКнига. 2005.-328с.

[5] Асмаков С., Елманова Н., Пахомов С., Татарников О. Перспективные технологии: итоги и прогнозы // КомпьютерПресс. 2009. №1.-с.26-30.

[6] Сахаров В.О. Выделение характерных фрагментов сигналов речевых команд управления оборудованием методом логической обработки экстремумов. // VI Всероссийская конференция "Проблемы совершенствования робототехнических и интеллектуальных систем летательных аппаратов", МАИ. 2002.-с.85-89.

[7] Латышев В.В., Рыжак И.С. Применение моментов, кумулянтов и спектров высоких порядков в современных методах обработки сигналов. - М.:МАИ.1998.-76с.

[8] Гиголо Л.А., Сахаров В.О. Применение биспектрального анализа для формирования признаков сложных сигналов. // Вопросы радиоэлектроники. Сер. Радиолокационная техника. Выпуск 1. 2005.-с.175-183.

[9] Устройство речевого управления автоматизированным рабочим местом отработки антенного блока радиолокационной станции. Патент РФ №2340930 на изобретение / Патентообладатель ОАО "Корпорация "Фазотрон - НИИР", авторы Гиголо Л. А., Сахаров В.О. / Заявка 2007100065/09, заявлено 09.01.2007 / Опубликовано 10.12.2008. Бюл.№34. Сведения об авторах

Сахаров Виталий Олегович, ведущий инженер ОАО "МНИИ "Агат", vitsahar@rambler.ru, 8(495) 2535757

i Надоели баннеры? Вы всегда можете отключить рекламу.