Научная статья на тему 'Компьютерное моделирование метода распознавания речи для организации речевого канала в авиационных системах'

Компьютерное моделирование метода распознавания речи для организации речевого канала в авиационных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
739
130
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВИАЦИОННАЯ ЭЛЕКТРОСВЯЗЬ / РЕЧЕВАЯ КОММУНИКАЦИЯ / РАСПОЗНАВАНИЕ РЕЧИ / СИНТЕЗ РЕЧИ / ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Клёсова Юлия Викторовна, Шаврин Сергей Сергеевич

Профессиональное общение это "речевое общение представителей одной профессиональной группы в ситуации, связанной с непосредственным выполнением ими профессиональных или служебных обязанностей" [1]. Таким образом, деятельность эксплуатационного персонала (диспетчеры, пилоты, инженерный состав) имеет прямое отношение к безопасности и эффективности воздушных перевозок. Речевое общение применяется в ситуациях, когда необходимо срочно передать командные или уведомительные сигналы, подтвердить принятое сообщение, обратить внимание диспетчера управления воздушным движением (УВД) или членов экипажа на определенную ситуацию и т. д. При использовании речевой коммуникации (РК) в авиации диспетчеры и экипаж на борту стараются придерживаться специальной терминологии (тезауруса) с тем, чтобы повысить вероятность правильного понимания (распознавания) речи. Согласно [2, стр. 5], специализированная фразеология "разработана для обеспечения эффективного, ясного, четкого и недвусмысленного обмена информацией при ведении связи". В "Руководстве по радиотелефонной связи" предусмотрен определенный порядок ведения переговоров посредством радиосвязи, отмечены особенности применения специальной терминологии, отражена специфика построения речевого сообщения. Все это рассчитано с целью упорядочения и сокращения по времени ведения передачи, а так же повышения надежности радиосвязи. Все вышеуказанные особенности: ограниченность словаря, определенный порядок слов в предложении открывают возможность для реализации в рамках авиационного радиообмена метода распознавания речи. Усталость, накапливаясь, влияет на работоспособность человека. Отсюда появляются ошибки, связанные с чтением и восприятием информации от источника. Распознавание речи системой позволит повысить эффективность ввода информации, поскольку уменьшается нагрузка на операторов (при занятости рук и глаз для человека предпочтительней речевой ввод). Приведена компьютерная модель исследования качества распознавания речи на примере текстового фрагмента, показан дополнительный сценарий применения системы, а также приводятся результаты моделирования по данной схеме.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Клёсова Юлия Викторовна, Шаврин Сергей Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Компьютерное моделирование метода распознавания речи для организации речевого канала в авиационных системах»

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ МЕТОДА РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ ОРГАНИЗАЦИИ РЕЧЕВОГО КАНАЛА В АВИАЦИОННЫХ СИСТЕМАХ

Профессиональное общение - это "речевое общение представителей одной профессиональной группы в ситуации, связанной с непосредственным выполнением ими профессиональных или служебных обязанностей" [1]. Таким образом, деятельность эксплуатационного персонала (диспетчеры, пилоты, инженерный состав) имеет прямое отношение к безопасности и эффективности воздушных перевозок. Речевое общение применяется в ситуациях, когда необходимо срочно передать командные или уведомительные сигналы, подтвердить принятое сообщение, обратить внимание диспетчера управления воздушным движением (УВД) или членов экипажа на определенную ситуацию и т. д. При использовании речевой коммуникации (РК) в авиации диспетчеры и экипаж на борту стараются придерживаться специальной терминологии (тезауруса) с тем, чтобы повысить вероятность правильного понимания (распознавания) речи. Согласно [2, стр. 5], специализированная фразеология "разработана для обеспечения эффективного, ясного, четкого и недвусмысленного обмена информацией при ведении связи". В "Руководстве по радиотелефонной связи" предусмотрен определенный порядок ведения переговоров посредством радиосвязи, отмечены особенности применения специальной терминологии, отражена специфика построения речевого сообщения. Все это рассчитано с целью упорядочения и сокращения по времени ведения передачи, а так же повышения надежности радиосвязи.

Все вышеуказанные особенности: ограниченность словаря, определенный порядок слов в предложении - открывают возможность для реализации в рамках авиационного радиообмена метода распознавания речи. Усталость, накапливаясь, влияет на работоспособность человека. Отсюда появляются ошибки, связанные с чтением и восприятием информации от источника. Распознавание речи системой позволит повысить эффективность ввода информации, поскольку уменьшается нагрузка на операторов (при занятости рук и глаз для человека предпочтительней речевой ввод).

Приведена компьютерная модель исследования качества распознавания речи на примере текстового фрагмента, показан дополнительный сценарий применения системы, а также приводятся результаты моделирования по данной схеме.

Клёсова Юлия Викторовна,

аспирант кафедры МТС МТУСИ, Москва, Россия, [email protected]

Шаврин Сергей Сергеевич,

д.т.н, профессор кафедры МТС МТУСИ,

Москва, Россия,

[email protected]

Ключевые слова: авиационная электросвязь, речевая коммуникация, распознавание речи, синтез речи, имитационное моделирование.

Для цитирования:

Клёсова Ю.В., Шаврин С.С. Компьютерное моделирование метода распознавания речи для организации речевого канала в авиационных системах // T-Comm: Телекоммуникации и транспорт. - 2016. - Том 10. - №5. - С. 54-59.

For citation:

Klesova Ju.V., Shavrin S.S. Applications of speech recognition in aeronautical telecommunications. T-Comm. 2016. Vol. 10. No.5, рр. 54-59.

(in Russian)

Всемирная практика такова, что голосовые данные перелаются при помощи амплитудной модуляции. По сравнению с аналоговыми, цифровые средства вещания имеют ряд существенных технических преимуществ: более эффективное использование радиочастотного спектра, меньшие требуемые мощности передатчиков при одинаковой зоне обслуживания и более высокая степень устойчивости к акустическим шумам [3]. Необходимость перехода на цифровые системы приема и передачи речевой информации обусловлена высоким темпом развития цифровых технологий и тенденцией к объединению передачи телеметрических данных (скорость, координаты, курс и проч.) и связи «воздух-земля». Интеграционные процессы позволят отдалить появление трудностей, связанных с недостатком частот во всех диапазонах спектра, поскольку увеличение объема воздушных перевозок приводит к увеличению спроса на использование частотного ресурса всеми пользователями и радиослужбами.

В рамках УКВ ЛПД режима 4 возможно организовать передачу речевых данных цифровыми методами. Основные достоинства режима 4 заключаются в следующем [4]:

1, Получение информации о самолетах без использования системы радаров, за счет создания самоорганизующейся сеги АЗП-В обмена телекоммуникационными данными самими летательными аппаратами [5],

2, Каждый борт принимает сообщения от других бортов о положении, скорости и курсе.

3, Информация обновляется в режиме реального времени.

Исходные данные УКВ ЛПД режима 4 следующие:

!. Скорость цифрового потока - 19,2 кбит/с;

2. Ширина полосы канала—25 кГц;

3. Коэффициент ошибок (BI2R - bit error rate) - Юе-4;

4. Модуляция - GFSK.

В случае спокойной воздушной обстановки и отсутствия угроз, правила ведения радиообмена отражены в стандарте радиообмена ИКАО Doc 9432 «Manual of Radiotelephопу» [2]. Фразеология, разработанная ИКАО, предназначена для использования в большинстве новее-дневных ситуаций, но предусмотреть фразеологию на все случаи, которые могут возникнуть, не представляется возможным. И, тем не менее, использование разговорного языка в случаях, когда отсутствует уместная стандартная фразеология, не дает права иа искажение порядка ведения радиообмена ненормативной лексикой. Специфика области применения требует придерживаться основных свойств речевого радиообмена в авиации - Ясности, лаконичности и однозначности.

Средства воздушной и наземной связи обеспечивают постоянно действующей радиосвязью по каналам «дис-иетчер-борт» экипажи всех воздушных судов, осуществляют трансляцию радиолокационных данных в центры управления воздушным движением (УВД), поддерживают связь между диспетчерами и техническим персоналом служб аэропорта.

В действующей модели УВД приоритет отдан человеку - диспетчеру. Безопасность воздушного движения полностью определяется способностью диспетчера обнаружить и своевременно Предпринять меры до того момента, когда ошибка повлечет за собой нештатную ситуацию, а в случае ее необнаружения - опасные последствия. Именно действия диспетчера УВД (умение предвидеть, обнаружить и контролировать факторы угрозы) являются опре-

деляющей возможностью предотвратить опасные последствия. Посредством радиообмена диспетчер осуществляет передачу указаний на борт ВС, а также ведет наблюдение за движением ВС в общем воздушном пространстве.

Авиационное наблюдение позволяет определять, отслеживать и обновлять информацию о местоположений ВС, От точности этой информации зависит, соблюдаются или нет нормы эшелонирования (минимально возможное расстояние между ВС), а также возможность максимально эффективного использования участка воздушного пространства. Функция наблюдения позволяет прогнозировать любые отклонения при следовании по маршруту, выдержке заданного эшелона и, таким образом, играет ключевую роль в обеспечении безопасности полетов. Информация и указания, передаваемые на борт диспетчером, позволяют экипажу ВС знать воздушную обстановку (так называемая «ситуационная осведомленность») что, в свою очередь, является важным для обеспечения безопасной эксплуатации ВС.

Системы распознавания речи (СРР) делятся на два типа: системы распознавания слитной речи и системы распознавания изолированной речи. Первые способны извлекать информацию из естественно произнесенной речи, то есть непрерывных последовательностей слов. Эти системы ПОЗВОЛЯЮТ минимизировать дискомфорт, возникающий при раздельном произнесении слов. Системам распознавания изолированной речи требуются короткие паузы после каждого высказывания.

В Самом общем виде СРР должны преобразовывать речевое сообщение в эквивалентный текст. Сложность задачи распознавания определяется объемом словаря, условиями произнесения, а также наличием/отсутствием возможности настройки на диктора [6]. Кроме того, речевой радиообмен в авиации характеризуется высокой скоростью ввода данных (выше 50 слов в минуту). Для таких систем требуется более низкий уровень ошибок, чем для систем, применяемых в областях с меньшим темпом ввода данных, в которых у оператора есть время и возможности для внесения поправок.

В настоящее время уровень технологий распознавания русской речи уступает аналогичным показателям для других языков, например, для английского. Согласно |7], причин тому несколько:

- произвольный порядок слов и высокая флективность (большое количество словоформ) русского языка, затрудняющих его автоматическое распознавание;

- отсутствие/труднодоступность русских языковых ресурсов (т.н. корпусов русского языка);

- сравнительно малый объем рынка отечественных разработок в данной области. Достоверность распознавания речи с увеличением объема словаря уменьшается, однако для узкоспециализированного словаря разборчивость речи будет выше, чем для широкого словаря.

Для получения количественной оценки качества распознавания речи в |8| была предложена компьютерная модель, показанная на рис. I.

На рисунке 1 приведена схема компьютерного моделирования метода распознавание-синтез, предложенная. В этой схеме акустическое речевое колебание преобразуется в текст и в двоичном виде передается на вход модулятора. Далее — на вход приемопередатчика (транспонде-ра), который должен иметь каждый участник информационного обмена.

L

V V

Акустическая волна

ш Распознавание

г речи

10100 0110.,,

Летные

данные £

к F

Й

Фильтр 5 5

Приемопередатчик

Приемопередатчик

Летные данные

Фильтр

10100 0110...

Оцифрованный голос

Синтез речи

Рис. 1. Компьютерная модель исследования достоверности распознавания и синтеза речи

t полета [WHHÎ ВЗОР (РП) БВС 04 (ПТ£РО) БВС 3» [Supeicam) БВС 05 (ворон) 511 {АН-2) ЯСТРЕБ (СПДГ) АРЕНА (ВЦПС)

00-3 вЗОР,4 ИЮНЯ 2015 ГОДА, МОСКОВСКОЕ ВРЕМЯ---- .НАЧИНАЕМ ПОИСКОВО-СПАСАТЕЛЬНЫЕ РАБОТЫ, ЭКИПАЖИ И ВЦПС ДОЛОЖИТЕ ОБ ИСПРАВНОСТИ АЗН-В И ГОТОВНОСТИ к ВЫ/IE ГУ

БВС 04, РАЙОН ПОИСКА 631Е В ПРОГРАММУ АВТОПИЛОТА ЗАГРУЖЕН, АЗНв ВКЛЮЧЕН, И СП РАВЕН, К ВЫЛЕТУ готов. БВС 3S0, РАЙОН ПОИСКА Б31Д В ПРОГРАММУ АВТОПИЛОТА ЗАГРУЖЕН, АЗН в ВКЛЮЧЕН, ИСПРАВЕН, К ВЫЛЕТУ ГОТОВ БВС 005, АЗН В ВКЛЮЧЕН. ИСПРАВЕН, К ВЗЛЕТУ ГОТОВ, К ПРИЕМУ ИНФОРМАЦИИ ПО ПРОГРАММЕ ПОЛЕТА ГОТОВ 511 АЗН В ВКЛЮЧЕН. ИСПРАВЕН. С ПДГ НА БОРТУ, К ВЫЛЕТУ готов АРЕНА вЗОРУ. АЗН-В ВКЛЮЧЕН, ИСПРАВЕН, ВЦПС К НАЧАЛУ ПСР готов

00-1 БВС 04. БВС 3SO. БВС OOS ЗАПУСК, БВС 04 ВЗЛЕТ ПО готовности, ОСТАЛЬНЫМ ПО КОМАНДЕ

БВС 04 ПОНЯЛ ЗАПУСК, ВЗЛЕТ ПО готовности ЬВС 350 ПОНЯЛ ЗАПУСК, ВЗЛЕТ ПО КОМАНДЕ БВС 005 ПОНЯЛ ЗАПУСК, ВЗЛЕТ ПО КОМАНДЕ

Рис. 2, Исходный фрагмент текста.

.----х.-^"--' 17 П1 JOli О СП МЩ « « К7ГО4ТХ1 -

Взор 4 июня 2015 года. Московское время 18:59. f 1ачннаем поисково-спасательные работы, экипажи и BI U 1С доложите об исправности A3II1Ï и готовности к вылету БВС CÇjl район поиска ЬдЗ t]E. I I Цршрамму автопилота загружен A3 H В включен, исправен к вылету готов. БВС 350 район поиска Бд31 Д. В программу автопилота -загружен АЗПВ включен, ис и равен к вылету готов. БВС (Д>5, [занимаю! включен, исправен к вылету готов к приему информации!ПО программе полета готов. 511-й АЗНВ включен, исправен СГ1ДГ па борту к вылету готов. арена[ взо pv]A3HB включен, исправен ВЦПС к началу IICP готов БВС 0tj4 BBC35(faEBQa 0g)5. Запуск БВС 0Q4 ЕППготовности остальным по команде БВС (04. Понял запуск. Вздет [ПО] готовности БВС 350. Понял запуск. Взлет по команде БВС (0)5 понял запуск. Взлет по команде.

И 1№М01[1Г11-ПН1»И

Рис. 3. Текст, распознанный модулем распознавания речи на передающей стороне. Красным выделены ошибки распознавания

На приемной стороне реализуются обратные преобразования и человек, принимающий голосовое сообщение, слышит синтезированный голос собеседника. Синтезатор речи необходим для воспроизведения голоса говорящего. Летные данные - это телеметрическая информация, которая предусматривает информирование других участников воздушного движения о скорости, курсе и текущих координатах.

Возможна реализация дублирования речевой информации в виде текста на мониторе в кабине пилота или па экране диспетчера. Эта функция может быть полезна в зашум-ленной обстановке, при сбоях голосовой линии связи, по-

скольку уменьшает необходимость диспетчера/пилота переспрашивать и уточнять команды и указания. Речевая информация интегрируется в существующий стандарт авиационной связи УКВ ЛПД режима 4.

При анализе речевой линии связи полагается, что человек в секунду произносит 1 слово из 6 букв, что эквивалентно 48 битам информации в секунду. На скорости 19200 бит в секунду алгоритм позволяет реализовать до 400 итераций передаваемого символа. Например, достаточно всего 50 кратного значения для достижения 99,9% достоверности. Таким образом, за счет использования СРР возможна

организация 8 каналов вместо одного (при традиционной ЛМ) для передачи речевых данных. Ниже будут рассмотрены результаты экспериментов на примере реального радиообмена между экипажами и диспетчером. Полученные результаты - это принятый текст, прошедший через все этапы преобразований, или же текстовый аналог того, что услышит оператор на приеме.

В данном случае ошибками считаются отсутствие пробелов или наличие лишних пробелов, подмена или пропуск буквы/слова, неправильный регистр, отсутствие необходимых знаков препинания или наличие лишних знаков препинания. Несмотря на то, что необходимый словарь - слова, словосочетания, лексемы - разрабатывается заранее, тем не менее, существует вероятность появления нештатной ситуации (чрезвычайная ситуация на борту ВС), в которой радиообмен между экипажем ВС и диспетчером может выйти за рамки корпоративной коммуникации. И в этом случае речь теряет свою нейтральность и спокойствие, приобретая эмоциональную окрашенность говорящего и использование ненормируемой лексики. Как видно из текста, ошибки распознавания здесь вносит не среда распространения, а сама система распознавания речи, требующая более тщательного обучения.

Ввиду того, что речь в авиации характеризуется сильными фоновыми шумами и помехами, в компьютерной модели предусмотрено добавление аддитивного белого гауссовского шума (АБГШ). Повышение помехоустойчивости достигается за счет СРР и освободившегося в канале частотно-временного ресурса, многократно превосходящего требуемый для передачи той же речевой информации другими методами: с помощью АМ или использования вокодеров. В зависимости от разных значений ОСШ мы наблюдаем разные картины достоверности речевого сообщения на приеме.

На рис. 4-6 показаны результаты моделирования при ОСШ = -3 дБ, когда мощность шума в два раза превышает мощность полезного сигнала, и при использовании алгоритма повышения помехоустойчивости. Система связи с таким низким показателем ОСШ, как правило, не допускается к эксплуатации (согласно ГОСТ27285-87: минимальным условием для выработки сигнала «отказ кодека» является снижение отношения сигнал/шум до 22 дБ), однако полученные результаты даже для такого случая отражают лишь преимущества предлагаемого метода.

1 ü 'X' - AkelPad

файл Правка у,-л застройки ¿правка

7)зор 4 лУСС 15 ЗоР!_*акЫ1]рдб eiLS : 59'начин1:ем Роисог>во-спас¥Ъел1|№ыд ÈaaoTj, , экищалЕ ВФПР ДАро^Се ¡30 исщр°Я!ости 4 РШ SÜo joüHocpP к ВщлОу АБС 0. 4 A1Ü£ .:>30~/ j3. Е. UpXrpÜSiy авВоли&пт ÜarpyíeH AI BÜKKOYeHÜ ирпрРвен к BHhere ловов. БВ050 район поьс —. 31(_ в раграым^ ^топилоба Огрран Чй' включЗй, ncnpaPPv к выо5ту гОок esc 0:р5. зани<аю вкйюСн. ислЧа2енк < : и; npBD инфорШцоти □ poxpaDÔ лолйуа IÍ5QOK. (т 511) й ' 1 H вклШеЙиснвавеэ СПДГОРи

0>рт" кОвыПту POTÜ. APEHAPPD¿í DHB Bitmosare, Оич0£аве= ВРП 3 .чС*"у!П,:Г ГотРв 4В! 0. 4 ВВС 350. I К•. 0:15. linyç: ВВС S. 4 за Gtoujhocth оАтальняц Ро"корайде Евс 0 .В4>хпикял0"7апуск> Азлгт й& гюго-Зоости ЕВ& 35 & o-y-if. $нь9ве яо

' :^t"j'" 0:04 ?о=чл запсог. R'iлми[к: комаляд.

Ins Win 65001 (UTf-S) без BOM

Рис. 4. Текст при ОСШ = -3 дБ и N=10 раз

tejrt_10.txl - AlcetPad

Файл Правил Ъги НАСТРОЙ** Справка

Взор 4 :иокя 2015 года, московское время 16:59. начинаем поисково-спасательные работы, жилап и ВЦПС доложите г& исправности АЗНВ и готовности н вылету ЕВС 0. -4 район поиска Б. 31. в. Программу автопилота загружен АЗНВ включен, исправен к вылету готов. ВВС 350 район поиска Б. 31 Д. В программу автопилота '■ ■■ : . ■ Г .. включен, исправен к вылету готов, евс 0:05. занимаю включен, исправен к вылету готов к приему информации по программе полета готов.

SU —А А H • < включен, иглрдлсн СПЛГ мл Порту 1С ишнту гйтйй. APF.HA в я пру А^НЙ Грключей. испрлнкн ЕЩПС к илчялу ПСР

ГОТОВ Б ВС 0. 4 ВВС 350. вес. 0:05. Запуск БВС 0. 4 за готовности осталвныч ло команде евс 0. 4. Понял запуск, взлет ПО готовности ЕВС 350. Поннл запуск. Взлет по команде 0:05 понял запуск. Взлет ло команде.

Ire W.n 6S001 (UTF-S) без BOM

Рис, 5. Текст при ОСШ = -3 дБ и N=30 раз. Количество ошибочных символов - 3

те*1_10.с*1 - AisetPad

файл ! '. г,. H act ро й «з. С:, л г . л

взор 4 июня 2015 года, московское время 18:59. начинаем поисково-спасательные расоты. экипажи и ВЦПС доложите ОО исправности АЗНВ и готовности к вылету ВВС 0. 4 район поиска Б■ 31. Б. Программу автопилота загружен АЗНВ включен, исправен к вылету готов. ЕВС 350 район поиска Б. 31 я. в программу автопилота зат-ружГн|АЭнв включен, исправен к

вылету готов. ВВС 0:05. запиши} вхлхчен, исправен к вылету готов к приему ...... программ полета готов.

511-й АЗНВ включен, исправен спдг на борту к вылету готов. АРЕНА взору Л"'МЕ)I включен, исправен ВЦПС к началу пер готов ВВС 0. 4 ВВС 350. ВВС. 0:05. запуск ВВС О. 4 - * —' остальным лс* команде ВВС 0- 4. понял запуск, взлет

по готовности ВВС 350. понял запуск, взлет по команде ^вс р:05 понял запуск, взлет по команде.|

1гв Win 6W01 (UTF-S) без вом

Рис. 6. Текст при ОСШ = -3 дБ и N=50 раз. Количество ошибочных символов - О

На рисунке 6 видно, что ошибки, обнаруженные на рисунке 5, исправлены и текст полностью соответствует исходному. Однако алгоритм не позволяет исправлять ошибки распознавания на передающей стороне. Чтобы минимизировать эти ошибки, необходимо более тщательно обучать систему распознавания речи на большом количестве материала.

На рисунке 7 приведен график, из которого ясно видно, что качество (достоверность) принятой информации прямо Пропорциональна количеству итераций передаваемых символов.

Рис. 7. График зависимости количества ошибочно принятых символов от количества итераций

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Кроме организации канала «воздух-земля», возможен другой сценарий применения распознавания речи в авиони-ке с участием беспилотных летательных аппаратов (БПЛА). В связи с широким распространением малой и частной авиации, БПЛА являются полноправными участниками воздушного движения. Сценарий предполагает использование БПЛА в качестве ретранслятора голосовых сообщений на протяженных участках.

Оператор БПЛА в наземном пункте управления (НПУ) осуществляет выдачу указаний. При этом преобразование аналогового голоса в цифровой реализуется здесь же, в режиме реального времени. В эфир на борт БПЛА передается цифровой сигнал. Одновременно БПЛА наблюдает на экране диспетчер пункта управления воздушным движением (УВД). Диспетчер УВД может принимать синтезированный на борту БПЛА голос оператора БПЛА. На рис. 8 показан рассматриваемый сценарий.

Предложенный алгоритм повышения помехоустойчивости системы передачи голосовых сообщений позволяет правильно передать речевое сообщение, преобразованное в

текст, практически независимо от текущего ОСШ. Уровень дублирования информации в канале определяется требуемой достоверностью РК и может быть изменен в большую сторону с увеличением уровня помех (адаптивный алгоритм). Однако возможны и другие методы, например, использование алгоритмов помехоустойчивого кодирования (в частности, широко применяемый алгоритм Рида-Соломона). Но это требует дополнительного частотного ресурса, поскольку все алгоритмы помехоустойчивого кодирования вносят некоторую избыточность в сообщение.

При использовании рассматриваемого алгоритма удается восстановить речевое сообщение при крайне низком показателе ОСШ, в то время как традиционная амплитудная модуляции или применение вокодеров в рассматриваемых условиях оказываются бесполезными. Появляется дополнительная возможность повышения устойчивости речевого канала с распознаванием речи к имитационным помехам, основанная на предварительном шифровании сообщения с его последующим дешифрованием. Стороннее сообщение просто не дешифруется и естественным образом отсеивается.

Повышение уровня разборчивости возможно благодаря дублированию речевой информации в виде текста на экране в кабине нилота или на экране диспетчера. Для эффективного использования систем распознавания речи в авионике необходимо учитывать факторы, влияющие на достоверность распознавания. Относительно области применения -это шумовой фон, искажающий речь: со стороны человеческого фактора - это ошибки коартикуляции, паузы хезита-ции и ненормированная лексика в чрезвычайной ситуации. На эффективность распознавания влияет размер словаря, время, необходимое на обработку введенных данных и представление результатов в визуальном/речевом виде, т.н. обратная связь. Развивая идею создания системы распознавания и синтеза речи на базе авиационного протокола передачи данных, можно надеяться па расширение областей применения речевого ввода в будущем.

Л итература

1. Мапъковская Т.А. Англо-русские соответствия в языковой структуре радиообмена в режиме общения пилот-авиадиспетчер, дис. на соиск. учен. степ. канд. филолог, наук: (10.02.20)/ Мальков-екая Татьяна Александровна; Пятигорский госуд. Лингвистич. ун-т. - Пятигорск, 2004. - 163 с.

2. Doc 9432 - 2007. Издание четвертое. Руководство по радиотелефонной связи.

3. Рихтер С.Г, Цифровое радиовещание. - М.: Горячая линия -Телеком, 2008. 352 с.

4. Кяёсова Ю.В.. Татарчук И,А,. Кулаков М.С. Перспективные технологии в авиации на базе ОВЧ ЛПД Режима 4 II T-Comm: Телекоммуникации и транспорт, 2015. - Том 9. - No8. - С, 63-67,

5. Кулаков М.С. Анализ особенностей функционирования мобильных самоорганизующихся сетей MANET на уровне доступа к среде MAC // T-Comm: Телекоммуникации и транспорт. 2014. Т. 8. № 10. С. 39-42.

6. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. - М.: Радио и связь, 1981.-495 с.

7. Кибкало А.А.. Данилов А.Г. и др. Экспериментальная оценка качества распознавания разговорной русской речи // Речевые технологии. - 2012. 4. - С.23-33.

8. Клёсова Ю.В. Многокритериальный анализ алгоритмов передачи речевой информации в авиации И Перспективные технологии в средствах передачи информации - ПТСПИ'20!5; материалы конференции. - Суздаль, 20! 5. - С. 254-258.

APPLICATIONS OF SPEECH RECOGNITION IN AERONAUTICAL TELECOMMUNICATIONS

Klesova Julia Victorovna,

postgraduate student of the department of Multichannel Telecommunication Systems MTUCI, Moscow, Russia,

[email protected]

Shavrin Sergey Sergeevich, Doctor of Technical sciences, Professor at the Department of Telecommunication Systems MTUCI, Moscow, Russia, [email protected]

Abstract

Voice communication systems are used when an air traffic controller/pilot needs to pass command signals to confirm or pay attention the received message. So, activities of the air traffic controllers and pilots is directly related to the flight safety and efficiency of airlift. Air traffic controller and pilots try to follow the specific terminology (thesaurus) for increase the probability of a correct understanding (recognition) of speech. In [2], there are specific procedure for negotiations by radio, describes some especially use of special terminology and reflects the peculiarities of the voice message. All this is designed to streamline and reduce the transmission time of reference, as well as increase the reliability of radio communication.

The particular qualities such as: limited vocabulary, a certain order of words in a sentence - provide an opportunity to implement in Aeronautical Telecommunication speech recognition method. The air traffic controller or pilot can experience fatigue, which affects human performance. There are some errors, associated with reading and perception of information from the source. Speech recognition system will increase the efficiency of perception information (the ability to see and hear) because it reduces the load on air traffic controller (because in a situation, when the operator's hands and eyes are busy, for air traffic controller or pilot voice input information is preferred). The article describes a computer model investigations of speech recognition quality, also the article provides results of the simulation under this scheme an example of text.

Keywords: speech communication, aeronautical telecommunications, speech recognition, simulation. References

1. Mal'kovskaya T.A. English-Russian match in the linguistic structure of the radio communication mode to pilot an air traffic controller. Pyatigorsk, 2004. 163 p. (in Russian)

2. Doc 9432-2007. Fourth Edition. Manual of Radiotelephony. (in Russian)

3. Rihter S.G. Digital broadcast. 2008. 352 p. (in Russian)

4. Klesova J.V., Tatarchuk I.A., Kulakov M.S. Perspective technologies in aviation base on VDL Mode 4 / T-Comm. 2015. Vol 9. No. 8, pp. 63-67. (in Russian)

5. Kulakov M.S. Analysis of functioning of mobile self_organizing networks MANET on the media access control layer MAC / T-Comm. 2014. Vol. 8. No 10. pp. 39-42. (in Russian)

6. Rabiner L. R., Schafer R.V. Digital processing of speech signals. Prentice-Hall, Inc., Englewood Cliffs, New Jersey.

7. Kibkalo A.A., Danilov A.G. Experimental evaluation of Russian speech recognition quality. Speech technology, 2012, No 4, pp. 23-33.

(in Russian)

8. Klesova J.V. Multi-criteria analysis of the voice data transmission algorithms in aviation - PTSPI 2015. Suzdal', 2015. pp. 254-258.

(in Russian)

i Надоели баннеры? Вы всегда можете отключить рекламу.