Научная статья на тему 'Применение фразеологических шаблонов в процессе распознавания диспетчерских указаний для использования в тренажерах систем УВД'

Применение фразеологических шаблонов в процессе распознавания диспетчерских указаний для использования в тренажерах систем УВД Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
202
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ РЕЧИ / ГОЛОСОВОЕ УПРАВЛЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Плясовских Александр Петрович, Иванов Александр Юрьевич, Панкова Ольга Вячеславовна

В статье предлагается алгоритм распознавания сообщений диспетчера УВД, использующий метод контекстного анализа элементов фразеологии радиообмена, основанного на применении фразеологических шаблонов. Приведен пример использования фразеологических шаблонов для исчерпывающего распознавания диспетчерского указания при заранее известном ограниченном наборе слов, входящих в это указание. Доказано, что использование метода распознавания с контекстным анализом элементов фразеологии УВД в совокупности с распознаванием, осуществляемым при использовании программной библиотеки, предназначенной для распознавания универсального речевого потока, позволит повысить точность работы последней при сохранении производительности системы на уровне, достаточном для применения данного способа в системах управления и контроля реального времени. Согласно экспертной оценке, прирост точности при использовании данного метода может составлять до 30 %.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Плясовских Александр Петрович, Иванов Александр Юрьевич, Панкова Ольга Вячеславовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The paper proposes an algorithm for recognizing ATC controller’s messages using method of contextual analysis of phraseology elements based on the application of phraseological patterns. A practical example of phraseological patterns for comprehensive recognition of ATC controller’s instruction is given, when a limited set of words included in this instruction is known in advance. It is proved that the use of the recognition method with contextual analysis of the ATC phraseology elements in conjunction with the recognition carried out by using software library intended for the universal recognition of the speech stream, will allow to increase the accuracy of the latter, while maintaining performance at a level sufficient to apply this method in control systems and real-time control. According to experts, the accuracy increase when using this method can be up to 30 %.

Текст научной работы на тему «Применение фразеологических шаблонов в процессе распознавания диспетчерских указаний для использования в тренажерах систем УВД»

Civil Avition High TECHNOLOGIES

Vol. 19, № 04, 2016

УДК 004.522

ПРИМЕНЕНИЕ ФРАЗЕОЛОГИЧЕСКИХ ШАБЛОНОВ В ПРОЦЕССЕ РАСПОЗНАВАНИЯ ДИСПЕТЧЕРСКИХ УКАЗАНИЙ ДЛЯ ИСПОЛЬЗОВАНИЯ В ТРЕНАЖЕРАХ СИСТЕМ УВД

А.Ю. ИВАНОВ, О.В. ПАНКОВА, А.П. ПЛЯСОВСКИХ

В статье предлагается алгоритм распознавания сообщений диспетчера УВД, использующий метод контекстного анализа элементов фразеологии радиообмена, основанного на применении фразеологических шаблонов. Приведен пример использования фразеологических шаблонов для исчерпывающего распознавания диспетчерского указания при заранее известном ограниченном наборе слов, входящих в это указание. Доказано, что использование метода распознавания с контекстным анализом элементов фразеологии УВД в совокупности с распознаванием, осуществляемым при использовании программной библиотеки, предназначенной для распознавания универсального речевого потока, позволит повысить точность работы последней при сохранении производительности системы на уровне, достаточном для применения данного способа в системах управления и контроля реального времени. Согласно экспертной оценке, прирост точности при использовании данного метода может составлять до 30 %.

Ключевые слова: распознавание речи, голосовое управление.

Создание комплексных системных тренажеров управления воздушным движением (КСТ УВД) с голосовым управлением является задачей, актуальность которой обусловлена необходимостью дальнейшего совершенствования тренажерной подготовки специалистов службы УВД, а также повышением безопасности, производительности и экономической эффективности эксплуатации существующих систем и тренажеров УВД. Однако вопрос конструирования подобных устройств целиком и полностью упирается в возможность создания модуля распознавания голосовых сообщений, способного обеспечить необходимую точность распознавания при сохранении производительности системы на уровне, позволяющем применять ее в КСТ УВД. Разработка подобного модуля - весьма сложный и трудоемкий процесс, который и сам неоднократно являлся предметом обсуждения в различных публикациях [1, 2].

В рамках данного исследования предлагается использовать одну из уже существующих программных библиотек распознавания речи. На сегодняшний день разработан целый ряд коммерческих и некоммерческих программных библиотек (например, MS Speach API, CMU Sphinx или RWTH ASR), позволяющих с некоторой точностью осуществлять приведение речевого сигнала к символьной последовательности. Они достаточно сильно различаются по своим параметрам, однако в подавляющем большинстве используют способы описания речевого потока, характеризующиеся некоторой долей вероятности, что само по себе подразумевает возможность ошибочного распознавания сообщения. Вследствие этого преобразование речи в строковую последовательность никогда не может быть на 100 % верным. К примеру, при использовании библиотеки CMU Sphinx для решения задач распознавания новостных сообщений, получаемых по телерадиоканалам, точность распознавания составляет всего 20-25 % [3]. Безусловно, такой результат не может считаться приемлемым ни для какой системы управления. Таким образом, для успешного применения вышеописанных библиотек в КСТ УВД необходимо найти способы дополнительной обработки полученного результата, позволяющие повысить его достоверность при сохранении общей производительности вычислительного комплекса на уровне, позволяющем использовать его в системах управления и контроля реального времени.

Осмысленный речевой поток (сообщение) B - это последовательная цепочка относящихся друг к другу ассоциаций и идей, выраженная языковыми средствами и служащая для отображения результата мышления. Таким образом, главной отличительной чертой осмысленного речевого потока является наличие основной идеи (тезиса). Все множество тезисов можно сопоставить множеству обобщающих их тем T . Отсюда видно, что заранее определенная тема Тк ожидаемого речевого потока к в достаточной степени обуславливает его содержание B(Tk).

Vol. 19, № 04, 2016

Civil Avition High TECHNOLOGIES

Для заблаговременного определения темы обмена сообщениями (диалога) Б (Тк) между

диспетчером и пилотом можно воспользоваться методом контекстного анализа вариантов развития диалога. Контекстный анализ представляет собой логическую сортировку последовательностей

событий 8т (при т = 1,М), составляющих воздушную обстановку {8,8^,...,8М} = ®(8т) Д-™

данного этапа полета £, с целью оценки вероятности появления очередного в близлежащей

перспективе и дальнейшего исключения событий 85т , возможность появления которых на данном

£ противоречит здравому смыслу (Р(8£)~ о). Наличие априорной информации о событии ^ ,

которое должно произойти в близлежащее время, позволяет сократить количество тем диалогов Т ^ Тк, которые будут использоваться в ходе распознавания дальнейших диспетчерских указаний

до к, присущих конкретной воздушной обстановке ). Это, в свою очередь, позволяет сократить множество эталонных слов А до количества, реально используемого при обмене сообщениями между диспетчером и пилотом (Адз с А) при наступлении данного 8т .

Процедуру управления летательным аппаратом (ЛА) диспетчером УВД можно разделить на некоторое количество Ь заранее известных этапов полета (при / = 1, Ь). Каждому £ соответствует присущее ему множество тем диалогов Т\ применимых или не применимых в сложившихся условиях. Кроме этого, выбор Т£ также обуславливается {8, 8£,...,8М} ^Тк, таким образом исключение цепочек, состав которых отличается от цепочки, представляющей текущую воздушную обстановку на данном этапе полета, также привело бы и к исключению соответствующих

. Т. е. выбор конкретного Тк осуществляется исходя из текущего £ и сложившейся &(8т), или

д©(8т)} ^ аТк при р (8т )> о, (1)

где Sj - /-й этап полета, ®(8т) - сложившаяся воздушная обстановка, Тк - к-я тема

диалога между диспетчером и экипажем ВС, Р (8т) - вероятность появления события

8т. Иными словами, для сокращения словаря комплекс УВД, обладающий способностью распознавания сообщений диспетчера УВД, должен уметь прогнозировать последовательности 8т для конкретного , на основании информации о 8^ , предшествующих данному, для любого £.

При анализе диалогов Б(Тк ), возникающих при появлении соответствующей ®(8т) для каждого Бп (Тк ) (где п - количество сообщений, составляющих диалог), на этапе полета Sj для конкретной ), можно отметить существование комбинаций слов (ключевых слов) АпТ сАд£, присущих исключительно конкретному £. Это позволяет сделать вывод, что любой БП (Тк) при вполне определенном £ однозначно будет содержать некий, характеризующий исключительно его, фразеологический шаблон аоТ е Аш. . Таким образом, можно заключить, что выявление подобного аБТ е АВТ^ при определенных £ и @(8т) в речевом потоке позволит однозначно идентифицировать искомую фразу, как Бьп (Тк) или производную от нее.

Civil Avition High TECHNOLOGIES

Vol. 19, № 04, 2016

Описанный метод позволяет выполнить направленное двухэтапное сокращение словаря А : предварительное - анализ содержимого всевозможных допустимых фраз О (тя) для идентификации определяющих их ключевых слов, и динамически формируемое в процессе распознавания, путем анализа контекста диалога относительно сложившейся 0(3) • Полученное в результате множество Ащ с Ая (ПРИ АОт << А ) в дальнейшем можно использовать для целенаправленного поиска ключевых комбинаций в каждом получаемом диспетчерском указании. Итак, распознавание любого диспетчерского сообщения можно свести к следующим этапам (рис. 1).

Рис. 1. Применение метода контекстного анализа элементов фразеологии радиообмена при распознавании диспетчерского указания

Vol. 19, № 04, 2016

Civil Avition High TECHNOLOGIES

Подобное уменьшение словаря A ^ ADT позволит значительно сократить количество

итераций, что окажет положительное влияние на производительность вычислительной системы в процессе распознавания и точность полученного результата.

Рассмотрим способ применения метода контекстного анализа фразеологии радиообмена для осуществления распознавания сообщений диспетчера, получаемых при сопровождении ВС, осуществляющего сквозное следование через контролируемый сектор. Процесс управления пролетающих транзитом ЛА, как видно из наших исследований, можно разбить на три основные части:

• прием на управление;

• следование в секторе УВД;

• передачу на управление в смежный сектор.

Этап приема Si характеризуется рядом событий ösm . Первым из них является приближение ЛА к точке входа в район управления. Для него характерен следующий набор сообщений: при отсутствии внештатных ситуаций диалог начинает экипаж ЛА фразой, в которой сообщает время пролета рубежа передачи, наименование рубежа, эшелон, расчетное время пролета следующего по маршруту ПОД, минимум командира, остаток топлива и т. п. При наличии вторичной радиолокации (ВРЛ) часть этой информации поступает к диспетчеру по вторичному радиоканалу, автоматически отображается на экране радара и не произносится. Следующими 8sm могут быть:

• прием ЛА без изменений летного плана;

• прием с корректировкой плана полета (например, при обходе опасных метеоявлений или при разрешении конфликтных ситуаций) путем изменения курса или эшелона.

Как по инициативе диспетчера, так и по инициативе пилота при следовании через сектор могут появляться следующие события: изменение курса, высоты или скорости, возникновение конфликтной ситуации, завершение отдельных Si запланированного маршрута Особенностью

Si - передача на управление, является сообщение экипажу ЛА частоты работы диспетчера

смежного сектора и рубежа передачи, после пролета которого необходимо вести связь на указанной частоте.

В качестве примера проанализируем следование ЛА по маршруту R369 через Московский узловой диспетчерский район (МУДР) (рис. 2). Исходя из вышесказанного, можно заметить, что следование по маршруту R369 должно включать в себя несколько обязательных Si. Первым из них является этап приема на управление, который

начинается от пересечения границы зоны ответственности в точке SUGIR при МПУ 323° и длится до подлета к пункту донесения по запросу KULEG. Далее следуют этапы: пролет через пункт донесения по запросу KULEG и пролеты ПОДов MOLOT, ATRUN, MAKSI при МПУ 322°, которые начинаются в указанных пунктах и заканчиваются при подлете к следующему по маршруту пункту. Последним обязательным является Si - передача

управления, который длится от ПОД MAKSI до пересечения границы сектора в точке BELAG. Полет осуществляется между эшелонами FL280-FL530 [5]. Каждый из вышеназванных Si можно характеризовать определенным набором комбинаций возможных событий ®(sm) и допустимых тем диалогов Tk. Так, S1 - прием на управление, условно можно представить в виде цепочки следующих ожидаемых ^ и определить для каждой новой 0(c>m) соответствующий ей диалог Dsn (Тк) [6, 7]:

ÖS - приближение ЛА к рубежу передачи.

Научный Вестник МГТУ ГА_Том 19, № 04, 2016

Civil Avition High TECHNOLOGIES Vol. 19, № 04, 2016

вила

MWONÜMU

i-KMMASOVO-l У 745 BG у

V. W CON 03« V w

mm

Рис. 2. Схема пролегания маршрута Я369 через Московский узловой диспетчерский район

Для этого события характерна следующая тема диалога:

Tf1 - согласование условий пересечения рубежа передачи.

Диалог на данную тему инициируется экипажем и несет в себе следующую информацию, поступающую от экипажа диспетчеру:

- экипаж: «сообщение времени пролета (если передача производится не в момент пролета), наименование рубежа, эшелон пролета, расчетное время пролета следующего ПОД».

Следующими ожидаемыми событиями с присущими ему темами, сообщениями и шаблонами являются:

8f - прием ЛА на управление без изменений плана полета.

Для этого события допустимо несколько тем развития диалога:

T2f - местонахождение ЛА;

T3f - курс и эшелон ЛА после приема на управление;

Tfl - воздушная обстановка в районе приема на управление;

- диспетчер: «(если не было указано ранее) указание о порядке набора заданного эшелона, информация о местонахождении и воздушной обстановке на участке набора высоты».

Изменение высоты, курса и скорости могут применяться при различных 0(3), поэтому их удобно выделить в отдельную группу. Построение данных Dsn(bk) уместнее рассмотреть

после классификации и группировки указаний по способу построения и области применения, что планируется сделать в процессе дальнейшей работы.

Df1 (T2) - Вы находитесь (Radar contact/Position/You are/You appear to be) <число> (kilometers) ориентир < He обязательное: указания дальнейшего курса и эшелона>

Vol. 19, № 04, 2016

Civil Avition High TECHNOLOGIES

(a12 = Radar contact/Position/You are/You appear to be <число> kilometers).

- завершение маневра (данное событие возникает по завершении любого предписанного ЛА изменению курса или эшелона);

T5Sl - доклад о завершении маневра;

T6Sl - доклад о воздушной обстановке в районе текущего местонахождения;

- экипаж: «подтверждение о достижении заданного эшелона, доклад о метеорологической обстановке (при необходимости)».

T7Sl - действия экипажа после завершения маневра;

- диспетчер: «указание о дальнейшем ходе выполнения полета»;

DS1 (T) - Разрешаю (Cleared to) <имя собственное> согласно запланированному маршруту (via flight planed route)

( a27 = Cleared to <имя собственное> via flight planed route); <Возможен вариант: указание нового курса и эшелона>

Следующими четырьмя обязательными S2, S3, S4, S5 являются пролеты ПОД. Их можно охарактеризовать следующими обязательными Ssfn.

55 - пролет ПОД;

T1S2 - доклад о пролете ПОД;

- экипаж: «сообщение времени пролета ПОД (если передача производится не в момент пролета), эшелон, расчетное время пролета следующего ПОД»;

TS - доклад о воздушной обстановке в районе текущего местонахождения

- диспетчер: «(при необходимости) запрос условий полета»; форма запроса информации выглядит следующим образом:

Ds„ (Tk) - запрос информации: Доложите (Report) <необходимая информация> ( aDT = Report)

- экипаж: сообщение условий полета;

TS - действия экипажа после пролета ПОД;

- диспетчер: подтверждение пролета ПОД, (при необходимости) указания о дальнейшем выполнении полета по форме:

Ds„(Tk) - подтверждение получения информации:

Вас понял (Roger/Wilco/Affirm) < Не обязательное: указания дальнейшего курса и эшелона> ( aDT = Roger/Wilco/Affirm).

56 - пролет ПОД последнего перед пересечением границы сектора, имеет некоторые индивидуальные особенности:

SS - пролет ПОД последнего по маршруту;

T1S6 - доклад о пролете ПОД;

T26 - обсуждение условий передачи;

- экипаж: сообщение времени пролета ПОД (если передача производится не в момент пролета), эшелон, расчетное время пролета рубежа передачи;

TS - обсуждение условий передачи;

Civil Avition High TECHNOLOGIES

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Vol. 19, № 04, 2016

- диспетчер: «подтверждение пролета ПОД, (при необходимости) указания о дальнейшем выполнении полета, (в зависимости от соблюдения безопасных интервалов с соседними ВС) разрешить текущие или задать новые значения чисел М в качестве условий входа в смежный район».

Последним обязательным S7 является передача управления:

0s - приближение к рубежу передачи;

TS - описание технических подробностей радиосвязи со смежным пунктом УВД;

- диспетчер: «сообщение о переводе экипажа на связь с диспетчером смежного пункта УВД, сообщение частоты его работы»;

DS (T1) - <Не обязательное: указание местоположения> Работайте с (Contact)

<название следующего по маршруту района управления> <частота> <Не обязательное: указания дальнейшего курса и эшелона >

( an = Contact<название следующего по маршруту района управления> <частота>).

ЗАКЛЮЧЕНИЕ

Из рассмотренных выше цепочек причинно-следственных закономерностей можно сделать выводы:

• несмотря на достаточно большое количество вариантов развития диалога в любой момент времени, детальное рассмотрение каждого этапа полета позволяет выделить конечное количество фраз, применимых к каждому событию, входящему в состав рассматриваемой воздушной ситуации.

• принимая во внимание избыточность, изначально присущую человеческой речи, составляющую для естественных языков 70-80 % [8], большинство предложений можно сократить до последовательности нескольких ключевых слов, несущих основную смысловую нагрузку.

Получаемое таким образом двухэтапное сокращение словаря (за счет селекции фраз и отбрасывания их избыточной составляющей) позволяет не только сократить количество итераций, выполняемых при сравнениях, но также выделить набор фраз, одна из составляющих которого однозначно должна представлять собой распознаваемый элемент. Это позволяет вести распознавание не до полного совпадения сравниваемого элемента с эталонным, а до исключения наименее подходящих вариантов, что, в свою очередь, не может не сказаться на производительности вычислительной системы.

Таким образом, использование метода распознавания с контекстным анализом элементов фразеологии УВД в совокупности с распознаванием, осуществляемым при использовании программной библиотеки, предназначенной для распознавания универсального речевого потока, позволит повысить точность работы последней при сохранении производительности системы на уровне, достаточном для применения данного способа в системах управления и контроля реального времени. Согласно экспертной оценке, прирост точности при использовании данного метода может составлять до 30 %.

СПИСОК ЛИТЕРАТУРЫ

1. Иванов А.Ю., Астапов К.А., Плясовских А.П. Некоторые вопросы построения систем голосового управления в тренажерных комплексах управления воздушным движением гражданской авиации // Научный вестник МГТУ ГА. 2013. № 198 (12). С. 129-135.

2. Леонович A.A. Современные технологии распознавания речи [Электронный ресурс]. URL: http://www.km.ru/referats/334470-sovremennye-tekhnologii-raspoznavaniya-rechi#

Vol. 19, № 04, 2016

Civil Avition High TECHNOLOGIES

3. CMUSphinx Tutorial For Developers [Электронный ресурс]. URL: http://cmusphinx. sourceforge.net/wiki/tutorialconcepts

4. Управление воздушным движением / под ред. Ю.П. Дарымова. М.: Транспорт, 1989.

5. Организация воздушного движения. Правила аэронавигационного обслуживания. 15-е изд. Международная организация гражданской авиации. 2007.

6. Федеральная служба воздушного транспорта России. Технологии работы диспетчеров управления воздушным движением. М.: Воздушный транспорт, 2000.

7. Правила и фразеология радиобмена на английском языке при выполнении полетов и управлении воздушным движением в воздушном пространстве Российской Федерации. 2-е изд. М., 2001.

8. Избыточность языка. http://ru.wikipedia.org/wiki/Избытoчнocть_языкa

APPLICATION OF PHRASEOLOGICAL PATTERNS IN THE RECOGNITION OF CONTROLLER'S INSTRUCTIONS, FOR AIR TRAFFIC CONTROL TRAINING COMPLEXES

Ivanov A.U., Pankova O.V., Plyasovskih A.P.

The paper proposes an algorithm for recognizing ATC controller's messages using method of contextual analysis of phraseology elements based on the application of phraseological patterns. A practical example of phraseological patterns for comprehensive recognition of ATC controller's instruction is given, when a limited set of words included in this instruction is known in advance. It is proved that the use of the recognition method with contextual analysis of the ATC phraseology elements in conjunction with the recognition carried out by using software library intended for the universal recognition of the speech stream, will allow to increase the accuracy of the latter, while maintaining performance at a level sufficient to apply this method in control systems and real-time control. According to experts, the accuracy increase when using this method can be up to 30 %.

Key words: speech recognition, voice command.

REFERENCES

1. Ivanov A.U., Astapov K.A., Plyasovskih A.P. Nekotorie voprosi postroeniya sistem golo-sovogo upravleniya v trenazhernih kompleksah upravleniya vozdushnim dvizheniem grazhdanskoy aviacii. The MSTU CA Scientific Bulletin. 2013. № 198 (12). S. 129-135.

2. Leonovich A.A. Sovremennie tehnologii raspoznavaniya rechi. URL: http://www.km.ru/ referats/334470-sovremennye-tekhnologii-raspoznavaniya-rechi#

3. CMUSphinx Tutorial For Developers. URL: http://cmusphinx.sourceforge.net/wiki/tutorialconcepts

4. Upravlenie vozdushnim dvizheniem. Moskva, 1989.

5. Organizaciya vozdushnogo dvizheniya. Pravila aeronavigacionnogo obsluzhuvaniya. Izdanie pyatnadcatoe. Mezhdunarodnaya organizaciya grazhdanskoy aviacii. 2007.

6. Federal'naya sluzhba vozdushnogo transporta Rossii. Tehnologiya raboti dispetcherov up-ravleniya vozdushnim dvizheniem. Moskva, 2000.

7. Pravila i frazeologiya radioobmena na angliyskom yazike pri vipolnenii poletov i upravlenii vozdushnim dvizheniem v vozdushnom prostranstve Rossiyskoy Federacii. Izdanie vtoroe. Moskva, 2001.

8. Izbitochnost' yazika. http://ru.wikipedia.org/wiki/H36biT04H0CTb языка.

СВЕДЕНИЯ ОБ АВТОРАХ

Плясовских Александр Петрович, доктор технических наук, начальник научно-исследовательской лаборатории ОАО ВНИИРА.

Иванов Александр Юрьевич, аспирант ОАО ВНИИРА, инженер ОАО ВНПНРА, электронный адрес: [email protected].

Панкова Ольга Вячеславовна, инженер 1 категории ОАО ВНИИРА.

i Надоели баннеры? Вы всегда можете отключить рекламу.