Научная статья на тему 'МЕТОДЫ И АЛГОРИТМЫ СЕМАНТИЧЕСКОГО АНАЛИЗА ТЕКСТОВОЙ ИНФОРМАЦИИ ПРИ ПОДГОТОВКЕ ПОЛЕТНЫХ ЗАДАНИЙ НА ИСПЫТАТЕЛЬНЫЕ ПОЛЕТЫ'

МЕТОДЫ И АЛГОРИТМЫ СЕМАНТИЧЕСКОГО АНАЛИЗА ТЕКСТОВОЙ ИНФОРМАЦИИ ПРИ ПОДГОТОВКЕ ПОЛЕТНЫХ ЗАДАНИЙ НА ИСПЫТАТЕЛЬНЫЕ ПОЛЕТЫ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
5
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
информационная система / полетное задание / интеллектуализация / семантический анализ / летные испытания / information system / flight task / intellectualization / semantic analysis / flight tests

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Осипов А.А.

В статье представлены основные технологические концепции четвертой промышленной революции. Рассмотрены аспекты развития нейронных сетей и обоснована актуальность их применения при решении задач обработки естественного языка и автоматизации работы с текстовыми документами. Описан процесс семантического анализа текста и обоснована возможность его применения при создании информационных систем обработки текстовых данных. Определены основные проблемы существующих принципов проведения летных испытаний современных авиационных комплексов и сделан вывод о необходимости их автоматизации и интеллектуализации. Описан процесс разработки полетных заданий на испытательные полеты и предложен способ его модернизации. Обоснована необходимость создания интеллектуальной информационной системы подготовки полетных заданий на испытательные полеты и предложен способ ее построения. Рассмотрена возможность применения в архитектуре интеллектуальной информационной системы цифровых нейронных сетей, построенных по принципам вычислительных моделей Transformer. Приведено описание алгоритмов работы вычислительных моделей Transformer, реализующих семантический анализ текстовой информации. Предложена архитектура построения интеллектуальной информационной системы подготовки полетных заданий на испытательные полеты, использующая принципы сетевых технологий. Сделаны выводы об актуальности и технической реализуемости предложенной интеллектуальной информационной системы подготовки полетных заданий на испытательные полеты.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Осипов А.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS AND ALGORITHMS FOR SEMANTIC ANALYSIS OF TEXTUAL INFORMATION DURING THE PREPARATION OF FLIGHT TEST MISSIONS

The article presents the main technological concepts of the fourth industrial revolution. The aspects of neural networks development are considered and the relevance of their application in solving problems of natural language processing and automation of work with text documents is substantiated. The process of semantic analysis of text is described and the possibility of its application in the creation of information systems of text data processing is substantiated. The main problems of the existing principles of conducting flight tests of modern aviation complexes are defined and the conclusion about the necessity of their automation and intellectualization is made. The process of development of flight tasks for test flights is described and the method of its modernization is proposed. The necessity of creating an intelligent information system for preparing flight tasks for test flights is substantiated and the method of its construction is proposed. The possibility of using digital neural networks built on the principles of Transformer computational models in the architecture of the intellectual information system is considered. The description of algorithms of Transformer computational models realizing semantic analysis of text information is given. The architecture of building an intelligent information system of flight task preparation for test flights using the principles of network technologies is proposed. Conclusions are drawn about the relevance and technical feasibility of the proposed intelligent information system of flight task preparation for test flights.

Текст научной работы на тему «МЕТОДЫ И АЛГОРИТМЫ СЕМАНТИЧЕСКОГО АНАЛИЗА ТЕКСТОВОЙ ИНФОРМАЦИИ ПРИ ПОДГОТОВКЕ ПОЛЕТНЫХ ЗАДАНИЙ НА ИСПЫТАТЕЛЬНЫЕ ПОЛЕТЫ»

УДК 629.7.018

ГРНТИ 55.47.81

МЕТОДЫ И АЛГОРИТМЫ СЕМАНТИЧЕСКОГО АНАЛИЗА ТЕКСТОВОЙ ИНФОРМАЦИИ ПРИ ПОДГОТОВКЕ ПОЛЕТНЫХ ЗАДАНИЙ НА ИСПЫТАТЕЛЬНЫЕ ПОЛЕТЫ

А.А. ОСИПОВ

Государственный летно-испытательный центр имени В.П. Чкалова (г. Щелково)

В статье представлены основные технологические концепции четвертой промышленной революции. Рассмотрены аспекты развития нейронных сетей и обоснована актуальность их применения при решении задач обработки естественного языка и автоматизации работы с текстовыми документами. Описан процесс семантического анализа текста и обоснована возможность его применения при создании информационных систем обработки текстовых данных. Определены основные проблемы существующих принципов проведения летных испытаний современных авиационных комплексов и сделан вывод о необходимости их автоматизации и интеллектуализации. Описан процесс разработки полетных заданий на испытательные полеты и предложен способ его модернизации. Обоснована необходимость создания интеллектуальной информационной системы подготовки полетных заданий на испытательные полеты и предложен способ ее построения. Рассмотрена возможность применения в архитектуре интеллектуальной информационной системы цифровых нейронных сетей, построенных по принципам вычислительных моделей Transformer. Приведено описание алгоритмов работы вычислительных моделей Transformer, реализующих семантический анализ текстовой информации. Предложена архитектура построения интеллектуальной информационной системы подготовки полетных заданий на испытательные полеты, использующая принципы сетевых технологий. Сделаны выводы об актуальности и технической реализуемости предложенной интеллектуальной информационной системы подготовки полетных заданий на испытательные полеты.

Ключевые слова: информационная система, полетное задание, интеллектуализация, семантический анализ, летные испытания.

Введение. Стремительное развитие цифровых технологий и их повсеместная интеграция во все сферы деятельности современного общества привело к становлению новой эпохи в техническом мире - четвертой промышленной революции или Индустрии 4.0 [1]. На новом этапе развития появились такие технологические концепции как IoT (Internet of Things, интернет вещей), CPS (Cyber-Physical System, киберфизические системы), Cloud computing (Облачные технологии или облачные вычисления), Big data (технологии больших данных), ML (Machine Learning, машинное обучение) и др. Все они призваны автоматизировать деятельность человека в той или иной области и обеспечить оптимальный результат выполнения поставленных задач [2, 3]. Одной из наиболее активно развивающихся технологических концепций в настоящее время является машинное обучение вычислительных моделей нейронных сетей. Возможность обучения нейронных сетей самостоятельному принятию решений при наличии неизвестных начальных условий нашла широкое применение во всех сферах деятельности человека [4, 5]. Одной из них является обработка естественного языка и решение сопутствующих задач (NLP-задачи (Natural Language Processing), задачи обработки естественного языка). Необходимость обработки естественного языка часто возникает при создании интеллектуальных информационных систем (ИИС) анализа данных, в которых присутствует пользовательский человеко-машинный интерфейс. В эпоху Индустрии 4.0 такие ИИС широко применяются для

автоматизации работы с текстовой информацией значительного объема и разнородной структуры содержания. Примером ИИС, решающей ряд NLP-задач по обработке большого объема текстовой информации и взаимодействующей с человеком-оператором посредством пользовательского интерфейса, может являться автоматизированная система подготовки полетных заданий (ПЗ) на испытательные полеты при проведении летных испытаний современных авиационных комплексов (АК).

Актуальность. Появление технологий Индустрии 4.0 дало толчок в развитии тяжелой промышленности, в том числе в авиастроении. Современные АК, способные одновременно решать разнородные функциональные задачи, оснащаются сложнейшим оборудованием и передовой электроникой. Управление АК осуществляется посредством единого информационного пространства, представляющего собой ИИС сбора и обработки данных о состоянии всех узлов и агрегатов АК, способную анализировать текущее состояние АК, вырабатывать рекомендации для действий экипажа, а также в автономном режиме осуществлять управление АК. Процесс создания и отладки столь сложных авиационных систем требует проведения большого количества летных экспериментов, которые выполняются в рамках предварительных и государственных летных испытаний. При этом, чем сложнее оборудование АК, тем большее количество летных экспериментов необходимо провести при его создании и отладке. Проведение летного эксперимента подразумевает под собой выполнение наземной отработки и испытательного полета, который проводится с целью подтверждения соответствия тех или иных характеристик АК и его оборудования требованиям технического задания. Порядок выполнения испытательного полета, а также алгоритм действий членов экипажа необходимый для достижения цели летного эксперимента определяется на этапе подготовки к полету и указывается в ПЗ на испытательный полет [6-8].

Разработка такого документа как ПЗ является одним из важнейших этапов подготовки к испытательному полету и является основанием для его выполнения. В процессе разработки ПЗ участвует большое количество специалистов-испытателей от различных профильных организаций. Указанный процесс неразрывно связан с обработкой и анализом большого количества нормативно-технической документации, представляющей собой разнородные тексты значительного информационного объема. При анализе такого информационного объема существует высокая вероятность возникновения ошибок, связанных с человеческим фактором и профессиональным опытом специалиста. Отсутствие автоматизации выполнения рассматриваемого процесса может привести к тому, что в содержании критически важных разделов ПЗ будет представлена информация недостаточно полно его описывающая или же вовсе будут упущены важные информационные аспекты, отсутствие которых может повлиять не только на результаты выполнения испытательного полета, но и на его безопасность [9-12].

Несмотря на стремительное развитие и внедрение передовых информационных технологий в авиастроении и других отраслях тяжелой промышленности, процесс разработки ПЗ на испытательные полеты остается сугубо консервативным и выполняется специалистами-испытателями путем визуального поиска и анализа необходимой информации как в электронных, так и в бумажных информационных источниках. Указанная проблема усугубляется тем, что нормативно-техническая документация, используемая профильными специалистами на своих рабочих местах, может быть недостаточно актуальной, что создает предпосылки к разночтениям разрабатываемого документа и возникновению фактических ошибок. Кроме того, из-за территориальной разрозненности предприятий авиационной промышленности, процесс согласования и выдачи предложений в содержание ПЗ занимает значительный период времени, так как разрабатываемые документы пересылаются в бумажной форме, что существенно снижает эффективность и увеличивает время выполняемых работ [13-15]. Указанных недостатков можно избежать посредством создания ИИС, автоматизирующей процесс подготовки ПЗ на испытательные полеты и организующей единое информационное пространство нормативно-технического обеспечения летных испытаний.

Алгоритмы семантического анализа при выполнении текстовых запросов. Основной задачей ИИС, реализующей автоматизированную подготовку ПЗ на испытательные полеты, является поиск по запросу пользователя текстовой информации внутри электронного хранилища нормативно-технической документации. При этом для обеспечения наилучшего качества и безошибочной работы ИИС должна реализовывать семантический поиск и анализ текстовой информации [16]. В отличие от синтаксического поиска, который в процессе работы использует только лишь прямое сходство слов, семантический поиск определяет значение поискового запроса в целом и находит наиболее значимые ключевые слова, которые определяют семантику поискового запроса.

Семантический поиск и анализ текстовой информации является одной из частных задач класса NLP. Для решения указанной задачи могут применяться нейронные сети, построенные по типу вычислительной модели Transformer [17]. Обобщенная структура нейронной сети, построенной по типу вычислительной модели Transformer, представляет собой совокупность двух последовательно соединенных модулей - модуль энкодеров и модуль декодеров (рисунок 1).

Рисунок 1 - Обобщенная структура вычислительной модели Transformer

В зависимости от требуемой точности результатов указанные модули могут содержать различное количество функциональных блоков (энкодеров, декодеров), однако, на практике определено, что содержание в вычислительной модели Transformer более 24 энкодеров не дает значительного прироста в точности полученных результатов и существенно повышает время обучения нейронной сети [17]. В свою очередь, энкодеры и декодеры состоят из трех основных слоев вычислений, представляющих собой самостоятельные нейронные сети: нейронная сеть внимания; нейронная сеть прямого распространения (слой активации); вычислительный слой нормализации значений. Принципы работы указанных функциональных блоков будут рассмотрены ниже.

Обучение нейронной сети, построенной по типу вычислительной модели Transformer, имеет свои особенности. Во-первых, для достижения высокой релевантности получаемых

результатов процесс обучения нейронной сети должен проходить на тестовом наборе данных значительного размера (миллионы текстовых последовательностей). В сфере нормативно-технической документации готового для применения в обучении нейронной сети набора тестовых данных такого объема не существует, а самостоятельная его реализация займет значительное время. В связи с этим при создании рассматриваемой ИИС предполагается использовать вычислительную модель Transformer, предобученную на большом корпусе текстов нейтрального содержания, и дообучить ее на небольшом количестве текстов профильного содержания. Это позволит существенно сократить время создания такой ИИС и повысить эффективность ее работы. Во-вторых, прямое использование стандартного механизма градиентного спуска при определении весовых коэффициентов нейронной сети (градиента функции потерь) требует огромных вычислительных затрат и может давать неудовлетворительные результаты. В связи с этим для обучения вычислительной модели Transformer необходимо использовать адаптивные алгоритмы обучения, такие как Adam (Adaptive Moment Estimation, алгоритм адаптивной оптимизации), RMSProp (среднеквадратичное распространение). Они построены на основе стохастического градиентного спуска, однако используют механизмы масштабирования скорости обучения, что позволяет значительно сократить вычислительные затраты.

Применимость таких нейронных сетей к решению NLP задач обуславливается наличием в их архитектуре механизма внутреннего внимания (self-attention). Механизм self-attention позволяет на каждом этапе анализа исходного текстового запроса, то есть при анализе любого слова «обращать внимание» на любое другое слово и делать вывод о степени их взаимосвязи и контекстуальной значимости в предложении, что существенно повышает релевантность получаемых результатов. В большей степени реализация механизма self-attention происходит в стеке энкодеров вычислительной модели.

На первом этапе вычислений на входы нейронной сети внимания поступают слова исходного текстового запроса, которые посредством специального алгоритма представления слов word embeddings преобразуются в векторы X с размерностью 512. Таким образом, исходный текстовый запрос S, содержащий n слов, представляется как функция вида

S = F(Xl,X2,...,Xn).

(1)

На следующем этапе обработки в нейронной сети происходит формирование трех групп дополнительных векторов размерностью 64: векторы запросов О, векторы ключей К , векторы значений V . Указанные векторы О , К , V формируются путем перемножения вектора X (7 = 1 • ■ • п) на матрицы IVе, 1¥к , Ж1 , соответственно:

Q=XxWQ.,

(2)

К. = X. х W

(3)

V.=X.xWl

(4)

При этом для каждого вектора X формируются свои векторы О, К, V, таким образом, количество векторов каждого вида соответствует количеству п слов, содержащихся в исходной текстовой последовательности Матрицы , , имеют размерность 64*512 и представляют собой набор весовых коэффициентов, значения которых экспериментально определяются в процессе обучения нейронной сети. Векторы О , К , V имеют смысл

отображения вектора X в пространстве матриц Жв , IV1' , IV1 , то есть отображение слова исходного текстового запроса на некоторые искусственно введенные параметры - запросы, ключи, значения.

Дальнейший анализ исходной текстовой последовательности подразумевает вычисление коэффициента внутреннего внимания К£. Для каждого слова в последовательности £ существует п коэффициентов внутреннего внимания К£, которые определяются как

•и,

7=1

• п.

(5)

Таким образом, к примеру, коэффициент Кш численно определяет требуемый уровень фокусирования внимания на слове, стоящем во второй позиции, при обработке слова, стоящего в первой позиции. Аналогично для коэффициента К£21 - уровень фокусирования внимания на слове, стоящем в первой позиции, при обработке слова, стоящего во второй позиции и т.д. В результате выполнения указанных вычислений, для каждого /-го слова в исходной последовательности £ формируется вектор коэффициентов внутреннего внимания длиной п,

а для всего текста запроса формируется матрица коэффициентов внутреннего внимания К£ размерностью п*п

К£ =

К к

511

К к

(6)

Затем выполняется процесс нормализации значений элементов матрицы К путем применения экспоненциальной функции нормализации Р к каждому элементу матрицы К . Нормализация коэффициентов внутреннего внимания Кв необходима для дальнейшей интерпретации их значений как распределения вероятной значимости слов исходного текстового запроса £ по отношению к анализируемому слову. Экспоненциальная функция нормализации Р коэффициентов внутреннего внимания исходного текстового запроса имеет следующий вид

Р( К£Р) =

(

к=1

, п = шах(/),

(7)

где п - количество элементов строки в матрице К (длина текстовой последовательности). Следует отметить, что для получения лучших результатов нормализации значения коэффициентов внутреннего внимания Кв перед вычислением функции Р делятся на число,

равное квадратному корню из размерности векторов О , К , V . Очевидно, что результаты вычисления функции нормализации Р для коэффициентов внутреннего внимания К, находящихся на главной диагонали матрицы К (при ]=Р), будут иметь наибольший вес среди коэффициентов соответствующей строки матрицы К . Это означает, что при анализе определенного слова исходной последовательности наибольшую взаимосвязь с рассматриваемым словом будет иметь это же слово. Указанный факт очевиден и не несет практической значимости, поэтому такие коэффициенты не учитываются в дальнейших вычислениях.

После выполнения процедуры нормализации нейронная сеть реализует перемножение взвешенных (нормализованных) значений коэффициентов внутреннего внимания Р(К5) на

соответствующие векторы значений V, рассчитанные для каждого слова исходной текстовой

е

последовательности 5, и производит суммирование вновь полученных значений. Указанные операции производятся для каждого у-го слова последовательности Л", в результате чего

формируется набор векторов внимания 7( , характеризующих семантику конкретного слова,

учитывающую контекст всей текстовой последовательности 5:

(8)

WZ =

(9)

Можно сказать, что матрица WZ полностью описывает семантику исходного текстового запроса S в двумерном пространстве значений A, однако, на этом возможности семантического анализа вычислительных моделей Transformer не ограничиваются. В дополнение к механизму self-attention в вычислительных моделях Transformer существует механизм расширенного внимания (multi-head attention), который улучшает качество семантического анализа за счет «расширения» пространства значений A, описывающего взаимосвязи слов. Для реализации механизма расширенного внимания в нейронной сети внимания создается несколько дополнительных слоев со своими матрицами WQ, WK , Wl . Количество дополнительных слоев нейронной сети зависит от размерностей векторов X , О, К, V . Таким образом, в каждом дополнительном слое нейронной сети параллельно происходят все вышеописанные вычисления с одними и теми же исходными данными (исходной текстовой последовательностью S), разница заключается лишь в том, что матрицы WQ , WK , WV каждого слоя в процессе обучения получают различные значения весовых коэффициентов, то есть каждый слой нейронной сети обучается «обращать внимание» на различные аспекты семантической взаимосвязи слов. Это приводит к тому, что выходными значениями каждого слоя нейронной сети являются матрицы

Wz , содержащие различные векторы внимания Z; . Следует отметить, что пространство значений A, определяющее взаимосвязи слов, в таком случае является трехмерным пространством и может быть представлено в виде вектора R матриц WZ

R = (WZ J, WZ

2>

,wz.

(10)

где q - количество дополнительных слоев нейронной сети внимания. Таким образом, реализация механизма расширенного внимания существенно улучшает точность семантического анализа текста за счет q-кратного увеличения параметров (взвешенных коэффициентов внимания), описывающих каждое анализируемое слово.

Для последующей обработки полученных значений элементы вектора Я необходимо представить в виде единой матрицы, где каждая строка будет соответствовать одному слову анализируемого текста и содержать все описывающие его весовые коэффициенты. С этой целью выполняется операция конкатенации (слияние) матриц WZ в матрицу Жк и перемножение ее с матрицей весовых коэффициентов W0, значения элементов которой также определяются в процессе обучения нейронной сети внимания:

WR = [WZl WZ

(11)

WR0 = WK xWи

(12)

Матрица Жко содержит выходные данные нейронной сети внимания, которые для дальнейшей обработки передаются в следующий слой энкодера - нейронную сеть прямого распространения. Однако между этими двумя нейронными сетями существует некоторый вспомогательный вычислительный слой, который обеспечивает организацию обратной связи с исходными данными и последующую нормализацию полученных значений. Обратная связь обеспечивается посредством построчного сложения элементов матрицы Жко с элементами векторов X

fjvR0 " 11 wm 1 rr 1512 ' x'

tvm' + x! + 1 , i = 1

wm " «1 • • wm rr «512 к

(13)

Стоит отметить, что размерность матрицы WR0 составляет и*512, что соответствует количеству слов в исходной текстовой последовательности S и количеству элементов в векторах X . Требуемая размерность матрицы WR0 обеспечивается за счет подбора необходимого количества дополнительных слоев нейронной сети внимания (т.е. количества групп матриц весовых коэффициентов WQ, WK , WV ), иными словами, глубиной пространства значений А.

Таким образом, можно сказать, что с выхода нейронной сети внимания на вход нейронной сети прямого распространения подаются слова исходной текстовой последовательности в виде векторов X, «окрашенных» взвешенными коэффициентами внимания, вычисленными посредством вышеописанных алгоритмов.

Нейронная сеть прямого распространения представляет собой набор операций, выполняемых над обрабатываемыми данными, реализующий нелинейную функцию, называемую функцией активации. Такой подход обусловливается тем, что в нейронной сети внимания выполняются только линейные операции, а для последующих итераций обработки исходных данных необходимо их нелинейное преобразование. Нелинейное преобразование исходных данных позволяет усложнить вычислительную модель и на каждом последующем шаге обработки взглянуть на исходные данные «по-новому», то есть выделить новые аспекты семантики текстовой последовательности, что позволяет повысить эффективность выполняемого анализа. Как правило, в качестве функции активации в нейронной сети прямого распространения вычислительной модели Transformer используется функция ReLU (Rectified linear Activation Unit, выпрямленная линейная функция активации). На выходе нейронной сети прямого распространения также организуется обратная связь с входными значениями, по типу нейронной сети внимания.

Выходные значения нейронной сети прямого распространения являются выходными значениями энкодера и одновременно являются входными значениями следующего энкодера. В последующем энкодере производятся идентичные вычисления, результаты которых передаются к следующему энкодеру. Этот процесс происходит до тех пор, пока исходная текстовая последовательность не будет проанализирована всеми блоками энкодеров в стеке. Принцип анализа информации в стеке декодеров аналогичен уже описанному, отличительной особенностью является то, что исходные данные для анализа подаются сразу на все блоки декодеров в стеке одновременно. Основной замысел рассмотренных механизмов анализа состоит в том, что на каждом этапе вычислений используются исходные данные текстовой последовательности совместно с результатами вычислений предыдущего этапа, тем самым каждый этап вычислений делает свой независимый вклад в анализ семантики исходной текстовой

последовательности, что позволяет выполнять разносторонним анализ текста, не упуская его исходное значение. Количество энкодеров зависит от размера вычислительной модели и аппаратных возможностей технических средств, выполняющих вычисления. Таким образом, в пространство значений А добавляется еще одна степень размерности, что позволяет говорить о содержании в нем исчерпывающих сведений о семантике анализируемого текста. Описанный процесс вычислений может быть представлен в виде алгоритма, приведенного на рисунке 2.

Рисунок 2 - Алгоритм внутреннего внимания вычислительной модели Transformer

Аналогичным образом анализируются тексты электронного хранилища нормативно-технической документации, которые и являются целью исходного текстового запроса пользователя. В результате проведенного анализа ИИС отбирает текстовые блоки, семантическое значение которых близко к семантическому значению исходного текстового запроса и представляет их в качестве ответа на запрос. Следует отметить, что семантический анализ всего объема текстов электронного хранилища нормативно-технической документации является ресурсоемкой и длительной задачей. Выполнение указанной задачи после каждого пользовательского запроса может существенно снизить эффективность работы ИИС и привести к перегрузке ее аппаратной части. Для устранения указанного недостатка семантический анализ всего объема текстов электронного хранилища должен выполняться лишь один раз, при его инициализации, а результаты анализа хранятся в базе данных электронного хранилища. При поступлении пользовательского запроса на поиск информации будет происходить сканирование базы данных с целью поиска записей, содержащих схожие с пользовательским запросом результаты семантического анализа текста, и выдача соответствующих текстовых блоков в ответном сообщении.

Таким образом, описанные алгоритмы вычисления обеспечивают выполнение основной задачи, рассматриваемой ИИС, реализующей автоматизированную подготовку ПЗ на испытательные полеты, - семантический поиск по запросу пользователя текстовой информации внутри электронного хранилища нормативно-технической документации.

Архитектура интеллектуальной информационной системы подготовки полетных заданий на испытательные полеты. Для эффективного решения ИИС поставленных задач к ней предъявляется ряд технических требований, основными из которых являются: высокая производительность аппаратной части системы, позволяющая эффективно выполнять алгоритмы семантического анализа; обеспечение возможности многопользовательского доступа к электронному хранилищу нормативно-технической документации; обеспечение криптографического шифрования циркулирующей в системе информации [18-20].

Архитектура ИИС, отвечающей заданным техническим требованиям, представлена на рисунке 3.

Рисунок 3 - Архитектура ИИС подготовки ПЗ на испытательные полеты

Предложенная архитектура ИИС построена на основе сетевых технологий и имеет три функциональных уровня. Первый уровень представляет собой информационно-техническое окружение, непосредственно взаимодействующее с человеком-оператором. Оно состоит из персональной электронной вычислительной машины (ПЭВМ) со специализированным программным обеспечением, реализующим выполнение операций по подготовке ПЗ и

составлению запросов к электронному информационному хранилищу нормативно-технической документации. Иными словами, ПЭВМ реализует интуитивный человеко-машинный интерфейс при работе оператора с ИИС. Кроме того, информационно-техническое окружение имеет электронное хранилище ПЗ, содержащее готовые варианты ПЗ, а также внешний носитель полетных данных (НПД), который используется для загрузки электронных ПЗ в бортовое радиоэлектронное оборудование испытываемого АК.

Вторым уровнем архитектуры ИИС является аппаратно-программный комплекс обработки и анализа циркулирующей в ИИС информации. Аппаратно-программный комплекс состоит из функциональных модулей, которые выполняют следующие задачи: обработка пользовательского запроса и представление его в виде текстовой последовательности S, которая может быть подана на вход вычислительной модели типа Transformer; семантический анализ как исходного пользовательского запроса, так и текстов нормативно-технической документации; формирование ответных сообщений, воспринимаемых специальным программным обеспечением ПЭВМ. Обмен информацией между первым и вторым уровнем архитектуры ИИС происходит посредством локальной сети передачи данных. Стоит отметить, что информационно-техническое окружение первого уровня архитектуры ИИС может состоять из множества ПЭВМ, представляющих собой рабочие места специалистов-испытателей одного предприятия, которые объединены в локальную сеть. Через сетевой коммутатор к указанной сети подключается аппаратно-программный комплекс второго уровня, что обеспечивает возможность параллельной работы нескольких специалистов.

На третьем уровне архитектуры ИИС размещается электронное хранилище нормативно-технической документации и обеспечивающий его работу аппаратно-программный комплекс. Электронное хранилище нормативно-технической документации размещается на высоконадежных и отказоустойчивых промышленных серверах хранения данных, которые имеют доступ во внешнюю сеть передачи данных. К этой же сети, посредством сетевых коммутаторов, подключаются программно-аппаратные комплексы второго уровня, которые физически находятся в составе локальных сетей различных предприятий авиационной промышленности и центров летных испытаний. Таким образом, реализуется распределенный многопользовательский доступ к электронному хранилищу нормативно-технической документации. Аппаратно-программный комплекс обеспечения работы электронного хранилища представляет собой систему управления базами данных, которая обеспечивает преобразование пользовательских текстовых запросов в SQL-запросы и обмен информацией с электронным хранилищем. Кроме того, система управления базами данных осуществляет администрирование электронного хранилища, обеспечивает целостность информации, а также периодическое резервное копирование хранящихся в нем сведений.

Необходимо отметить, что информация, циркулирующая в ИИС, может иметь конфиденциальный характер и для обеспечения возможности работы с ней необходимо принимать комплекс мер по защите информации. Для обеспечения информационной защиты в предложенной архитектуре ИИС предусмотрено использование криптографических средств шифрования (криптошлюзов), а также межсетевых экранов, фильтрующих проходящий через них информационный трафик. Таким образом, предложенная архитектура ИИС подготовки ПЗ на испытательные полеты отвечает предъявляемым к ней техническим требованиям и может быть использована для автоматизации процессов разработки и согласования ПЗ при проведении летных испытаний.

Выводы. На современном этапе развития авиастроения, задачи автоматизации и интеллектуализации процессов создания АК и проведения их летных испытаний являются одними из основных. Наиболее острая потребность в модернизации существующих способов и принципов выполнения работ возникает при испытаниях перспективных АК военного назначения. В силу технологичности и сложности систем АК военного назначения, а также высоких требований к их надежности, летные испытания таких АК являются весьма трудоемким

процессом, который может длиться десятки лет. Для сокращения сроков и повышения эффективности результатов летных испытаний, в структуру их проведения необходимо внедрять современные технологии Индустрии 4.0. Одним из таких решений может стать рассмотренная ИИС подготовки ПЗ на испытательные полеты. Предложенная в статье архитектура построения информационной системы, а также вычислительная модель, реализующая алгоритмы семантического анализа текста, могут быть использованы при создании такой ИИС, применение которой позволит повысить уровень автоматизации процессов проведения летных испытаний и сократить время подготовки к испытательным полетам перспективных АК военного назначения.

СПИСОК ЛИТЕРАТУРЫ

1. Солдатов А.С. Концепция создания перспективной информационно-измерительной системы для летных испытаний авиационной техники с применением технологий индустрии 4.0 // Воздушно-космические силы. Теория и практика. 2021. № 20. С. 167-177. [Электронный ресурс]. Режим доступа: http://www.vva.mil.ru/Izdaniay/VKS-teoriya-i-praktika (дата обращения 25.02.2024).

2. Щербаков И.В. Киберфизический подход к построению виртуального имитационно-моделирующего испытательного комплекса // Воздушно-космические силы. Теория и практика. 2023. № 26. С. 39-48. [Электронный ресурс]. Режим доступа: http://www.vva.mil.ru/Izdaniay/VKS-teoriya-i-praktika (дата обращения 25.02.2024).

3. Багдасарян Р.Х., Матвеева А.С., Лосева Е.С. Использование искусственного интеллекта в документообороте // Наука. Техника. Технологии (политехнический вестник). 2023. № 2. С. 26-29.

4. Осипов А.А. Анализ факторов, влияющих на безопасность полетов, при разработке полетных заданий на испытательные полеты // Проблемы безопасности полетов. 2023. № 9. С. 3-11.

5. Аверкин А.Н. Объяснимый искусственный интеллект как часть искусственного интеллекта третьего поколения // Речевые технологии. 2023. № 1. С. 4-10.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Тобин Д.С., Голосовский М.С., Богомолов А.В., Баландов М.Е. Особенности организации испытаний программного обеспечения киберфизических систем с использованием технологий Интернета вещей // Математические методы в технологиях и технике. 2022. № 9. С. 110-114.

7. Щербаков И.В. Анализ возможностей автоматизированного тестирования программного обеспечения с применением технологий Индустрии 4.0 // Известия Тульского государственного университета. Технические науки. 2023. № 7. С. 611-616.

8. Soldatov A.S., Sherbakov I.V., Osipov A.A. Cyber-Physical Approach to Building a Flight Experiment Control System // Data Science and Algorithms in Systems / In: Silhavy R., Silhavy P., Prokopova Z. (eds), Springer, Cham, 2022. P. 495-507.

9. Осипов Д.Л. Технологии проектирования баз данных. М.: ДМК Пресс, 2019. 498 с.

10. Солдатов А.С., Осипов А.А., Щербаков И.В. Облик информационно-измерительной системы сбора и обработки результатов летного эксперимента // Математические методы в технологиях и технике. 2022. № 8. С. 35-38.

11. Бородин Г.Д. Краткий обзор и классификация искусственных нейронных сетей // Известия Тульского государственного университета. Технические науки. 2021. № 11. С. 45-53.

12. Каракаев А.Б., Трапезникова Д.А. Обзор актуальных исследований в области применения искусственных нейронных сетей в электротехнике // Научные труды КубГТУ. 2023. № 2. С. 113-125.

13. Строева Е.Н., Тонких А.А. Методы формальной верификации искусственных нейронных сетей: обзор существующих подходов // International Journal of Open Information Technologies. 2022. Т. 10. № 10. С. 21-29.

14. Аверкин А.Н., Ярушев С.А. Обзор исследований в области разработки методов извлечения правил из искусственных нейронных сетей // Известия Российской академии наук. Теория и системы управления. 2021. Т. 6. № 6. С. 106-121.

15. Буркутпаева А.Р., Бакасов Б.Т. Использование технологий Big Date в сфере гражданской авиации // Вестник академии гражданской авиации. 2021. № 1 (20). С. 141-144.

16. Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A. N., Kaiser L.U., Polosukhin I. Attention is all you need // Advances in neural information processing systems. 2017. Vol. 30. P. 1-15.

17. Солдатов А.С., Осипов А.А. Функциональная модель автоматизированной системы подготовки полетных заданий на испытательные полеты // Известия Тульского государственного университета. Технические науки. 2023. № 5. С. 41-47.

18. Гусенков А.М., Ситтикова А.Р. Применение машинного обучения к задаче генерации поисковых запросов // Электронные библиотеки. 2021. Т. 24. № 2. С. 272-293.

19. Свидетельство о государственной регистрации базы данных № 2023621859 Российская Федерация. База данных информационного обеспечения процесса разработки полетных заданий на испытательные полеты / Солдатов А.С., Осипов А.А. № 2023621324: заявл. 08.05.2023: опубл. 07.06.2023.

REFERENCES

1. Soldatov A.S. Koncepciya sozdaniya perspektivnoj informacionno-izmeritel'noj sistemy dlya letnyh ispytanij aviacionnoj tehniki s primeneniem tehnologij industrii 4.0 // Vozdushno-kosmicheskie sily. Teoriya i praktika. 2021. № 20. pp. 167-177. fElektronnyj resurs]. Rezhim dostupa: http://www.vva.mil.ru/Izdaniay/VKS-teoriya-i-praktika (data obrascheniya 25.02.2024).

2. Scherbakov I.V. Kiberfizicheskij podhod k postroeniyu virtual'nogo imitacionno-modeliruyuschego ispytatel'nogo kompleksa // Vozdushno-kosmicheskie sily. Teoriya i praktika. 2023. № 26. pp. 39-48. fElektronnyj resurs]. Rezhim dostupa: http://www.vva.mil.ru/Izdaniay/VKS-teoriya-i-praktika (data obrascheniya 25.02.2024).

3. Bagdasaryan R.H., Matveeva A.S., Loseva E.S. Ispol'zovanie iskusstvennogo intellekta v dokumentooborote // Nauka. Tehnika. Tehnologii (politehnicheskij vestnik). 2023. № 2. pp. 26-29.

4. Osipov A.A. Analiz faktorov, vliyayuschih na bezopasnost' poletov, pri razrabotke poletnyh zadanij na ispytatel'nye polety // Problemy bezopasnosti poletov. 2023. № 9. pp. 3-11.

5. Averkin A.N. Ob'yasnimyj iskusstvennyj intellekt kak chast' iskusstvennogo intellekta tret'ego pokoleniya // Rechevye tehnologii. 2023. № 1. pp. 4-10.

6. Tobin D.S., Golosovskij M.S., Bogomolov A.V., Balandov M.E. Osobennosti organizacii ispytanij programmnogo obespecheniya kiberfizicheskih sistem s ispol'zovaniem tehnologij Interneta veschej // Matematicheskie metody v tehnologiyah i tehnike. 2022. № 9. pp. 110-114.

7. Scherbakov I.V. Analiz vozmozhnostej avtomatizirovannogo testirovaniya programmnogo obespecheniya s primeneniem tehnologij Industrii 4.0 // Izvestiya Tul'skogo gosudarstvennogo universiteta. Tehnicheskie nauki. 2023. № 7. pp. 611-616.

8. Soldatov A.S., Sherbakov I.V., Osipov A.A. Cyber-Physical Approach to Building a Flight Experiment Control System // Data Science and Algorithms in Systems / In: Silhavy R., Silhavy P., Prokopova Z. (eds), Springer, Cham, 2022. pp. 495-507.

9. Osipov D.L. Tehnologii proektirovaniya baz dannyh. M.: DMK Press, 2019. 498 p.

10. Soldatov A.S., Osipov A.A., Scherbakov I.V. Oblik informacionno-izmeritel'noj sistemy sbora i obrabotki rezul'tatov letnogo 'eksperimenta // Matematicheskie metody v tehnologiyah i tehnike. 2022. № 8. pp. 35-38.

11. Borodin G.D. Kratkij obzor i klassifikaciya iskusstvennyh nejronnyh setej // Izvestiya Tul'skogo gosudarstvennogo universiteta. Tehnicheskie nauki. 2021. № 11. pp. 45-53.

12. Karakaev A.B., Trapeznikova D.A. Obzor aktual'nyh issledovanij v oblasti primeneniya iskusstvennyh nejronnyh setej v 'elektrotehnike // Nauchnye trudy KubGTU. 2023. № 2. pp. 113-125.

13. Stroeva E.N., Tonkih A.A. Metody formal'noj verifikacii iskusstvennyh nejronnyh setej: obzor suschestvuyuschih podhodov // International Journal of Open Information Technologies. 2022. T. 10. № 10. pp. 21-29.

14. Averkin A.N., Yarushev S.A. Obzor issledovanij v oblasti razrabotki metodov izvlecheniya pravil iz iskusstvennyh nejronnyh setej // Izvestiya Rossijskoj akademii nauk. Teoriya i sistemy upravleniya. 2021. T. 6. № 6. pp. 106-121.

15. Burkutpaeva A.R., Bakasov B.T. Ispol'zovanie tehnologij Big Date v sfere grazhdanskoj aviacii // Vestnik akademii grazhdanskoj aviacii. 2021. № 1 (20). pp. 141-144.

16. Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A. N., Kaiser L.U., Polosukhin I. Attention is all you need // Advances in neural information processing systems. 2017. Vol. 30. pp. 1-15.

17. Soldatov A.S., Osipov A.A. Funkcional'naya model' avtomatizirovannoj sistemy podgotovki poletnyh zadanij na ispytatel'nye polety // Izvestiya Tul'skogo gosudarstvennogo universiteta. Tehnicheskie nauki. 2023. № 5. pp. 41-47.

18. Gusenkov A.M., Sittikova A.R. Primenenie mashinnogo obucheniya k zadache generacii poiskovyh zaprosov // 'Elektronnye biblioteki. 2021. T. 24. № 2. pp. 272-293.

19. Svidetel'stvo o gosudarstvennoj registracii bazy dannyh № 2023621859 Rossijskaya Federaciya. Baza dannyh informacionnogo obespecheniya processa razrabotki poletnyh zadanij na ispytatel'nye polety / Soldatov A.S., Osipov A.A. № 2023621324: zayavl. 08.05.2023: opubl. 07.06.2023.

© О^пов А.А., 2024

Осипов Александр Андреевич, инженер-испытатель, Государственный летно-испытательный центр имени В.П. Чкалова (г. Щелково), Россия, 141103, Московская область, городской округ Щелково, территория аэродрома Чкаловский, стр.6, AlAndr2263@gmail.com.

UDK 629.7.018

GRNTI 55.47.81

METHODS AND ALGORITHMS FOR SEMANTIC ANALYSIS OF TEXTUAL

INFORMATION DURING THE PREPARATION OF FLIGHT TEST MISSIONS

A.A. OSIPOV

V.P. Chkalov State Flight Test Center (Shchelkovo)

The article presents the main technological concepts of the fourth industrial revolution. The aspects of neural networks development are considered and the relevance of their application in solving problems of natural language processing and automation of work with text documents is substantiated. The process of semantic analysis of text is described and the possibility of its application in the creation of information systems of text data processing is substantiated. The main problems of the existing principles of conducting flight tests of modern aviation complexes are defined and the conclusion about the necessity of their automation and intellectualization is made. The process of development of flight tasks for test flights is described and the method of its modernization is proposed. The necessity of creating an intelligent information system for preparing flight tasks for test flights is substantiated and the method of its construction is proposed. The possibility of using digital neural networks built on the principles of Transformer computational models in the architecture of the intellectual information system is considered. The description of algorithms of Transformer computational models realizing semantic analysis of text information is given. The architecture of building an intelligent information system of flight task preparation for test flights using the principles of network technologies is proposed. Conclusions are drawn about the relevance and technical feasibility of the proposed intelligent information system of flight task preparation for test flights.

Keywords: information system, flight task, intellectualization, semantic analysis, flight tests.

i Надоели баннеры? Вы всегда можете отключить рекламу.