Научная статья на тему 'ВЫБОР ОПТИМАЛЬНОЙ КОНФИГУРАЦИИ БОРТОВОГО КОМПЛЕКСА КОСМИЧЕСКОГО АППАРАТА ДЛЯ ВОССТАНОВЛЕНИЯ ЕГО РАБОТОСПОСОБНОСТИ'

ВЫБОР ОПТИМАЛЬНОЙ КОНФИГУРАЦИИ БОРТОВОГО КОМПЛЕКСА КОСМИЧЕСКОГО АППАРАТА ДЛЯ ВОССТАНОВЛЕНИЯ ЕГО РАБОТОСПОСОБНОСТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
44
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТРУКТУРНО-ФУНКЦИОНАЛЬНАЯ РЕКОНФИГУРАЦИЯ / МАРКОВСКИЙ ПРОЦЕСС ПРИНЯТИЯ РЕШЕНИЙ / ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / ВЕРОЯТНОСТНЫЙ ПОЛИНОМ / ЖИВУЧЕСТЬ / КОСМИЧЕСКИЕ АППАРАТЫ / БОРТОВАЯ АППАРАТУРА / СИСТЕМА УПРАВЛЕНИЯ ДВИЖЕНИЕМ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кулаков А. Ю.

Рассмотрены подходы к формулировке и решению задачи выбора конфигурации бортового комплекса космического аппарата (КА), обеспечивающего проведение автономной реконфигурации КА. Выделено два направления решения таких задач: на основе формализации марковского процесса принятия решений (Markov decision process, MDP) и с использованием динамического программирования и машинного обучения, и на основе учета структурно-функциональных зависимостей элементов бортового комплекса управления КА (бортовой аппаратуры) с применением общего логико-вероятностного подхода (включая машинное представление схемы функциональной целостности) и теории структурной динамики сложных систем. Подход на основе MDP представлен зарубежными авторами, которые рассматривают реконфигурацию в контексте планирования сеансов целевой аппаратуры КА. Подход на основе структурно-функциональных зависимостей формулируется, прежде всего, как синтез нового структурного состояния КА после возникновения отказа. При этом как отечественные, так и зарубежные авторы, независимо друг от друга приходят к специфической постановке задачи выбора конфигурации бортового комплекса, предполагая при этом, что выбор необходимой рациональной конфигурации осуществляется в заданных режимами функционирования КА условиях.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кулаков А. Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CHOOSING THE OPTIMAL CONFIGURATION OF THE ONBOARD COMPLEX OF THE SPACECRAFT TO RESTORE ITS OPERABILITY

Approaches to formulation and solution of the problem of choosing the configuration of spacecraft onboard equipment, which ensures autonomous reconfiguration of the spacecraft, are considered. Two directions for solving such problems are singled out: based on the formalization of the Markov decision process (MDP) and using dynamic programming and machine learning, and on the basis of account for structural and functional dependencies of the spacecraft onboard control complex (onboard equipment) elements with application of general logical-probabilistic approach (including machine representation of functional integrity scheme) and the theory of structural dynamics of complex systems. The MDP-based approach is presented by foreign authors who consider reconfiguration in the context of scheduling sessions of the target spacecraft equipment. The approach based on structural-functional dependencies is formulated, first of all, as a synthesis of a new structural state of the spacecraft after a failure occurs. At the same time, both domestic and foreign authors, independently of each other, come to a specific formulation of the problem of choosing the configuration of onboard equipment, while assuming that the choice of the necessary rational configuration is carried out under specified conditions, defined as the required modes of functioning of the spacecraft and the limitations associated with them.

Текст научной работы на тему «ВЫБОР ОПТИМАЛЬНОЙ КОНФИГУРАЦИИ БОРТОВОГО КОМПЛЕКСА КОСМИЧЕСКОГО АППАРАТА ДЛЯ ВОССТАНОВЛЕНИЯ ЕГО РАБОТОСПОСОБНОСТИ»

УДК 519.8

DOI: 10.17586/0021-3454-2023-66-2-100-111

ВЫБОР ОПТИМАЛЬНОЙ КОНФИГУРАЦИИ БОРТОВОГО КОМПЛЕКСА КОСМИЧЕСКОГО АППАРАТА ДЛЯ ВОССТАНОВЛЕНИЯ ЕГО РАБОТОСПОСОБНОСТИ

А. Ю. Кулаков

Санкт-Петербургский федеральный исследовательский центр Российской академии наук

Санкт-Петербург, Россия russ69@bk.ru

Аннотация. Рассмотрены подходы к формулировке и решению задачи выбора конфигурации бортового комплекса космического аппарата (КА), обеспечивающего проведение автономной реконфигурации КА. Выделено два направления решения таких задач: на основе формализации марковского процесса принятия решений (Markov decision process, MDP) и с использованием динамического программирования и машинного обучения, и на основе учета структурно-функциональных зависимостей элементов бортового комплекса управления КА (бортовой аппаратуры) с применением общего логико-вероятностного подхода (включая машинное представление схемы функциональной целостности) и теории структурной динамики сложных систем. Подход на основе MDP представлен зарубежными авторами, которые рассматривают реконфигурацию в контексте планирования сеансов целевой аппаратуры КА. Подход на основе структурно-функциональных зависимостей формулируется, прежде всего, как синтез нового структурного состояния КА после возникновения отказа. При этом как отечественные, так и зарубежные авторы, независимо друг от друга приходят к специфической постановке задачи выбора конфигурации бортового комплекса, предполагая при этом, что выбор необходимой рациональной конфигурации осуществляется в заданных режимами функционирования КА условиях.

Ключевые слова: структурно-функциональная реконфигурация, марковский процесс принятия решений, искусственные нейронные сети, вероятностный полином, живучесть, космические аппараты, бортовая аппаратура, система управления движением

Благодарности: исследования, выполненные по данной тематике, проводились при частичной финансовой поддержке гранта РФФИ (№ 20-08-01046) в рамках бюджетной темы FFZF-2022-0004.

Ссылка для цитирования: Кулаков А. Ю. Выбор оптимальной конфигурации бортового комплекса космического аппарата для восстановления его работоспособности // Изв. вузов. Приборостроение. 2023. Т. 66, № 2. С. 100—111. DOI: 10.17586/0021-3454-2023-66-2-100-111.

CHOOSING THE OPTIMAL CONFIGURATION OF THE ONBOARD COMPLEX OF THE SPACECRAFT

TO RESTORE ITS OPERABILITY

А. Yu. Kulakov

St. Petersburg Federal Research Center of the RAS, St. Petersburg, Russia russ69@bk.ru

Abstract. Approaches to formulation and solution of the problem of choosing the configuration of spacecraft onboard equipment, which ensures autonomous reconfiguration of the spacecraft, are considered. Two directions for solving such problems are singled out: based on the formalization of the Markov decision process (MDP) and using dynamic programming and machine learning, and on the basis of account for structural and functional dependencies of the spacecraft onboard control complex (onboard equipment) elements with application of general logical-probabilistic approach (including machine representation of functional integrity scheme) and the theory of structural dynamics of complex systems. The MDP-based approach is presented by foreign authors who consider reconfiguration in the context of scheduling sessions of the target spacecraft equipment. The approach based on structural-functional dependencies is formulated, first of all, as a synthesis of a new structural state of the spacecraft after a failure occurs. At the same time, both domestic and foreign authors, independently of each other, come to a specific formulation of the problem of choosing the configuration of onboard equipment, while assuming that the choice of the necessary rational configuration is carried out under specified conditions, defined as the required modes of functioning of the spacecraft and the limitations associated with them.

Keywords: structural-functional reconfiguration, Markov decision process, artificial neural networks, probabilistic polynomial, survivability, spacecraft, onboard equipment, motion control system

© Кулаков А. Ю, 2023

Acknowledment: the studies performed on this topic were carried out with the partial financial support of the RFBR grant (No. 20-08-01046) within the framework of the budget topic FFZF-2022-0004.

For citation: Kulakov A. Yu. Choosing the optimal configuration of the onboard complex of the spacecraft to restore its operability. Journal of Instrument Engineering. 2023. Vol. 66, N 2. P. 100—111 (in Russian). DOI: 10.17586/0021-34542023-66-2-100-111.

Введение. Задача выбора конфигурации бортового комплекса (БК) для восстановления работоспособности космического аппарата (КА) является одной из наиболее актуальных, решаемых в ходе реализации технологий отказоустойчивого управления. Далее процесс восстановления работоспособности будем называть реконфигурацией БК КА. Под бортовым комплексом будем понимать как комплекс управления в целом, так и отдельные бортовые системы (или их совокупность), а под элементами БК — бортовую аппаратуру. Также следует отметить, что в зарубежной литературе термин „реконфигурация" имеет более широкое толкование, являясь синонимом обобщенного понятия FDIR (fault detection, isolation and recovery), которое переводится как „обнаружение неисправностей, локализация и восстановление" [1].

Важно разделить подходы и методы отказоустойчивого управления, основанные на непрерывных моделях и теории автоматического управления (пусть и с применением таких методов искусственного интеллекта, как нечеткая логика или машинное обучение), а также подходы и методы планирования реконфигурации, основанные на моделях и теории искусственного интеллекта, общем логико-вероятностном методе, теории структурной динамики сложных систем, методах и моделях динамического программирования и машинного обучения.

Методы отказоустойчивого управления, основанные на непрерывных моделях и теории автоматического управления, фокусируются на разработке отказоустойчивых регуляторов/контроллеров [2]. Разработка таких регуляторов/контроллеров связана либо с управлением КА, при формировании которого учитывается параметрическая неопределенность основных характеристик БК, либо с доработкой штатных регуляторов при возникновении неисправности.

Как правило, концептуальная постановка задачи планирования реконфигурации БК КА сводится к следующему. Дано: конечное множество всех возможных состояний КА и его БК, множества их начальных и конечных состояний, множество возможных управляющих воздействий (в зависимости от текущего состояния БК КА). Требуется найти последовательность управляющих воздействий, которая переводит БК КА из начального (начальных) в заданное состояние (состояния) [3]. Важной составной частью задачи планирования реконфигурации является выбор рабочей конфигурации БК.

Анализ текущего состояния выбора рабочей конфигурации БК. В ряде исследований зарубежные специалисты решают задачу выбора рабочей конфигурации БК в рамках предложенного ими формализма (модели) марковского процесса принятия решений (Markov decision process, MDP), применяя методы (адаптивного) динамического программирования и обучения с подкреплением [4].

В работе [5] выбор оптимальной конфигурации БК представлен как часть решения более общей задачи планирования работы научной аппаратуры КА на основе MDP. На содержательном уровне соответствующая модель описана в рамках следующих допущений: миссия КА предполагает решение множества задач; в результате решения каждой задачи соответствующая цель может быть достигнута либо не достигнута; каждое действие имеет два состояния (выполняется/не выполняется); бортовые системы (или БК) имеют встроенную диагностику неисправностей; в качестве показателей работоспособности элементов БК используются либо вероятности возникновения неисправностей, либо обобщенные значения показаний датчиков (на основе которых указанные вероятности могут быть рассчитаны); управляющие воздействия по реконфигурации реализуются мгновенно.

Технология использования MDP для решения задачи планирования работы научной аппаратуры определяется с учетом: состояния выполнения задач миссии и действий, информации, генерируемой системой диагностики, вероятности правильности определения неисправности БК, текущей конфигурации БК и закона управления элементов БК (исполнительных органов). Действия могут включать в себя либо выбор конкретной конфигурации БК и соответствующего закона управления (ЗУ), либо отсутствие каких-то действий.

В работе [5] описано решение задачи планирования реконфигурации на примере КА FUSE, в состав БК которого входят: четыре двигателя-маховика (ДМ), две сборки трехосевых измерительных гироскопов, трех электромагнитов и трехосевых магнитометров (магнитная система), однокоординатных и двухкоординатных датчиков Солнца и полезной нагрузки. В задаче рассматривается только реконфигурация ДМ (при совместной работе с магнитной системой) и гироскопов. При этом из-за большой размерности MDP задача разбивается на две: одна — для ДМ и их ЗУ, другая — для гироскопов. Далее приводится описание состояния MDP для реконфигурации ДМ. Также используется упрощение, что ЗУ однозначно определяют конфигурацию ДМ (четыре закона управления с тремя ДМ, шесть ЗУ с двумя ДМ и четыре ЗУ с одним ДМ, при управлении на одном ДМ также задействуется магнитная система).

Функция вознаграждения определяется для подсистемы ДМ следующим образом. Учитываются штрафы за использование менее эффективного ЗУ для каждой из целей миссии (менее эффективным считается ЗУ, использующий меньшее количество ДМ) и приоритет целей. Также устанавливаются штрафы за использование ДМ с признаком неисправности и неиспользование ДМ с признаком исправности. Подробности описания функции вознаграждения приведены в [5]. В рамках этого примера авторы упростили формулировку решения задачи планирования реконфигурации: чтобы найти оптимальную технологию реконфигурации БК КА, необходимо выбирать действие (управляющее воздействие), приносящее максимальный выигрыш с точки зрения показателя качества управления КА, а также исходя из текущего состояния БК КА при переводе его в следующее требуемое (возможное) состояние.

Другие зарубежные авторы [6] рассматривают задачу выбора конфигурации БК КА на основе планирования работы исполнительных органов системы управления движением КА с комбинированным использованием адаптивного динамического программирования (adaptive dynamic programming) и искусственных нейронных сетей (artificial neural networks). Содержательную постановку такой задачи авторы описывают следующим образом. Дана система управления движением, которая обеспечивает перевод КА в требуемую ориентацию до окончания сеанса целевой аппаратуры (СЦА), интервалы СЦА не перекрываются, каждый сеанс имеет требования по точности ориентации и стабилизации, условия выполнения сеансов не связаны между собой, для каждого сеанса заданы приоритет и ограничение на энергопотребление исполнительных органов в СЦА.

Технология использования MDP для планирования работы исполнительных органов КА определяется с учетом: текущего углового положения КА, текущей конфигурации БК, реализуемого СЦА, информации о сбое/отказе элемента БК. Действия включают: переключение конфигурации БК, переориентацию КА, реализацию СЦА, „холостой ход" (действия не выполняются) и переход в безопасный режим.

С учетом вышеизложенного задача планирования в [6] была представлена в следующем виде. Дано: множество запланированных СЦА и доступных конфигураций БК КА. Необходимо принять решения, следует ли реконфигурировать БК КА, как их реконфигурировать и как оптимизировать показатели производительности КА после сбоя/отказа БК. Таким образом, необходимо найти: 1) подмножество СЦА для их последующей реализации; 2) оптимальную технологию реконфигурации, на основе которой может быть найдена последовательность действий, обеспечивающих перенастройку управления КА для успешного завершения сеансов, а также максимизацию показателя общей производительности БК КА в ходе выполнения серии СЦА и минимизацию возможных затрат энергии на выполнение реконфигурации.

Для оценки действий по переориентации КА были получены аналитические зависимости по времени переориентации, энергетическим затратам и приращению кинетического момента. Входными данными для решения задачи оценивания этих параметров являются: моменты инерции КА, управляющий момент ДМ, скорость переориентации, начальное и заданное угловые положения, матрица установки ДМ, максимальный кинетический момент ДМ.

Для планирования реконфигурации исполнительных органов в [6] применяется О-обучение. Традиционно конструкции, использующиеся в адаптивном динамическом программировании, базируются на нейронной сети действий и сети „критиков" (учителей). Подход, предложенный в [7], содержит две сети „критиков", сеть СЦА и сеть, описывающую энергетические затраты. При реализации такого подхода (рис. 1) используются две сети СЦА и две сети энергозатрат, модуль кодирования состояния-действия, алгоритм выбора оптимального действия и переход состояния.

Рис. 1

Сеть СЦА используется для оценки показателя )г (^,ак ), а результат ее работы — для оценки показателя Qt (,ак). Сеть энергозатрат используется для оценки показателя

Qe (^,ак ), результат ее работы — для оценки показателя ))е (sk,ак ) . Поскольку состояния sk

и действия ак содержат как непрерывные, так и дискретные переменные, авторы используют модуль кодирования состояния-действия с целью их перевода в двоичную форму, служащую входными данными для двух перечисленных сетей. Модуль принятия решения о

реконфигурации используется для получения оценки оптимального действия а* при

заданном состоянии Sк. С помощью модуля принятия решения о реконфигурации оценивается оптимальное действие для перехода из текущего состояния БК КА в возможное либо требуемое. Для итеративного обучения нейронных сетей принят двухкритериальный алгоритм, значения его выходных переменных при заданной паре „действие—состояние" должны итерационно сходиться и обеспечивать максимизацию показателя качества управления СЦА, а также минимизацию общих энергетических затрат на управление элементами БК КА.

Отечественные исследователи предлагают иной подход. Так, в работе [8] решение соответствующей задачи не связано напрямую с управлением реконфигурацией на борту КА, а ориентировано на обоснование выбора состава БК на этапе проектирования с точки зрения требований, предъявляемых к значениям показателей живучести малых КА. В работе [9] авторы предложили использовать методику, применяемую при проектировании КА для выбора конфигурации на этапе летной эксплуатации.

Показатель живучести определяется как отношение эффективности БК КА после возникновения последовательности отказов на протяжении времени Тас к эффективности в начальный момент времени. Эффективность функционирования КА определяется с учетом вероятности нахождения КА и элементов его БК в возможных состояниях и показателя эффективности выполнения конкретной целевой задачи в этих состояниях. Состояния КА определяются через состояния элементов БК (работоспособен/неработоспособен). Для решения каждой задачи (функции) задействуется определенная конфигурация БК, которая имеет свой показатель эффективности выполнения задачи (функции).

В качестве исходных данных для каждого элемента БК КА задается перечень функций, при выполнении которых она может быть использована, а также рассчитывается коэффициент эффективности ее применения, который нормируется в интервале от 0 до 1.

В работах [8, 9] рассматриваются следующие варианты задания исходных данных для БК малых КА: (1) аддитивный вариант — функция БК КА выполняется хотя бы одним из ее элементов, коэффициенты эффективности суммируются („горячий" резерв); (2) замещающий вариант — одним из работоспособных элементов, имеющих наибольший коэффициент эффективности („холодный" резерв); (3) совместный вариант — функция выполняется всеми элементами одновременно, коэффициенты эффективности перемножаются.

Для этапа проектирования предложен следующий алгоритм выбора конфигурации БК КА, основанный на оптимизации показателя ее живучести. Для выполнения любой функции определяется способ реализации КА в зависимости от множества элементарных функций, которые выполняет вся БК. При проектировании состава БК малого КА может быть целенаправленно синтезирована функциональная избыточность, при которой какой-либо задаче (функции) аппарата сопоставляется более одного способа ее решения (реализации).

Наличие нескольких способов решения задачи позволяет в случае нештатной ситуации производить эмуляцию отсутствующих элементарных функций (которые выполнял отказавший элемент), таким образом, используется уже новая конфигурация БК. Принимая во внимание возможную неоднозначность выбора эквивалентного функционального соответствия конфигурации БК (или байпаса — в терминологии подхода, рассмотренного в [10]), необходимо решить задачу оптимального выбора конфигураций БК, определив перечень эквивалентных конфигураций для каждого алгоритма. В этом случае первым критерием оптимизации является минимальное снижение показателя эффективности функционирования КА по отношению к его начальному значению. Если две конфигурации БК КА позволяют достичь одинаковой эффективности функционирования, необходимо выбрать конфигурацию с меньшим значением потребляемой электроэнергии. Таким образом, для каждого алгоритма перечень эквивалентных конфигураций будет ранжирован по заданным критериям.

Примеры реализации изложенного алгоритма представлены в работах [8] — выбор конфигурации БК КА при проектировании, [9] — обеспечение живучести на этапе эксплуатации КА. Следует отметить, что зарубежные авторы [5, 7] описывают задачи реконфигурации БК КА в формулировках МОР, применяя методы решения, распространенные в динамическом программировании и „машинном обучении". При этом либо вообще не акцентируется внимание на структурно-функциональных связях элементов БК, либо их учитывают в достаточно агрегированном виде. Более того, недостатком подхода, основанного на МОР, можно считать „проклятие размерности" даже для небольших систем, состоящих, например, только из гироскопов и двигателей-маховиков. Положительной стороной такого подхода является изначальная постановка не задачи о „ранце", а задачи планирования. Оригинальный подход на основе МОР, в рамках которого возможно объединить методы планирования реконфигурации с методами отказоустойчивого управления, описан в работе [7].

Отечественные авторы описывают задачу реконфигурации БК КА с помощью статической модели булева программирования, изначально уходя от строгого решения задачи планирования и ориентируясь на эвристические способы и методы [7]. С другой стороны,

авторы [7] основное внимание уделяют структурно-функциональным связям элементов БК КА, описываемым с помощью особых показателей эффективности функционирования КА, в которых учитывается логика взаимодействия этих элементов при выполнении задач КА. Однако недостатком такого подхода является необходимость составления сложных функций эффективности „вручную", что может значительно затруднить его применение на практике. Также можно утверждать, что задача математического программирования, о которой говорится в работе [9], не предполагает изменения режима функционирования КА, а ограничивается только поиском конфигурации БК в текущем режиме, выполняющей функцию, аналогичную потерянной („отказавшей").

Выбор оптимальной конфигурации восстановления работоспособности БК на основе вероятностного полинома. В качестве альтернативы рассмотренным ранее подходам к решению задачи выбора конфигурации БК КА с учетом многорежимности его функционирования предлагается использовать подход, базирующийся на вероятностном полиноме [11, 12] (далее будем называть такой подход к реконфигурации структурно-функциональным).

Ключевую роль в этой задаче будет играть вероятностный полином, который формируется с помощью общего логико-вероятностного метода [13] на основе схемы функциональной целостности, проектируемой экспертами (как правило, специалистами по бортовым системам КА) и описывающей функционирование КА, в том числе с учетом многорежимности. По сути, полином представляет базу знаний экспертов, описанную в виде многочленов большой размерности. Полином содержит знания обо всех работоспособных конфигурациях БК в заданных режимах и будет описываться следующим образом:

где Pj, Qj — вероятность наступления альтернативных событий, характеризующая работоспособность и отказ j-го элемента, а аг- — степень использования 1-го режима.

В работе [14] предложена методика структурно-функциональной реконфигурации, которая сводится к планированию смены режимов КА. Реконфигурация выполняется по принципу автоматического управления, получающего на вход рассогласование (отказ или сбой в БК), а на выходе формирующего управляющее воздействие (рабочую конфигурацию БК, соответствующую ее текущему режиму). Функционирование БК КА (смена его режимов) планируется исходя из логики ранжирования соответствующих режимов по правилу: приоритетный режим — текущий, далее группа альтернативных режимов, которая обеспечивает применение КА по целевому назначению, затем — любой режим, который является обеспечивающим при штатном функционировании КА, после этого — „аварийный" режим (используется минимально возможный состав БК, а КА находится в ориентированном положении для выполнения сеансов связи с наземным комплексом управления (НКУ) или для поддержания минимально необходимого энергобаланса).

* (,..., Р1,..., Рп, Ql,..., Qj,..., Qn, аь.

(1)

<

Восстановление

Восстановление

Штатные режимы

НКУ

танов

Отказ

Восстановление

Текущий режим

Отказ

УЧ

-I -

Режимы частичной работоспособности

Я

Аварийный режим

Рис. 2

Предложенная в [14] методика структурно-функциональной реконфигурации, которая связана с планированием смены режимов КА (рис. 2), состоит из следующих шагов.

Шаг 1. Анализ возможности выбора конфигурации БК в текущем режиме. Если имеется возможность, то переход на шаг 5, иначе — переход на шаг 2.

Шаг 2. Анализ возможности выбора конфигурации БК в альтернативном или обеспечивающем режиме. Если возможно, переход на шаг 6, иначе — на шаг 3.

Шаг 3. Анализ возможности выбора конфигурации БК в „аварийном" режиме без наземного комплекса управления (попадание в ситуацию, когда КА не способен выполнять задачи по предназначению). Если возможно, переход на шаг 7, иначе — шаг 4.

Шаг 4. Переход в режим неориентированного полета. Вызов наземного комплекса управления. Выход из алгоритма.

Шаг 5. Решение задачи выбора конфигурации БК КА в текущем режиме, включение БК в контур управления или его исключение. Выход из алгоритма.

Шаг 6. Выбор конфигурации БК КА в альтернативном режиме, включение элемента БК в контур управления или ее исключение. Выход из алгоритма.

Шаг 7. Выбор конфигурации БК КА в „аварийном" режиме, включение элемента БК в контур управления или его исключение. Выход из алгоритма.

Проверка возможности выбора конфигурации БК в заданном режиме (шаги 1, 2, 3 методики структурно-функциональной реконфигурации) осуществляется на основе расчета показателя живучести для этого режима с использованием вероятностного полинома. Указанная проверка состоит в анализе выполнимости следующего условия:

R(s+)> 0, (2)

где s+ = ju, а/] — вектор состояния КА, при котором в рабочую конфигурацию БК u включены все работоспособные элементы и вектор ar = {0,...1r, ...0] соответствует заданному режиму (или группе режимов ar =j0,...1r1,...1rjV,...,0], 1, ..., N — группа альтернативных или

обеспечивающих режимов). Если это условие удовлетворяется, можно переходить к решению задачи выбора конфигурации БК КА в требуемом режиме.

В общем случае эта задача может быть представлена виде:

Gi (u) ^ extr, (3)

Rj (s')> 0, (4)

s' = {u,ar}e 0', (5)

©' = {s|R (s')> 0}, (6)

где Gi (u) — критериальные функции, характеризующие эффективность выбранной конфигурации БК u; Rj (s') — функции, описывающие ограничения на выбор конфигурации u с учетом требуемого режима ar; i, j e O — множество функций, характеризующих принципы функционирования КА; s ' — вектор состояния КА, описываемый конфигурацией БК u и вектором режимов функционирования КА a r; 0' — множество работоспособных конфигураций для установленного в векторе ar режима; R — полином, соответствующий выбранному варианту функционирования КА.

Для упрощения дальнейших записей рассмотрим описание и решение задачи выбора конфигурации БК КА (см. шаги 5, 6, 7 методики структурно-функциональной реконфигурации) для случая, когда используются один показатель качества управления и два ограничения:

G1 (u ) ^ max, (7)

Я (в')>0, (8)

Я2 (в')> 0, (9)

где и = (м1з..., ип ) — вектор, характеризующий рабочую конфигурацию БК КА, если и/ = 0 — в рабочей конфигурации не задействуется 1-й элемент, если и/ = 1 — в противоположном случае; (в ') = Я1 (и) = Я (в ') = Я (р • _ь Рп • 01 • U1, П • Un,01, ^ "-,0т ) — оЦенка живучести КА для /-го (требуемого) режима с учетом рабочей конфигурации и, т — число режимов КА; Я2 (в') = Е+ -Е(и), Е(и) — расход электроэнергии рабочей конфигурацией

БК и, Е+ — накапливаемая электроэнергия в /-м режиме за определенный промежуток вре-

п / п

мени (например, виток, сутки и т.п.); 01 (и) = ^и- • е^ ^и- — целевая функция, характери-

/=1 / /=1

зующая расход временного ресурса БК, который необходимо перераспределить при решении

Тр -т-

задачи выбора, где с/ = —-- — коэффициент использования /-й БК в течение эксплуата-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Т/

ции КА, Т-р — временной ресурс элемента, т- — наработка элемента. Отметим, что значение критериальной функции (показателя ресурсоемкости) О1 (и) становится тем выше, чем

большее количество БК с неизрасходованным временным ресурсом включается в рабочую конфигурацию.

Для решения задачи с учетом описанных ограничений и показателя ресурсоемкости БК КА предлагается использовать методы [15], базирующиеся на бионическом подходе и теории случайного поиска, а именно алгоритм случайного направленного поиска и „жадный" алгоритм. Сущность применения этих алгоритмов состоит в организации повторяющейся генерации и поиске допустимых альтернатив (конфигураций) в ходе многочисленных машинных экспериментов. По результатам каждого эксперимента формируется рабочая (допустимая) конфигурация БК из числа сгенерированных альтернатив. По окончании работы алгоритма выбирается оптимальная конфигурация.

Кратко остановимся на особенностях реализации предлагаемых алгоритмов. Так, показатель живучести КА для выбираемой конфигурации БК в /-м режиме оценивается по следующей формуле:

Я К ) =

/ _ _ _ . (10) = я (pul,..., Ри. Рпип, QLU1,•••, Пи.Опип ,0n+1,•••, ап+/ ,.,0п+т) Р п 05 . 1 05

Если Яц (и£ ) = 0, то конфигурация считается неработоспособной. Тогда требуется выбрать и ввести в конфигурацию работоспособный элемент. Новая конфигурация будет характеризоваться вектором и ¿+1 = и £ Ф е., где е. =( 01,.,1. ,...,0п ) — вектор, соответствующий

включению некоторого исправного .-го элемента в рабочую конфигурацию, Ф — оператор булева сложения. Если после ввода .-го элемента состояние БК КА остается неработоспособным (( (и£+1) = 0), то процесс формирования рабочей конфигурации БК следует продолжить. В противоположном случае (Яц (и^+1) > 0) процесс завершается.

Примем за начальную такую конфигурацию, когда ни один элемент БК не включен (т.е. и0 =(01,02,...,0п), Яц (и0) = 0). Тогда сценарий включения элементов в рабочую конфигу-

e1=1 j =1

рацию БК можно представить последовательностью u0 ^ ... uk_1 ^ uk . При формировании указанной последовательности главная задача состоит в выборе очередного элемента из числа работоспособных.

Для текущей конфигурации каждый работоспособный и не включенный в конфигурацию u^ j-й элемент характеризуется структурной значимостью, вычисляемой по следующей формуле [16]:

% j (uk ) = Rj +_ R f, (11)

где Rj+ = Rj(рц,...,PjUj,...,Pnun,Qm,...,QjUj,...

, QnUn ,0n+1,., an+i0n+m , где Pi = 0,5,

Qi = 0,5, i = 1,.,j_ 1,j +1,.,n,Pj = 1, Qj = 0, an+i = 0,5,

R j = R j (P1U1,., Pjuj PnUn, Q1U1,•••, QjujQnUn, 0n+1, ^ ^, an +i,0n+m ) ,

где P = 0,5, Qi = 0,5, i = 1,...j _ 1, j +1,., n, Pj = 0, Qj = 1, a n+,- = 0,5. Другими словами, % j

отражает суммарный вклад данного элемента в живучесть КА.

В зависимости от правила выбора элемента конфигурации предлагается решать задачу математического программирования либо „жадным" алгоритмом, на каждом шаге выбирая элемент с максимальной структурной значимостью, либо алгоритмом случайного направленного поиска, где выбор осуществляется случайно, но более вероятно для элемента (прибора) с большей значимостью (алгоритм softmax) [4]. Для равнозначных элементов предлагается использовать комбинированный алгоритм.

„Жадный" алгоритм. На каждой k-й итерации выбор включаемого элемента осуществляется по следующему правилу:

Jj = max (uk )|uf = 0, f e ф} , (12)

где Ф — множество неработоспособных элементов, то есть выбирается элемент с максимальной значимостью из числа работоспособных.

Алгоритм случайного направленного поиска. При построении рабочей конфигурации каждый элемент выбирается следующим образом. Для вектора uk формируется вектор

величин значимости работоспособного БК {%1,..., % j,..., %i} = {% j (uk )ufk = 0, f e ф}, причем

% j e [0,1]. Для поиска интервал [0,1] разбивается на подынтервалы так, что координаты концов подынтервалов образуют последовательность

% ■ i

0,©1 = bl,©2 =©1 + ¿2,•••,©l = ©l_1 + b, где bj =-j, Л = V% j.

Л

j=1

Здесь, чем меньше значимость элемента % j в структурном построении, тем меньшая длина подынтервала [ш j _1, ш j ] отводится элементу работоспособного БК.

Для выбора включаемого элемента генерируется случайное число С, распределенное по равномерному закону на интервале [0, 1], которое попадает в некоторый подынтервал [ш j '_1, ш j'] и тем самым определяет выбор „восстанавливаемого" элемента. Таким образом, в

соответствии с построенной вероятностной гипотезой организуется поиск глобального экстремума, причем в окрестности глобального экстремума плотность случайно выбираемых

e1=1 ejk =1

сценариев „восстановления" u0 ^ ... uk_1 ^ uk будет наибольшей.

Комбинированный алгоритм. Чтобы сформировать множество альтернатив, по аналогии с алгоритмом случайного направленного поиска для „жадного" алгоритма, необходимо провести серию испытаний, где при каждом последующем испытании возможно построение новой рабочей конфигурации БК. Так как в контур управления КА входят элементы, имеющие одинаковую значимость (т.е. эквивалентные с точки зрения структурного построения), то при последовательном включении элементов в рабочую конфигурацию u возникает неоднозначность в выборе элемента с максимальной значимостью (структура может иметь несколько таких элементов). В результате выбор элемента целесообразно осуществлять случайным образом. Тем самым, предлагается комбинировать „жадный" и случайный выбор.

Реализация алгоритмов поиска работоспособных конфигураций БК осуществляется N раз. По завершении N экспериментов формируется множество альтернатив 0', из которых выбираются варианты, удовлетворяющие ограничению на энергопотребление R2 (s') > 0 . Из оставшихся конфигураций выбираются оптимальные, удовлетворяющие следующему критерию Gj (u) ^ max . В случае неоднозначности получаемых результатов можно также применить случайный выбор.

Заключение. В статье кратко рассмотрены варианты решения задачи выбора работоспособной конфигурации БК КА в контексте более общей задачи реконфигурации КА или даже планирования его работы [5, 7—9].

Основные недостатки существующих вариантов конфигурации (и реконфигурации БК КА), предложенных зарубежными и отечественными авторами, состоят либо в отсутствии учета структурно-функциональных взаимосвязей элементов БК (представленных, например, в подходах, основанных на моделях MDP), либо в их слабой формализации (см. отечественных авторов [8, 9]), описывающей задачу выбора конфигурации БК (байпаса) в весьма ограниченной постановке (рассматривались только две целевые функции: энергопотребление и эффективность БК КА). Также к недостаткам подхода, предлагаемого отечественными авторами, можно отнести отсутствие учета многорежимности функционирования КА и, как следствие, недостаточное внимание вопросу смены режимов при проведении реконфигурации.

Безусловный интерес представляет дальнейший синтез подходов на основе моделей MDP с учетом многорежимности функционирования не только КА, но и элементов БК, а также структурно-функциональных взаимосвязей, возникающих при функционировании БК КА.

СПИСОК ЛИТЕРАТУРЫ

1. Meß J.-G., Dannemann F., and Greif F. Techniques of Artificial Intelligence for Space Applications — A Survey // Conference: European Workshop on On-Board Data Processing (OBDP2019). 2019. P. 1—14.

2. Yin Shen et al. A Review on Recent Development of Spacecraft Attitude Fault Tolerant Control System // IEEE Transactions on Industrial Electronics. 2016. Vol. 63, N 5. Р. 3311—3320.

3. Nasir A., Atkins E., Kolmanovsky I. Review of Tools and Methods for Fault Tolerance in Spacecraft Mission Planning // J. of Space Technology. 2018. Vol. 18, is. 1.

4. Саттон Р. С., Барто Э. Дж. Обучение с подкреплением: Введение / Пер. с англ. А. А. Слинкина. М.: ДМК Пресс, 2020. 552 с.

5. Nasir A., Atkins E., and Kolmanovsky I. A mission based fault reconfiguration framework for spacecraft applications // J. of Aerospace Computing, Information and Communication. 2012. Vol. 11, N 10. P. 1—12.

6. Chen J. W., Cheng Y. H., and Jiang B. Mission-constrained spacecraft attitude control system on-orbit reconfiguration algorithm // Journal of Astronautics. 2017. Vol. 38, N 9. P. 989—997.

7. Cheng Y., Jiang B., Li H., and Han X. On-orbit reconfiguration using adaptive dynamic programming for multimission-constrained spacecraft attitude control system // Intern. J. of Control, Automation and Systems. 2019. Vol. 17, N 4. P. 822—835.

8. Егоров А. М., Белоконов И. В. Выбор состава бортовых средств для обеспечения заданной живучести наноспутника // Ракетно-космическое приборостроение и информационные системы. 2018. Т. 5, № 3. С. 78— 86. DOI 10.30894/issn2409-0239.2018.5.3.78.86. EDN YQWXIT.

9. Белоконов И. В., Егоров А. М. Проблема живучести наноспутника и ее обеспечение за счет использования функциональной избыточности // Изв. Тульского гос. ун-та. Технические науки. 2019. № 8. С. 287—298. EDN CTNUST.

10. Калинин В. Н., Кулаков А. Ю., Павлов А. Н. и др. Методы и алгоритмы синтеза технологий и программ управления реконфигурацией бортовых систем маломассоразмерных космических аппаратов // Информатика и автоматизация. 2021. Т. 20, № 2. С. 236—269. DOI 10.15622/ia.2021.20.2.1. EDN BMHJYS.

11. Pavlov A. N., Pavlov D. A., Vorotyagin V. N., Umarov A. B. Structural and functional analysis of supply chain reliability in the presence of demand fluctuations // Models and Methods for Researching Information Systems in Transport 2020 (MMRIST 2020). 2020. N 1.

12. Кулаков А. Ю., Павлов А. Н., Павлов Д. А. Функциональная реконфигурация чувствительных элементов системы управления движением космического аппарата // Тр. СПИИРАН. 2013. № 5(28). С. 169—181. EDN QYZRZR.

13. Ryabinin I. A., Strukov A. V. Quantitative examples of safety assessment using logical-probabilistic methods // Intern. J. of Risk Assessment & Management. 2018. Vol. 21, N 1-2. P. 4—20. DOI 10.1504/IJRAM.2018.090253. EDN XXERLF.

14. Научно-технический отчет (промежуточный, 1 этап) по теме „Проектно-поисковые исследования в части управления целевым применением многоспутниковой ОГ КА ДЗЗ с помощью бортового интеллектуального вычислительного комплекса" (шифр „Нейроборт БИВК-ИИ-СПИИРАН"). СПб: фИц РАН, 2021. Кн. 2. 184 с.

15. Растригин Л. А. Адаптация сложных систем. Рига: Зинанте, 1981. 375 с.

16. Павлов А. Н., Павлов Д. А., Кулаков А. Ю., Умаров А. Б. Анализ значимости элементов цепи поставок при изменяющихся спросах клиентов // Тр. 6-й Междунар. науч.-практ. конф. „Имитационное и комплексное моделирование морской техники и морских транспортных систем" (ИКМ МТМТС-2021). СПб, 23 июня 2021 года. СПб: Изд-во „Перо", 2021. С. 104—112. EDN VHEJNV.

Сведения об авторе

Александр Юрьевич Кулаков — канд. техн. наук; Санкт-Петербургский федеральный исследователь-

ский центр Российской академии наук, лаборатория информационных технологий в системном анализе и моделировании; старший научный сотрудник; E-mail: russ69@bk.ru

Поступила в редакцию 30.08.22; одобрена после рецензирования 09.09.22; принята к публикации 27.12.22.

REFERENCES

1. Meß J.-G., Dannemann F., and Greif F. Conference: European Workshop on On-Board Data Processing (OBDP2019), 2019, pp. 1-14.

2. Yin Shen et al. IEEE Transactions on Industrial Electronics, 2016, no. 5(63), pp. 3311-3320.

3. Nasir A., Atkins E., Kolmanovsky I. Journal of Space Technology, 2018, no. 1(18).

4. Sutton R.S. and Barto A.G. Reinforcement Learning: An Introduction, The MIT Press Cambridge, MA, 2018.

5. Nasir A., Atkins E., and Kolmanovsky I. Journal of Aerospace Computing, Information and Communication, 2012, no. 10(11), pp. 1-12.

6. Chen J.W., Cheng Y.H., and Jiang B. Journal of Astronautics, 2017, no. 9(38), pp. 989-997.

7. Cheng Y., Jiang B., Li H., and Han X. International Journal of Control, Automation and Systems, 2019, no. 4(17), pp. 822-835.

8. Egorov A.M., Belokonov I.V. Rocket-Space Device Engineering and Information Systems, 2018, no. 3(5), pp. 78-86, DOI 10.30894/issn2409-0239.2018.5.3.78.86, EDN YQWXIT.

9. Belokonov I.V., Egorov A.M. Izvestiya Tula State University (Izvestiya TulGU), 2019, no. 8, pp. 287-298, EDN CTNUST.

10. Kalinin V., Kulakov A., Pavlov A., Potryasaev S., Sokolov B. Informatics and Automation, 2021, no. 2(20), pp. 236-269, DOI 10.15622/ia.2021.20.2.1, EDN BMHJYS.

11. Pavlov A.N., Pavlov D.A., Vorotyagin V.N., Umarov A.B. Models and Methods for Researching Information Systems in Transport 2020 (MMRIST 2020), 2020, no. 1.

12. Kulakov A.Yu., Pavlov A.N., Pavlov D.A. Trudy SPIIRAN (SPIIRAS Proceedings), 2013, no. 5(28), pp. 169-181, EDN QYZRZR.

13. Ryabinin I.A., Strukov A.V. International Journal of Risk Assessment & Management, 2018, no. 1-2(21), pp. 4-20, DOI 10.1504/IJRAM.2018.090253, EDN XXERLF.

14. Nauchno-tekhnicheskiy otchet (promezhutochnyy, 1 etap) po teme „"Proyektno-poiskovyye issledovaniya v chasti upravleniya tselevym primeneniyem mnogosputnikovoy OG KA DZZ s pomoshch'yu bortovogo intellektual'nogo vychislitel'nogo kompleksa" (shifr„Neyrobort BIVK-II-SPIIRAN") (Scientific and Technical Report (Intermediate, Stage 1) on the Topic "Design and Exploratory Research in Terms of Controlling the Targeted Use of the Multi-Satellite Remote Sensing Satellite with the Help of an Onboard Intelligent Computer Complex" (code "Neurobort BIVK-II-SPIIRAN"), St. Petersburg, 2021, Book 2, 184 p. (in Russ.)

15. Rastrigin L.A. Adaptatsiya slozhnykh sistem (Adaptation of Complex Systems), Riga, 1981, 375 p. (in Russ.)

16. Pavlov A.N., Pavlov D.A., Kulakov A.Yu., Umarov A.B. Imitatsionnoye i kompleksnoye modelirovaniye morskoy tekhniki i morskikh transportnykh sistem (IKM MTMTS-2021) (Simulation and Complex Modeling of Marine Equipment and Marine Transport Systems" (IKM MTMTS-2021)), Proceedings of the Sixth International Scientific and Practical Conference, St. Petersburg, June 23, 2021, pp. 104-112, EDN VHEJNV. (in Russ.)

Data on author

Alexander Yu. Kulakov — PhD; St. Petersburg Federal Research Center of the RAS, Laboratory of Information Technologies in System Analysis and Modeling; Senior Researcher; E-mail: russ69@bk.ru

Received 30.08.22; approved after reviewing 09.09.22; accepted for publication 27.12.22.

i Надоели баннеры? Вы всегда можете отключить рекламу.