Научная статья на тему 'Синтез живучих робототехнических систем управления'

Синтез живучих робототехнических систем управления Текст научной статьи по специальности «Математика»

CC BY
84
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АДАПТИВНАЯ СИСТЕМА УПРАВЛЕНИЯ / ЖИВУЧЕСТЬ / ТАКТОВЫЙ МОМЕНТ ВРЕМЕНИ / ПРОГНОЗИРУЮЩАЯ МОДЕЛЬ

Аннотация научной статьи по математике, автор научной работы — Прокопьев Игорь Витальевич

В данной статье рассматривается метод синтеза системы управления с переменной структурой, обеспечивающий повышение живучести системы управления в условиях существенного изменения внешней среды, а также самого объекта в результате неблагоприятного воздействия. Рассмотрена формальная постановка задачи синтеза живучей системы управления. Задан ансамбль критериев селекции выбора модели. Приведено правило реализации алгоритма выбора на основе различных опорных функций. Сделан вывод о том, что при предварительной обработке имеющейся априорной информации можно правильно выбирать опорные функции, которые отражают физические процессы более точно. Приведено математическое описание динамического объекта на основе дифференциального уравнения либо его решения. Дано определение функции тренда. Приведены критерии для селекции модели повреждения. Сделана рекомендация о модификации алгоритма трендов Демарка с помощью скользящего окна Язвинского и метода самоорганизации для повышения точности построения прогнозирующей модели повреждения. Предложено осуществлять выбор модели с помощью более сложного логического анализа наблюдаемого вектора в соответствующей ситуации. Дано определение задачи логико-функционального управления и сформулирован подход к ее решению. Приведен вывод о том, в чем заключается задача синтеза живучей системы управления.Change.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Also the object as a result of an adverse effect is considered. The formal problem definition of synthesis of hardy management system is considered. Model choice criteria ensemble is set. The rule of choice algorithm implementation on the basis of different reference functions is provided. The conclusion is drawn that in case of preliminary processing of the available prior data it is possible to select reference functions correctly which reflect physical processes more precisely. The mathematical description of a dynamic object on the basis of a differential equation, or its decision is provided. Definition of function of a trend is given. Criteria for selection of model of damage are given. The recommendation of modification of Demark trends algorithm by means of the sliding Yazvinsky's window and a method of self-organization for increase of accuracy of creation of a predictive model of damage is made. It is offered to realize a model choice by means of more complex logical analysis of an observed vector in the appropriate situation. Logic-functional control task definition is given and approach to its decision is formulated. The conclusion about what the task of synthesis management system consists of is given. This article describes the method of synthesis of control system with variable structure provides increasing survivability control system in a significant change of the external environment, as well as the object itself from the adverse impacts.

Текст научной работы на тему «Синтез живучих робототехнических систем управления»

Ovil Aviation High TECHNOLOGIES

Vol. 19, No. 05, 2016

УДК 62.50, 519.6

СИНТЕЗ ЖИВУЧИХ РОБОТОТЕХНИЧЕСКИХ СИСТЕМ УПРАВЛЕНИЯ

И.В. ПРОКОПЬЕВ1

В данной статье рассматривается метод синтеза системы управления с переменной структурой, обеспечивающий повышение живучести системы управления в условиях существенного изменения внешней среды, а также самого объекта в результате неблагоприятного воздействия. Рассмотрена формальная постановка задачи синтеза живучей системы управления. Задан ансамбль критериев селекции выбора модели. Приведено правило реализации алгоритма выбора на основе различных опорных функций. Сделан вывод о том, что при предварительной обработке имеющейся априорной информации можно правильно выбирать опорные функции, которые отражают физические процессы более точно. Приведено математическое описание динамического объекта на основе дифференциального уравнения либо его решения. Дано определение функции тренда. Приведены критерии для селекции модели повреждения. Сделана рекомендация о модификации алгоритма трендов Демарка с помощью скользящего окна Язвинского и метода самоорганизации для повышения точности построения прогнозирующей модели повреждения. Предложено осуществлять выбор модели с помощью более сложного логического анализа наблюдаемого вектора в соответствующей ситуации. Дано определение задачи логико-функционального управления и сформулирован подход к ее решению. Приведен вывод о том, в чем заключается задача синтеза живучей системы управления.

Ключевые слова: адаптивная система управления, живучесть, тактовый момент времени, прогнозирующая модель.

Основной характеристикой живучих систем управления является то, что система управления должна обеспечивать достижение целей управления с сохранением качества в условиях существенного изменения внешней среды, а также самого объекта в результате неблагоприятного воздействия [1].

Основным направлением в этой области является повышение интеллектуализации роботов и обеспечения возможности их самодиагностики для принятия решения с учетом поставленных целей и уровня повреждений.

Пусть объект управления описывается уравнением состояния вида

где х е Яп - вектор состояния; и е Ят - вектор управления; / е Яп, (ре Яп - векторная и матричная функции указанных аргументов соответственно; q - вектор параметров, изменяющийся в зависимости от режимов полета. Кроме того, вектор параметров может претерпевать непредсказуемые заранее изменения вследствие отказов и повреждений ЛА.

Практическую результативность в прикладных задачах управления имеют методы аналитического конструирования оптимальных регуляторов (АКОР). На их основе разработаны алгоритмы функционирования отказоустойчивых систем управления. Для нетерминальной (для ЛА - пилотажной), со скользящим интервалом оптимизации [I, I + Тп ] задачи управления объектом традиционный оптимизирующий критерий (функционал) имеет вид

1 Федеральный исследовательский центр «Информатика и управление» РАН, г. Москва, Россия

1

x = f (x, q, t) + ф(x, q, t)u ,

(1)

где

матрица весов управляемых координат вектора состояния;

Vol. 19, No. 05, 2016

Ovil Aviation High TECHNOLOGIES

Оптимальное управление, минимизирующее критерий (2), вычисляется по формуле

Td V

и • =-W—, (3)

d x

dV где — дх

dV dVпТ

, , - вектор-градиент функции Беллмана.

дх1' ' дхп

Краткий анализ свойств оптимального управления (2)-(3) показывает, что в силу случайного изменения параметров объекта при отказах и повреждениях программные настройки не обеспечат необходимое качество процессов управления.

Для модификации функционала, с целью придания ему адаптивных свойств, осуществляется синтез оптимального управления с учетом требований малой чувствительности. Он предполагает включение в функционал наряду с векторами состояния х и и вектор-функции

дх1 дх/Т

чувствительности xql,..., xqr ; где xql =

- вектор-функция чувствительности

дЧ1 дЧ1

вектора состояния по параметру ^ . При этом размерность пространства состояния увеличивается на число функций чувствительности, т. е. на пг.

В рассмотренных подходах можно отметить недостаток, связанный с эвристичностью задания критерия оптимальности, который не гарантирует глубоких оптимизационных свойств формируемых управлений с точки зрения поставленной задачи оптимального включения сохранившихся в системе ресурсов, выражающегося в минимальном расходе управляющих воздействий для сохранения заданного качества переходных процессов.

Для управления нестационарными объектами с широкими диапазонами изменения динамических свойств, при отсутствии априорной информации о законах изменения переменных коэффициентов (структуры) во времени, имеется обширный класс алгоритмов адаптивного управления.

Объект управления описывается уравнениями в операторной форме с одним входом:

В (р,г) у (I ) = Б (р,г )р( I); (4)

[Во (р) - ДВ(р, г)] у(0 = [Б (р) + АБ(р, г)] р(г); (5)

р(г) = и(г) - —^ [ Ш (р, г )р(г) + АК (р, г) у(г)]; (6)

Бо( р)

Во(р)Ум (г) = Бо(р)и(г); (7)

е( 0 = У(г) - Ум (г); (8)

pbn} ( t) = a(t)p]p(t), pbkj ( t) = g(t)p'y(t), j = 0, m , i = 0, n -1; (9)

a(t) = W(p)e(t). (10)

где p = d / dt, y (t ) - регулируемая координата (выход обобщенного настраиваемого объекта), p(t) - входная координата исполнительного механизма, u(t) - управление, yM (t) - выходная координата модели, s(t) - рассогласование между выходными координатами объекта и модели B(p, t) = B0 (p) - AB(p, t), D(p, t) = D0 (p) - AD(p, t) - дифференциальные операторы объекта,

Ovil Aviation High TECHNOLOGIES

Vol. 19, No. 05, 2016

рассматриваемые как алгебраические суммы некоторых операторов с постоянными коэффициентами В0 (р), А0 (р), характеризующими модель системы с желаемыми динамическими характеристиками, и операторов ЛВ(р, I), ЛА(р, t) - изменение вектора параметров в результате отказов (повреждений), определяемых отклонениями параметров объекта от их желаемых значений.

Влияние нестационарных операторов ЛВ(р, t) и ЛА( р, t) на динамику системы компенсируется контурами (адаптации), реализующими операторы

п-1 т

ЛК(р, t) = X Ч (t)р , ЛN(р, t) = 2 Лп1 (t)р1 ,

¿=0 1=0

алгоритмы перестройки параметров которых определяются уравнениями (9).

Параметрическое управление - целенаправленное изменение конструктивных параметров объекта, вместе с координатным управлением значительно расширяющее возможности управления существенно нестационарными объектами.

Рассмотрим математическую модель обобщенного настраиваемого объекта (ОНО) коор-динатно-параметрического управления:

[Во( р )-ЛВ (р^ ) + ЛКД р^)] у (г ) = [А( р ) + ЛА (p,t )-Л^( p,t )]р( t),

п-1 т

ЛК1 (р, t) = XЬ. (t) Лкир', Л^1 (р, t) = £ ^ (t)Апцр\

¿=0 1=0

где Лк. Лп11 - координаты параметрического управления объектом, Ь1.(t), ё1]. (t) - положительные весовые коэффициенты параметрического управления.

Представим структуру регулятора координатного управления в виде

N(р,)р(I) = ^ (р)и -ЛК2(р,)у(I),

где

т / \ п-1

N2 (р, t) = 2 (¿¡0 + ЛП21 (t)) р1 , ЛК2 (р, t) = 2 Лк2. (t) р ,

1=0 ¿=0 т

Л^( р, t ) = ^Лп21 ^) р1.

1=0

При условиях

ЛК1 (р, t) + ЛК 2 (р, t) = ЛВ(р, t), Л^ (р, t) + ЛN2 (р, t) = ЛА(р, t), ^01 (р ) = А (р)

обобщенный настраиваемый объект при параметрическом и координатном управлении описывается стационарным оператором

В0( р) у^) = А( р)и(г).

Vol. 19, No. 05, 2016

Civil Aviation High TECHNOLOGIES

Синтез алгоритмов функционирования контуров параметрического управления объектом в целом не отличается от синтеза беспоисковой самонастраивающейся системы (БСНС) с эталонной моделью на основе прямого метода Ляпунова и других методов:

Если в результате повреждения системы управления необходима реконфигурация системы управления, то есть вектор состояния и вектор управления может менять размерность во времени, синтезировать управление традиционным способом не представляется возможным.

Автор предлагает для решения данной проблемы использовать множество моделей повреждения (МП) для трансформации системы управления, каждая из которых описывает новую структуру при характерном (базовом) повреждении или отказе, а также при существенных изменениях параметров объекта или условий эксплуатации, приводящих к функциональной неустойчивости.

Структура и параметры поврежденного объекта могут быть представлены моделью такого объекта, которую будем называть моделью повреждения. Одной из возможностей обеспечения живучести является подход, направленный на создания множества систем управления.

Отыскание модели повреждения может осуществляться различными способами, один из которых основан на использовании статистической информации в тактовые моменты времени и предварительно определенного разработчиком критерия отбора базовых моделей повреждений. При различных условиях функционирования системы получаются подходящие МП, набор которых образует «базу моделей» объекта управления в динамической экспертной системе.

Очевидно, что алгоритм работы контура адаптации можно представить в форме системы логических правил:

Если nM = arg min (Jn), то indexp = nM .

Если indexp , то ©* = ©index , где Jn - критерий оценки адекватности прогнозирующих

моделей; n*M - индекс наилучшей МП в конкретный момент функционирования системы; indexp - выбранный порядковый номер в базе настроек регуляторов в вышеуказанный момент;

© - любой набор в базе настроек параметров регулятора; ©* - набор наилучших настроек регулятора соответственно оптимальной МП.

Рассмотрим формальную постановку задачи синтеза живучей системы управления.

Задано множество моделей объекта управления

где / - номер модели, х - вектор пространства состояний объекта управления, и - вектор управления, х е Яп, и еи 1 с Ят , иг - ограниченные замкнутые множества, I = 1, V . Для каждой системы заданы области начальных условий

pAnj(t) = a(t)p}p(t), pAkj(t) = a(t)p'y(t), j = 0,m, i = 0,n-1, a(t) = W(p)e(t).

x = f (x, u),

(11)

(12)

Заданы цели управления в форме многомерных многообразий

Научный Вестник МГТУ ГА_Том 19, № 05, 2016

Ovil Aviation High TECHNOLOGIES Vol. 19, No. 05, 2016

где tfi - время достижения цели (13), которое может быть ограничено некоторой заданной положительной величиной t+ , tfj < t;+, но не задано. Заданы критерии качества управления

tu _

J (u(•))= j f0j (X(t),u(t))dt ^ min, i = 1,v. (14)

0

Необходимо найти управление в форме многомерных функций

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

u = hi (x), i = 1, v, (15)

где

h (x): Rn ^ Rm, i = Vv, (16)

hi ( x ) £ Ut, i = Vv. (17)

Задано описание вектора наблюдения

У = g ( x) , (18)

g (x): Rn ^ Rk. (19)

Вектор наблюдения соответствует сигналам, реально поступающим с датчиков объекта управления.

Пусть у (t) - вектор наблюдений реального объекта в момент времени t. Условие выбора модели объекта управления имеет вид

||g(хг,г (t))-у(1)||<ö, (20)

где х''' (t) - решение системы дифференциальных уравнений

х = Г (X, h (х)), (21)

xi,i (0)е Хо,' , (22)

ö - малая положительная величина.

Пусть в момент tк условие (20) не выполняется:

где

Vol. 19, No. 05, 2016

Civil Aviation High TECHNOLOGIES

||g(x' (t))-y(t)||>£. (23)

Тогда необходимо определить подсистему управления из (25) по условию

minJj||g(x" (t))-y(t)||dt: j = [, (24)

j 10

где x''3 (t) - решение системы уравнений

X = fJ (x, h' (x)), (25)

с начальными значениями

xJ

' (0 ) = х" (1к )е X^, (26)

У(0) = У(ч), (27)

Аг - положительная величина.

После нахождения минимума в (24), т. е. модели ], определяем систему управления

к] (х) и соответствующие цель (13) и критерий качества (14).

Норма в (20), (23), (24) может быть любой выпуклой известной нормой векторного пространства Кк, например Евклидовой.

, k

Hz

= JI z2. (28)

112

i=1

Разработчик математической модели должен задать ансамбль критериев селекции выбора модели, а математическая модель, соответствующая состоянию объекта, выбирается уже автоматически.

Алгоритм выбора может быть реализован на различных опорных функциях. При предварительной обработке имеющейся априорной информации можно правильно выбирать опорные функции, которые отражают физические процессы более точно.

Математическое описание динамического объекта может быть представлено либо его дифференциальным уравнением, либо решением этого уравнения. Низкочастотная часть решения называется функцией тренда и представляет собой решение уравнения динамики в виде

у(г ) = / (и,£, г), (29)

или при соответствующих допущениях

у(г )= / (и, г)+£(г), (30)

где ^(г) - аддитивная помеха. Функция тренда /(и, г) может быть аппроксимирована некоторой системой опорных функций:

Civil Aviation High TECHNOLOGIES

Vol. 19, No. 05, 2016

f(u, 0 = £с^ (t), (31)

i=0

где ft (t) - в свою очередь является опорной функцией.

Для селекции модели повреждения используются различные критерии, в том числе и критерии минимума смещения, который является основным.

Для повышения точности построения прогнозирующей модели повреждения предлагается модифицировать алгоритм трендов Демарка с помощью скользящего окна Язвинского и метода самоорганизации [4]. Посредством использования скользящего окна Язвинского осуществляется компенсация влияния эффекта «старения» измерений.

Разработанный алгоритм модифицированных трендов Демарка имеет вид [2]

Xk = Xk-1 + ck-1, (32)

где Xk - прогноз переменной состояния динамического объекта в момент времени k;

к

ck-1 = ï au К. x i=1

).

(33)

здесь К - число опорных функций; ^ - опорные функции. Каждая опорная функция определяется в соответствие с двухмерным вектором параметров (а^, щ )Г, где - амплитуда, щ - частота.

В качестве критериев селекции в алгоритме использованы критерий регулярности и критерий сходимости, представленные соответственно в выражениях (16) и (17):

Мв 2

Х( ъ-х)

А2 = -, (34)

NK

Zt

ï

t=i

N

ï(Xt - zt )

J = ^-. (35)

N ï

zt2 t=i

Л А 2

где - измерение; х{ - значение, прогнозируемое по модели; А - среднеквадратическая ошибка, вычисленная на проверочной выборке Ыв; J - значение ошибки пошагового интегрирования на всем интервале интерполяции, которая включает обучающую Ыл и проверочную Ыв выборки, т. е. N = ЫА + Ыв.

Выбор модели может осуществляться с помощью более сложного логического анализа наблюдаемого вектора в соответствующей ситуации. Тогда вместо синтезирующей функции (15) необходимо искать функцию вида

и = И (х, V), (36)

Vol. 19, No. 05, 2016

Civil Aviation High TECHNOLOGIES

где V - логический вектор, определяющий выбор управления.

В синтезирующей функции (36) компоненты вектора v = [Vl ... Vp~J могут быть бинарными vi е {0,1}, i = 1, p . Тогда их следует получать в результате синтеза логических функций

v = я ( d ( х )), (37)

где d ( х) - функция дискретизации,

n

d(х) : Rn ^{0,1}.{0,1}, (38)

_p_ _n_

я(d): {04}...{0,1}V{0,1}...{0,1}. (39)

Рассматриваемую задачу называем задачей логико-функционального управления. Для ее решения мы ищем две многомерные функции (37) и (38). Поиск решения осуществляем методом сетевого оператора [5]. Для поиска функции (37) используем арифметический сетевой оператор [5]. Для поиска функции (39) используем логический сетевой оператор.

Задача синтеза живучей системы управления заключается в нахождении синтезирующих функций (15), а также положительных величин 8 и At, обеспечивающих логический выбор подсистемы управления.

СПИСОК ЛИТЕРАТУРЫ

1. Северцев Н.А. Безопасность и отказоустойчивость динамических систем. М.: Культура и знание, 2013.

2. Петров Б.Н., Рутковский В.Ю., Земляков С.Д. Адаптивное координатно-параметрическое управление нестационарными объектами. М.: Наука, 1980. 224 с.

3. Дивеев А.И., Северцев Н.А., Прокопьев И.В. Синтез системы управления беспилотного аппарата, обладающей запасом живучести, методом сетевого оператора. // Нелинейный мир. 2014. Т. 12. №7. С. 38-41. ИФ РИНЦ-0,172

4. Неусыпин K.A., Кэ Фан, Шолохов Д.О. Разработка алгоритма построения моделей с помощью метода самоорганизации для коррекции навигационных систем // ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. «Приборостроение». 2010. No 3.

5. Дивеев Н.А., Северцев Н.А., Атиенсия Вильягомес Х.М. Метод сетевого оператора для синтеза интеллектуальной системы управления динамическим объектом // Cloud of Science. 2014. Т. 1. № 2. С. 191-201.

СВЕДЕНИЯ ОБ АВТОРЕ

Прокопьев Игорь Витальевич, д.т.н., старший научный сотрудник отдела нелинейного анализа и проблем безопасности ФИЦ ИУ РАН, электронный адрес: fvi@list.ru.

SYNTHESIS OF THE TECHNICAL CONTROL SYSTEMS WITH VARIABLE STRUCTURE

Igor' V. Prokopyev

Civil Aviation High TECHNOLOGIES

Vol. 19, No. 05, 2016

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Federal Research Center "Informatics and management" to the Russian Academy of Sciences

Moscow, Russia, fvi2014@list.ru

ABSTRACT

This article considers the method of management system synthesis. The management system has a variable structure, which provides the increase of management system survivability in conditions of external environment essential change. Also the object as a result of an adverse effect is considered. The formal problem definition of synthesis of hardy management system is considered. Model choice criteria ensemble is set. The rule of choice algorithm implementation on the basis of different reference functions is provided. The conclusion is drawn that in case of preliminary processing of the available prior data it is possible to select reference functions correctly which reflect physical processes more precisely. The mathematical description of a dynamic object on the basis of a differential equation, or its decision is provided. Definition of function of a trend is given. Criteria for selection of model of damage are given. The recommendation of modification of Demark trends algorithm by means of the sliding Yazvinsky's window and a method of self-organization for increase of accuracy of creation of a predictive model of damage is made. It is offered to realize a model choice by means of more complex logical analysis of an observed vector in the appropriate situation. Logic-functional control task definition is given and approach to its decision is formulated. The conclusion about what the task of synthesis management system consists of is given. This article describes the method of synthesis of control system with variable structure provides increasing survivability control system in a significant change of the external environment, as well as the object itself from the adverse impacts.

Key words: control system, time moment of time, forecasting model.

REFERENCES

1. Severtsev N.A. Security and fault tolerance of dynamic systems. M.: Kultura i znanie [Culture and knowledge], 2013. (in Russian)

2. Petrov B.N., Rutkowski V.Y., Zemlyakov S.D. Adaptive coordinate-parametric control of non-stationary objects. M.: Nauka, 1980, 224 p. (in Russian)

3. Diveev A.I., Severtsev N.A., Prokopyev I.V. Synthesis of the management system of the pilotless device possessing a survivability inventory, method of the network operator.// Nelinejnyj mir [Nonlinear world], 2014, Issue 12, No. 7, pp. 38-41. IF RINTs-0,172 (in Russian)

4. Neusypin K.A., Fang Ke, Sholokhov D.O. Development of algorithm of creation of models by means of a self-organization method for correction of navigation systems. ISSN 0236-3933. Vest-nik MGTU im. N.E. Baumana. ser. "Priborostroenie" [Bulletin of MGTU named N.E. Bauman]. It is gray. "Instrument making", 2010, No 3. (in Russian)

5. Diveev N.A., Severtsev N.A., Atiensiya Villagomez J.M. Metod of the network operator for synthesis of an intellectual management system dynamic object. Cloud of Science, 2014, issue 1, No. 2, pp. 191-201. (in Russian)

i Надоели баннеры? Вы всегда можете отключить рекламу.