Общая задача синтеза оптимального управления и ее решение в классе интеллектуальных систем

Дивеев А.И.; Пупков К.А.; Софронова Е.А.

УДК 62-50

ОБЩАЯ ЗАДАЧА СИНТЕЗА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ И ЕЕ РЕШЕНИЕ В КЛАССЕ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ

А.И. Дивеев, К.А. Пупков, Е.А. Софронова

МГТУ им. Н.Э. Баумана, Москва

e-mail: [email protected]; [email protected]; [email protected] Рассмотрена общая задача синтеза оптимального управления, которая заключается в нахождении управления как функции от координат пространства состояний для области начальных значений. Для ее решения применен численный метод сетевого оператора, позволяющий находить структуру и параметры многомерной функции. Полученная в результате синтеза система управления кроме функций от координат пространства состояний содержит еще и логическую функцию, что позволяет отнести данную систему управления к классу интеллектуальных систем. Приведен пример решения задачи общего синтеза системы управления пространственным движением беспилотного вертолета.

Ключевые слова: интеллектуальные системы управления, синтез оптимального управления, метод сетевого оператора.

A GENERAL PROBLEM OF OPTIMAL CONTROL SYNTHESIS AND SOLVING IT IN A CLASS OF INTELLIGENT SYSTEMS

A.I. Diveev, K.A. Pupkov, Ye.A. Sofronova

Bauman Moscow State Technical University, Moscow e-mail: [email protected]; [email protected]; [email protected] A general problem of optimal control synthesis is considered which consists in finding a control as a function of coordinates of the state space for a domain of initial values. For solving the problem, a numerical method of network operator is applied which allows the multidimensional function structure and parameters to be found. The control system obtained as a result of the synthesis contains also a logic function in addition to functions of the state space coordinates, which makes it possible to ascribe this control system to a class of intelligent systems. An example of solving the problem of general synthesis of the system for control of spatial motion of the unmanned helicopter is given.

Keywords: intelligent systems of control, optimal control systems, network operator method.

Проблема синтеза системы управления заключается в нахождении управления как функции координат пространства состояний. Полученная в результате синтеза многомерная функция называется синтезирующей. Проблема поиска синтезирующей функции заключается в том, что искомая функция является многомерной, негладкой и имеет разрывы по сложным поверхностям в пространстве состояний объекта.

Наиболее известным методом для решения задачи синтеза является метод аналитического конструирования оптимальных регуляторов [1], который позволяет получить управление как линейную функцию координат пространства состояний для объекта управления, описываемого линейной системой дифференциальных уравнений, и квадратичного критерия качества.

Другие аналитические методы синтеза, например метод аналитического конструирования агрегированных регуляторов [2, 3], требуют для решения задачи ясного понимания поведения оптимальной системы, чтобы построить притягивающее многообразие или поверхности переключения, что ограничивает область их применения.

Последние достижения в области алгоритмизации и развитие вычислительной техники позволяет сегодня создавать численные методы для решения задачи синтеза управления. Одним из таких методов является метод сетевого оператора [4-8], позволяющий за счет представления многомерной функции в виде целочисленной матрицы, элементы которой указывают на унарные и бинарные операции, выполняемые при вычислении функции, находить решение с помощью, например, генетического алгоритма.

Проблема общей задачи синтеза управления [9, 10] состоит в нахождении синтезирующей функции для области начальных значений. Если предположить, что синтезирующая функция представляет собой комбинацию различных функций, каждая из которых оптимальна для определенной области пространства состояний, то возникает идея синтезировать каждую функцию отдельно, например для определенных начальных значений, а затем выбирать необходимую функцию в процессе управления. В этом случае система управления должна включать в себя подсистему для принятия решений по выбору синтезирующей функции.

Для поиска логической функции используем логический сетевой оператор, который отличается тем, что строится на множестве логических операций [11, 12]. Наличие логического вывода в системе позволяет утверждать, что полученная система управления относится к классу интеллектуальных систем.

Рассмотрим общую задачу синтеза управления. Задана модель объекта управления в виде системы обыкновенных дифференциальных уравнений

Х = f (X, и), (1)

где х е Мп, и е Мт, т < п.

Задано ограничение на управление

и е и, (2)

где и — ограниченное замкнутое множество.

Заданы терминальные условия

^ (х (^)) = 0, г =й, (3)

где — время окончания процесса управления (может быть не задано), определяемое по выполнению условий (3).

Заданы ограниченный снизу функционал

3 = I / (х (¿), и (¿)) <Ц (4)

0

и область начальных состояний

Хо С Еп. (5)

Необходимо найти математическое выражение в виде

и = ь (х), уг> о, ь (х (¿)) с и, (6)

где Ь (х) — однозначное не обязательно непрерывное или дифференцируемое отображение, Ь (х) : Мп ^ Мт.

Искомое отображение (6) должно обладать следующим свойством: Ух0 е Х0 решение х (¿) системы хх = f (х, Ь (х)) с начальными условиями

х (0) = х0 е Хо (7)

должно удовлетворять терминальным условиям (3) и минимизировать функционал (4) в том смысле, что если решить задачу оптимального управления для тех же начальных значений (7), то значение функционала (4) будет таким же, как и при решении задачи синтеза:

3 (х°, Ь(х)) = 3 (х°, и (•)) , (8)

где Ь (х) — решение задачи синтеза (1)-(6); и (•) — решение задачи оптимального управления (1)-(4), (7).

Основной особенностью задачи синтеза (1)-(6) является поиск одной функции Ь (х) для всех начальных условий из заданной области Х0.

Пусть множество начальных условий состоит из одной точки

X = {х0} . (9)

Тогда в постановке (1)-(4), (7) решение задачи оптимального управления существует.

Пусть мы имеем численный алгоритм, который решает задачу оптимального управления (1)-(4), (7) с заданной точностью за конечное число шагов. Применяем этот алгоритм для каждого х (¿¿), ^ > 0, как для начального значения. Для значения х (¿¿) получаем оптимальное управление и (•). Возьмем из полученного управления первое значение й(^). Данное значение зависит от начальных условий или от х (¿¿). Используем й (¿¿) для получения х (¿¿+1). После этого вновь решаем задачу оптимального управления, считая х (¿¿+1) начальным условием. Снова получаем й (¿¿+1) и т.д. В результате находим упра-

вление в виде функции координат пространства состояний (6). Следовательно, алгоритм решения задачи оптимального управления (1)-(4), (7) за конечное число шагов обеспечивает решение задачи синтеза с точечным начальным значением (9).

Выберем во множестве начальных значений (5) конечное число

точек - , „

Хо = {х0-1,..., х0-к} С Хо. (10)

Решив задачу синтеза для каждого начального значения, получим множество решений

Н={ Ь1 (х),..., Ьк (х)} , (11)

где Ь (х) - решение задачи синтеза для начального значения х0 г, г = !,!.

Допустим, что Ух (0) € Х0 ЗЬг (х) € Н, 1 < г < к, что и = Ьг (х) является решением задачи синтеза не только для начального условия х0 г, но и для начального условия х (0) = х°'\ В результате после решения задач синтеза для к начальных условий из множества Х0 необходимо решить задачу выбора одного из найденных решений для конкретного начального значения Ух (0) € Х0. Следует учитывать, что выбор не всегда должен определяться близостью х (0) к х°'\ 1 < г < к.

На практике общая задача синтеза всегда решается на этапе проектирования. Если удается формализовать оценку качества управления в виде функционала (4), то различные синтезирующие функции определяют различные режимы управления, например режим стабилизации в окрестности стационарного состояния или режим маневра при движении к целевой точке. Заметим, что в обоих указанных случаях режим управления зависит от начального состояния объекта управления.

Сформулируем задачу выбора синтезирующей функции из множества решений (11). Для заданных начальных условий х (0) € Х0 необходимо выбрать синтезирующую функцию Ь (х) € Н, которая обеспечивает минимальное значение функционала (4). Выбор синтезирующей функции должен осуществляться в процессе режима управления, поэтому для осуществления выбора необходимо также синтезировать функцию принятия решения

г = ь (Б), (12)

где г — целое число от 0 до к — 1; Б — матрица размера п х к:

0,1 /т>\ 0,к

D

— x\ (0) ... x{ — x\ (0)

X,n' xn (0) . . . xn' xn (0)

w (D) : Rn x Rk ^ {0,... ,k — 1}.

(13)

Функцию ы (Ю) представим в виде сложной функции

* = 9 , (14)

где W — целочисленная матрица размера п х р:

Ы1,1 ... Ы1,р

W =

Wn,1 ... W.

Р,Р

(15)

е {0,..., к — 1}, г = 1,п, 3 = 1,р, р < к.

Для вычисления значения , г = 1,п, 3 = 1,р используем дискретизацию выборочных разностей векторов х0 г — х (0), г = 1, к. Для того чтобы отобрать разности, ведем целочисленный вектор

а = [«1.. .а ]т , (16)

где а е {0,1}. Тогда

г

Ыг,з = в (а (Уг,т)) , 3 = ^ "г, (17)

1=1

где а (А) — монотонно неубывающая функция; в (у) — функция дискретизации; ( )

уг,г = аг. (ж0'г — хг (0)) . (18)

Для выполнения операций дискретизации находим граничные значения аргумента у- < у < у+, определяем приращения аргумента в соответствии со значением р, числом рассматриваемых для выбора решений, как

Ау = У+—^. (19)

р — 1

Находим дискретные значения аргумента

у? = у +3Аy, 3 = 0,р — 1. (20)

Определяем значения функции дискретизации, если

, , уг + уг+1 1 ч

уг < у < -^-, (21)

то в (у) = 3.

Для синтеза системы выбора решений необходимо найти вектор а размерности к, состоящий из 0 и 1, и две функции: монотонно-неубывающую функцию а (А) и целочисленную функцию матричного аргумента 9 (W).

Для решения задачи поиска синтезирующих функций Ь (х) е Н и неубывающей функции а (А) используем метод сетевого оператора

[4-10], а для поиска целочисленной функции д (W) используем метод логического сетевого оператора.

Метод сетевого оператора предназначен для поиска записи математического выражения, построенного на множестве переменных Х = (х1,...,хп), параметров р = (?1,...,?р), унарных операций 01 = (р1 (г) = г, р2 (г),..., рш (г)) и бинарных операций 02 = (х0 (г', г''),..., Ху-1 (г', г")). Метод позволяет записать математическое выражение в виде ориентированного графа. Граф указывает на порядок вычислений, аргументы и операции, которые необходимо выполнить. Узлы-источники связаны с параметрами и переменными. Остальные узлы графа связаны с бинарными операциями. Дуги графа связаны с унарными операциями.

В памяти компьютера сетевой оператор представляют в виде целочисленной матрицы, которая по своей структуре соответствует матрице смежности графа, только вместо единиц, соответствующих дугам графа, указывают номера унарных операций, а на диагонали вместо нулей указывают номера бинарных операций.

Например, рассмотрим математическое выражение

—Х2

y = x + sinxi + qi^ie

Для данного выражения имеем следующие множества переменных X = (x1,x2), параметров Q = (q1), множество унарных операций O1 = (р1 (z) = z,p3 (z) = —z,p6 (z) = ez,p12 (z) = sin z), множество бинарных операций O2 = (x0 (z', z'') = z' + z'', x1 (z', z'') = z'z''). Номера операций здесь соответствуют таблице, приведенной в работах [4, 5].

Матрица сетевого оператора имеет вид

Ф =

0 0 0 0 0 0 0 0 0

12 0 0 1 0 0 0 0 0

Метод логического сетевого оператора включает в себя использует множества логических унарных и бинарных операций 01=(у),... (у)), 02 = (^0 (у' ,у'') (у', у'')).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для поиска монотонной функции а (А) ограничиваем набор унарных операций только монотонно неубывающими функциями.

Пример синтеза системы управления. Метод использовался для синтеза системы управления пространственным движением беспилотного вертолета.

Математическая модель объекта управления описывалась уравнениями

x = VX, V^X = — cos y sin $; m

y = Vy, Vy = — cos y cos $ — g;

• т/ т> —2 •

z = Vz, Vz = — sin y; m

—3

Y = x = ;

ó • —1

$ = Wz ,Cóz = —,

Jzz

где x, y, z — координаты центра масс; VX, Vy, Vz — проекции вектора скорости на оси координат; y, $ — углы поворота вокруг осей координат; wX, wz — угловые скорости вращения; —2 — сила тяги винтов; —1, —3 — моменты вокруг осей координат.

Необходимо построить систему автоматического управления пространственным движением квадротора.

Задана пространственная траектория в виде точек пространства

Y = ([ x* y* z* Г y*N zN Г) .

Необходимо построить систему управления, которая обеспечит движение объекта по пространственной траектории в окрестности заданных точек и при этом как можно быстрее достичь последней точки. Управление должно минимизировать функционалы

J:l= max jmin{\\[x (t) y (t) z (t) ]т — [ x* y* z* ]т\\}} ^ min,

J2 = tf + sk ^ min, где tf — время достижения последней точки, tf = t, если

\\[ x (t) y (t) z (t) ]т — [ xN yN zN ]т\\ <e;

s - штраф за прохождение объекта вдали от точки траектории (s > 1), k — число недостигнутых точек, если

min {\\[ x (t) y (t) z (t) ]т — [ x* y* z* ]т\\} >e.

Проблема синтеза системы управления заключалась в том, чтобы переключать точки в определенные моменты времени в соответствии с состоянием объекта управления по отношению к участку пространственной траектории.

Движение квадротора по отношению к пространственной траектории определялось его положением относительно двух точек траектории, текущей и следующей, поэтому при синтезе управления можно не рассматривать всю траекторию, а достаточно рассмотреть задачу синтеза системы стабилизации относительно текущей точки из области начальных значений и синтеза логической функции, которая обеспечивает переключение от текущей точки к следующей. Синтезирующие функции в задаче стабилизации будут отличаться друг от друга в зависимости от начального состояния объекта по отношению к текущей и следующей точкам траектории.

Синтезирующие функции для задачи стабилизации имели вид

«1 = (х* — х, К, 0, Шг) , «2 = ^2 (у* — у, V,) , «з = (г* — г, V;, 7, шх) .

Для построения функции логического выбора использовалась дискретизация и два значения функцииг € {0,1}. Синтезирующая функция логического выбора имела вид

\

/

Выводы. Метод сетевого оператора может быть успешно применен для задачи синтеза оптимального управления интеллектуальными системами. Метод позволяет находить приближенные синтезирующие функции в виде арифметических сетевых операторов, а выбор функций в процессе управления осуществлять с помощью логического сетевого оператора.

Работа выполнена по грантам РФФИ № 10-08-00618-а, № 11-08-00532-а.

СПИСОК ЛИТЕРАТУРЫ

1. Афанасьев В. Н., Колмановский В. Б., Носов В. Р. Математическая теория конструирования систем управления. - М.: Высш. шк., 2003. -615 с.

2. КолесниковАл. А. Управление нелинейными колебаниями. Энергетические инварианты // Изв. РАН. ТиСУ - 2009. - № 2. - С. 24-37.

3.Воронов Е. М. Многокритериальный синтез позиционного управления на основе многопрограммной стабилизации. Ч. 1 // Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. - 2012. - № 2 (87). - С. 3-20.

4. Д и в е е в А. И., С о ф р о н о в а Е. А. Метод сетевого оператора и его применение в задачах управления. - М.: Изд-во РУДН, 2012. - 182 с.

z = w

rp 1 _ rp rp 1 _ rp

iAJ j iAJ iAJ j —

Vx

y;— y y;+i— y

к

Vy

Zj z Zj—1 Z

v2

Vz

5. Д и в е е в А. И. Метод сетевого оператора. - М.: Изд-во ВЦ РАН, 2010. - 178 с.

6. D i v e e v A. I., Sofronova E. A. Application of network operator method for synthesis of optimal structure and parameters of automatic control system // Proceedings of 17-th IFAC World Congress. Seoul, 2008, 05.07.2008-12.07.2008. -P. 6106-6113.

7. Д и в е е в А. И., С о ф р о н о в а Е. А. Метод построения функциональных зависимостей для решения задачи синтеза оптимального управления // Тр. ИСА РАН. Динамика неоднородных систем / Под ред. чл.-кор. РАН Ю.С. Попкова. -М.: ИСА РАН, КомКнига, 2007. Вып. 31 (2). - С. 14-27.

8. Д и в е е в А. И., Пупков К. А., Софронова Е. А. Повышение качества систем управления на основе многокритериального синтеза методом сетевого оператора // Вестник РУДН. Сер. Инженерные исследования. - 2009. - № 4. -С. 5-12.

9. Д и в е е в А. И. Численный метод сетевого оператора для синтеза системы управления с неопределенными начальными значениями // Изв. РАН. Теория и системы управления. - 2012. - № 2. - С. 63-78.

10. Д и в е е в А. И., С е в е р ц е в Н. А. Метод сетевого оператора для синтеза системы управления спуском космического аппарата при неопределенных начальных условиях // Проблемы машиностроения и надежности машин. - 2009. - № 3. - С. 85-91.

11. Алнов айни Г. Х. А., Дивеев А. И., Пупков К. А., Софроно-в а Е. А. Метод логического сетевого оператора для синтеза управления потоками транспорта в сети городских дорог // Вестник РУДН. Сер. Инженерные исследования. - 2010. - № 4. - С. 94-102.

12. Д и в е е в А. И., Софронова Е. А. Идентификация интеллектуальной системы управления методом логического сетевого оператора // Труды IX Меж-дунар. конф. "Идентификация систем и задачи управления" SICPRO'12 Москва 30 янв.-02 февр. 2012. ИПУ РАН. - С. 630-636.

Статья поступила в редакцию 14.09.2012

Асхат Ибрагимович Дивеев — д-р техн. наук, профессор, зав. сектором проблем кибернетики вычислительного центра им. А.А. Дородницына РАН. Автор более 160 научных работ в области теории управления, вычислительных алгоритмов и дискретной оптимизации.

A.I. Diveev — D. Sc. (Eng.), professor, head of sector for problems of cybernetics of the Dorodnitsyn Computing Center of the Russian Academy of Sciences. Author of more than 160 publications in the field of control theory, effective computational algorithms and discrete optimization.

Константин Александрович Пупков — д-р техн. наук, профессор, заведующий кафедрой "Системы автоматического управления" МГТУ им. Н.Э. Баумана. Автор более 30 монографий, учебников и учебных пособий в области теории управления и интеллектуальных систем.

Pupkov K.A. — D.Sc. (Eng.), professor, head of department "Automatic Control Systems" of the Bauman Moscow Higher Technical University. Author of more than 30 monographs and teaching aids in control theory and intelligent systems.

Елена Анатольевна Софронова — канд. техн. наук, доцент кафедры "Кибернетика и мехатроника" РУДН. Автор 45 научных работ в обласи теории управления, вычислительных алгоритмов, синтеза и идентификации систем управления.

Ye.A. Sofronova — Ph. D. (Eng.), assoc. professor of Cybernetics and Mechatronics department of the Peoples' Friendship University of Russia. Author of 45 publications in the field of control theory, effective computational algorithms, synthesis and identification of control systems.

Общая задача синтеза оптимального управления и ее решение в классе интеллектуальных систем Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Дивеев А. И., Пупков К. А., Софронова Е. А.

Похожие темы научных работ по математике , автор научной работы — Дивеев А. И., Пупков К. А., Софронова Е. А.

A GENERAL PROBLEM OF OPTIMAL CONTROL SYNTHESIS AND SOLVING IT IN A CLASS OF INTELLIGENT SYSTEMS

Текст научной работы на тему «Общая задача синтеза оптимального управления и ее решение в классе интеллектуальных систем»