Научная статья на тему 'Подход к построению нелокального синтеза оптималь ного управления'

Подход к построению нелокального синтеза оптималь ного управления Текст научной статьи по специальности «Математика»

CC BY
51
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
iPolytech Journal
ВАК
Область наук

Аннотация научной статьи по математике, автор научной работы — Ливанцова Татьяна Сергеевна, Горнов Александр Юрьевич

Предлагается технология построения приближенно оптимального управления в виде обратной связи для однопараметрического семейства нелинейных динамических моделей, Технология основана на формировании и численном ре шении последовательности аппроксимативных задач параметрической идентификации и апробирована на тестовых примерах.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Подход к построению нелокального синтеза оптималь ного управления»

Таким образом, результатом применения метода является разложение временного ряда на компоненты, которые могут быть интерпретированы как медленные тренды, циклические составляющие и шум,

Таким образом, предлагаемый метод СРМР позволяет получить отдельные элементарные составляющие, как показано на рис. 3, каждая из которых, характеризует долю процесса изменения макроэкономического показателя. При этом суть моделирования движения полных макроэкономических величин заключается в том, чтобы разбить один сложный объект на множество элементарных объектов, которые на прогнозируемом интервале достаточно легко могут быть описаны математическими моделями. Полученные на основе исходного ряда элементарные составляющие могут быть использованы для точного прогнозирования и, в соответствии с принципом суперпозиции, объединив влияния отдельных составляющих, возможна оценка реакции макроэкономической величины на какое либо воздействие, вызванное политическими или экономическими новостями. В итоге прогнозируемое значение исходного ряда вычисляется как сумма прогнозов отдельных составляющих.

Библиографический список

1, Платонова И, Н. (ред.) Валютный рынок и валютное регулирование. - М.: БЕК, 1996.

2, Eisner J,В, and Tsonis A.A., Singular Spectrum Analysis, A New Tool in Time Series Analysis. New York and London: Plenum Press, 1996.

3. Дж.Форсайт, М.Малькольм, К.Моулер. Машинные методы математических вычислений./Пер. с англ.-М,;Мир, 1980.

4. Дж,Голуб,Ч.Ван Лоун, Матричные вычисления,/Пер. с англ -М.: Мир, 1999.

Т.С.Аиванцова, А.КХГорнов

Подход к построению нелокального синтеза оптимального управления

Введение, Задача построения оптимального управления в виде закона с обратной связью (задача синтеза оптимального управления, COY) оказалась значительно сложнее, чем задача построения программного управления и к настоящему моменту, несмотря на усилия многих специалистов, не имеет удовлетворительного решения ([1-5]). Уравнение Беллмана (Гамильтона - Якоби - Беллмана), решение которого удовлетворяет искомым математическим требованиям, в вычислительном отношении в общем случае должно быть признано неразрешимым (см., напр,, [5-7]). Единственным классом задач, для которого, по мнению специалистов, возможно построения СОУ в конструктивном виде, являются линейно-квадратичные задачи (линейная система, квадратичный функционал), но и в этом случае, малоинтересном для практики, решение основной вспомогательной задачи - интегрирование матричного уравнения Риккати может оказаться невозможным в силу его жесткости.

В то же время, прикладная потребность в конструктивных технологиях синтеза оптимального управления увеличивается. Во-первых, увеличивается «социальный заказ» на разработку автономных систем управления в реальном времени со стороны промышленных приложений. Во-вторых, рост вычислительной мощности доступной компьютерной техники, к сожалению, не дает качественно новых возможностей практического применения итеративных алгоритмов оптимизации, в большинстве случаев чрезвычайно затратных по процессорному времени, В-третьих, наличие адекватных систем управления с обратной связью позволило бы значительно уменьшить требования к качеству математических моделей и к их информационной обеспеченности. Наличие этих, и, возможно, многих других объективных факторов позволяют утверждать, что актуальность задачи СОУ в настоящее время значительно возросла. В статье рассматривается подход к созданию методики решения задачи СОУ для нелинейных систем, основанный на задаче параметрической идентификации.

1. Постановка задачи СОУ, Пусть имеется управляемый процесс, описываемый системой обыкновенных дифференциальных уравнений х = /(x(t),u, рЛ), определенный на интервале Т ~[t0,/J. Здесь t - независимая переменная (время), x(t)~ п-вектор фазовых координат, u~ г-вектор управляющих функций., р- скалярный параметр модели, принимающий значение из интервала [p¡,pK]. Вектор-функция f(x(t),u,p,t) размерности п предполагается непрерывно-дифференцируемой по всем аргументам, кроме t , Начальный фазовый вектор x(tQ)-x°(p) задан как функция параметра р,

Задача синтеза оптимального управления состоит в поиске вектор-функции u(x,p,t), доставляющей минимум терминальному функционалу 10{и) = <p0(x(t{)) при любом значении р е [p,,pg].

2. Подход к построению COY, Для построения COY формируется аппроксимативная задача оптимального управления большой размерности, состоящая из некоторого числа "экземпляров" исходной задачи. На интервале LPnPg] вводится равномерная сетка с шагом hs - (pg - p¡)/(L-1), где L - число узлов сетки,

p¡ = < s2 < ... < Sj = р0. Для каждого узла введенной сетки формулируется свой "экземпляр системы", соответствующий значению параметра в данном узле, Например, если x,(í0) = /;, то начальный фазовый вектор в аппроксимативной задаче примет вид: х(/0) = х°(р) = = (s,,x(°M)w+2Оо )> • • х(°м)я+л(ro)) - гАе = 1Д • в поставленной

аппроксимативной задаче размерности п х L на первом этапе осуществляется поиск оптимального управления, зависящего только от времени (программного управления), полученное решение рассматривается в качестве эталонного. На следующем этапе формируется набор задач COY, в которых оптимальные управления приближаются полиномами возрастающих степеней, формулируются и решаются задачи идентификации по параметрам. В результате решения первой из этих задач получается аналитическое представление субоптимального управления первой степени. Оно используется в качестве начального при решении задачи COY полиномами второй степени и т.д. На каждом последующем этапе получаемое субоптимальное управление все точнее приближает известное оптимальное (рис. 1). Вывод о близости синтезированного управления к оптимальному может быть сделан на основе сравнения с эталонным оптимальным управлением.

3. Аппроксимативные задачи оптимизации по параметрам. Для аппроксимации управления используются полиномиальные функции нескольких переменных. Приведем полиномиальные шаблоны управлений, используемые для задачи COY в системе размерности 2. В аппроксимативной задаче первого порядка используется приближение оптимального управление линейным полиномом i^(xpx2) = a¡x, +а2х2, второго порядка - квадратичным

Р2(х,.х2) = <2,х,2 + а2х]х2 + а3х\ + а4х{ + а5х2, третьего - кубическим Ръ(x¡,х2) =

= a^x¡ + a2xfx2 + аъхлх2 + a4x¡ + а5х,2 + а6х}х2 + а7х2 + а%хх + а9х2 и т.д. Общая рекуррентная формула

таких полиномов степени к от двух переменных имеет вид Рк (х,, х2) = У^'а^"^"1 + Рк_} (Xj, х?). При наличии прямых ограничений на управляющие воздействия для синтеза релейного управления используются редукции типа и — sign((p(a,x)), сглаженные с помощью стандартного приема sign(x) ~ 2¡я; ■ arctg(d • х); значение параметра d выбирается с помощью численных экспериментов,

4. Технология решения задач параметрической идентификации. Трудности решения задач данного класса связаны с разномасштабностью переменных, связанной с характером влияния идентифицируемых коэффициентов на динамическую систему [8-10], Вычислительные характеристики аппроксимативных задач могут сильно отличаться в различных областях вариабельного множества, что требует применения специальных механизмов удержания оптимизационной траектории в исследуемых окрестностях.

При решении задач параметрической идентификации, как правило, сильно овражных, можно выделить следующие этапы: спуск в овраг, движение по дну оврага, уточнение экстремума. На этапе спуска в овраг типичной проблемой является наличие областей нефизичности оптимизируемой модели, выражающееся в «авостах» при вычислении целевой функции или ее градиентов. Выход видится в ограничении размеров вариаций, реализуемом посредством формулирования параметризованной последовательности аппроксимативных задач с монотонным увеличением размеров параллелепипедов прямых ограничений; оптимальное решение предыдущей задачи используется в качестве начального приближения для последующей. Движение по дну оврага и уточнение экстремума есть наиболее трудоемкие по времени расчетов этапы. Здесь, как правило, лучше других работают традиционные локальные методы со сверхлинейной скоростью сходимости (сопряженных градиентов, квазиньютоновские) с высокой частотой обновления направления спуска - через 5-10 итераций.

задач

Рис, 1. Схема построения последовательности

В качестве гдобализующего метода используется случайный мультистарт [11] - метод поиска глобального экстремума основанный на проведении локального спуска из многих начальных точек и выборе лучшего найденного минимума в качестве решения. В силу случайной генерации начальных точек нет гарантии попадания хотя бы одной точки в область притяжения глобального экстремума, но при увеличении числа локальных спусков вероятность попадания в эту область возрастает. Известный недостаток этого алгоритма - лишние затраты на спуск в неперспективные локальные минимумы, на наш взгляд, не является принципиальным.

5. Численные эксперименты. Предлагаемый подход к поиску оптимального управления с обратной связью продемонстрирован на известных тестовых примерах небольшой размерности. Численные эксперименты проводились с использованием разрабатываемого авторами программного комплекса для решения задач оптимального управления OPTCON - III.

Пример 1. Управляемый динамический процесс, описываемый системой обыкновенных дифференциальных уравнений,

< X2 ТЛ^ ' Slll A/j

• _ 2 2 2 Х^ — 1Лj Х^ Xj

определен при / е [0,2]; х,(0) может принимать любое значение из интервала [0,10], остальные компоненты траектории в начальный момент времени фиксированы: х2(0) = 0, х3(0) = 0. Необходимо найти управление, доставляющее минимум терминальному функционалу следующего вида J(u) = х3 (2), при любом значении jc, (0) из данного интервала.

Рассмотрим реализацию предложенного подхода для этого примера, сформулируем аппроксимативные задачи. На интервале изменения скалярного параметра модели [p¡,pg] = [0,10] введем равномерную сетку с шагом

hs -1, состоящую из ¿ = 11 узлов. Начальный фазовый вектор в аппроксимативной задаче примет вид:

x2M(/0) = s¡ = z -1, x2l(tQ) = 0, x2L+l(t0) = 0 где / = 1,11. Система дифференциальных уравнений формируется следующим образом:

X2i-\ = Х2 i < x2¡ = u¡ - sin x2¡_]

X2L+l ~ (ui + X2i-1 + X2i)

На временном интервале t e [0,2] необходимо найти управление, доставляющее минимум целевому функционалу J(u) — x2L+l (2). Решение этой задачи берется за эталонное при оценке точности решений аппроксимативных задач.

a б

Рис. 2. Оптимальная траектория системы (а) и оптимальное управление (6)

Сформируем последовательность аппроксимативных задач параметрической идентификации, Первая из этих задач основана на построении синтеза оптимального правления в виде полинома первой степени:

X2i-\ ~ X2i — CXtJC

¿I

2,-1 + sm X2i-\

C2L+\ ~~ !,-[ ((^\X2i~\ + a2X2i) + X2i~ 1 + X2/)

x2M(0) = /-l, x2/(0) - 0, / = Ц1, x2i+I(0) = 0 | Cij |< 10, j = 1~2 í e [0,2] J(u) = x2L+] (2) —» min ,

В результате численного решения поставленной задачи получим следующее аналитическое линейное представление приближения к оптимальному управлению;

и* = -0,8372 х, -1.935х2.

На следующем этапе синтез управления ищется в виде полинома второй степени, найденное ранее субоптимальное управление выбирается в качестве начального приближения,

X2i~\ ~ X2í

2 2 Х-,. &\X2i-] * ^2Х2' ' -1 СС^Х2j — Sin.

X2L+l = У1_1 (ia\X2i-\ + &2X2i-lX2i + aiX2i + &4X2i-1 + (%5X2i) ^ X2i-\ + X2/)

*2m(°) = x2,(°) = i = M 1 *2L+i(°) = 0;| |< 10, y = ü te [0,2], J{u) = x2/+!(2) -> min . В результате численного решения задачи получим уточнение субоптимального управления; и = -0.02117xs2 -0.09617x,x2 -0.1281x2 -0.7193Х, -1.686х2.

Невязка минимального значения функционалов в задаче квадратичной аппроксимации - 3,37989 меньше, чем в задаче линейной аппроксимации оптимального управления - 5.54435, что подтверждает очевидное свойство об улучшении аппроксимации с ростом степени полинома.

В следующем примере рассматривается задача COY с учетом прямых ограничений на управление.

X(t) о.о

X(t) 10.0

0.0 0.4

Рис. 3. Четные оптимальные и субоптимальные траектории системы (а) и нечетные оптимальные и субоптимальные траектории системы (6)

Пример 2. Динамика процесса описывается следующей системой

х2 = щ - sm х,

определенной на интервале: t е [0,3] i второй компонент вектора траектории в начальной точке фиксирован х2 (0) = 0, x¡(0) может принимать любое значение из интервала [3,7]. Критерием качества является целевой функционал вида J(u) - xf (3) + х\ (3) -» min .

Для формирования задачи COY сгенерируем равномерную сетку с шагом hs = 1 на интервале [papg] = [3,7], состоящую из L- 5 узлов. Получим начальный фазовый вектор х2м(Г0) = st = i + 2, x2i(t0) = 0, где / = 1,5 и следующую систему:

1 X2i-l = X2¡ 1*2/ =«/"SÍn*2w

Необходимо найти управление, удовлетворяющее прямым ограничениям | и,(t) |< 1, j = 1,5 и доставляющее

•v~-i2¿ 2

минимум функционалу J(u) = / x¡ .

Оптимальное управление и соответствующие ему оптимальные траектории приведены на рис,4, Полученное реше-

ние считается эталонным при анализе аппроксимативных задач параметрической идентификации.

Для синтеза релейного управления при формировании аппроксимативных задач используются сглаженные стандартным приемом редукции типа и(?) ~ и'(х, б/. 0 = 2¡п • • (Рк (х2м, хъ))), где

Рк (х2/ч. х2/) = ^'й^зм1^ + ^кл (х2/-1' хи); степень полинома к равна порядку аппроксимативной задачи.

Начальный фазовый вектор задан х2М(0) = 1 + 2, х2/(0) = 0, / = 1,5 , формируется система дифференциальных уравнений

Х2/-1 ~ ХИ

^х2/ = 2/я • arctg(d -(Рк (x2M, x2l))) - sin х2

X(t) 8.0-,

U(t) 1.2

0.8 -

-2-0 -т-г--—--

0.0 1.0 2.0

I

Рис. 4. Оптимальная траектории системы (а) и оптимальное управление (6)

Ограничения на параметры следующие: | а] (7) |< 10 , где у = (/ +1), т.е. в аппроксимативной задаче первого порядка 2 управляющих параметра, второго - 5, третьего - 9 и четвертого - 14. Целевой функционал имеет вид Ли) - —» шт.

Значение параметра д. , используемое для аппроксимации оптимального управления, выбирается экспериментально (таблица 1), Графическая интерпретация приближения оптимального управления (сплошная линия) субоптималь-

ными (пунктирные линии), полученными при решении аппроксимативной задачи четвертого порядка, представлена на рис.5.

1.2

0.8

0.4

0.0

-0,4

-0.8

-1.2

U2 1Г2

d=100

■ -d=1

/ \,r b d=0.1

í /

i d=0.01

d=10

0.0 1.0 2.0 3.0

Рис. 5. Изменение субоптимальных управлений в зависимости от значений параметра с/

Рекордные значения целевого функционала в аппроксимативной задаче четвертого порядка в зависимости от значений параметра д.

Таблица 1

Рекордные значения целевого функционала Невязки Время решения

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0.01 61.02904632295 3.186686573 134

0.1 58.72924547737 0,886885727 35

1 58.45390099578 0,611541246 16

10 58.34024952374 0,497889774 38

100 58.31611824283 0,473758493 248

В таблице 2 отражены результаты, полученные при численном решении аппроксимативных задач первого, второго, третьего и четвертого порядков.

Таблица 2

Рекордные значения функционалов и абсолютная погрешность решений аппроксимативных задач СОУ

Рекордные значения целевого функционала Невязки

Синтез управления - полином 1-ой степени 58,41341130133 0,571051551

Синтез управления - полином 11-ой степени 58.35525860407 0.512898854

Синтез управления - полином Ш-ой степени 58.33315050984 0.490790760

Синтез управления - полином 1У-ой степени 58,31616898826 0.473809238

Программное управление 57,84235975023 0.0

Заключение. Предлагаемый подход к построению синтеза субоптимального управления нелинейными процессами на тестовых примерах показал себя работоспособным. В работе предпринята попытка помимо полиномиального синтеза оптимального управлении без учета прямых ограничений, построить более трудоемкий синтез управления в задаче с прямыми ограничениями. Для определения адекватности синтезированного субоптимального управления использовалось сопоставление расчетных значений оптимальной траектории и функционала с оптимальным решением, полу-

ченным в задаче оптимального управления, зависящего только от времени. С ростом степени полинома погрешности аппроксимации монотонно уменьшаются, т.е. качество синтеза управления улучшается.

Численные эксперименты позволяют утверждать, что с помощью предложенной методики можно строить приближенный синтез оптимального управления в задачах рассматриваемого типа.

Библиографический список

1. Беллман Р., Калаба Р. Динамическое программирование и современная теория управления. - М.: Наука, 1969. - 118 с.

2. Красовский H.H. Теория управления движением. - М,: Наука, 1968, - 476 с,

3. Моисеев H.H. Численные методы в теории оптимальных систем. М.: Наука, 1971. - 424 с.

4. Афанасьев В.Н., Колмановский В.Б., Носов В.Р, Математическая теория конструирования систем управления, - М.: Высшая школа, 1989. - 447 с.

5. Красовский A.A. и др. Справочник по теории автоматического управления. - М.: Наука, 1987, - 712 с.

6. Kroîov V.F, Global methods in optimal control theory. - N.Y,; Marcel Dekker Inc., 1996.

7. Гурман В.И. Принцип расширения в задачах оптимального управления. - М„ Наука, 1985. - 288 с.

8. Федоренко Р.П, Приближенное решение задач оптимального управления, - М.: Наука, 1978. - 488 с.

9. Евтушенко Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации, - М.: Наука, 1982, - 432 с.

10. Тятюшкин А.И. Численные методы и программные средства оптимизации управляемых систем. - Новосибирск: Наука, 1992. -193 с.

11. Жиглявский А.А., Жилинскас А,Г, Методы поиска глобального экстремума. - М.: Наука, 1991. - 248 с,

Ю.Ф.Мухопад, А.Ю.Мухопад, Т.С.Бадмаева Встроенный контроль в автоматах управления

Надежность информационно-управляющих систем [1] и специализированных преобразователей информации [2] определяется не только исправностью основного оборудования, но и правильностью функционирования автоматов управления, которые для сложных систем и задач АСУТП могут составлять от 30 до 60% оборудования.

Методы контроля автоматов с историческим обзором развития достаточно подробно изложены в [1, 6, 7] на основании которых можно сделать вывод о том, что при динамическом (не тестовом) контроле автоматов наиболее эффективна проверка правильности смены состояний автоматов с использованием равновесных кодов (mCn) с фиксированном числом единиц.

В работах [1, 5, 6] предложен вариант кода mCn, названный модификацией геометрического кода (МГК), который получается методом замены каждых двух разрядов двоичного кода состояний автомата a(f) на три разряда а, Ь, с в которых возможна только одна единица. Зти разряды названы группой. Тогда условие отсутствия ошибки в группе описываются функцией:

у = abc + abc + abc.

В МГК накладываются так же дополнительное условие отсутствия рядом стоящих единиц в соседних группах кода a(t), В работе [5] показаны способы реализации этих простейших функций на элементах логики и на дешифраторах и сделан вывод в пользу дешифра-торной реализации. По сравнению с кодом mCn / / код МГК для того же числа состояний автомата увеличивает число разрядов в — 1,5 раза, а не в два в слу-

чае равновесного кодирования. Более того, для нахождения функций переходов автомата можно подать на вход комбинационной схемы переходов П (реализуется через ПЛМ, ПЗУ или ПЛИС) не сам код МГК, а его двоичный эквивалент, т.е. перейти снова к двоичному (но теперь уже не позиционному) коду по правилу: код 001 переводится в 01, код 010 в 10 и код 100 в 11. Тогда синтез автомата будет производиться по двоичному коду МГК (ДМГК), а самоконтроль по выходному коду комбинационной схемы в виде МГК.

При этом сложность комбинационный схемы самоконтролируемого и не контролируемого автомата возрастает несущественно, т.к. количество входов комбинационной схемы будет как и в классическом неконтролируемом варианте определятся конкатенацией разрядов ДПК (или ДМГК в предлагаемом варианте) и разрядов кода внешних переменных (логических условий а1, а2,...,ак).

Более того, в этом случае для ДМГК имеется возможность двойного контроля как кода ДМГК на входе П (в котором не должно быть комбинаций 00 в каждой группе из двух разрядов) так и на выходе схемы П контроль по входу МГК,

Как видно из анализа (рис. 1) структурной схемы самоконтролируемого автомата с кодами МГК и ДМГК такой возможности нет в автоматах при равновесном тСп кодировании состояний а(1),

На рис. 1 обозначено: СС - схема синхронизации; К - схема контроля; а1, а2,...,ак - логические сигналы; х1, х 2 ...,х р - разряды кода состояний; А1, А2,...,Ац - выходные сигналы автомата; СР - шифратор

i Надоели баннеры? Вы всегда можете отключить рекламу.