Научная статья на тему 'Численное исследование свойств алгоритмов параметрического синтеза оптимального управления'

Численное исследование свойств алгоритмов параметрического синтеза оптимального управления Текст научной статьи по специальности «Математика»

CC BY
58
19
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Зароднюк Татьяна Сергеевна

В данной работе для численного решения задачи построения управления в виде закона с обратной связью предлагается использовать подходы, основанные на алгоритмах параметрического синтеза оптимального управления. Приведены результаты численных экспериментов, проведенных с помощью исследуемых алгоритмов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Численное исследование свойств алгоритмов параметрического синтеза оптимального управления»

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ

ных с достаточно высокой вероятностью про- 3. гнозировать диагнозы для новых пациенток. Методика моделирования, основанная на дробно-рациональных аппроксимантах, оказалась адекватной при нахождении минимальных наборов наиболее влиятельных медико-социальных показателей, отражающих нарушение репродуктивной функции пациенток. 4.

Проведенные расчеты позволяют утверждать, что с использованием формальных методов можно выявлять значимые факторы и строить правдоподобные математические мо- 5. дели.

БИБЛИОГРАФИЯ

1. Моргиани, Ф.А. Женское бесплодие: медицинские и социальные аспекты / Ф.А. Моргиани // Проблемы репродуктологии. — М., 2002. - Т.5. - С. 28-32.

2. Neumaier A. Rational functions with prescribed global and local minimizers //J. Global Optimization, 25 (2003), pp. 175-181.

6.

Кузьменко, Е.Т. Опыт проведения эпидемиологического исследования частоты и структуры бесплодия в браке при анкетировании женщин репродуктивного возраста в г. Шелехов Иркутской области / Е.Т. Кузьменко, Л.В. Сутурина, Н.Р. Викулова [и др.] // Бюл. ВСНЦ СО РАМН. - 2005. -№ 5. - С. 49-53.

Горбань, А.Н., Россиев, Д.А. Нейронные сети на персональном компьютере // Новосибирск: Наука. Сибирская издательская фирма РАН, 1996. - 276 с. Уоссермен, Ф. Нейрокомпьютерная техника: теория и практика. - М.: Мир, 1992. -184 с.

Зароднюк, Т.С. Применение нейронной сети для решения модельной задачи оптимального управления с обратной связью // Материалы IX школы-семинара молодых ученых "Математическое моделирование и информационные технологии" 22 - 27 октября 2007. Издательство ИДСТУ СО РАН, 2007. - С. 77-78.

Зароднюк Т.С. УДК 519.714.3

ЧИСЛЕННОЕ ИССЛЕДОВАНИЕ СВОЙСТВ АЛГОРИТМОВ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

1. Введение.

Задачи построения управления в виде закона с обратной связью возникают при описании динамики многих технических процессов. На сегодняшний день классический синтез оптимального управления (СОУ) сводится к решению уравнения Беллмана [например, 1], которое для многомерных нелинейных объектов сталкивается с непреодолимыми трудностями при приближенном численном решении. Построение точных решений возможно лишь для линейно-квадратичных задач [2, 3]. Однако реальные практические задачи редко удается свести к линейным моделям и квадратичным функционалам.

В данной работе для численного решения задачи построения управления в виде закона с

обратной связью предлагается использовать подходы, основанные на алгоритмах параметрического СОУ.

Рассмотрим постановку задачи СОУ, для решения которой предлагается использовать исследуемые алгоритмы. Поведение модели объекта управления описывается системой обыкновенных дифференциальных уравнений х = /(х,и,(), где х = х(() - вектор фазовых координат размерности п, и = и(х,р,() - вектор управляющих функций размерности г, р - скалярный параметр модели, принимающий значение из интервала [р, ,рд ], t еТ = ] - интервал времени функционирования системы. Вектор-функция / (х,и,() размерности п предполагается непрерывно дифференцируемой по всем аргументам, кроме t. Начальный фазовый век-

е

УПРАВЛЕНИЕ В ТЕХНИЧЕСКИХ СИСТЕМАХ

тор x(t0) = x0 (р) задан как функция параметра р. Задача СОУ состоит в поиске вектор-функции u(x,p,t), доставляющей минимум терминальному функционалу I(u) = ф(х(^ )) ^ min, при любом значении р е [р7 ,pg ].

2. Полиномиальный СОУ.

Для построения управления в виде закона с обратной связью (позиционного управления) формируется аппроксимирующая задача оптимального управления, состоящая из некоторого числа экземпляров исходной задачи. На первом этапе осуществляется поиск оптимального управления, зависящего только от времени (программного управления), полученное решение рассматривается в качестве эталонного. Затем формируется набор задач СОУ, в которых оптимальные управления приближаются полиномами возрастающих степеней, формулируются и решаются задачи идентификации по параметрам. В результате решения первой из этих задач получается приближение управления полиномом первой степени (субоптимальное управление). Оно используется в качестве начального приближения при построении управления в виде полинома второй степени и т.д. Получаемое субоптимальное управление на каждом последующем этапе все точнее приближает известное оптимальное. При этом последовательность значений функционалов монотонно сходится к минимальному значению.

На базе комплекса программ для решения задач оптимального управления (ЗОУ) OPTCON-I [4] разработан алгоритм поиска управления с обратной связью в виде полиномов возрастающих степеней [5]. В результате работы алгоритма удается получить последовательность субоптимальных управлений U =|u1 ,u 2 ,...,uk Адекватность этих управлений, каждое из которых все точнее приближает известное оптимальное, оценивалась на основе сопоставления расчетных значений рекордных траекторий и функционала с оптимальным решением, полученным в аппроксимирующей задаче поиска программного управления.

3. Нейронный СОУ.

Второй исследуемый алгоритм основан на построении управления в виде закона с обратной связью путем использования нейронных функций стандартного вида. Нейронная функция традиционно строится из сумматора и нелинейного функционального преобразователя

Ф = я/(й + |), где й - характеристика крутизны преобразователя [6]. Входные и выходной сумматоры для сети с тремя входами вычисляются поформулам ^ = ах +а ^х, +, +а}+2(^х3,

, Ф.,здесь k - количество

1 =l,k-1 иsk = V u . „, .,

J k ¿—ij=1 j + 3 (k-1)т

нейронов. Представление управления в виде закона с обратной связью основывается на нейронной функции вида g(a,x ) = а 3 k-2 ф k.

Алгоритм обучения нейронной функции (параметрической идентификации по параметрам а) реализован на основе программного комплекса для решения невыпуклых ЗОУ OPTCON-III (Горнов А.Ю., Зароднюк Т.С.). Получаемый приближенный СОУ позволяет рассчитать минимальное значение целевого функционала в поставленной задаче для любого начального состояния из заданного интервала. Для оценки качества синтеза проводится сравнение результатов, полученных на основе нейронной аппроксимации, с вычисленными оптимальными значениями траектории в конечный момент времени.

Приведем результаты численных экспериментов, проведенных с помощью исследуемых алгоритмов параметрического СОУ.

4. Модельная задача гашения колебаний нелинейного маятника [7].

Рассмотрим классическую модельную задачу гашения колебаний нелинейного маятника: X1 = x2, X2 = u1 - sinx1, X3 = u2 + x2 + x2, x0 (0)=(5,0,0), I(u)= x3 (2) ^ min.

Для построения СОУ с помощью первого подхода формируется аппроксимирующая ЗОУ, состоящая из L экземпляров исходной задачи: x2i-1 = x 2i, x2i = uz - sinx2i -1, L =11

x2L+1 = V!i=1 (ui + x2z -1 + x2z ). При этом начальный фазовый вектор задан как функция параметра p : x2i -1 (0) = pi = i -1, x2, (0)= 0, x2l+ 1 (0)= 0, i = 1,L. Дискретный параметр модели p принимает значения из интервала [0,10] с единичным шагом, при этом p1 = 0, p11 =10. Необходимо найти управление, доставляющее минимум целевому функционалу I(u) = x2L+1 (2) ^ min, при значениях x2i -1 (0) из заданного интервала [010] на фиксированном промежутке изменения времени t еГ = [0,2]. Решение, полученное в этой задаче, выбирается в качестве эталонного.

Далее формируется последовательность задач параметрической идентификации, в которых управление приближается полиномами возрастающих степеней. В результате численного решения поставленной задачи на первом шаге получим следующее линейное приближение к оптимальному управлению:

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ

u1 = -0.837х1 -1.935х2. На следующем этапе синтез управления ищется в виде полинома второй степени, найденное ранее субоптимальное управление выбирается в качестве начального приближения. В результате численного решения задачи получим уточнение субоптимального управления: u2 = -0.021x2 --0.096х1 х2 -0.128х22 -0.719х1 -1.686х2. На графиках приведены оптимальные (сплошные линии) и субоптимальные (пунктирные лини) траектории системы — рис. 1.

Рекордное значение функционала в задаче квадратичной аппроксимации — 58.33 ближе к эталонному — 57.84, чем в задаче линейной аппроксимации оптимального управления, в которой рекордное значение функционала равно 58.41, что подтверждает очевидное свойство об улучшении приближения с ростом степени полинома.

Для построения синтеза с помощью второго подхода формируется расширенная система дифференциальных уравнений с заданными начальными условиями: х2i -1 = х2i,

х 2i = U - Sin х 2i -1, х 2i -1 (t 0 ) = 5i - 5, х 2i (t 0 )=0, i =1,3, t e[f0,t1 ] = [0,2]. Предлагается минимизировать

функционал следующего вида I(u) = Е6=1 (хГ (t1)-х'^ ))2 ^ min, гдех™(t1), i =16 - значения траекторий в конечный момент времени, найденные с помощью нейронной функции; х*(^), i =1,6 - оптимальные значения фазовых координат, полученные при решении описанной выше аппроксимирующей задачи поиска оптимального управления, зависящего только от времени. На входы сети подаются траектории системы, на выходе получаем управление, зависящее от фазовых ко- ординат и параметр а . Эта задача используется в качестве обучающей для нейронных функций, состоящих из 3-х, 4-х, 5-ти и 6-ти нейронов, т.е. позволяет найти значения а, при которых

функционал в поставленной задаче обучения минимален. На рис. 2 представлен результат оценки качества СОУ с помощью нейронных функций разной структуры, если экстремальное значение целевого функционала меньше эталонного, то соответствующая точка располагается ниже биссектрисы угла первой четверти, если больше, то — выше.

Для трехнейронной функции величина отклонения полученного функционала от эталонного значения составляет 3.83, для функции, состоящей из 4-х нейронов — 3.58, из 5-ти — 3.48, из 6-ти — 3.43. Таким образом, качество синтеза возрастает с усложнением структуры аппроксимирующей нейронной функции.

5. Модельная задача 2 [8].

Управляемый динамический процесс описывается системой обыкновенных дифференциальных уравнений x1 = sinx2, x2 = u1 -eXl, x3 = Xj2 + x2 + uf с заданными начальными условиями x1 (0) = x2 (0) = 1, x3 (0) = 0. T = [0,5] - интервал времени функционирования системы. Необходимо минимизировать функционал вида I(u) = x1 (5) + x2 (5) + x3 (5) ^ min.

Построение полиномиального синтеза начинается с формирования эталонной задачи большей размерности, состоящей из некоторого числа экземпляров исходной задачи. Таким образом, динамическая система примет следующий вид x2. -1 = sinx2., x2. = u. -ex2' 1, x2i+1 = XL=1 (u¡2 + x2-1 + xf. ). Необходимо минимизировать целевой функционал I(u) = x2L+1 (5) +x;- ^ min при следующих значениях траектории в начальный момент времени x2, -1 (f0 )=1, x2i (f0 ) = P, = x2L +1 (f0 )= 0 . =1ДÖ, L =10. Решение этой задачи берется за эталонное при оценке качества приближенного СОУ.

Рис. 1. Четные оптимальные и субоптимальные траектории системы (а); Нечетные оптимальные и субоптимальные траектории системы (б)

е

УПРАВЛЕНИЕ В ТЕХНИЧЕСКИХ СИСТЕМАХ

Рис. 2. Оценка качества СОУ с применением функции из 3-х, 4-х, 5-ти и 6-ти нейронов

Сформируем последовательность задач параметрической идентификации. Первая из этих задач основана на построении синтеза оптимального управления в виде полинома первой степени: Х2. =а1 х2._1 +а2х2. -еХ2>,

х 21+1 =Е-=1 ((а1 Х 2; -1 +а2 Х 2; )2 +4-1 + 4 ),

Рис. 3. Четные оптимальные и субоптимальные траектории системы (а); Нечетные оптимальные и субоптимальные траектории системы (б)

на следующей системой нелинейных диф-

а _

ференциальныхуравнений [9]:x 1 = x2,x2 -a1 sinx1 -(a2 + a3 sinx1 )x3, x3 = -k1 x3 + a4x2 sinx1 + +k1 u, где xj - угол поворота ротора генератора относительно синхронной оси вращения; x2-скольжение; x3- отклонение ЭДС генератора от установившегося значения; U - отклонение напряжения возбуждения генератора от уста-

; sin x 21, начальный фазовый вектор и вид новившегося значения; a 0 ^механическая

функционала остаются неизменными, водятся дополнительные ограничения на параметры а .| <10, ; =1,2 г е [0,5].

Усложняя структуру аппроксимирующего полинома путем добавления слагаемых, получим следующие субоптимальные управления щ = 0.59х1 _0.948х2, и2 = 0.550х1 _0.926х2 + +0.109x2, и3 = 1.031х1 -1.729х2 -0.505х2 +0.868х1 х2, и4 = 0.838х1 -1.667х2 _0.424х1 + 0.534х1 х2 + 0.058х22. Результаты приближения полиномом Р4 отражены на рис. 3.

Задача построения позиционного управления с помощью второго подхода формируется аналогично задаче нейронного СОУ колебаниями нелинейного маятника. На первом этапе с помощью функции, состоящей из 3-х нейронов, удалось получить аппроксимацию оптимального управления, доставляющую рекордное значение квадратичному функционалу равное 15.54. Функции более сложной структуры позволяют повышать качество синтеза: с помощью четырехнейронной функции получаем рекордное значение, равное 7.80; пя-тинейронной — 3.49.

6. Модельная энергетическая задача синтеза регуляторов возбуждения синхронных генераторов.

Рассмотрим задачу синтеза регуляторов возбуждения синхронных генераторов. Математическая модель движения ротора при работе на шины неограниченной мощности синхронного генератора может быть представле-

мощность турбины; к1, а., ; =1,4 - положительные постоянные. Начальный фазовый вектор задан х1 (г0 ) = _3, х2 (г0 ) = 0, х3 (г0 ) = 0. Критерием качества в данной задаче является следующий функционал:

I =

m'

+ c

Z РЛ

dt.

(1)

Для сведения к классической постановке стандартной ЗОУ вводится дополнительная фазовая координата, равная подынтегральному выражению в (1). Функционал приводится к терминальному виду — ЗОУ заключается в поиске минимума введенной координаты в конечный момент времени г1. Значения параметров модели даны в первоисточнике: а0 = 0,57, а1 = 0,64, а2 = 0,3, а3 = 0,25 , а4 = 1,37, Р1 = 0,5, Р2 = 3,81, Р3 =-0,5. Задача синтеза в рассматриваемом случае заключается в поиске управления, в виде закона с обратной связью и(х,р,г), переводящего объект из произвольного исходного состояния (в некоторой ограниченной области) в стационарное (х 1 = х2 = х3 = 0) при значениях параметра р из заданного интервала [-3,-1] на фиксированном промежутке изменения времени т =[г 0,г1 ] = [0,7].

В результате численного решения последовательности задач СОУ полиномами возрастающих степеней на последнем этапе получено следующее представление субоптимального позиционного управления

2

0

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ

и7 = 0178х1 + 0.503х2 + 0317х3 + 0.07x2 + 0.217х2 -

-0.027х2 + 0176х1 • х2 -0.006х1 х3 + 0.039х2 х3,

с помощью которого удалось получить наилучшую аппроксимацию оптимальных траекторий (рис. 4).

Абсолютная погрешность в задаче квадратичной аппроксимации, использующей 9 параметров а, равна 0.46. Это значительно меньше погрешности в случае линейной аппроксимации, которая составляет 1.75 (табл. 1), что подтверждает очевидное свойство об улучшении качества приближения с ростом степени полинома. Аналогичные результаты получены с помощью нейронных функций.

7. Заключение.

Предлагаемые подходы к построению СОУ нелинейными процессами показали себя работоспособными. С ростом степени полинома и с усложнением структуры нейронных функций погрешности аппроксимации монотонно уменьшаются, т.е. качество синтеза управления улучшается. Для определения адекватности синтезированного субоптимального управления использовалось сопоставление расчетных значений оптимальной траектории и функционала с оптимальным решением, полученным в задаче оптимального управления, зависящего только от времени.

Проведенные численные эксперименты позволяют утверждать, что разрабатываемые алгоритмы применимы для решения задач синтеза оптимального управления.

Таблица 1

Рекордные значения функционалов и абсолютная погрешность решений задач СОУ

Рекордные значения Абсолютная

целевого функционала погрешность

СОУ/u 1 =У3 а х 1 /—а =1 1 1 13.28 1.75

СОУ/u 2 =u1 +а 4 х2 13.18 1.65

СОУ/u 3 =u 2 +а 5 х 2 13.18 1.65

СОУ/u 4 =u 3 +а 6 х 2 12.72 1.20

СОУ/u 5 =u 4 +а 7 х1 х 2 12.60 1.07

СОУ/u 6 =u 5 +а 8 х1 х 3 12.21 0.69

СОУ/u 7 =u 6 +а 9 х 2 х 3 11.99 0.46

Эталонная ЗОУ 11.53 -

Рис. 4. Оптимальные и субоптимальные траектории системы

БИБЛИОГРАФИх

1. Беллман, Р., Калаба, Р. Динамическое программирование и современная теория управления // М., Наука, 1969. 118 с.

2. Афанасьев, В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления // М., Высшая школа, 1989, 447 с.

3. Красовский, А.А. и др. Справочник по теории автоматического управления. М., Наука, 1987. 712 с.

4. Горнов, А.Ю., Диваков, А.О. Комплекс программ для численного решения задач оптимального управления. Руководство пользователя. — Иркутск, 1990. — 27 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Ливанцова, Т.С., Горнов, А.Ю. Подход к построению нелокального синтеза оптимального управления// Вестник ИрГТУ. — 2006 - № 2 (26), т.3. - С 142-148.

6. Горбань, А.Н., Россиев, Д.А. Нейронные сети на персональном компьютере // Новосибирск: Наука. Сибирская издательская фирма РАН, 1996. — 276 с.

7. Тятюшкин, А.И. Численные методы и программные средства оптимизации управляемых систем. — Новосибирск: Наука. Сиб. отд-ние, 1992. — 193 с.

8. Горнов, А.Ю., Данеева, А.В. Подход к исследованию невыпуклых задач оптимального управления с параллелепипедными ограничениями // Вестник Бурятского университета. Серия 13: Математика и информатика. Вып. 2. — Улан-Удэ: Изд-во Бурятского госуниверситета, 2005. — С. 125—131.

9. Колесников, А.А. Последовательная оптимизация нелинейных агрегированных систем управления. — М.: Энергоатомиздат, 1987. — 160 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.